第555章 晚上來我房間,我教你學習!

投票推薦 加入書籤 小說報錯

  「你真的要聽嗎?」池遠收起玩樂的心思,認真道,「這其實跟我們手頭上的工作沒啥關係。」

  這部分是屬於數據分析,組裡不太可能讓他們涉及這部分任務。

  「聽!只是現在沒關係而已。」英子回答很自信。

  不僅是對她自己的學習能力自信,更是對池遠非人般的學習能力自信。

  「好吧。」池遠笑了笑,在英子無語的眼神下,從褲兜里掏出隨身攜帶的筆。

  只見他將紙張翻轉了一面,在上面寫道:

  【1.高緯度和多模態數據:測試數據可能來自多個傳感器,涉及多種參數,因此數據是高維度和多模態的。例如,包括溫度、壓力、速度等多種測量。】

  【2.時序性:測試數據通常是時序數據,因為太空飛行器的狀態和性能參數會隨著時間的推移而變化。】

  【3.複雜的非線性關係……】

  【4.缺失數據和異常值……】

  【5.實時性要求……】

  【6.數據標籤的稀疏性……】

  「這是你對測試數據特性的分析?」

  池遠點了點頭:

  「基於這些特徵分析,我放棄了限制小規模數據量的梯度提升算法(XGBoost、LightGBM)和要求維度較低的LS-SVM算法,決定用深度學習算法,準確來說是模型,不止一個算法。」

  「它的要求並不苛刻,複雜的數據結構,也可以通過多層神經網絡學習輸入數據的表示後進行處理。特別是它能自動學習高級抽象特徵,發現隱藏在數據背後的模式和規律,達到識別異常甚至預測的目的。」

  說完,他又將自己的模型構思一一寫下來:

  【1.時間序列分析:使用專門針對時間序列數據的深度學習模型,如長短時記憶網絡(LSTM)或門控循環單元(GRU)等。】

  【2.數據預處理:……】

  【3.學習模型預訓練:……】

  【……】

  【7.增強學習:在某些情況下,可以考慮使用增強學習來實時監測中遇到的決策問題。】

  一整頁都寫滿了。

  沒有在意小小稿紙承受的不該有字數,池遠期待地等待著英子的回答:

  「這模型怎麼樣?」

  池遠寫得很簡化,英子對深度學習有所了解也能看懂。

  也正是因為能夠看懂,她微微皺起了眉頭,有些猶豫道:

  「模型很完善……但是不是太複雜了?需要的計算資源是不是太多了?」

  「是需要很大的計算資源,但這不是為了追求『最優』,面面都要考慮到嘛。」但這的確是個困擾池遠的問題,「你有沒有什麼建議?」

  英子知道的不多,一時間也想不到好辦法。

  話題冷了下來,兩個人一邊吃飯一邊發呆。

  熟悉的眼神渙散,英子卻突然想起了下午看得眼神渙散的測試數據。

  「我想到了!那些數據!非線性關係!」

  她突然出聲,把池遠嚇了個一激靈,回過神忍不住提醒道,「是『複雜的』非線性關係……」

  「別強調『複雜』了,要簡化!既然是非線性的,將略微相關的數據進行分類處理,得到類屬性,那時不時可以忽略類屬性變量之間的依賴關係可以相對忽略?」

  要是拋開對『複雜』的執著,池遠也懂了英子的意思,「你的意思是用樸素貝葉斯分類器?」

  「還有TAN分類器。」英子眯眼道。

  「這想法不錯。」池遠笑著敲了敲桌子,「還有嗎?」

  「我認為還能引入『注意力機制』,讓模型更加關注重要的特徵,從而提高對關鍵信息的捕捉能力。」英子越說越自信。

  果然,不同的思考方式注意到的重點都是不一樣的。

  英子兩條意見都是衝著『偷懶』……咳,是『簡化』的目的。

  「但可靠性呢?」

  深度學習算法有識別異常的工程,更重要的是它還能預測。

  預測,就對可靠性有著更嚴苛的要求。


  池遠的問題很致命。

  「再設計一個可靠性模型?」英子試探性地問?

  這又何嘗不是一種辦法?

  池遠琢磨著除了將測試相關數據收入進去外,還可以將試車時長、試車次數、技術狀態、試車各環境參數等多種因素塞進可靠性模型中,最好綜合得到一個考核分值。

  建模方法可以選生存分析(Survival Analysis)、可靠性塊圖(Reliability Block Diagram)、貝葉斯網絡,最好比較得到效果最好那個。

  但,這會不會太複雜了?

  池遠有些頭疼,沒辦法,這是擁有『抽象思維』也無法改變的思考習慣,『做減法』對於他而言太難,刪掉一個因素他都要糾結是不是就不可靠了。

  他是做不到了……

  「英子,」池遠眨巴起了大眼睛,「要不……模型算法部分就交給你了。你比較一下,最終選擇相對合適的。我可以負責將它實現。」

  因為計算能力不行,英子養成了『簡化』的……好習慣,這任務交給她最合適不過。

  「嗯哼~」英子很享受這種被需要的感覺,得意地微微仰下巴,「系統實現,不是十一所能做嗎?」

  「能做又不代表願意去做,還得靠我們自己。」池遠心頭有數,十一所有自己的工作,不見得會認同他們的想法並付出時間,「所以,你看這算法。」

  「我不會!」英子第一次覺得說這三個字能夠這樣理直氣壯。

  「沒事,不會可以學,說好我教你學。」池遠拍拍胸口保證下來,並提議道,「乾脆你就別搬離我們的宿舍了。」

  「不行,這得搬!」英子想了想,然後擺頭拒絕。

  池遠暗道可惜,退而求次道:「那這樣,你今晚來我房間吧。」

  也幸好周圍沒人!

  「就……只是學習……」英子微微紅了俏臉。

  「當然是學習啊!」

  池遠灑脫地點頭,隨即從另一個褲兜摸出一張寫滿字的白紙給英子——

  可靠性工程和統計學:

  《可靠性工程:概率模型與維護方法》、《可靠性工程與風險分析:實踐指南》、《工程師與科學家的概率統計導論》……

  數據挖掘和機器學習:

  《數據挖掘:概念與技術》、《統計學習基礎:數據挖掘、推斷與預測》、《模式識別與機器學習》、《大規模數據挖掘》、《數據挖掘:實用機器學習工具與技術》……

  深度學習:

  《Scikit-Learn、Keras和TensorFlow實戰機器學習》、《機器學習:概率透視》、《模式識別與機器學習》、《」Deep Learning」 by Ian Goodfellow, Yoshua Bengio, and Aaron Courville》、《強化學習導論》……

  英子眨眼看著上面眼花繚亂的書單愣住了,緋紅也慢慢消散。

  她沒看到池遠低頭寫……這只能是他一開始就寫好的。

  還掏得那樣果斷……

  所以,胡思亂想的就一直只有她?

  池遠還在自顧自地囑咐道:

  「這些書你先讀著,晚上有問題隨時來問我。特別要注重基礎啊,有幾本要多讀幾遍的,就這本……痛!」

  他還沒說完,就冷不丁地腳背挨了一腳,不由地有些委屈:

  「你要是只想看一遍,也可以……我這不是讓步了嗎?怎麼還踩?!」

  「就是想!」

  ……

章節目錄