第96章 老師是變態

投票推薦 加入書籤 小說報錯

  第96章 老師是變態

  吳辰能猜到她心中所想。

  但這也正是他所希望的效果。

  不論是姜楠還是閔欣柔,也不論感情如何發展。

  和自己工作的時候,她們必須拿出工作時該有的狀態。

  而閔欣柔也不負他的期待,壓下其他心思,開始思考如何解決問題。

  過了半晌後,她終於想清楚了。

  「老師,如果像我這樣標記5000條數據是沒有意義的,因為這些內容不是給人看的,是給機器看的,對嗎?」

  「思路對了,所以研究人工智慧的時候,看似在和文字打交道,實際上最終都會轉換為數學問題————那麼接下來呢,應該怎麼做?」

  吳辰誇獎了一句。

  能理解人的視角和機器視角的不同,是成為優秀工程師關鍵的一步。

  受到鼓勵,閔欣柔也大膽的放開了思路。

  「我應該選選擇出來5000條高質量的帖子,然後將這些帖子進行分詞,然後將這些帖子拆分成最小的字符單位,編寫一個腳本統計所有相鄰字符對的出現頻率,頻率最高的組合就合併成一個新的詞,循環往復,最後用您說BPE算法,來構建一個至少包含3萬個常用Token的中文基礎詞表。」

  閔欣柔的意思是這樣:

  一口氣說完,閔欣柔也終於明白了吳辰之前讓她標註5000條數據的真正意圖。

  她感覺自己終於將看過的論文和手頭正在做的事情串了起來。

  「不錯。」

  吳辰點點頭表示認可。

  針對BPE算法的實現,他又提點了一番具體的思路。

  特別是如何處理未登錄詞的邊界情況。

  接下來,閔欣柔只要按部就班的實現就好了。

  幫她理清思路後,吳辰也要開始自己的工作了。

  他想了想,拿出了馬克送的新鮮蘋果電腦,對閔欣柔道:「我要用這台新電腦工作,你等一會兒再做。」

  閔欣柔下意識的問道:「那舊的呢?」

  「舊的我————先給你用,你寫數據處理算法對電腦性能有要求。」

  吳辰說。

  他目前需要做的工作是閱讀文獻和設計Transformer的頂層架構,以便儘快完成GPT—1的開發,對電腦性能並沒有太大要求,用蘋果電腦看文檔正合適。

  而閔欣柔需要處理大規模的數據,正需要啟明一號這樣四卡並聯的算力怪獸。

  吳辰開始拷貝數據的時候,閔欣柔劃著名電腦椅幫他去泡咖啡。

  趁著她不在,吳辰打算先把比較重要的日語學習資料給拷出來。

  不過打開文件夾後,他突然發現最近訪問目錄中,竟然有他存放日語學習資料的打開記錄!

  難道閔欣柔打開看過?

  這就讓吳辰很尷尬了。

  他有一個朋友喜歡玉足,所以在他的電腦上存放了許多奇怪的視頻,標題也很誇張,如果讓人以為是吳辰自己喜歡,那太冤枉了。

  於是在閔欣柔泡咖啡回來後,吳辰神態隨意的開口。

  「電腦硬碟的空間不太夠,我打算清理一下,你在上面沒放什麼數據吧?」

  閔欣柔搖了搖頭:「除了今晚發研究資料目錄下的文檔給您,我沒有動其他的東西。」

  「那就行。」

  吳辰咳嗽一聲後略微放下了心。

  應該是她找文件的時候不小心點錯了,畢竟研究資料和學習資料兩個文件夾離的很近嘛。

  閔欣柔是個乖孩子,肯定不會亂翻東西。

  拷貝好自己的資料後,吳辰就將位置讓開,坐到旁邊開始和閔欣柔一起工作。

  雖然已經晚上10點鐘,但師徒倆都沒有睡覺的打算。

  閔欣柔是因為有了新的解決思路,急著進行實踐。

  而吳辰則是打算先解決蘋果的問題。

  雖然他跟馬克約的是一星期後交出修複方案。

  但他開啟思維加速看了幾個拆解視頻,又用工程聖手研究了一番蘋果的設計後後,就得出了兩套解決方案。


  這個問題其實既有英飛凌的基帶晶片問題,也有蘋果的設計問題。

  所以吳辰給出了兩套解決方案。

  一套是短期的解決方案:

  修改基帶固件中的遲滯策略,將3G網絡向2G切換的信號閾值降低3dBm,並增加500毫秒的判斷延遲,防止在信號波動時出現乒兵切換導致的掉線。

  另一套是長期的解決方案,需要修改硬體:

  優化射頻前端的供電電路,在基帶晶片和功放之間增加一級穩壓電容,防止高功率發射時的電壓跌落導致基帶復位。

  至於怎麼選,那就是賈伯斯和馬克需要做出的選擇了。

  問題解決後,吳辰從思維加速的效果中退出來,心情十分愉悅。

  他只用了10分鐘時間就換來帕羅阿爾托的設計文檔。

  一個字:值。

  這就是那個經典的道理。

  怎麼擰螺絲不值錢,但知道在哪裡擰螺絲才是最值錢的。

  愜意的喝了口咖啡,他又進入深度閱讀狀態,開始研究谷歌TPU的核心架構:

  脈動陣列(SystolicArray)。

  既然AMD給了他MPW的拼車資格,那他必須快速利用起來,準備製造自己的第一波TPU晶片。

  當然直接做出谷歌2025年的TPU是不可能的。

  製造它需要海量的知識,包括但不限於:

  半導體物理基礎、集成電路設計原理、光刻膠材料特性、數位訊號處理架構、低功耗電路設計技術、晶圓封裝測試標準————

  所以吳辰第一步的打算,是做出性能和FPGA驗證版差不多的就行。

  它的核心任務只有一個:

  瘋狂加速矩陣乘法(MatMuI)運算。

  就算這樣,在推理的運算上,也能吊打英偉達目前最強的GTX280了。

  一小時的時間轉瞬即逝。

  深度閱讀狀態結束後,吳辰稍微休息了幾分鐘,然後看了看閔欣柔的電腦。

  她還在全神貫注地調試著統計字頻的Python腳本。

  看她的神態,似乎已經進入了所謂的「心流」狀態,完全沉浸在了自己的世界裡。

  吳辰也沒打擾她,輕輕的站起身回臥室睡覺去了。

  直到凌晨兩點多,閔欣柔才終於完成了腳本的初步調試,簡單測試了一下也沒什麼問題,成功輸出了第一批高頻詞表。

  從明天開始,她就可以快速收集高質量的帖子然後跑數據了。

  這樣算下來,剩下八天的時間完全足夠她整理完5000萬條數據的清洗工作。

  甚至可能還有時間幫吳辰做預訓練的準備。

  閔欣柔想和吳辰分享喜悅。

  但一轉頭,才發現他已經離開了。

  只有吳淑芬察覺到她的動作,從睡夢中抬起頭來對她喵了一聲。

  閔欣柔瞅了一眼主臥緊閉的房門,聽到從裡面傳來了微微的鼾聲。

  於是她抱起吳淑芬放到自己的腿上,然後慢慢的劃著名電腦椅回到了次臥。

  艱難的爬上床後,閔欣柔看了看自己紅腫的腳腕。

  想起吳辰電腦上那些奇怪的視頻,她就感覺自己臉上像火燒一樣。

  「老師是變態!」

  她悄聲嘀咕了一句。

  然後似乎想到了什麼,她連忙用被子蒙住頭,擋住了窗外的月光和吳淑芬探究的目光。

  接下來的幾天,兩人都相安無事的「同居」著。

  沒有狗血的劇情,也沒有發生什麼浴室滑倒之類的暖昧意外。

  而且雖然是十一假期,但兩人都有巨量的工作要忙。

  閔欣柔需要完成基礎數據的標註。

  吳辰則是一方面要主持改造榛果電子廠的生產線,讓它能滿足安防攝像頭的生產。

  另一方面,他還得想辦法解決電子廠未來生產顯卡的問題。

  現在3畝的占地面積實在是太小了。

章節目錄