第113章_算力方案

投票推薦 加入書籤 小說報錯

  第二天一早,沈一鳴就把自己關進了實驗室。

  昨晚他幾乎沒睡,整夜都在思考協同推理的具體實現。早上七點,左城到公司的時候,實驗室的燈已經亮了。

  」一鳴,你這是通宵了?」左城推門進去,看到沈一鳴趴在桌上睡著了。

  沈一鳴揉揉眼睛坐起來:」城哥,我想出來了。」

  他從桌上拿起一疊手繪的圖紙:」你看,這是我設計的分布式邊緣AI架構。」

  左城接過圖紙,仔細看著上面的線條和標註。

  」每顆衛星不再運行一個完整的AI模型,而是運行一個精簡版的'決策代理'。」沈一鳴指著圖解釋,」代理只負責局部決策,通過星間鏈路與其他代理通信。」

  方澤這時候也走了進來,手裡端著三杯咖啡。

  」我來補充一下硬體層面的思路。」他把咖啡放下,」如果用協同推理的架構,單顆衛星的算力需求可以大幅降低。我們可以考慮用低功耗的嵌入式AI晶片。」

  」功耗能壓到多少?」左城問。

  方澤調出一些測試數據:」我昨晚查了一下,目前行業里最低功耗的嵌入式AI晶片可以做到2瓦左右。如果用三四顆這樣的晶片協同,功耗大概在6到8瓦。」

  」還是超標。」沈一鳴皺眉,」目標必須壓到5瓦以下。」

  」與其用多顆低功耗晶片,不如把一個高性能晶片的模型壓縮到極致。」左城突然開口。

  沈一鳴眼睛一亮:」模型壓縮?」

  」對。」左城在白板上畫了一個示意圖,」如果我們能把AI模型的體積壓縮到原來的三十分之一,同時保持80%以上的決策準確率,就能在單晶片上運行。」

  方澤快速計算著:」寒武紀的MLU270功耗30瓦,如果壓縮到三十分之一,理論上功耗可以降到1瓦左右。」

  」問題是,我們現在的壓縮技術能做到嗎?」沈一鳴問。

  左城打開系統面板,查看當前的葉片列表。

  【科技樹葉片】

  - 神經網絡基礎

  - 深度學習框架

  - 強化學習策略

  - 自然語言理解

  - 計算機視覺

  - 模型壓縮優化

  - 聯邦學習

  - 因果推理

  - 生成式模型

  - 梯度稀疏化壓縮

  模型壓縮優化。

  這枚葉片應該有用。

  但他不能直接告訴沈一鳴這些。

  」一鳴,你覺得我們的壓縮技術有提升空間嗎?」左城問。

  沈一鳴沉吟片刻:」有。但需要新的算法突破。」

  」什麼樣的突破?」

  」有一種方向叫'知識蒸餾'。」沈一鳴在白板上寫下這個詞,」把大模型的知識'蒸餾'到小模型里。但知識蒸餾的難點在於,我們沒有一個足夠強大的'教師模型'來指導學生模型。」

  」為什麼?」

  」因為天穹衛星的AI調度是一個全新的場景。」沈一鳴解釋道,」傳統的預訓練模型在這個場景上表現不好,我們需要從頭訓練一個專用的大模型。」

  」這需要多少時間?」

  沈一鳴估算了一下:」至少兩到三個月。」

  兩到三個月。

  而他們只有兩周。

  」還有一個方向。」方澤突然說。

  」邊緣計算。」方澤說,」與其在衛星上跑完整的AI模型,不如把一部分計算任務搬到地面站或者中繼衛星上。」

  」你的意思是?」沈一鳴問。

  」雲邊協同。」方澤在白板上畫了一個簡單的架構圖,」衛星只負責簡單的感知和決策,複雜的推理放到地面站或者中繼衛星上完成。」

  」但這樣會增加通信延遲。」沈一鳴提出問題,」對於實時性要求高的場景,延遲可能是致命的。」


  」所以要用預測性調度。」左城突然開口。

  兩人一愣。

  」我們的目標不是讓衛星'實時思考',而是讓它'提前預判'。」左城在白板上畫了一條時間線,」比如,星間鏈路的狀態變化是可以預測的。如果衛星能提前幾秒鐘預判到鏈路擁塞,就可以提前調整路由,避免問題發生。」

  」預測性調度……」沈一鳴喃喃自語,」這需要對衛星網絡的動態特性有深入理解。」

  」我們不是有聯邦學習嗎?」左城說,」用聯邦學習的方式,讓所有衛星共享網絡狀態信息,然後用AI預測鏈路變化。」

  」城哥,你是說,用聯邦學習訓練一個預測模型?」

  」對。」左城點頭,」這個模型不需要在衛星上運行,只需要在地面站訓練好後,下發預測參數給各衛星。衛星根據參數做簡單計算就行了。」

  沈一鳴眼睛一亮。

  」這樣既保證了預測的準確性,又降低了衛星的算力需求。」方澤興奮地補充。

  」能壓縮到多少?」左城問。

  沈一鳴估算了一下:」原來需要壓縮到三十分之一,現在可能只需要十分之一就夠了。準確率可以從70%提升到85%左右。」

  85%。

  距離90%的目標更近了一步。

  」但還不夠。」左城搖頭,」必須做到95%以上。」

  沈一鳴有些為難:」95%的話,單純的壓縮很難做到。除非……」

  」除非有新的算法突破。」沈一鳴說,」比如,超參數自動優化。」

  超參數自動優化。

  這正是他需要的。

  」能提升多少?」左城問。

  」理論上能提升5到10個百分點。」沈一鳴說。

  5到10個百分點。

  85%加上10%,就是95%。

  左城閉上眼睛,深吸一口氣。

  他需要這項技術。

  科技雷達的冷卻還有多久?

  他打開系統面板看了一眼:剩餘8小時。

  8小時後,他就可以掃描沈一鳴,獲取超參數自動優化的技術。

  」好。」左城睜開眼睛,」就這麼定了。」

  」定了?」沈一鳴有些意外。

  」第一,用聯邦學習訓練預測模型。第二,把模型壓縮到十分之一。第三,用超參數自動優化提升準確率。」

  左城在白板上寫下三個關鍵詞。

  」兩周內完成。」

  沈一鳴和方澤對視一眼,都看到了彼此眼中的決心。

  」沒問題。」沈一鳴說,」我這就開始寫技術方案。」

  」晶片的事交給我。」方澤說,」我去聯繫寒武紀,看他們能不能提供一些技術支持。」

  三人分頭行動,會議室里重新忙碌起來。

  左城最後一個離開。他看了一眼系統面板上的倒計時。

  8小時。

  只需要再等8小時。

章節目錄