第233章 LPU的進展

投票推薦加入書籤小說報錯

時間如白駒過隙，轉眼已是11月中旬。

距離徐辰那篇《Logic Is Also You Need》在arXiv上發表，已經過去了兩個多月。

而華國的秘密布局，更是已經悄然推進了三個多月。

這三個月里，雖然表面上風平浪靜，但在半導體和AI的核心圈層，早已是暗流涌動。

……

十一月中旬，深圳，南山。

這間位於地下二層的恆溫實驗室里，這裡是海絲半導體的絕密測試區。

總工程師何庭波站在單向玻璃後，並沒有像往常那樣盯著滿屏的數據，而是閉著眼睛，似乎在聽著什麼。

實驗室里擺著兩台測試機櫃。

左邊那台，風扇正在發出噴氣式飛機起飛般的嘯叫，紅色的過熱警報燈瘋狂閃爍。裡面插著的，是目前市面上最頂級的算力怪獸——英偉達H100。

右邊那台，卻安靜得像是一塊石頭。只有機箱面板上那顆綠色的指示燈，以一種極其緩慢、悠閒的節奏呼吸著。裡面躺著的，是剛剛流片回來的工程樣片——「昇騰LPU-Alpha」。

「跑完了。」

操作員的聲音打破了死寂。

何庭波睜開眼：「報數據。」

「任務：SLRM架構下的千萬級邏輯門推演。」

「H100組：耗時4分12秒，峰值功耗700W，核心溫度85度。GPU利用率……只有12%。」操作員看著數據，咽了口唾沫，「因為大量的邏輯跳轉導致CUDA核心一直在等待數據，顯存帶寬都快被撐爆了，算力卻發揮不出來。」

「LPU組呢？」

「耗時……58秒。」

操作員的聲音有些顫抖，仿佛不相信自己的眼睛。

「峰值功耗45W，核心溫度……室溫。」

何庭波沒有說話，只是走到玻璃前，看著那台安靜的機櫃。

4分12秒對58秒。

700W對45W。

4nm先進位程對14nm成熟工藝。

這是一場不對稱的屠殺。

沒有歡呼，沒有掌聲。在場的工程師們只是面面相覷，眼神中流露出的不是狂喜，而是一種近乎敬畏的恐懼。

他們比誰都清楚這意味著什麼。

當英偉達還在用「蠻力」去模擬邏輯的時候，徐辰設計的架構，已經讓晶片學會了「思考」。

「封存數據。」何庭波的聲音很輕，卻在空曠的實驗室里迴蕩，「把這台機器的代號，從『備胎』改成……『破壁者』。」

……

雖然核心數據被嚴密封鎖，但在這個信息爆炸的時代，總有一些風聲會從牆縫裡漏出來。

B站，科技區。

一個名為「極灣Geekerwan」的UP主，發布了一條名為《有些事不能細說，但國產晶片可能真的要變天了》的視頻。

視頻里，UP主雲非並沒有像往常那樣拿著顯卡跑分，而是坐在鏡頭前，神色有些神秘，甚至帶著點壓抑不住的興奮。

「兄弟們，最近我去了趟深圳，本來是想去華強北淘點電子垃圾的，結果被幾個『菊廠』的朋友拉去喝茶。簽了保密協議，具體的參數我一個字都不能說，說了號就沒了。」

「但我可以給你們打個比方。」

雲非拿起桌上的一個魔方，又拿起一把錘子。

「以前我們搞AI，就像是用錘子砸魔方。只要力氣夠大，錘子夠硬，總能把魔方砸開。」

「這也是英偉達一直在做的事，他們造出了世界上最硬的錘子。」

「但是這次……」

放下了錘子，輕輕轉動了一下魔方。

「我看到了一種全新的解法。它不需要多大的力氣，也不需要多硬的錘子。它只是……找到了那個公式。」

「咔噠。」

魔方復原。

「那種絲滑感，那種降維打擊的感覺……真的，我當時在現場，雞皮疙瘩都起來了。」

「我只能透露一點：這玩意兒不挑食。哪怕是咱們國內那種成熟工藝，也能跑得飛起。」

「時間呢，我不敢保證啊，我估計最快可能半年，慢一點一年左右，應該就能看到商業化產品問世了。當然，都是我猜測啊，猜不准我不負責。」

彈幕瞬間炸了。

【謎語人滾出哥譚！】

【臥槽？真的假的？雲飛從來不吹牛逼的啊。】

【成熟工藝？難道是說晶片製程麼？】

【傳說中的存算一體？還是光子晶片？】

【別猜了，前幾天我看新聞，科技部批了個『新一代認知智能計算架構』的專項，好像就是以SLRM模型為原型開發的。】

評論區里，除了興奮的吃瓜群眾，很快就湧現出了一批畫風詭異的帳號。

「笑死，又在吹牛逼了。之前吹光刻機，現在吹LPU，能不能務實一點？」

「承認差距有那麼難嗎？人家英偉達幾萬人的團隊搞了幾十年，你換個名字就能彎道超車？做夢呢？」

「又是『沸騰體』，能不能別整天遙遙領先了，看著尷尬。」

這些帳號ID大多是一串亂碼或者新註冊的小號，言辭激烈，邏輯統一，顯然是有組織的水軍。

他們試圖用冷嘲熱諷，把這股剛剛燃起的希望之火給澆滅。

畢竟，對於某些勢力來說，中國AI的崛起，是他們絕對不願意看到的噩夢。

……

除了硬體圈的傳聞，軟體圈也不甘寂寞。

知乎上，一個名為「AI觀察者」的大V，也發了一篇長文爆料。

《國產大模型的新賽道？通義、字節、月之暗面都在秘密測試新架構！》

文章里寫道：

「據內部人士透露，國內幾家頭部AI大廠，最近都在秘密測試一種非Transformer架構的新模型。據說這種模型在邏輯推理和長文本處理上有著驚人的表現，完全沒有『幻覺』問題。」

「該模型據悉仍在非常早期的階段，但是內部負責人表示在某些小數據集上訓練後表現非常好。」

「工程師團隊目前據說處在軟體等硬體的狀況下，因為缺少匹配的硬體，目前還沒有辦法跑大參數的模型，但是據說這個過程很快會有改進。」

「目前團隊的重點還是提效和降本上，其中某個團隊的運行成本已經降低了30%，而且還有很大的降本空間。」

「我有幸體驗了一個內部測試版的Demo。說實話，生成速度很慢，但是回答的內容非常清晰，幾乎沒看出有什麼幻覺類的問題。」

「不過目前測試只能限定在一些小的知識範圍內，應該也和小模型demo有關。」

「雖然目前的綜合能力可能還打不過GPT-4，甚至連GPT-3.5都夠嗆。畢竟人家發展了八年，咱們這個新架構才搞了幾個月，數據量和訓練時長都還不夠。」

「但這就像是一個剛出生的天才嬰兒，雖然現在還不會跑，但你能看到他眼裡的光。這是一種全新的可能性！」

文章下面，評論區也是兩極分化。

「真的假的？邏輯推理無幻覺？這可是LLM的死穴啊！」

「半成品也好啊！只要路子對了，早晚能追上！」

「得了吧，又是PPT造車。連個能用的產品都沒有，就敢吹『新賽道』？等拿出來再說吧。」

「估計又是騙經費的項目。Transformer已經是公認的最優解了，非要另起爐灶，這不是瞎折騰嗎？」

……

無論是硬體圈的LPU傳聞，還是軟體圈的新模型爆料，都像是在平靜的湖面上投下了一顆顆石子。

雖然水軍在瘋狂地潑冷水，雖然公眾依然半信半疑，但那種「山雨欲來風滿樓」的氣息，已經越來越濃烈。

所有人都隱隱感覺到，一場巨大的變革，正在醞釀之中。

溫馨提示：按回車[Enter]鍵返回書目，按 ←鍵返回上一頁，按 →鍵進入下一頁，加入書籤方便您下次繼續閱讀。