第233章 LPU的進展

投票推薦 加入書籤 小說報錯

  時間如白駒過隙,轉眼已是11月中旬。

  距離徐辰那篇《Logic Is Also You Need》在arXiv上發表,已經過去了兩個多月。

  而華國的秘密布局,更是已經悄然推進了三個多月。

  這三個月里,雖然表面上風平浪靜,但在半導體和AI的核心圈層,早已是暗流涌動。

  ……

  十一月中旬,深圳,南山。

  這間位於地下二層的恆溫實驗室里,這裡是海絲半導體的絕密測試區。

  總工程師何庭波站在單向玻璃後,並沒有像往常那樣盯著滿屏的數據,而是閉著眼睛,似乎在聽著什麼。

  實驗室里擺著兩台測試機櫃。

  左邊那台,風扇正在發出噴氣式飛機起飛般的嘯叫,紅色的過熱警報燈瘋狂閃爍。裡面插著的,是目前市面上最頂級的算力怪獸——英偉達H100。

  右邊那台,卻安靜得像是一塊石頭。只有機箱面板上那顆綠色的指示燈,以一種極其緩慢、悠閒的節奏呼吸著。裡面躺著的,是剛剛流片回來的工程樣片——「昇騰LPU-Alpha」。

  「跑完了。」

  操作員的聲音打破了死寂。

  何庭波睜開眼:「報數據。」

  「任務:SLRM架構下的千萬級邏輯門推演。」

  「H100組:耗時4分12秒,峰值功耗700W,核心溫度85度。GPU利用率……只有12%。」操作員看著數據,咽了口唾沫,「因為大量的邏輯跳轉導致CUDA核心一直在等待數據,顯存帶寬都快被撐爆了,算力卻發揮不出來。」

  「LPU組呢?」

  「耗時……58秒。」

  操作員的聲音有些顫抖,仿佛不相信自己的眼睛。

  「峰值功耗45W,核心溫度……室溫。」

  何庭波沒有說話,只是走到玻璃前,看著那台安靜的機櫃。

  4分12秒對58秒。

  700W對45W。

  4nm先進位程對14nm成熟工藝。

  這是一場不對稱的屠殺。

  沒有歡呼,沒有掌聲。在場的工程師們只是面面相覷,眼神中流露出的不是狂喜,而是一種近乎敬畏的恐懼。

  他們比誰都清楚這意味著什麼。

  當英偉達還在用「蠻力」去模擬邏輯的時候,徐辰設計的架構,已經讓晶片學會了「思考」。

  「封存數據。」何庭波的聲音很輕,卻在空曠的實驗室里迴蕩,「把這台機器的代號,從『備胎』改成……『破壁者』。」

  ……

  雖然核心數據被嚴密封鎖,但在這個信息爆炸的時代,總有一些風聲會從牆縫裡漏出來。

  B站,科技區。

  一個名為「極灣Geekerwan」的UP主,發布了一條名為《有些事不能細說,但國產晶片可能真的要變天了》的視頻。

  視頻里,UP主雲非並沒有像往常那樣拿著顯卡跑分,而是坐在鏡頭前,神色有些神秘,甚至帶著點壓抑不住的興奮。

  「兄弟們,最近我去了趟深圳,本來是想去華強北淘點電子垃圾的,結果被幾個『菊廠』的朋友拉去喝茶。簽了保密協議,具體的參數我一個字都不能說,說了號就沒了。」

  「但我可以給你們打個比方。」

  雲非拿起桌上的一個魔方,又拿起一把錘子。

  「以前我們搞AI,就像是用錘子砸魔方。只要力氣夠大,錘子夠硬,總能把魔方砸開。」

  「這也是英偉達一直在做的事,他們造出了世界上最硬的錘子。」

  「但是這次……」

  放下了錘子,輕輕轉動了一下魔方。

  「我看到了一種全新的解法。它不需要多大的力氣,也不需要多硬的錘子。它只是……找到了那個公式。」

  「咔噠。」

  魔方復原。

  「那種絲滑感,那種降維打擊的感覺……真的,我當時在現場,雞皮疙瘩都起來了。」


  「我只能透露一點:這玩意兒不挑食。哪怕是咱們國內那種成熟工藝,也能跑得飛起。」

  「時間呢,我不敢保證啊,我估計最快可能半年,慢一點一年左右,應該就能看到商業化產品問世了。當然,都是我猜測啊,猜不准我不負責。」

  彈幕瞬間炸了。

  【謎語人滾出哥譚!】

  【臥槽?真的假的?雲飛從來不吹牛逼的啊。】

  【成熟工藝?難道是說晶片製程麼?】

  【傳說中的存算一體?還是光子晶片?】

  【別猜了,前幾天我看新聞,科技部批了個『新一代認知智能計算架構』的專項,好像就是以SLRM模型為原型開發的。】

  評論區里,除了興奮的吃瓜群眾,很快就湧現出了一批畫風詭異的帳號。

  「笑死,又在吹牛逼了。之前吹光刻機,現在吹LPU,能不能務實一點?」

  「承認差距有那麼難嗎?人家英偉達幾萬人的團隊搞了幾十年,你換個名字就能彎道超車?做夢呢?」

  「又是『沸騰體』,能不能別整天遙遙領先了,看著尷尬。」

  這些帳號ID大多是一串亂碼或者新註冊的小號,言辭激烈,邏輯統一,顯然是有組織的水軍。

  他們試圖用冷嘲熱諷,把這股剛剛燃起的希望之火給澆滅。

  畢竟,對於某些勢力來說,中國AI的崛起,是他們絕對不願意看到的噩夢。

  ……

  除了硬體圈的傳聞,軟體圈也不甘寂寞。

  知乎上,一個名為「AI觀察者」的大V,也發了一篇長文爆料。

  《國產大模型的新賽道?通義、字節、月之暗面都在秘密測試新架構!》

  文章里寫道:

  「據內部人士透露,國內幾家頭部AI大廠,最近都在秘密測試一種非Transformer架構的新模型。據說這種模型在邏輯推理和長文本處理上有著驚人的表現,完全沒有『幻覺』問題。」

  「該模型據悉仍在非常早期的階段,但是內部負責人表示在某些小數據集上訓練後表現非常好。」

  「工程師團隊目前據說處在軟體等硬體的狀況下,因為缺少匹配的硬體,目前還沒有辦法跑大參數的模型,但是據說這個過程很快會有改進。」

  「目前團隊的重點還是提效和降本上,其中某個團隊的運行成本已經降低了30%,而且還有很大的降本空間。」

  「我有幸體驗了一個內部測試版的Demo。說實話,生成速度很慢,但是回答的內容非常清晰,幾乎沒看出有什麼幻覺類的問題。」

  「不過目前測試只能限定在一些小的知識範圍內,應該也和小模型demo有關。」

  「雖然目前的綜合能力可能還打不過GPT-4,甚至連GPT-3.5都夠嗆。畢竟人家發展了八年,咱們這個新架構才搞了幾個月,數據量和訓練時長都還不夠。」

  「但這就像是一個剛出生的天才嬰兒,雖然現在還不會跑,但你能看到他眼裡的光。這是一種全新的可能性!」

  文章下面,評論區也是兩極分化。

  「真的假的?邏輯推理無幻覺?這可是LLM的死穴啊!」

  「半成品也好啊!只要路子對了,早晚能追上!」

  「得了吧,又是PPT造車。連個能用的產品都沒有,就敢吹『新賽道』?等拿出來再說吧。」

  「估計又是騙經費的項目。Transformer已經是公認的最優解了,非要另起爐灶,這不是瞎折騰嗎?」

  ……

  無論是硬體圈的LPU傳聞,還是軟體圈的新模型爆料,都像是在平靜的湖面上投下了一顆顆石子。

  雖然水軍在瘋狂地潑冷水,雖然公眾依然半信半疑,但那種「山雨欲來風滿樓」的氣息,已經越來越濃烈。

  所有人都隱隱感覺到,一場巨大的變革,正在醞釀之中。

章節目錄