第206章 AI界的反應 一

投票推薦 加入書籤 小說報錯

  楊老的新聞如同一場及時雨,徹底洗刷了國內關於「造神」的質疑。

  徐辰的生活也重新歸於平靜,每天穿梭在圖書館和實驗室之間,靜靜等待著那些投遞出去的論文開花結果。

  但他並不知道,在大洋彼岸,一顆被他半個月前隨手種下的種子,終於迎來了發芽的時刻。

  ……

  時間來到9月9日。

  這一天,,對於鎂國的AI行業來說,是註定載入史冊的「黑色星期二」,儘管大眾對此一無所知。

  加州山景城,谷歌總部。

  深夜十一點,Google Brain的實驗室里依舊燈火通明。

  高級研究員大衛·陳正百無聊賴地刷著arXiv。作為一名負責Gemini模型推理優化的工程師,他最近的日子並不好過。OpenAI的GPT-5依然像一座大山壓在頭頂,而Meta的LLaMA系列又在開源社區瘋狂背刺,谷歌這個曾經的AI霸主,如今卻顯得有些步履蹣跚。

  「又是這種標題黨……」

  大衛看著屏幕上一篇名為《Logic Is Also You Need》的論文,撇了撇嘴。

  自從《Attention Is All You Need》火了之後,這種蹭熱度的標題簡直泛濫成災。

  「作者……徐辰?」

  大衛愣了一下。

  「這名字怎麼有點眼熟?好像是那個搞定哥德巴赫猜想的數學天才?」

  出於好奇,也是出於對數學天才的一絲敬意,他沒有直接划走,而是點開了PDF。

  原本只是想隨便掃兩眼,看看數學家是怎麼「玩票」AI的。

  然而,十分鐘後。

  大衛的坐姿從葛優癱變成了正襟危坐,眼睛死死地盯著屏幕上的公式。

  「Gumbel-Box幾何嵌入……邏輯門控單元……這思路,有點野啊。」

  作為資深從業者,他一眼就看出了這個架構的精妙之處。它沒有試圖去修改Transformer的主幹,而是像外掛一樣,巧妙地利用幾何約束來修正概率生成。

  「這玩意兒……能跑通嗎?」

  職業習慣讓他立刻打開了Colab,按照論文裡的偽代碼,手搓了一個極簡版的Demo。

  雖然沒有經過大規模訓練,參數也是隨機初始化的,但他只是想驗證一下那個核心的「幾何求交」算子是否真的可導。

  但作為大廠員工,上班時間都在忙著優化Gemini的推理延遲,根本沒空搞這種「私活」。

  於是,接下來的半個月裡,大衛只能利用下班後的碎片時間,一點一點地復現這個模型。

  ……

  半個月後。

  看著屏幕上那條雖然抖動劇烈、但卻頑強向下的Loss曲線,大衛的手開始顫抖。

  「臥槽……真的收斂了?!」

  他猛地站起身,立刻撥通了傑夫·迪恩的電話。

  傑夫·迪恩是誰?

  在谷歌,甚至在整個矽谷,這個名字就是一個神話。

  他是谷歌大腦的創始人,是MapReduce、BigTable、Spanner等分布式系統的設計者,是TensorFlow的締造者。

  在程式設計師圈子裡流傳著無數關於他的「查克·諾里斯式」笑話:

  「當傑夫·迪恩提交代碼時,編譯器會向他道歉。」

  「傑夫·迪恩不需要編譯器,他直接寫二進位機器碼。」

  「光速在真空中是常數,是因為傑夫·迪恩還沒優化它。」

  他是真正的「代碼之神」,是谷歌技術帝國的基石。

  ……

  電話接通,那頭傳來傑夫·迪恩冷靜而富有磁性的聲音。

  「大衛,現在是凌晨一點。如果不是AlphaGo有了自我意識,或者地球即將毀滅,你最好給我一個合理的解釋。」

  「傑夫,別睡了!快看我發給你的郵件!我們可能錯過了一個億!」大衛的聲音都在顫抖,「不,是錯過了一個時代!」


  十分鐘後。

  傑夫·迪恩坐在家裡的書房,盯著屏幕上的論文和Demo數據。

  他的眼神,從最初的睏倦,逐漸變得銳利,最後變成了震驚。

  作為系統架構的大師,他看到的不僅僅是算法的精妙,更是其背後對計算範式的顛覆。

  「這個中國人……他繞過了矩陣。」

  傑夫·迪恩喃喃自語。

  「現在的AI,本質上是建立在矩陣乘法之上的。無論是GPU還是我們引以為傲的TPU,其底層邏輯都是為了加速矩陣運算。」

  「但是這個SLRM……」

  傑夫·迪恩的手指在桌面上輕輕敲擊。

  「它的核心是幾何求交和非線性變換。這些操作在現有的TPU上跑,效率極低。TPU那龐大的脈動陣列會因為無法填滿數據而空轉。」

  「這意味著,如果我們想大規模部署這個模型,我們現有的硬體架構……全是廢鐵。」

  這對於谷歌來說,是一個災難性的結論。

  要知道,谷歌為了TPU項目,已經投入了數千名工程師和數百億美元。TPUv4剛剛部署到數據中心,TPUv5正在流片。

  現在,突然有人告訴他:你們的路走窄了。

  「馬上召開戰略會議。」傑夫·迪恩拿起電話,聲音不容置疑,「通知皮查伊,還有DeepMind的哈薩比斯。所有人,立刻上線。」

  ……

  第二天,谷歌最高級別的戰略會議室。

  會議室里的氣氛,冷靜得近乎壓抑。

  這裡坐著的,是谷歌技術體系的最高大腦:桑達爾·皮查伊(CEO)、傑夫·迪恩(首席科學家)、戴密斯·哈薩比斯(DeepMind創始人)。

  屏幕上投射的,正是徐辰的那篇論文。

  「結論?」皮查伊的聲音聽不出情緒。

  傑夫·迪恩推了推眼鏡,指著架構圖上的核心模塊:「從數學上講,這是完美的。它繞過了Transformer最大的缺陷——注意力機制的計算冗餘。它用幾何關係替代了注意力權重,這讓邏輯推理變成了『查表』而不是『計算』。」

  「但是,」傑夫的話鋒一轉,切中了商業邏輯的要害,「這對我們現有的基礎設施,是一個災難。」

  「解釋一下。」

  「我們的TPU,其核心架構是脈動陣列。這種架構是為了大規模矩陣乘法而生的。它就像是一個巨大的流水線工廠,只有當數據像洪流一樣整齊劃一地流過時,效率才最高。」

  傑夫調出一張對比圖:

  「但徐辰提出的SLRM模型,其核心算子是極值、交集和隨機採樣。這些操作充滿了條件判斷和非線性變換。」

  「如果讓TPU跑這個,就像是讓一輛F1賽車去送外賣。賽車很快,但它在紅綠燈和樓道里會卡死。我們的TPU利用率會從70%暴跌到5%以下。」

  會議室陷入了死寂。

  這意味著,谷歌引以為傲的算力護城河,在這個新算法面前,失效了。

  「英偉達呢?」哈薩比斯突然問道,「他們的GPU會好一點嗎?」

  「好不到哪去。」傑夫搖頭,「CUDA核心雖然比TPU靈活,但本質上也是單指令多線程架構,依然依賴數據並行。面對這種高維幾何邏輯,GPU的緩存命中率會低得令人髮指。」

  皮查伊的手指輕輕敲擊著桌面。

  作為CEO,他看到的不是技術難題,而是戰略危機,也是戰略機遇。

  「如果這個算法是真的,那麼誰先造出適合它的硬體,誰就定義了下一代AI。」

  皮查伊抬起頭,目光銳利:「成立『幾何計算』專項組。DeepMind負責算法復現,硬體團隊立刻評估TPU v6架構調整的可能性。

章節目錄