第206章 AI界的反應 一
楊老的新聞如同一場及時雨,徹底洗刷了國內關於「造神」的質疑。
徐辰的生活也重新歸於平靜,每天穿梭在圖書館和實驗室之間,靜靜等待著那些投遞出去的論文開花結果。
但他並不知道,在大洋彼岸,一顆被他半個月前隨手種下的種子,終於迎來了發芽的時刻。
……
時間來到9月9日。
這一天,,對於鎂國的AI行業來說,是註定載入史冊的「黑色星期二」,儘管大眾對此一無所知。
加州山景城,谷歌總部。
深夜十一點,Google Brain的實驗室里依舊燈火通明。
高級研究員大衛·陳正百無聊賴地刷著arXiv。作為一名負責Gemini模型推理優化的工程師,他最近的日子並不好過。OpenAI的GPT-5依然像一座大山壓在頭頂,而Meta的LLaMA系列又在開源社區瘋狂背刺,谷歌這個曾經的AI霸主,如今卻顯得有些步履蹣跚。
「又是這種標題黨……」
大衛看著屏幕上一篇名為《Logic Is Also You Need》的論文,撇了撇嘴。
自從《Attention Is All You Need》火了之後,這種蹭熱度的標題簡直泛濫成災。
「作者……徐辰?」
大衛愣了一下。
「這名字怎麼有點眼熟?好像是那個搞定哥德巴赫猜想的數學天才?」
出於好奇,也是出於對數學天才的一絲敬意,他沒有直接划走,而是點開了PDF。
原本只是想隨便掃兩眼,看看數學家是怎麼「玩票」AI的。
然而,十分鐘後。
大衛的坐姿從葛優癱變成了正襟危坐,眼睛死死地盯著屏幕上的公式。
「Gumbel-Box幾何嵌入……邏輯門控單元……這思路,有點野啊。」
作為資深從業者,他一眼就看出了這個架構的精妙之處。它沒有試圖去修改Transformer的主幹,而是像外掛一樣,巧妙地利用幾何約束來修正概率生成。
「這玩意兒……能跑通嗎?」
職業習慣讓他立刻打開了Colab,按照論文裡的偽代碼,手搓了一個極簡版的Demo。
雖然沒有經過大規模訓練,參數也是隨機初始化的,但他只是想驗證一下那個核心的「幾何求交」算子是否真的可導。
但作為大廠員工,上班時間都在忙著優化Gemini的推理延遲,根本沒空搞這種「私活」。
於是,接下來的半個月裡,大衛只能利用下班後的碎片時間,一點一點地復現這個模型。
……
半個月後。
看著屏幕上那條雖然抖動劇烈、但卻頑強向下的Loss曲線,大衛的手開始顫抖。
「臥槽……真的收斂了?!」
他猛地站起身,立刻撥通了傑夫·迪恩的電話。
傑夫·迪恩是誰?
在谷歌,甚至在整個矽谷,這個名字就是一個神話。
他是谷歌大腦的創始人,是MapReduce、BigTable、Spanner等分布式系統的設計者,是TensorFlow的締造者。
在程式設計師圈子裡流傳著無數關於他的「查克·諾里斯式」笑話:
「當傑夫·迪恩提交代碼時,編譯器會向他道歉。」
「傑夫·迪恩不需要編譯器,他直接寫二進位機器碼。」
「光速在真空中是常數,是因為傑夫·迪恩還沒優化它。」
他是真正的「代碼之神」,是谷歌技術帝國的基石。
……
電話接通,那頭傳來傑夫·迪恩冷靜而富有磁性的聲音。
「大衛,現在是凌晨一點。如果不是AlphaGo有了自我意識,或者地球即將毀滅,你最好給我一個合理的解釋。」
「傑夫,別睡了!快看我發給你的郵件!我們可能錯過了一個億!」大衛的聲音都在顫抖,「不,是錯過了一個時代!」
十分鐘後。
傑夫·迪恩坐在家裡的書房,盯著屏幕上的論文和Demo數據。
他的眼神,從最初的睏倦,逐漸變得銳利,最後變成了震驚。
作為系統架構的大師,他看到的不僅僅是算法的精妙,更是其背後對計算範式的顛覆。
「這個中國人……他繞過了矩陣。」
傑夫·迪恩喃喃自語。
「現在的AI,本質上是建立在矩陣乘法之上的。無論是GPU還是我們引以為傲的TPU,其底層邏輯都是為了加速矩陣運算。」
「但是這個SLRM……」
傑夫·迪恩的手指在桌面上輕輕敲擊。
「它的核心是幾何求交和非線性變換。這些操作在現有的TPU上跑,效率極低。TPU那龐大的脈動陣列會因為無法填滿數據而空轉。」
「這意味著,如果我們想大規模部署這個模型,我們現有的硬體架構……全是廢鐵。」
這對於谷歌來說,是一個災難性的結論。
要知道,谷歌為了TPU項目,已經投入了數千名工程師和數百億美元。TPUv4剛剛部署到數據中心,TPUv5正在流片。
現在,突然有人告訴他:你們的路走窄了。
「馬上召開戰略會議。」傑夫·迪恩拿起電話,聲音不容置疑,「通知皮查伊,還有DeepMind的哈薩比斯。所有人,立刻上線。」
……
第二天,谷歌最高級別的戰略會議室。
會議室里的氣氛,冷靜得近乎壓抑。
這裡坐著的,是谷歌技術體系的最高大腦:桑達爾·皮查伊(CEO)、傑夫·迪恩(首席科學家)、戴密斯·哈薩比斯(DeepMind創始人)。
屏幕上投射的,正是徐辰的那篇論文。
「結論?」皮查伊的聲音聽不出情緒。
傑夫·迪恩推了推眼鏡,指著架構圖上的核心模塊:「從數學上講,這是完美的。它繞過了Transformer最大的缺陷——注意力機制的計算冗餘。它用幾何關係替代了注意力權重,這讓邏輯推理變成了『查表』而不是『計算』。」
「但是,」傑夫的話鋒一轉,切中了商業邏輯的要害,「這對我們現有的基礎設施,是一個災難。」
「解釋一下。」
「我們的TPU,其核心架構是脈動陣列。這種架構是為了大規模矩陣乘法而生的。它就像是一個巨大的流水線工廠,只有當數據像洪流一樣整齊劃一地流過時,效率才最高。」
傑夫調出一張對比圖:
「但徐辰提出的SLRM模型,其核心算子是極值、交集和隨機採樣。這些操作充滿了條件判斷和非線性變換。」
「如果讓TPU跑這個,就像是讓一輛F1賽車去送外賣。賽車很快,但它在紅綠燈和樓道里會卡死。我們的TPU利用率會從70%暴跌到5%以下。」
會議室陷入了死寂。
這意味著,谷歌引以為傲的算力護城河,在這個新算法面前,失效了。
「英偉達呢?」哈薩比斯突然問道,「他們的GPU會好一點嗎?」
「好不到哪去。」傑夫搖頭,「CUDA核心雖然比TPU靈活,但本質上也是單指令多線程架構,依然依賴數據並行。面對這種高維幾何邏輯,GPU的緩存命中率會低得令人髮指。」
皮查伊的手指輕輕敲擊著桌面。
作為CEO,他看到的不是技術難題,而是戰略危機,也是戰略機遇。
「如果這個算法是真的,那麼誰先造出適合它的硬體,誰就定義了下一代AI。」
皮查伊抬起頭,目光銳利:「成立『幾何計算』專項組。DeepMind負責算法復現,硬體團隊立刻評估TPU v6架構調整的可能性。
徐辰的生活也重新歸於平靜,每天穿梭在圖書館和實驗室之間,靜靜等待著那些投遞出去的論文開花結果。
但他並不知道,在大洋彼岸,一顆被他半個月前隨手種下的種子,終於迎來了發芽的時刻。
……
時間來到9月9日。
這一天,,對於鎂國的AI行業來說,是註定載入史冊的「黑色星期二」,儘管大眾對此一無所知。
加州山景城,谷歌總部。
深夜十一點,Google Brain的實驗室里依舊燈火通明。
高級研究員大衛·陳正百無聊賴地刷著arXiv。作為一名負責Gemini模型推理優化的工程師,他最近的日子並不好過。OpenAI的GPT-5依然像一座大山壓在頭頂,而Meta的LLaMA系列又在開源社區瘋狂背刺,谷歌這個曾經的AI霸主,如今卻顯得有些步履蹣跚。
「又是這種標題黨……」
大衛看著屏幕上一篇名為《Logic Is Also You Need》的論文,撇了撇嘴。
自從《Attention Is All You Need》火了之後,這種蹭熱度的標題簡直泛濫成災。
「作者……徐辰?」
大衛愣了一下。
「這名字怎麼有點眼熟?好像是那個搞定哥德巴赫猜想的數學天才?」
出於好奇,也是出於對數學天才的一絲敬意,他沒有直接划走,而是點開了PDF。
原本只是想隨便掃兩眼,看看數學家是怎麼「玩票」AI的。
然而,十分鐘後。
大衛的坐姿從葛優癱變成了正襟危坐,眼睛死死地盯著屏幕上的公式。
「Gumbel-Box幾何嵌入……邏輯門控單元……這思路,有點野啊。」
作為資深從業者,他一眼就看出了這個架構的精妙之處。它沒有試圖去修改Transformer的主幹,而是像外掛一樣,巧妙地利用幾何約束來修正概率生成。
「這玩意兒……能跑通嗎?」
職業習慣讓他立刻打開了Colab,按照論文裡的偽代碼,手搓了一個極簡版的Demo。
雖然沒有經過大規模訓練,參數也是隨機初始化的,但他只是想驗證一下那個核心的「幾何求交」算子是否真的可導。
但作為大廠員工,上班時間都在忙著優化Gemini的推理延遲,根本沒空搞這種「私活」。
於是,接下來的半個月裡,大衛只能利用下班後的碎片時間,一點一點地復現這個模型。
……
半個月後。
看著屏幕上那條雖然抖動劇烈、但卻頑強向下的Loss曲線,大衛的手開始顫抖。
「臥槽……真的收斂了?!」
他猛地站起身,立刻撥通了傑夫·迪恩的電話。
傑夫·迪恩是誰?
在谷歌,甚至在整個矽谷,這個名字就是一個神話。
他是谷歌大腦的創始人,是MapReduce、BigTable、Spanner等分布式系統的設計者,是TensorFlow的締造者。
在程式設計師圈子裡流傳著無數關於他的「查克·諾里斯式」笑話:
「當傑夫·迪恩提交代碼時,編譯器會向他道歉。」
「傑夫·迪恩不需要編譯器,他直接寫二進位機器碼。」
「光速在真空中是常數,是因為傑夫·迪恩還沒優化它。」
他是真正的「代碼之神」,是谷歌技術帝國的基石。
……
電話接通,那頭傳來傑夫·迪恩冷靜而富有磁性的聲音。
「大衛,現在是凌晨一點。如果不是AlphaGo有了自我意識,或者地球即將毀滅,你最好給我一個合理的解釋。」
「傑夫,別睡了!快看我發給你的郵件!我們可能錯過了一個億!」大衛的聲音都在顫抖,「不,是錯過了一個時代!」
十分鐘後。
傑夫·迪恩坐在家裡的書房,盯著屏幕上的論文和Demo數據。
他的眼神,從最初的睏倦,逐漸變得銳利,最後變成了震驚。
作為系統架構的大師,他看到的不僅僅是算法的精妙,更是其背後對計算範式的顛覆。
「這個中國人……他繞過了矩陣。」
傑夫·迪恩喃喃自語。
「現在的AI,本質上是建立在矩陣乘法之上的。無論是GPU還是我們引以為傲的TPU,其底層邏輯都是為了加速矩陣運算。」
「但是這個SLRM……」
傑夫·迪恩的手指在桌面上輕輕敲擊。
「它的核心是幾何求交和非線性變換。這些操作在現有的TPU上跑,效率極低。TPU那龐大的脈動陣列會因為無法填滿數據而空轉。」
「這意味著,如果我們想大規模部署這個模型,我們現有的硬體架構……全是廢鐵。」
這對於谷歌來說,是一個災難性的結論。
要知道,谷歌為了TPU項目,已經投入了數千名工程師和數百億美元。TPUv4剛剛部署到數據中心,TPUv5正在流片。
現在,突然有人告訴他:你們的路走窄了。
「馬上召開戰略會議。」傑夫·迪恩拿起電話,聲音不容置疑,「通知皮查伊,還有DeepMind的哈薩比斯。所有人,立刻上線。」
……
第二天,谷歌最高級別的戰略會議室。
會議室里的氣氛,冷靜得近乎壓抑。
這裡坐著的,是谷歌技術體系的最高大腦:桑達爾·皮查伊(CEO)、傑夫·迪恩(首席科學家)、戴密斯·哈薩比斯(DeepMind創始人)。
屏幕上投射的,正是徐辰的那篇論文。
「結論?」皮查伊的聲音聽不出情緒。
傑夫·迪恩推了推眼鏡,指著架構圖上的核心模塊:「從數學上講,這是完美的。它繞過了Transformer最大的缺陷——注意力機制的計算冗餘。它用幾何關係替代了注意力權重,這讓邏輯推理變成了『查表』而不是『計算』。」
「但是,」傑夫的話鋒一轉,切中了商業邏輯的要害,「這對我們現有的基礎設施,是一個災難。」
「解釋一下。」
「我們的TPU,其核心架構是脈動陣列。這種架構是為了大規模矩陣乘法而生的。它就像是一個巨大的流水線工廠,只有當數據像洪流一樣整齊劃一地流過時,效率才最高。」
傑夫調出一張對比圖:
「但徐辰提出的SLRM模型,其核心算子是極值、交集和隨機採樣。這些操作充滿了條件判斷和非線性變換。」
「如果讓TPU跑這個,就像是讓一輛F1賽車去送外賣。賽車很快,但它在紅綠燈和樓道里會卡死。我們的TPU利用率會從70%暴跌到5%以下。」
會議室陷入了死寂。
這意味著,谷歌引以為傲的算力護城河,在這個新算法面前,失效了。
「英偉達呢?」哈薩比斯突然問道,「他們的GPU會好一點嗎?」
「好不到哪去。」傑夫搖頭,「CUDA核心雖然比TPU靈活,但本質上也是單指令多線程架構,依然依賴數據並行。面對這種高維幾何邏輯,GPU的緩存命中率會低得令人髮指。」
皮查伊的手指輕輕敲擊著桌面。
作為CEO,他看到的不是技術難題,而是戰略危機,也是戰略機遇。
「如果這個算法是真的,那麼誰先造出適合它的硬體,誰就定義了下一代AI。」
皮查伊抬起頭,目光銳利:「成立『幾何計算』專項組。DeepMind負責算法復現,硬體團隊立刻評估TPU v6架構調整的可能性。