第301章 真理的啟迪者 三

投票推薦 加入書籤 小說報錯

  稍微適應了一下升級後的大腦,徐辰估摸著DeepSeek的論文應該是發出來了。

  他打開電腦,熟練地登錄arXiv,輸入了關鍵詞。

  果然,那篇論文赫然在列。

  徐辰在公寓裡下載了這篇論文,仔細研讀了一遍。

  論文的核心原理極其驚艷,直擊當前大語言模型(LLM)的軟肋:現有的Transformer架構雖然通過MoE(混合專家)實現了「條件計算」,但缺乏原生的知識查找機制。

  當模型需要回憶一個靜態事實的時候,比如「巴黎是法國的首都」,它只能通過消耗寶貴的注意力機制和前饋網絡層去「重新計算」和「模擬提取」。這就像是讓一個頂級數學家去死記硬背電話號碼,極大地浪費了推理算力。

  而DeepSeek給出的解法,正是「條件記憶」。

  他們引入了一個名為「Engram(記憶印跡)」的模塊,將經典的N-gram嵌入現代化,實現了O(1)時間複雜度的常數級知識查找。簡單來說,模型不再需要死記硬背,而是學會了「查字典」。

  論文中還提出了一條「U型縮放定律」,證明了將大約20%到25%的稀疏參數分配給Engram模塊時,模型性能達到最優。更恐怖的是,由於Engram的查找是確定性的,它完全可以繞開昂貴的GPU顯存(HBM)限制,直接從廉價的主機內存(DRAM)中進行運行時預取,幾乎沒有額外的性能開銷。

  「幹得漂亮。」

  徐辰看著論文裡的架構圖,暗自點頭。

  以他升級後的信息學LV2的眼光來看,梁文鋒的這個成果,和系統當初給出的那個完美的D-LTMN方案相比,其實做了一些工程上的妥協。

  系統方案更偏向於底層硬體架構的微調,而DeepSeek則是在現有的GPU集群和Transformer框架下,做到了軟體層面的極致壓榨。

  「這算是……系統方案的『青春版』?」

  徐辰摸了摸下巴。

  但這已經足夠驚艷了。

  不出意外,這篇論文將在接下來的幾個月里,成為整個AI界討論的焦點。

  ……

  徐辰猜得沒錯。

  此時的曼哈頓下城,摩根史坦利大樓。

  高級分析師約翰·史密斯正對著電腦屏幕發呆,手裡那杯昂貴的冷萃咖啡已經在那兒擺了半個多小時,冰塊化了一半,也沒動一口。

  屏幕上是一份還沒寫完的研報草稿——《英偉達:算力帝國的黃昏還是黎明?》。

  約翰感覺自己的頭髮都要掉光了。

  現在的華爾街,簡直就是個精神分裂的瘋人院。

  一方面,整個美股全靠那幾隻科技巨頭撐著,尤其是英偉達,簡直就是全村的希望。只要AI的故事還在講,只要大模型還需要燒錢買卡,納斯達克就能接著創新高,大家的年終獎就有著落。

  如果英偉達倒了,AI泡沫破裂,美股大盤就會瞬間崩盤,引發系統性的金融危機。到那時,不僅他的飯碗保不住,整個華爾街都要排隊去跳樓。

  所以,上頭的指令很明確:「看多!必須看多!不能讓泡沫破了!」

  但另一方面,現實的數據卻像是一記記響亮的耳光。

  年初那個中國小子搞出來的SLRM架構,已經讓訓練端對GPU的需求砍了一半。現在好了,DeepSeek又搞出了個Engram,直接在推理端把顯存需求給廢了!

  「這日子沒法過了……」

  他在研報里敲下了一段極其糾結的文字:

  【……我們注意到,近期來自中國研究團隊的SLRM架構與Engram模塊,在優化大語言模型(LLM)的KV Cache顯存占用及推理計算量方面取得了顯著進展。這表明,在純文本推理端,算力邊際成本遞減的趨勢正在加速。】

  【基於DCF(現金流折現)模型及對未來三年TAM(總潛在市場)的重新評估,我們預計北美四大雲服務商(CSP)在純文本推理端的Capex(資本支出)增速將出現拐點。Engram架構的O(1)常數級查找特性,實質上打破了『顯存牆』的物理限制,導致單Token的算力與顯存成本呈斷崖式下降。因此,我們將英偉達2026財年的營收預期下調12%,目標價由145美元下調至115美元。】


  寫完這段,約翰又覺得太悲觀了,可能會被老闆罵「唱空美股」。

  於是他又加了一句找補的話:

  【當然,如果考慮到未來AI應用場景的爆發式增長,市場總需求的急劇膨脹將完全對沖單Token算力成本下降帶來的負面影響,英偉達的算力護城河依然深不可測。因此,我們維持『增持』評級。】

  看著屏幕上這段文字,約翰自己都覺得滑稽。

  一邊大幅下調目標價,一邊又給出「增持」評級,這簡直就是赤裸裸的精神分裂!

  但是作為華爾街的分析師,他根本沒辦法。

  他既要閉著眼睛吹捧美國AI產業蒸蒸日上,以保住當前脆弱的股市大盤和自己的飯碗;又要面對英偉達不斷累積的產業崩盤風險,在研報里留下足夠的「免責聲明」,免得日後泡沫破裂時被憤怒的投資者起訴欺詐。

  其實,不僅僅是華爾街,現在的美國到處都在上演著這種「精神分裂」的荒誕劇。比如華盛頓那幫政客,美聯儲一邊聲嘶力竭地喊著維持高利率抗擊通脹,財政部一邊卻又在瘋狂發債印鈔,往市場裡大肆放水。

  這種極度擰巴的現象,歸根結底,核心矛盾只有一個——美國的真實科技與金融實力已經開始不可逆地衰退,但為了維持全球霸權,外部的宣傳和資產定價卻必須死死撐住,絕不能露出半點疲態。

  里子已經千瘡百孔,但面子還得硬撐。這就是約翰,也是整個華爾街此刻面臨的死局。

  ……

  然而,就在華爾街還在糾結怎麼「圓謊」的時候,有人已經動手了。

  對於幻方量化(DeepSeek母公司)的交易團隊來說,技術突破不僅僅意味著發論文,更意味著——暴利。

  早在論文發布的前一周,他們就已經通過複雜的期權組合,在離岸市場上悄悄建立了大量的英偉達空頭頭寸。

  當論文發出的那一刻,也就是收網的時候。

  納斯達克開盤。

  英偉達(NVDA)的股價,在盤前交易階段就跳空低開了5%。

  開盤後,更是如自由落體般一路向下,短短半小時內蒸發了近千億美元的市值。

  交易大廳里,哀鴻遍野。

  「該死!DeepSeek這幫人簡直是強盜!」

  一個交易員憤怒地摔了鍵盤,「他們一邊發論文砸盤,一邊在期權市場上做空!這簡直是降維打擊!技術碾壓就算了,金融手段也這麼狠!」

  「聽說幻方那邊的空單已經翻了三倍了!這幫搞量化的,簡直比搶銀行還快!」

  恐慌情緒迅速蔓延。

  原本還在觀望的機構紛紛拋售,英偉達的股價一度跌破了關鍵支撐位。

  幾位交易員癱坐在椅子上,不禁發出了靈魂拷問:

  「上帝啊,到底誰才是科技強國?到底誰才是金融強國?」

  「我們建了那麼複雜的金融衍生品,不就是為了收割全世界嗎?怎麼現在反過來被中國人用技術加金融的雙重手段給收割了?這劇本不對啊!」

  ……

章節目錄