第159章 論文發布

投票推薦 加入書籤 小說報錯

  第159章 論文發布

  就在平平無奇的某一天,《破壁論壇》創刊號,封面震撼發布。

  作為Aetos聯盟發布的論文集,論文質量高不高暫且不談,但是熱度這塊,肯定不會低,關注的人自然也不少。

  純黑的封面背景下,是一個散發著幽藍色微光的神經網絡結構圖,封面正中央,寫著這樣一句話—APathway TowardsAGl—scale Intelligence。

  使用英文只是為了方便外國人閱讀,事實上,論文的原始稿件全部都是中文版本。

  而NDN也被發布在了這上面,作者並不是一個人,而是整個Aetos聯合實驗室。

  很快,NDN就掀起了軒然大波,所造成的影響比當時的《attentionisall

  you need》更甚。

  燕京大學,智能計算實驗室,凌晨三點。

  不得不說,包括周昀在內的科研人員總有一個習慣,老是喜歡半夜三更發論文。

  林凡,燕京大學智能計算實驗室的博士後,方向是純AI算法,平時打交道最多的就是Transformer架構,他的博士論文、他正在進行的幾個重點項目,無一例外,基本都是基於Trans

  former架構之上。

  桌邊,一杯冷掉的咖啡旁,散落著幾篇試圖在Transformer基礎上做一些輕微改進的論文草稿。

  就在他揉著發脹的太陽穴,準備再次編譯代碼時,一個偶然彈出的學術社區推送吸引了他的目光——《破壁論壇》?

  怎麼感覺好像在哪裡聽到過這個名字?

  但是具體的他也想不起來了,嘟囔了幾句,順手點開了推送,畢竟科研也得勞逸結合,放鬆放鬆腦子,說不定會有新的思路。

  「APathwayTowardsAGl—scale Intelligence?」他輕聲念出副標題,嘴角下意識地撇了撇,「又一個標題黨。」

  畢竟AGI這個詞,在學術界都快被用濫了,在最近幾年,新出現的架構其實並不算少,而且每一個都號稱超越了Transformer,結果經過試驗之後,很大一部分都是徒有其表,唯一一個還有點看頭的就是mamba架構,但也稱不上顛覆Transformer。

  不過他還是決定看一看,他點開了PDF。

  「Aetos聯合實驗室?原來是這個實驗室!」作為國內熱度一直不小的Aetos

  聯盟,現在在整個計算機圈子裡,基本就沒有不認識的了,他們實驗室有的項目還是用的Aetos提供的方案做的,當他看到作者名字的時候,下意識提起了幾分興趣。

  目光掃過摘要,看到「動態神經元」、「自發功能集群」、「摒棄固定層級」這些字眼時,眉頭微微皺起。

  引言部分匆匆掃了一眼,基本還是那些,他幾乎都能背的出來,無非就是現有的各種架構的缺陷,這已經是一種寫作套路了。

  接下來的方法部分才是重頭戲。

  十分鐘後,他的眼神逐漸專注,半小時後,他沖好了第二杯咖啡,但一口沒喝,眼睛死死盯著屏幕上的數學推導和架構圖,一小時後,他咬著筆尖,思考著論文中的數學公式。

  筆尖在草稿紙上無意識地劃拉著,在他的認知里,神經元就是加權求和、激活函數,是確定性的、可微的、為了反向傳播而存在的組件,而NDN描述的卻完全不是這樣。

  他本能地想否定,但那些用精確的數學語言定義了「動態神經元」的內部狀態空間、模式選擇函數以及參數微調機制告訴他,就是這樣的!

  他嘗試沿著作者的思路進行推導,驚愕地發現,這套看似離經叛道的框架,在數學邏輯上竟然是自洽的!甚至————有一種異樣的美感?

  「這不可能————」他喃喃自語,這篇論文裡的理論完全顛覆了他對神經網絡底層運作方式的認知!

  但是根據論文的邏輯,這些看似顛覆常識的方法卻又符合數學邏輯。

  而且當他看到實驗部分,一條條碾壓基準線、甚至呈現幾何級數差距的曲線映入眼帘時,他只有一個感覺—要變天了!

  數據不會說謊,除非他學術造假,但是這樣一個大型實驗室,完全沒必要吧?

  「難道我們一直走在一條次要的路徑上?」

  對於把大多數精力都放在Transformer架構身上的他來說,打擊無疑是巨大的O

  他在椅子上,目光失焦地望著屏幕,過去幾年裡,他熬夜推導的公式、調試的模型、撰寫的論文,那些曾經讓他充滿成就感的成果,此刻在NDN面前,仿佛都是無用功。

  就好像你修煉了一百年,終於要飛升的時候,有人告訴你,你修煉錯了,你這樣是飛升不了的,而他還沒什麼理由反駁。

  簡單來說,他有點道心破碎了。

  不過,並不只有他一個人有這種感覺,幾乎全球所有的學者,都是差不多的感覺。

  麻省理工學院,某頂尖AI實驗室。

  一位剛剛憑藉Transformer架構改進獲得頂會最佳論文獎的博士生,正志得意滿地準備將成果開源,他順手點開了導師轉發來的NDN論文連結。

  半小時後,他臉上的笑容徹底消失,取而代之的是一種茫然,他環顧實驗室里掛滿的白板,上面密密麻麻都是注意力機制的變體和優化公式,曾經這些都是他的驕傲,但是現在,似乎變的沒什麼意義了。

  矽谷,某研究院。

  一場原定討論下一代千億參數模型架構的早間會議,徹底跑題,巨大的投影屏上展示著NDN的性能曲線圖,會議室里鴉雀無聲。

  一位資深首席科學家猛地將手中的雷射筆摔在桌上,發出「啪」的一聲脆響,打破了沉默。

  「F**k!我們投入幾十億美金,幾千個GPU年,就為了在一條次要道路上比別人快上百分之零點幾?現在呢!」

  歐洲,某大學城的咖啡館。

  一位年輕的助理教授和他的博士生相對而坐,筆記本屏幕上同樣是那篇論文,博士生聲音顫抖:「教授,我明年就要畢業了,我的畢業論文全是基於Transformer的擴展————」

  助理教授苦笑著搖了搖頭,拍了拍學生的肩膀,想說些安慰的話,卻發現自己詞窮,他自己的tenure(終身教職)申請材料里,Transformer相關的工作也是重中之重,但是現在,隨著NDN的提出,恐怕都要作為無用功了。

  從頂尖學府到工業界巨頭,從功成名就的學者到躊躇滿志的青年研究員,同樣的迷茫開始在全球AI圈蔓延。

  對他們來說,NDN的提出,無異於是天塌了。

  好消息:研究有進展。

  壞消息:方向重了。

  但是技術的進步,總歸還是好事,畢竟並不是所有計算機專業的相關研究者都是死摳Transformer架構,大多數人還只是把他當成一個工具而已,既然有更好用的工具提出來,那他們換掉就是。

  僅僅是論文發布的當天晚上,就有研究團隊宣布復現成功了,畢竟論文裡有幾個輕量級的驗證模型,跑起來不費多少時間。

  除了這些學術研究者,要說反應最大的,不是聯盟的幾個大廠,反倒是那些選擇了梭哈的小廠。

  國內某小廠的辦公室。

  「錢總!錢總!爆了!徹底爆了!」

  年輕的助理幾乎是撞開了錢總辦公室的門,舉著平板電腦的手都有些顫抖,臉上漲的通紅。

  錢總正對著一份日常運營報表有些走神,最近一段時間,他表面鎮定,實則內心承受著巨大的壓力,他抬起頭,剛想訓斥下屬的冒失,目光卻落在了助理遞過來的平板屏幕上。

  是最新的新聞,碩大的標題異常醒目:

  【NDN架構橫空出世,Aetos生態概念股全線飆紅!】

  錢總伸向平板的手,在空中停頓了一瞬,他接過平板,手指滑動,又看到了科技版塊的頭條:

  【顛覆性突破!Aetos聯合實驗室發布NDN架構,AGI路徑豁然開朗!】

  【多家國際頂尖實驗室宣布初步復現NDN輕量模型,性能與論文宣稱一致!】

  一條條標題,看的他眼睛越來越亮。

  隨後,他緩緩地靠在了他那張有些舊了的辦公椅背上,抬起手,用力抹了一把臉,手指在眼眶周圍停留了片刻。

  一旁的小助理看情況有些不對,悄咪咪地退出了房間,順便還把門帶上了。

  過了足足有一分鐘,錢總才長長地舒出了一口氣,他再睜開眼時,眼圈有些發紅。

  「賭對了!」

  不過作為商人,他的嗅覺是絕對靈敏的,很快就看到了其中的巨大商機。

  他迅速按下了內部通訊鍵,「通知所有部門負責人,大會議室緊急會議!!!」

  十分鐘後,原本略顯空曠的會議室被擠得滿滿當當。

  錢總沒有廢話,指著投影幕布的NDN論文封面,開門見山:「這個東西也許有人不熟悉,沒關係,我也不熟,但是我知道,憑藉這東西,日後Aetos的生態絕對爆火,因為NDN就是基於Aetos生態的,這就意味著一個足以和CUDA分庭抗禮,甚至在未來碾壓它的新計算生態,正在我們腳下破土而出!

  而我們就是現在是這個生態里,最早入局、押注最重的玩家之一!想必大家都知道這代表什麼。」

  畫餅這個技能,作為公司老闆,他可以說是非常熟練。

  「這是千載難逢的機會!是我們這種小廠商,能夠再進一步的唯一機會!所以,從今天起,公司所有戰略,全部轉向Aetos生態!

  咱們所有的計算卡,都要對Aetos做適配!所有研發人員,分成三班倒,吃透NDN論文,儘快將NDN落地應用。」

  星海」的能力他見過,這樣一個大模型,無論放在什麼領域都不愁賺不到錢,時間才是唯一的阻礙。

  雖然他們公司小,但是該有的部門一個不少,很快在錢總的命令下快速運轉起來。

  消息出來之後,作為現在Aetos聯盟最大的對手英偉達肯定也有所反應。

  英偉達總部會議室里。

  氣氛凝重得能擰出水來,投影上,正清晰地展示著《破壁論壇》的論文封面,以及性能對比圖表。

  老黃坐在主位上,他已經不記得這是今年第幾次因為Aetos開會了。

  之前AMD新驅動的事情,在他看來其實也就是小打小鬧,畢竟消費級顯卡並不是他們最為主要的賺錢領域,但是現在不一樣了,Atos聯盟提出的NDN已經侵犯了他們最為核心的領域—AI。

  老黃看著投影,操作了一下面前的控制器,調出了一張複雜的圖表,上面清晰地標註著英偉達近年來在AI晶片研發上的投入軌跡,以及基於傳統Scaling

  Law對未來性能提升的預測。

  「看看這個,」他的手指重重地點在預測曲線上,「我們投入數百億美金,數千名頂尖工程師,按照這個路線圖,預計在下個季度才能將特定模型的性能再提升可憐的百分之幾十,而他們————」

  他的手指劃向NDN那幾乎垂直的性能曲線,「用一套全新的架構,直接在能效和性能上實現了數量級的跨越!」

  「先生們,這是生存危機,如果NDN被證明是更優的路徑,那麼我們龐大的GPU庫存、我們規劃的下一代晶片、我們賴以生存的CUDA生態————所有這些,價值都可能在一夜之間蒸發大半!」

  這一點他絲毫沒有在危言聳聽,雖然N卡的存世量巨大,但是全球對於他們的不滿早就是寫在臉上了,畢竟沒有什麼人願意給一個壟斷商好臉色,這就意味著,一旦出了問題,他們將面臨的,一定是群起而攻之的場面。

  「沒錯,而且最致命的是能效比,NDN論文裡提到的能耗降低超過60%,在大型數據中心運營中,這意味著天文數字的成本優勢,我們的客戶,那些雲服務巨頭,會毫不猶豫地轉向能給他們省下數十億電費的技術。」

  「我們需要時間!」軟體研究部門的負責人忍不住說道,「我們需要時間去理解、復現、找到應對甚至超越NDN的方法!」

  「時間?」老黃冷笑一聲,「資本市場會給我們時間嗎?我們的客戶會給我們時間嗎?那些嗅覺敏銳的開發者會給我們時間嗎?

  」

  他沒有說下去,但所有人都明白。

  「我不管你們用什麼方法!」老黃站起身「動用一切資源!收購任何有潛力的相關初創公司!挖角他們的核心研究人員!

  我要在三個月內,看到我們自己的下一代動態神經擬態架構」!同時,軟體部門必須立刻開始研究CUDA向此類架構的遷移工具!」

  「如果我們做不到————」他停頓了一下,「那麼坐在這個房間裡的我們,都將是英偉達帝國崩塌的見證者和責任人。

  ,,

章節目錄