第154章 AGI

投票推薦 加入書籤 小說報錯

  第154章 AGI

  大賽結束之後,周的除了每周固定前往Aetos的聯合實驗室,其他時間都泡在自己的實驗室里。

  在這期間,他們實驗室又多了一位學生,主要的研究方向也相當的硬核,搞的是晶片研究,說實話,周昀也很好奇,為什麼這樣的人才會在一個雙非,倒是又給他撿到漏了。

  不過搞晶片也是需要硬體的,就算周昀現在有能力買,他也沒那個時間,乾脆把新來的學生扔到Aetos聯合實驗室里去了,反正那裡設備非常充足。

  至於為什麼周昀沒時間,是因為他最近在搞一個非常NB的東西,這個東西要是搞出來,改天換地都是輕的了。

  沒錯,就是周昀一直夢想實現的AGI。

  之所以費這麼大的力氣搞Aetos,就是覺得憑藉現有的模型架構和軟硬體系統,很有可能永遠都無法承載真正的AGI。

  而Aetos,就是他為新一代AGI量身打造的新載體,GPU架構本質上是為大規模、規則、高度並行的數值計算優化的,計算核心雖然數量龐大,但結構相對單一,控制邏輯簡單,面對AGI所需要的複雜且混合了多種模態的計算任務時,GPU的固定流水線和內存hierarchy會帶來巨大的效率損耗和編程複雜性,這就非常依賴於模型的架構,模型架構優秀,性能就好,架構不優秀,性能就差。

  而Aetos的統一內存架構和極細粒度任務調度,正是為了應對這種「計算混沌」而生的,AGI的「思維」過程,可能間在感知、記憶提取、邏輯推理、情感模擬等不同模式間切換,需要硬體資源能夠像水一樣靈活地流動和重組,Aetos允許將不同類型的計算單元無縫地整合在同一個內存空間下,由運行時系統根據任務特性動態分配資源,實現「需要什麼,就分配什麼;哪裡需要,就分配到哪裡」的理想狀態,這對於降低AGI訓練和推理的能耗、提升其應對複雜場景的敏捷性至關重要。

  不過這都是周昀的假設,但他有一種預感,肯定能成功。

  隨著Aetos的不斷疊代更新,功能也越來越完善,雖然依舊受制於硬體,但是因為其獨特的優勢,光從軟體層面已經非常好用了,像是AMD,英特爾這些廠商還會專門在開源本版上做優化,就像是遊戲廠商對遊戲引擎進行個性化的改造一樣。

  而有了如此承受的工具,周的的研究也快要有結果了。

  比賽結束後的第三個月,實驗室里,周的看著控制欄里輸出的結果,嘴角久違的揚起了笑容。

  神經擬態網絡,這就是他這幾個月的研究成果,簡稱NDN。

  這個架構的靈感,直接源於他對人類大腦神經網絡的理解,與當前主流Transformer模型那種依賴固定前向和反向傳播路徑的結構截然不同。

  它的基本單元被稱為「動態神經元」,與人工神經網絡中簡單的加權求和再激活的函數單元不同,每一個「動態神經元」都是一個具備一定自主性的計算代理,它內部封裝了多種計算模式,並能根據輸入信號的模式、強度和上下文,動態選擇最合適的處理方式,甚至微調自身的激活閾值和輸出函數,這模仿了生物神經元在神經調質影響下改變自身興奮性的能力。

  簡單來說就是把生物裡面神經元那一套搬到了電腦上,當然,可能不是照搬。

  不過單個「動態神經元」的能力確實有限,甚至可以說「愚鈍」,但NDN的特殊在於它們之間的連接與組織方式。

  他拋棄了傳統的層狀結構,取而代之的是一種受大腦皮層功能柱和全局工作空間理論啟發的「動態功能集群」機制,無數個「動態神經元」通過Aetos硬體提供的極致通信帶寬,形成一個巨大的、扁平的連接池,當處理特定任務時—一比如識別一個圖像中的貓,或者理解一句話中的反諷相關的神經元不會按照預設的層級被激活,而是通過一種自發組織的方式,臨時聚合成一個高效的、專用於該任務的」

  微電路」或「功能集群」,這個聚合過程,極度依賴於Aetos的極細粒度任務調度能力,想要用CUDA實現,麻煩不說,而且還未必能達到一樣的效果。

  而且按照實驗結果來看,當「動態神經元」的數量增加時,其性能不是傳統深度學習中觀察到的指數律提升,而是出現了一種幾何倍增式的跳躍。

  而當數量達到一定程度的時候,整個模型則會開始出現一種抽象推理和知識遷移的能力,不過這種能力還很弱,還需要時間優化修改,但是也足以看出,其巨大的潛力!

  於此同時,沉寂了幾個月的英偉達也有動作了,畢竟再不搞點動靜出來,股價都得跌到底了。


  老黃,作為技術高超的刀法大師,因為Aetos的出現,也不得不稍稍調整一下自己的刀法了。

  大洋彼岸,矽谷的心臟地帶,英偉達的年度大會GTC正在舉行,本來不應該是在這個時間點的,但是礙於Aetos給的壓力實在太大,只好提前了。

  會場內,聚光燈下,身著標誌性皮衣的黃仁勛登台。

  隨著大會的進行,老黃宣布了第一款產品——DGXSpark,這台被譽為「世界上最小的AI超級計算機」,性能卻高達1petaflop,並能在一台桌面設備上本地微調高達700億參數的模型。

  但是想都不用想,這種東西肯定對華國有限制。

  緊接著,老黃將話題引向了當下最炙手可熱的領域——AI推理。

  「我們的對手給了我們不小的壓力,但也在關鍵技術上為我們給了我們不少提示。」他坦言,這裡的「對手」顯而易見。

  他宣布推出專為AI推理打造的BlackwelIUItraGPU。與主要用於模型預訓練的前輩A10O、H100不同,BlackwellUltra明確定位為「AI模型推理打造」,同時兼顧訓練和多場景AI應用的高效性。

  「然而,強大的晶片需要同樣強大的神經系統」。」老黃話鋒一轉,介紹了新型AI推理服務軟體Dynamo,他解釋道,Dynamo能夠協調和加速數千個GPU之間的推理通信,並使用分解服務將大型語言模型的處理和生成階段分離在不同GPU上,確保最大程度地利用GPU

  資源。

  老黃認為,從過去一年的行業發展進程來看,預訓練為主的ScalingLaw法則已走入「誤區」,未來,AgenticAI(智能體AI)將代替生成式AI,成為行業新的發展方向,由於AgenticAI強調自主性與複雜問題解決能力,其每一步解決複雜問題、分解任務的邏輯思考過程都需要用到「模型推理」,因此推理將成為新階段的核心動力,其所催生的算力需求規模可能「輕鬆超過去年估計的100倍」。

  之後他又介紹了IsaacGROOTN1—專為人形機器人設計的基礎模型,NVIDIASpectrum—X和NVIDIAQuantum—X矽光網絡交換機則是展示了英偉達在基礎設施層面的野心,這是英偉達首次利用「光電共封裝技術」將光通信直接集成到交換機上推出的商用化矽光交換機產品,他們希望通過此舉突破超大規模和企業網絡的傳統限制,為目前萬張、十萬張GPU的數據中心向百萬張GPU的AI工廠過渡奠定基礎。

  大會最後,老黃預告了下一代Rubin架構,其RubinGPU算力性能約為BlackweIIUItraGPU的5倍,並將用上HBM4、HBM4E先進AI內存,繼Rubin架構之後,黃仁勛現場公布下一代GPU架構的命名為「Feynman」,取自著名物理學家理察·費曼,Feynman架構產品將於2027年發布。

  原本下一代Rubin架構的性能並不會提升這麼多,而現在則是達到了驚人的五倍。

  GTC作為世界矚目的發布會,消息自然很快傳到了國內,英偉達強大的技術力毋庸置疑,自然多出了不少質疑Aetos的人。

  不少論壇都出現了質疑的帖子。

  「我參加了破壁者大賽,真心佩服Aetos的技術,但比賽結束,回到公司,老闆問我:新項目,用Aetos一個月能出原型,還是用CUDA一個星期能上線?」

  我怎麼答?我只能選CUDA,不是因為更好,而是因為習慣了,而且英偉達的Dynamo推理框架據說能把成本降到傳統方案的30%以下,我們光是解決Aetos的編譯問題就可能要花掉30%的開發時間,理想不能當飯吃。」

  「沒錯!而且英偉達已經構建了一個從晶片到系統,再到軟體的完整閉環,Aetos如何對抗他們?我看吃棗藥丸!」

  質疑的聲音越來越多,畢竟Aetos聯盟除了搞了一個大賽,確實沒展現出什麼實質性的東西,而隨著大賽熱度過去,Aetos生態的人數也明顯下降了一截,不過即使如此,也還有不少人支持Aetos生態。

  面對外界愈演愈烈的質疑,Aetos聯盟迅速召集了一次核心成員內部會議。

  「情況不容樂觀,GTC之後,我們的社區活躍度下降了15%,新註冊開發者增長率放緩,很多觀望中的企業客戶明確表示,要等看到我們更成熟的商業案例和更穩定的性能表現後,才考慮投入資源,這都不是最重要的,主要是輿論上,我們很被動。」


  「而且光是從GTC上我們就能看的出來,他們新一代的技術參考了不少我們的技術,結果卻一點沒提,真是無恥!」

  「我們是不是應該發起一些輿論反擊?至少要點明他們在概念上的借鑑」?」有人提議。

  「沒錯,咱們比賽一結束,他們就發布新產品,真的是好難猜啊!」

  主位上的徐總,作為這段時間的輪值主席敲了敲桌子:「大家安靜一下,狗咬了我們難道我們還要咬回去?不過反擊肯定是要反擊的,周博士,你怎麼看?」

  要說對策他們也有一些,不過據他所知,周昀這段時間除了搞研究,還和AMD

  在商量什麼,所以想先聽聽他的建議。

  周昀笑了笑:「徐總說得對,不過對策,大家也應該馬上會收到消息,那我就提前說了?」

  說著他看向AMD的代表,後者點了點頭。

  「最近,我們正在和AMD合作,推進一個項目,不過主要是聚焦在優化AMD消費級顯卡,也就是遊戲卡的驅動程序上,眾所周知,這是AMD長期以來最被玩家詬病的一點,驅動不穩定、性能調度保守、新特性跟進慢。」

  會場裡響起一陣低低的議論聲,不少人露出疑惑的表情。這和應對英偉達的壓迫感似乎關係不大?

  「大家可能覺得這和這次的事情沒什麼關係,但我要說的是,大多數沉默的用戶才是基本盤,而發聲的其實還是少部分,但是這少部分的人里,大部分用戶其實都是消費級顯卡的用戶,所以我們只要讓他們的體驗變好了,輿論自然反轉,而且這也是一次比較直觀的技術展示,遊戲性能是普通用戶最能直觀感受到的指標,成功優化遊戲驅動,比我們發布十篇論文更能讓大眾理解Aetos技術的實用價值和強大之處,當遊戲玩家和開發者都看到Aetos技術在解決實際工程難題上的威力時,自然會有人思考:這項技術能否用到我的領域?

  這會為我們吸引來自遊戲開發、虛擬實境、實時仿真等更廣泛領域的開發者和合作夥伴,極大豐富我們的應用生態。」

  說完他看了眼手錶:「我沒記錯的話,現在發布會應該開始了吧?要不大家一起看一看?」

  周昀的話音剛落,會議室的巨大顯示屏便應聲亮起,畫面切入AMD發布會現場。

  AMDCEO正站在舞台中央,背景是深邃的科技藍和醒目的AMD標識,「各位朋友,歡迎來到發布會現場,今天我們不僅將展示新一代Radeon顯卡的卓越性能,更重要的是,我們將共同見證一次軟體體驗的革命性飛躍!

  我們深知,長期以來,部分用戶對我們的軟體體驗,特別是驅動程序的穩定性和性能調度,抱有疑慮,今天,我們將用實際行動,徹底扭轉這一刻板印象!」

  舞檯燈光聚焦,大屏幕上出現了「AMDSoftware:AdrenalinEdition

  withAetosRuntime」的醒目字樣。

  >

章節目錄