第129章 Aetos

投票推薦加入書籤小說報錯

第129章 Aetos

「啟智』的試驗還在繼續，期間也不用周昀每天盯著，不過他也不會閒著。

雖然只有他和陳默兩個人，但也還是在九月底的時候完成了第一個版本的Aetos，Aetos就是周昀計劃替代CUDA的生態。

當然，現在還遠遠做不到CUDA那樣強大。

在陳默完成了矩陣運算的TiIe分割的攻克之後，VO.1版本的Aetos就有了最為趁手的解決工具。

而在進行了一系列的算子重寫之後，Aetos可以實現讓一些非英偉達的顯卡做到與之相同的矩陣運算速度。

但畢竟只是兩個人做的，功能非常少，現如今能做到的只有一些核心基礎算子，比如ReLU、Sigmoid、Tanh等激活函數，以及加法、乘法.

還有求和、求最大值，矩陣轉置，不過最為核心的還是GEMM，也就是通用矩陣乘法，而GEMM是深度學習、科學計算等領域的絕對計算核心。

掌握了它就代表他們完成了從零到一的突破。

為此他們還專門寫了一個專用的編譯器，能將某種形式的計算描述轉換成高度優化的GPU的機器代碼，而這個機器代碼可以適配不同的GPU核心，比如AMD，英特爾，還有國產的。

簡單來說，通過Aetos，可以實現在AMD平台上訓練出一個簡單的深度學習模型，例如輕量級的CNN、LSTM、DNN等等。

這在以前是很難想像的，最重要的就是其運算速度可以接近甚至持平在同級別N卡上用CUDA跑的效果，這都是Tie分割所帶來的效果，讓其足以彌補硬體上的差距。

除了這些優點，缺點自然也是有的，比如他現在還無法直接運行為CUDA編寫的現有代碼，還無法兼容PyTorch、TensorFIow等主流框架，同時也缺少CUDA提供的成千上萬個高度優化的庫，如cuDNN，cuBLAS，cuFFT，缺乏NVIDIANsight那樣強大的性能分析、調試工具，而且現在的Aetos優化主要集中在AI和線性代數計算上，對圖形、物理模擬等其他通用計算任務的支持非常有限或尚未開發。

而且哪怕是坐到了這種程度，就算工程師們知道你的東西是自己，勉強能用，但也不會捨棄已經非常成熟的CUDA，除非是玄武』這種國家級別的項目，為了做到完全自研，才會去做這種費力不討好的事情。

這也能看的出來，想要構建一個完整的生態是多麼的困難。

而此時，正是Aetos在大眾面前的第一次亮相。

因為之前參加了玄武』項目，周昀在接下來的幾年之內都不能出國，NeurIPS之類的會議他自然是沒法去了，國外的主會場去不了，國內的NeurIPS線下論文分享會卻是邀請了周昀。

周昀作為一個年輕學者，在NeurIPS連續發表六篇論文，並且每一篇質量都極高，自然會引起學術圈的注意。

他也答應了，他正愁著該怎麼宣傳Aetos，一個良好的技術生態或者是平台，開源永遠都是疊代最快的方式。

而所謂NeurIPS線下論文分享會，主要是為了國內人工智慧領域的學者、研究人員、

學生以及從業者提供一個高質量的學術交流平台，因為NeurIPS主會場在國外，很多人不能親臨，這才有了這個線下討論會，也是為了能讓國內的AI社區成員也能近距離接觸和討論最前沿的AI研究成果。

線下交流會的第二天，報告廳內，周昀在為大家講解他發表在NeurIPS上的論文。

報告廳內座無虛席，周昀站在講台後，身後的巨幕投影著論文的整體框架圖，他則是指著屏幕，不急不緩地講解著自己的工作。

台下，來自各大高校、研究所和企業的專家學生們還不時有人舉起手機拍下照片。

隨後的提問環節，周昀都一一作答。

到了這個階段，這場報告的預定時間才過了一半，不少人都覺得這可能是安排上的一個失誤，周昀卻是微微笑道：「感謝各位的問題，關於這篇論文的內容就到這裡，接下來的時間，我想分享一下我們實驗室最近的一個工作，相信各位肯定會感興趣的。」

這個環節也是提前和主辦方說好的。

不過台下的人並不知情，泛起些騷動，大家的好奇心都被勾了起來，畢競隨著周昀論文引用量的不斷增加，他在學術圈的名氣也是越來越大，至少在多模態這個領域，多數人都看過他的論，他的幾篇論，都對多模態模型的發展做出了巨大的貢獻。

周昀操作電腦，投影畫面切換，一個LOGO出現在屏幕中間，Aetos，下方則是一行小字AGPUComputingEcosystemforEveryone。

「在過去幾個月里，我和我的學生，完成了一個非常創造性的工作，」周昀的目光掃過台下，朝著陳默點了點頭，眾人也看向這個有些拘謹的男孩。

「就是大家看到的這個，我們稱之為Aetos，目標是構建一個不依賴於特定硬體廠商的高性能GPU計算生態。「

話音落下，台下響起一陣陣議論。

GPU計算？生態？這兩個詞組合在一起，尤其是在當前的技術背景下，其指向性再明確不過CUDA和英偉達的統治地位。

周昀也不意外大家的反應，只是繼續自己的報告，PPT翻頁：「為了實現這個目標，我們主要做了兩件事：

第一，設計了一套新的中間表示（IR）層；

第二，創建了一個專用的編譯器，負責將高級計算描述通過這套IR，最終轉換為高度優化的且能適配不同GPU架構的機器碼。

傳統的CUDA代碼，其內核的編寫方式與NVIDIAGPU的硬體特性，如線程層級結構、內存模型深度綁定，這使得它為N卡帶來了極致性能，但也導致了其天然的封閉性。

Aetos的IR層，試圖站在一個更高的角度去描述計算本身，而不是如何映射到硬體，它更關注的是「要計算什麼'，比如一個矩陣乘法的數據維度、依賴關係、並行粒度，而不是具體有多少個ThreadBlock或Warps。」

隨後他展示了一個簡單的GEMM在AetosIR中的表示方式，它看起來更像是一個數學表達式和數據依賴圖的結合體，幾乎沒有硬體特定的術語。

「這套IR是我們整個生態的基石，它就像普通話，而我們支持的各種GPU架構，就像是說不同方言的人，我們的編譯器，就是一個優秀的翻譯官。「

溫馨提示：按回車[Enter]鍵返回書目，按 ←鍵返回上一頁，按 →鍵進入下一頁，加入書籤方便您下次繼續閱讀。