第342章 開源即是王炸,全世界都開始使用江神的AI框架?

投票推薦 加入書籤 小說報錯

  當晚九點。

  燕北大學官方圍脖、官方公眾號、官方B站帳號,同時發了一條動態。

  【重磅!由我校江辰院士獨立開發的下一代AI深度學習框架Stellaris,已在GitHub正式開源!】

  【這是目前全球最先進的AI框架,完全免費,歡迎所有開發者下載使用!】

  配圖是GitHub倉庫截圖。

  以及一張江辰在燕北大學圖書館老位置寫代碼的側臉照。

  這張照片是唐若曦夏天拍的。

  畫面里他穿著白襯衫,袖子挽到手肘,手指搭在鍵盤上,屏幕上密密麻麻全是代碼。

  她本來只是覺得好看才拍的,沒想到被學校拿去當宣傳照了。

  動態一發,評論區瞬間就炸了。

  「臥槽?江神自己寫了個AI框架?還開源?」

  「Stellaris?這名字好帥!」

  「我剛去GitHub看了一眼,還真開源了!文檔全是中文加英文雙語的!API寫得清清楚楚!江神牛逼!」

  「等等,你們看介紹了嗎?比TensorFlow先進兩代?真的假的?」

  「江神說比TensorFlow先進兩代,那就是真先進兩代,他什麼時候吹過牛?」

  「也是......人家連哥德巴赫猜想都能證明,區區一個AI框架算什麼。」

  「話不能這麼說,搞框架跟搞數學是兩碼事。TensorFlow背後是股歌幾千個工程師,江神一個人寫的框架,真能打?」

  「能不能打,下載下來試試不就知道了。」

  「對!有沒有兄弟已經跑了的?來說說使用體驗!」

  「我跑了!公司顯卡剛好空著,就拿MNIST數據集試了一下。」

  「說真的,我到現在手還在抖……同樣一個簡單的卷積神經網絡,用TensorFlow訓練要跑二十分鐘,用Stellaris只跑了兩分鐘。」

  「兩分鐘!而且訓練過程中的內存占用不到TensorFlow的四分之一!」

  「臥槽?真的假的?兩分鐘?你確定不是顯卡問題?」

  「同樣的硬體,同樣的數據集,同樣的網絡結構,控制變量法懂不懂?就是框架的優化牛逼!而且我剛才又跑了個Transformer,訓練速度比PyTorch快了將近八倍!八倍啊兄弟們!」

  「我作證!我也剛跑完BERT的預訓練,用TensorFlow加四張顯卡跑了整整兩天一夜。」

  「剛才用Stellaris試了一下,同樣的數據量,只跑了不到五個小時就收斂了!中間還沒崩過一次!全程穩如老狗!這效率簡直離譜!」

  「五個小時?你是認真的嗎?我之前訓BERT訓了整整三天才勉強收斂,你五個小時就搞定了?」

  「騙你幹嘛!GitHub上已經有其他開發者在跑GPT架構的測試了,初步數據更誇張……同樣的參數量,內存占用不到PyTorch的三分之一,訓練速度是PyTorch的十倍以上。」

  「十倍!你知道這是什麼概念嗎?也就是說,以前要花半個月才能訓完的大模型,現在一天就能跑完!」

  「臥槽......真的假的?這框架也太猛了吧?」

  「還有更猛的,你們看文檔里那個LoRA加速模式……在模型微調階段開啟之後,推理延遲能進一步降低到原來的幾十分之一,功耗降低到幾十分之一。」

  「這意味著什麼?意味著以前在手機上根本跑不動的千億參數大模型,現在在手機上直接就能用!離線版ChatGPT,沒網也能跑!(這世界已經有了)」

  「離線版ChatGPT?我的天!這也太離譜了吧!」

  「關鍵是代碼質量,我剛花了一個小時讀了核心調度的那部分代碼,說實話,讀完想哭……真的太優雅了。」

  「江神的代碼風格,就像一個圍棋大師在棋盤上落子,每一處都恰到好處,沒有一行是多餘的。」

  「他寫的不只是代碼,是藝術品。」

  「藝術品+1,我一個阿巴P8的同事看完之後沉默了整整半個小時,然後去陽台抽了半包煙。回來之後說了一句:我這五年寫的都是屎。」


  與此同時。

  東大科技部的官方帳號也轉發了燕北大學的那條圍脖。

  附上了簡簡單單的一句話:

  「祝賀江辰院士,東大AI,未來可期。」

  這條轉發一出,熱度瞬間飆到了頂峰。

  國家級官方媒體的背書,意味著這件事已經不只是技術圈的自嗨,而是上升到了國家戰略的高度。

  各大科技媒體的頭條迅速更換……

  《江辰:從數學天才到AI框架之父》

  《一個人的開源項目,挑戰股歌幾千工程師?》

  《Stellaris到底有多強?全球開發者連夜實測!》

  《東大AI框架橫空出世,燈塔國技術霸權宣告終結?》

  GitHub上,Stellaris倉庫的Star數正在以肉眼可見的速度往上漲。

  兩萬、五萬、八萬,幾乎每刷新一次頁面,數字就跳一大截。

  Fork數也在瘋狂增長,Issue區已經被全世界開發者的反饋和建議塞爆。

  「來自高盧雞的開發者:剛用Stellaris跑完一個圖像識別項目,訓練速度比之前用的任何框架都快了至少五倍。江辰,你是神。」

  「來自D國的博士生:我正在寫畢業論文,研究方向是大語言模型的輕量化部署。Stellaris的LoRA加速模式直接幫我解決了困擾我大半年的性能瓶頸!江院士,請收下我的膝蓋!」

  「來自東大魔都的創業者:我們是個五人的創業小團隊,之前一直用PyTorch,顯卡成本壓得喘不過氣。」

  「現在換了Stellaris,同樣的訓練量,硬體成本直接砍到原來的四分之一。江神,你是我的救命恩人!」

  「來自島國的研究員:我花了整整一天的時間,把Stellaris的底層算子調度代碼從頭到尾讀了一遍。」

  「說實話,讀完之後我在工位上發呆了很久。這種水平的代碼,不是靠『努力』就能寫出來的,這是天賦。或者說,是神啟。」

  短短二十四小時。

  Stellaris的Star數突破三十萬,Fork數突破十萬,登上GitHub全球熱榜第一,而且熱度還在持續攀升。

  這數據,已經超過了TensorFlow當初發布時的首周表現。

  陳小胖躺在床上,左手舉著手機,右手抓著醬板鴨,嘴裡含含糊糊地念叨著:

  「四十萬了,四十萬了!江神,這簡直是屠榜啊!」

  隔壁床的李默早已不見人影,正坐在電腦前,屏幕上開著Stellaris的官方文檔,一邊看一邊往筆記本上記東西,嘴裡還念念有詞。

  陳小胖喊了半天沒人理他,坐起來朝李默那邊看了一眼,一臉無奈:「瘋了瘋了,都瘋了。」

  而江辰本人,此刻正坐在未名湖邊的長椅上。

  唐若曦靠在他肩上,手裡舉著手機,屏幕上顯示著GitHub的實時Star數。

  夜風習習,湖面波光粼粼。

  「老辰,五十萬了。」

  「嗯。」

  「全世界都在用你的框架,你開心嗎?」

  江辰低頭看了看她,然後伸手輕輕揉了揉她的頭髮。「還行。」

  唐若曦笑了。

  她早就知道他會說這兩個字。

  湖對岸,博雅塔靜靜矗立,塔尖的燈光映在水面上,像一顆落進湖裡的星星。

  Stellaris,星辰。

  屬於東大AI的星辰大海,才剛剛開始。

  ……

章節目錄