505 目標世界第一。
很快,陳凱就來到了魔都,和蘇陽會面。
「蘇總,我昨天看了你的招聘視頻。」陳凱放下包,開門見山,「一億年薪,世界第一。我想知道你憑什麼說能做到。」
蘇陽沒有立刻回答。他起身走到辦公桌旁,拿起一個銀色的U盤,回到沙發邊,把U盤放在茶几上,推到陳凱面前。
「這裡面是盤古大模型的技術架構概要。不是PPT,不是概念,是可落地的工程方案。你先看。看完再決定要不要聊下去。」
陳凱看著那個小小的U盤,猶豫了一秒,然後拿起它,插進了自己的筆記本電腦。
文件打開。第一頁:模型架構——混合專家模型,總參數量兩萬億,激活參數量三千億,上下文長度一百萬字。
他的手指頓住了。兩萬億參數。目前公開的全球最大模型,參數量也不過一萬億出頭。而盤古直接翻倍。更關鍵的是那個「激活參數量」——這意味著模型雖然龐大,但每次推理只調用部分參數,既保證能力,又控制成本。
他的目光往下掃。推理速度:比現有主流模型快十倍。訓練成本:行業平均水平的二十分之一。陳凱的呼吸開始變得急促。
第二頁:核心技術——獨創的稀疏注意力機制,長文本處理效率提升兩個數量級;自研分布式訓練框架,萬卡集群線性加速;知識截止日期為最新,支持持續更新。
陳凱摘下眼鏡,揉了揉眼睛,又重新戴上。這些東西,有些是他和團隊在千問嘗試過但沒做成的,有些是他只在學術論文裡見過、從未在工程上實現的,有些甚至是他想都沒想過的。
第三頁:應用場景。第四頁:商業模式。第五頁:……
陳凱一頁一頁地翻,翻到最後一頁時,他的手在微微發抖。他抬起頭,看著蘇陽。蘇陽正端著茶杯,不緊不慢地喝著,像在看一場已經知道結局的電影。
「蘇總,這些技術方案……是誰做的?」陳凱的聲音有些發澀。
蘇陽放下茶杯,語氣平靜:「你不用管誰做的。你只需要回答我——你能不能把它做出來?」
陳凱沉默了很久。他想起在千問的那些日子,每次提出新的技術方案,都要被產品部門質疑「這能賺錢嗎」,被管理層質問「競爭對手有沒有做」,被財務部門駁回「預算超了」。技術理想在資本面前,一次次退讓,一次次妥協。而眼前這個人,給他看了一份足以顛覆整個行業的技術方案,然後問他——你能不能把它做出來。
沒有問成本,沒有問周期,沒有問ROI。只問能不能。
「能。」陳凱說。
聲音不大,但很堅定。
蘇陽點了點頭,站起身,走到窗邊。陽光透過玻璃照在他的側臉上,勾勒出一個清晰的輪廓。
「陳博士,我不是做技術的。我不懂算法,不懂模型,不懂訓練框架。但我知道一件事——在這個行業里,華夏一直被美國壓著。GPT出的時候,我們追;Gemini出的時候,我們追;每次都是追。我不想追了。」
他轉過身,看著陳凱:「盤古要做,就做世界第一。不是國內第一,是世界第一。你做得到,我給你一切資源。你做不到,我換人做。」
陳凱站起身來,伸出手:「蘇總,我做得到。」
蘇陽握住他的手,力度不大,但很穩:「那就這麼定了。盤古大模型的技術負責人,是你。年薪一億。團隊你來搭,預算你來批。我不干涉你的技術決策。」
陳凱深吸一口氣,點了點頭。
很快,兩人就簽訂了合同,由陳凱擔任盤古大模型的開發負責人。
簽約之後的下午,陳凱立馬開始忙碌起來。
他去魔都軟體園,立馬簽訂了辦公場地。
然後開始招兵買馬,招聘人才。
他在這行幹了快二十年,腦子裡裝著一份華夏AI領域最頂尖人才的圖譜——誰在算法上有真功夫,誰只會搭積木吹牛;誰的工程能力強,誰只會寫論文發頂會;誰在訓練框架上有獨門絕技,誰只是調參熟練工。這些人,他要麼帶過,要麼合作過,要麼競爭過。每一個人的技術底細、性格特點、當前薪資、離職意願,他都能說出個八九不離十。
第一個電話打給趙宇。千問AI的資深算法工程師,陳凱在千問時期帶出來的徒弟,國內少數幾個真正懂MoE架構的人。電話響了三聲就接了。
「趙宇,我是陳凱。」
「老師?您真的去蘇總那邊了?」趙宇的聲音壓得很低,像是在辦公室偷偷接電話。
「來了。現在我這邊缺人,你來不來?薪資翻倍。你負責盤古的算法架構。」
電話那頭沉默了兩秒。趙宇咬了咬牙:「老師,我跟你干。什麼時候報到?」
「明天。」
掛了電話,陳凱在名單上劃掉了趙宇的名字,寫下「算法組負責人」。第二個電話打給林曉,百川的推理引擎專家。他在稀疏注意力方面的研究業內公認一流,但百川給他的資源不夠,他的技術方案一直被擱置。陳凱知道,林曉等這個機會等了很久。
「林曉,我是陳凱。盤古需要你來做推理加速。條件你開。」
林曉沒有猶豫:「陳老師,我今晚就把簡歷發給你。」
第三個電話打給陳默,智譜的訓練框架負責人。他是分布式訓練領域的老將,曾經在智譜主導過千卡集群的訓練框架搭建。陳凱和他有過幾次技術交流,互相欣賞。
「陳默,蘇總這邊要搭萬卡集群,你來帶訓練框架組。」
「萬卡?」陳默的聲音明顯提高了,「蘇總真捨得?」
「真捨得。你來不來?」
「來。」
一個下午,陳凱打了二十多個電話。名單上的人,有的當場答應,有的說需要考慮,有的委婉拒絕。他不在乎。答應的人,他記下來;需要考慮的,他給三天時間;拒絕的,他劃掉,換上備選。
很快,陳凱帶著趙宇、林曉、陳默三個人,坐在幻神AI的會議室里。四個人,一台投影儀,一杯咖啡。陳凱站在白板前,畫了一張架構圖——底層是算力集群,中間是訓練框架,上層是模型架構,旁邊是數據 pipeline 和評測體系。
「盤古的目標,十二個月內上線。第一版模型,一萬億參數,一百萬上下文,多模態。」他沒有回頭看,筆在白板上刷刷地寫,「算力方面,蘇總已經批了預算,第一期採購一萬張 H800。訓練框架,陳默你負責。算法架構,趙宇你負責。推理引擎,林曉你負責。數據團隊,我親自帶。」
趙宇舉手問了一個問題:「老師,一萬張H800,國內能調動的算力不超過五萬張。蘇總一次性拿一萬張,其他廠商會不會有意見?」
陳凱轉過身,看了他一眼,語氣平淡:「這不是我們需要考慮的問題。蘇總會搞定。」
會議室里安靜了一秒。然後陳默笑了:「也是。」
消息傳得比他們預想的快。
科技媒體就開始報導:「幻神AI組建盤古大模型團隊,陳凱出任技術負責人,已從千問、百川、智譜等公司挖走核心算法和工程人才。」緊接著,又有媒體跟進:「據知情人士透露,幻神AI已採購一萬張H800 GPU,用於盤古大模型的訓練,總投入超過二十億元。」
熱搜上,一個新詞條沖了上來——「盤古大模型」。抖音上,科技博主們開始分析盤古的技術架構和商業前景。知乎上,問題「如何評價幻神AI的盤古大模型」瀏覽量突破百萬。有人說蘇陽是在燒錢,有人說陳凱是被高估了,有人說華夏AI終於有了真正的挑戰者。但不管怎麼說,所有人都在討論盤古。
「蘇總,我昨天看了你的招聘視頻。」陳凱放下包,開門見山,「一億年薪,世界第一。我想知道你憑什麼說能做到。」
蘇陽沒有立刻回答。他起身走到辦公桌旁,拿起一個銀色的U盤,回到沙發邊,把U盤放在茶几上,推到陳凱面前。
「這裡面是盤古大模型的技術架構概要。不是PPT,不是概念,是可落地的工程方案。你先看。看完再決定要不要聊下去。」
陳凱看著那個小小的U盤,猶豫了一秒,然後拿起它,插進了自己的筆記本電腦。
文件打開。第一頁:模型架構——混合專家模型,總參數量兩萬億,激活參數量三千億,上下文長度一百萬字。
他的手指頓住了。兩萬億參數。目前公開的全球最大模型,參數量也不過一萬億出頭。而盤古直接翻倍。更關鍵的是那個「激活參數量」——這意味著模型雖然龐大,但每次推理只調用部分參數,既保證能力,又控制成本。
他的目光往下掃。推理速度:比現有主流模型快十倍。訓練成本:行業平均水平的二十分之一。陳凱的呼吸開始變得急促。
第二頁:核心技術——獨創的稀疏注意力機制,長文本處理效率提升兩個數量級;自研分布式訓練框架,萬卡集群線性加速;知識截止日期為最新,支持持續更新。
陳凱摘下眼鏡,揉了揉眼睛,又重新戴上。這些東西,有些是他和團隊在千問嘗試過但沒做成的,有些是他只在學術論文裡見過、從未在工程上實現的,有些甚至是他想都沒想過的。
第三頁:應用場景。第四頁:商業模式。第五頁:……
陳凱一頁一頁地翻,翻到最後一頁時,他的手在微微發抖。他抬起頭,看著蘇陽。蘇陽正端著茶杯,不緊不慢地喝著,像在看一場已經知道結局的電影。
「蘇總,這些技術方案……是誰做的?」陳凱的聲音有些發澀。
蘇陽放下茶杯,語氣平靜:「你不用管誰做的。你只需要回答我——你能不能把它做出來?」
陳凱沉默了很久。他想起在千問的那些日子,每次提出新的技術方案,都要被產品部門質疑「這能賺錢嗎」,被管理層質問「競爭對手有沒有做」,被財務部門駁回「預算超了」。技術理想在資本面前,一次次退讓,一次次妥協。而眼前這個人,給他看了一份足以顛覆整個行業的技術方案,然後問他——你能不能把它做出來。
沒有問成本,沒有問周期,沒有問ROI。只問能不能。
「能。」陳凱說。
聲音不大,但很堅定。
蘇陽點了點頭,站起身,走到窗邊。陽光透過玻璃照在他的側臉上,勾勒出一個清晰的輪廓。
「陳博士,我不是做技術的。我不懂算法,不懂模型,不懂訓練框架。但我知道一件事——在這個行業里,華夏一直被美國壓著。GPT出的時候,我們追;Gemini出的時候,我們追;每次都是追。我不想追了。」
他轉過身,看著陳凱:「盤古要做,就做世界第一。不是國內第一,是世界第一。你做得到,我給你一切資源。你做不到,我換人做。」
陳凱站起身來,伸出手:「蘇總,我做得到。」
蘇陽握住他的手,力度不大,但很穩:「那就這麼定了。盤古大模型的技術負責人,是你。年薪一億。團隊你來搭,預算你來批。我不干涉你的技術決策。」
陳凱深吸一口氣,點了點頭。
很快,兩人就簽訂了合同,由陳凱擔任盤古大模型的開發負責人。
簽約之後的下午,陳凱立馬開始忙碌起來。
他去魔都軟體園,立馬簽訂了辦公場地。
然後開始招兵買馬,招聘人才。
他在這行幹了快二十年,腦子裡裝著一份華夏AI領域最頂尖人才的圖譜——誰在算法上有真功夫,誰只會搭積木吹牛;誰的工程能力強,誰只會寫論文發頂會;誰在訓練框架上有獨門絕技,誰只是調參熟練工。這些人,他要麼帶過,要麼合作過,要麼競爭過。每一個人的技術底細、性格特點、當前薪資、離職意願,他都能說出個八九不離十。
第一個電話打給趙宇。千問AI的資深算法工程師,陳凱在千問時期帶出來的徒弟,國內少數幾個真正懂MoE架構的人。電話響了三聲就接了。
「趙宇,我是陳凱。」
「老師?您真的去蘇總那邊了?」趙宇的聲音壓得很低,像是在辦公室偷偷接電話。
「來了。現在我這邊缺人,你來不來?薪資翻倍。你負責盤古的算法架構。」
電話那頭沉默了兩秒。趙宇咬了咬牙:「老師,我跟你干。什麼時候報到?」
「明天。」
掛了電話,陳凱在名單上劃掉了趙宇的名字,寫下「算法組負責人」。第二個電話打給林曉,百川的推理引擎專家。他在稀疏注意力方面的研究業內公認一流,但百川給他的資源不夠,他的技術方案一直被擱置。陳凱知道,林曉等這個機會等了很久。
「林曉,我是陳凱。盤古需要你來做推理加速。條件你開。」
林曉沒有猶豫:「陳老師,我今晚就把簡歷發給你。」
第三個電話打給陳默,智譜的訓練框架負責人。他是分布式訓練領域的老將,曾經在智譜主導過千卡集群的訓練框架搭建。陳凱和他有過幾次技術交流,互相欣賞。
「陳默,蘇總這邊要搭萬卡集群,你來帶訓練框架組。」
「萬卡?」陳默的聲音明顯提高了,「蘇總真捨得?」
「真捨得。你來不來?」
「來。」
一個下午,陳凱打了二十多個電話。名單上的人,有的當場答應,有的說需要考慮,有的委婉拒絕。他不在乎。答應的人,他記下來;需要考慮的,他給三天時間;拒絕的,他劃掉,換上備選。
很快,陳凱帶著趙宇、林曉、陳默三個人,坐在幻神AI的會議室里。四個人,一台投影儀,一杯咖啡。陳凱站在白板前,畫了一張架構圖——底層是算力集群,中間是訓練框架,上層是模型架構,旁邊是數據 pipeline 和評測體系。
「盤古的目標,十二個月內上線。第一版模型,一萬億參數,一百萬上下文,多模態。」他沒有回頭看,筆在白板上刷刷地寫,「算力方面,蘇總已經批了預算,第一期採購一萬張 H800。訓練框架,陳默你負責。算法架構,趙宇你負責。推理引擎,林曉你負責。數據團隊,我親自帶。」
趙宇舉手問了一個問題:「老師,一萬張H800,國內能調動的算力不超過五萬張。蘇總一次性拿一萬張,其他廠商會不會有意見?」
陳凱轉過身,看了他一眼,語氣平淡:「這不是我們需要考慮的問題。蘇總會搞定。」
會議室里安靜了一秒。然後陳默笑了:「也是。」
消息傳得比他們預想的快。
科技媒體就開始報導:「幻神AI組建盤古大模型團隊,陳凱出任技術負責人,已從千問、百川、智譜等公司挖走核心算法和工程人才。」緊接著,又有媒體跟進:「據知情人士透露,幻神AI已採購一萬張H800 GPU,用於盤古大模型的訓練,總投入超過二十億元。」
熱搜上,一個新詞條沖了上來——「盤古大模型」。抖音上,科技博主們開始分析盤古的技術架構和商業前景。知乎上,問題「如何評價幻神AI的盤古大模型」瀏覽量突破百萬。有人說蘇陽是在燒錢,有人說陳凱是被高估了,有人說華夏AI終於有了真正的挑戰者。但不管怎麼說,所有人都在討論盤古。