第977章 員工福利提升,新的一年發展規劃

投票推薦 加入書籤 小說報錯

  王東來在會客廳里目送克里斯多福一行人的背影消失在走廊盡頭,梁松把那份簽了字的意向書放進文件夾,抬頭看了他一眼。

  王東來搖了搖頭,重新坐回主位上,端起那杯早已涼透的龍井喝了一口。

  阿斯麥的事對他來說已經結束了,剩下的是法務和財務團隊要忙的活,不需要他再操心。

  他放下茶杯,站起來對梁松說了一句話:「讓指令集研發團隊準備一下,下午我去實驗室看進度。」

  銀河半導體總部位於唐都高新區的最東端,與光刻工廠只隔了一條寬闊的銀杏大道。

  指令集研發團隊的實驗室在大樓的第十一層,整層樓都被劃為保密區域,進出需要雙重身份認證。

  王東來刷開工牌穿過氣閘門時,實驗室里幾十號人正圍在一塊巨大的白板前爭論不休。

  白板上畫滿了密密麻麻的架構圖,不同顏色的記號筆把數據通路、控制單元、緩存層級標註得層層迭迭,像一張被反覆塗抹的作戰地圖。

  「王總來了。」

  不知道誰先喊了一聲,爭論聲戛然而止。

  所有人都轉過頭看著他,眼神里有敬畏,有期待,還有一種壓不住的焦灼,他們已經被一個問題卡了快兩周了。

  「繼續。」

  王東來拉了一把椅子在實驗室角落坐下,示意他們不用管自己。

  但沒有人繼續爭論了,所有人的目光都落在白板旁邊那個頭髮花白的老工程師身上。

  他叫陳遠洲,和負責鴻蒙生態的那個陳遠洲同名同姓,但在半導體領域深耕的時間同樣漫長。

  他從國家大規模集成電路研究所退休後被王東來親自請到銀河半導體,專門負責國產指令集的研發。

  陳遠洲放下記號筆,轉過身對著王東來,語氣直接:「王總,你來得正好。我們卡在指令流水線的分支預測模塊上,預測準確率卡在百分之九十幾,怎麼也上不去了。這個數字放在三年前是行業頂尖,但現在的鴻蒙系統對晶片的實時性要求太高,車機端要同時處理雷射雷達點雲和自動駕駛決策,手機端要在幾十毫秒內完成語音助手的自然語言理解。流水線每預測錯一次,就要清空重裝,浪費好幾個時鐘周期。這些浪費累積起來,鴻蒙的分布式協同體驗就會在低端晶片上大打折扣。」

  王東來站起來走到白板前,仔細看了幾分鐘那些架構圖。

  然後他拿起一支黑色記號筆,在分支預測模塊的旁邊畫了一個極簡的示意圖,一個極小的、獨立於主流水線之外的輔助預測單元。

  「你們現在的思路是把分支預測的邏輯堆在主流水線前端,用深度學習模型做模式識別。思路沒錯,但放錯了位置。主流水線太擠了,信號繞來繞去,繞一圈好幾個時鐘周期就沒了。把這個輔助預測單元拆出來,直接掛在取指階段後面。它不參與主流水線的任何運算,只做一件事,提前一個周期把分支目標地址算好,餵給取指單元。」

  他在輔助預測單元和取指單元之間畫了一根粗粗的箭頭,箭頭旁邊標註了幾個關鍵的延遲參數。

  陳遠洲盯著那根箭頭看了很久,忽然摘下老花鏡用袖口擦拭鏡片。

  這個動作他重複了兩次,然後重新戴上眼鏡,拿起紅色記號筆在輔助預測單元旁邊飛快地寫了一組數學公式。

  筆尖划過白板的沙沙聲越來越快,寫到最後一個等號時他的手微微發抖,不是緊張,是興奮。

  「把預測邏輯拆出來獨立運行,主流水線不用等,取指不用搶。王總,你這個思路不是優化,是直接改架構。但輔助單元和主流水線之間的數據同步怎麼解決?預測單元跑得再快,如果和主流水線的狀態不同步,預測結果就是廢的。」

  王東來在輔助單元和主流水線之間補了一根虛線,旁邊標註了同步鎖存的時序圖。

  「用異步FIFO緩衝,深度不用大,夠存兩次預測結果就行。預測單元提前算完就扔進去,取指單元到點自己取。主流水線永遠不等預測,預測永遠不拖主流水線,異步時鐘域,各跑各的。媧之前在設計鴻蒙內核調度器時用過類似的異步緩衝思路,FIFO的深度參數可以直接調過來。」

  陳遠洲把手裡的紅色記號筆擱在白板槽里,後退幾步看著那張被畫得密密麻麻的架構圖,沉默了好一會兒。

  然後他轉過身對著團隊裡一個戴眼鏡的年輕人說:「小劉,把王總剛才畫的輔助預測單元用Verilog搭一版原型,時鐘約束按異步FIFO的方案來設,今天搭完直接跑仿真。王總,如果這版跑通,預測準確率應該能再往上提好幾個百分點。」


  他又補了一句,語氣很篤定:「不是線性提升,是直接把預測延遲砍掉。這套分支預測邏輯如果跑通,鴻蒙在低端晶片上的實時性至少能追上現在中高端晶片的水平。」

  王東來點了點頭沒有多說什麼。

  他在實驗室里又待了一段時間,逐項看了緩存一致性協議的優化方案和低功耗模式下的時鐘門控設計,分別提了幾個調整建議,然後離開了指令集實驗室。

  走廊里燈光調得很暗,只有應急燈還亮著。

  他走進電梯按下另一層的按鈕,那是AI晶片研發團隊所在的樓層。

  AI晶片實驗室里的氣氛比指令集那邊更凝重。

  長桌上攤著好幾塊測試板,每塊板上都焊著不同版本的AI加速核心。

  測試板旁邊堆著厚厚一摞功耗曲線報告,每一頁的頁腳都被翻得起了毛邊。

  項目負責人姓周,是從英偉達挖過來的資深架構師,頭髮已經白了大半,但眼神極其銳利。

  「王總。」

  周工把他引到主測試台前,屏幕上正跑著一組AI推理任務的功耗曲線。

  「我們目前基於傳統SIMD架構做的AI加速核心,在圖象識別和自然語言處理上的性能已經追平了英偉達同級別產品,但功耗始終偏高。主要是數據搬運太頻繁,神經網絡每一層都要從外部DRAM里反覆加載權重,加載一次能耗比算一次還高。這個問題不解決,我們的AI晶片就只能用在伺服器端,塞不進車機和手機。」

  他把功耗曲線逐層拆解開來,每拆一層就在屏幕上標一個對應的數據搬運量。

  從卷積層到全連接層再到注意力機制,搬運量的峰值越來越高,整張圖看上去就像一面正在傾斜的牆。

  王東來沒有直接回答。

  他走到白板前拿起記號筆,畫了一個全新的架構草圖。

  不是傳統的SIMD陣列,而是一種混合粒度的張量計算單元,粗粒度處理大規模矩陣乘法,細粒度處理稀疏化後的注意力計算。

  兩者共用同一組片上緩存,但調度邏輯分開。

  「傳統GPU用SIMD堆算力,靠暴力計算碾壓神經網絡。但AI推理任務的瓶頸不是算力,是數據搬運。每一層神經網絡的權重都要從外部內存搬進計算單元,搬一次消耗的能量比算一次還多。你們的方案用大容量片上緩存來減少搬運次數,方向對,但片上緩存的容量終歸有限,緩存再大,也裝不下整個GPT模型的權重。」

  他在混合粒度張量計算單元的架構圖上添了幾筆,在片上緩存和外部DRAM之間加了一個極簡的數據壓縮引擎。

  「在數據進出片上緩存的時候加一層硬體壓縮解壓邏輯,不是軟體壓縮,是直接做在矽片上的專用壓縮引擎。神經網絡權重本身有大量冗餘,稀疏化之後大部分權重是零,非零部分也有很強的規律性。用輕量級的差分編碼把權重流壓縮到原來的幾分之一,數據搬運量就對應降下來了。」

  周工盯著那張架構圖看了很久,眼神越來越亮。

  他拿起紅色記號筆在數據壓縮引擎旁邊寫了幾行字,差分編碼、零值壓縮、自適應量化,每一行都是硬體壓縮領域的前沿方向,但真正做成矽片的沒有幾家。

  看了一會兒,周工問了一個關鍵問題:壓縮解壓本身會帶來延遲開銷,如果延遲累積超過計算單元的空閒窗口,整體推理時間反而會被拖長。

  王東來的回答更是沒有絲毫猶豫:壓縮解壓邏輯和計算流水線做並行化處理,不是先解壓再計算,是邊解壓邊計算。解壓完一個數據塊直接推進計算流水線,不等整個批次解壓完成。延遲開銷被計算流水線的吞吐率吃掉,淨功耗下降,淨延遲不增。

  他在白板上寫下最後一行字,然後轉過身把記號筆放回槽里。

  周工看著那行字沉默了很長時間。

  測試台上那組還在跑的功耗曲線在屏幕上緩慢波動著,每一層神經網絡的計算功耗被拆解成數據搬運和矩陣運算兩部分,前者占比高得驚人。

  他知道如果王東來提出的這個架構能跑通,國內AI晶片在車機端和手機端將實現從無到有的跨越。

  他轉過身對團隊說了一句話:「把王總的混合粒度計算單元方案做成RTL級仿真,三天之內出結果。另外,通知梁總,AI晶片流片排期提前,光刻工廠那邊需要單獨排產線。」

  實驗室里頓時響起一片鍵盤敲擊聲。


  幾個年輕工程師圍在測試台前七嘴八舌地討論著硬體壓縮引擎的編碼方案,有人調出媧之前做過的神經網絡權重稀疏性分析報告,把差分編碼的壓縮比逐層標出來。

  那個從英偉達跟周工一起跳過來的年輕工程師對著屏幕看了很久,忽然說了一句:「如果我們真把這東西做出來,以後英偉達的GPU在端側推理上就沒法跟我們打了。不是價格戰,是直接從架構上抄近路,他們還在用SIMD堆算力,我們已經切到數據流驅動的張量計算了。」

  周工沒有回答。

  他只是看著白板上那張被畫得密密麻麻的架構圖,想起自己在英偉達時期曾經反覆呼籲過用近存計算思路來打端側AI晶片,但每次都被優先級更高的數據中心GPU項目壓下去。

  現在他坐在唐都的實驗室里,和一群年輕人一起重新做這件事,這條路終於有人肯認真走下去了。

  第二天,王東來坐在辦公室里審閱AI晶片團隊連夜跑出來的RTL仿真初版數據。

  功耗曲線在屏幕上平穩下滑,混合粒度計算單元的調度延遲優於設計指標。

  他拿起電容筆在報告上批了兩行字,流片節點提前,光刻工廠單獨排產線,優先保障AI晶片首批工程樣片交付,然後把報告推給媧存檔。

  「媧,把銀河集團目前的員工總數和業務分布調出來。」

  屏幕上頓時跳出一組數據。

  總員工數正好突破了一百零一萬,分布在星火快遞、拼好飯、銀河商超、銀河能源、銀河半導體、銀河航天、銀河生物等核心業務線上,以及分布在全國各地的人才公寓、社區食堂、產線培訓中心和剛剛落成的員工子女託管站。

  一百多萬的僱工規模,放到國內,已經是民營企業中的第一家了。

  就算是和國企相比,也差不了多少。

  並且,明眼人都能看得出來,以銀河科技的發展勢頭,用工數量肯定還能再漲。

  比如說是遍地開花的銀河商超、銀河農業、銀河家電等等。

  「做一份薪酬福利調整方案,要求全員底薪普遍上調,最低漲幅不少於百分之十。餐補、住房補貼、交通補貼同步優化。另外,核心崗位的長期激勵翻倍,具體方案對接各部門負責人,一天之內匯總到我這裡,我明天要用。」

  「人才公寓和員工子女託管站的建設進度,單獨列一份報告出來,從總裁預備金里劃一塊專項資金,不要走常規預算審批流程。調整的具體方案你來擬,擬完直接發各部門負責人確認。」

  「最後,做一份年度預算,明年擴大銀河教育的規模,成立從幼兒園到小學再到中學高中的全鏈條,初期以集團員工為主,要打造精品,初期可以賠錢,後期利潤率控制在8%附近。」

  「加大銀河農業的種植規模,配套我們的銀河生物研發出來的新質品種,進行高質量高水平的種植。」

  王東來語速很快,媧一點都沒有漏下,立即就動用超級算力進行了工作安排。(本章完)

章節目錄