第1084章 看起來完美,用起來致命。

投票推薦 加入書籤 小說報錯

  陳默的數據儀錶盤上,那條曲線在第二十天的時候出現了一個陡峭的拐點——高質量數據的比例從23%跳到了41%。

  他給蘇哲打了個電話,聲音裡帶著一種克制的興奮:

  「書記,現在總量八千九百萬組。高質量的三千六百萬。按這個速度——再有兩周——」

  「別算了。」蘇哲打斷他,「給你一個壞消息。」

  陳默的聲音停住了。

  「OpenAI和西門子的Forge項目提前了。威爾遜剛發來的情報——他們原計劃三個月後正式發布,現在改成了六周。發布會定在底特律,三大車企全部站台。」

  電話那頭的鍵盤聲也停了。

  「六周。」陳默重複了一遍。

  「夠嗎?」

  陳默用了十秒做計算。蘇哲在電話這頭能聽到他急促的呼吸聲。

  「勉強。但數據量必須在四周內突破一億組,而且高質量占比不能低於45%。否則模型訓練出來的效果會有明顯短板——特別是在複雜曲面和多物理場耦合這兩個維度上。」

  蘇哲沒回話。他在想另一件事。

  六周。Forge提前發布。

  這不正常。

  OpenAI的項目管理一向保守——他們在發布GPT系列產品的時候,從來不提前。總是延期。

  為什麼這次反而提前了?

  蘇哲撥了威爾遜。

  「Forge提前發布的原因查到了嗎?」

  「正在查。初步判斷是西門子那邊施壓了。」威爾遜的聲音帶著一點不確定,「我在舊金山的線人說,西門子數字工業的CEO上周親自飛了一趟舊金山跟OpenAI談判。原因——他們的大夏區業務數據非常難看。盤古造物上線後的三個月里,西門子NX在大夏的新增訂閱量下降了61%。續約率從88%掉到了53%。」

  蘇哲把這幾個數字默默記下了。

  「他們急了。」威爾遜下了一個判斷,「Forge如果不儘快上市,西門子在大夏的存量客戶也會流失。所以他們寧願發一個不那麼完善的版本,也要搶時間。」

  蘇哲把電話掛了。

  急了的對手會犯錯。但急了的對手也最危險——因為他們沒什麼好失去的了。

  當天晚上,蘇哲做了一個決定。

  他讓林銳通知老周:「法律意見書我簽了。明天上午送工信部和國家網信辦。」

  林銳愣了一下。之前蘇哲說時機不對,怎麼突然改了主意?

  蘇哲沒解釋。他在辦公桌上鋪開了一張白紙,用筆畫了一條時間線。

  時間線的左端標註著「現在」,右端標註著「六周後——Forge發布」。

  在時間線的中間偏左位置,他畫了一個標記:「舉報西門子數據違規。」

  在標記的右側,他畫了一條虛線延伸出去,旁邊寫著:「調查啟動→西門子被要求暫停數據同步→大夏用戶數據服務中斷→ NX用戶被迫遷移→遷移到哪裡?」

  答案不需要寫。盤古造物是唯一的選擇。

  他在虛線的終點畫了第二個標記:「用戶湧入→數據湧入→訓練加速。」

  時間差。

  舉報的目的不是懲罰西門子。是製造一個窗口期——在Forge發布之前,讓盤古系統吃掉西門子在大夏的剩餘市場份額,同時獲得這些用戶手裡的高質量工業數據。

  一箭三雕。

  第二天上午十點,老周帶著法律意見書和全套證據材料坐上了飛燕京的航班。

  證據包括三部分:西門子NX用戶協議第17.3款的條文分析、三條數據出境鏈路的流量監控記錄、以及47PB數據跨境傳輸總量的統計報告。

  老周在機場候機廳給蘇哲打了最後一個確認電話。

  「書記,這個舉報一出去,西門子肯定會反應。他們在歐洲的政治資源不少——」

  「讓他們反應。」蘇哲的聲音很平,「他們能做的無非兩件事:要麼遊說華盛頓施壓,要麼在歐洲法院反訴。兩條路都需要時間。我們要的就是時間。」

  老周掛了電話,登了機。


  三天後。

  國家網信辦發布了一份「關於開展外資工業軟體數據安全專項檢查的通知」。通知沒有點名任何公司,但檢查範圍精確地覆蓋了CAD、CAE、PLM三類工業軟體——全球在這三個領域有份額的外資企業,不超過五家。

  通知發布當天下午,西門子大夏區總部的法務總監緊急飛往燕京。PTC的大夏區總裁約翰·格林——剛從紐約回來沒兩天——又訂了一張去燕京的機票。達索系統的亞太區副總裁也出現在了首都機場的出港大廳。

  三家公司的法務團隊在燕京的律所里連夜開會。他們拿到的那份專項檢查通知,措辭雖然是例行公事的口吻,但內行人一眼就能看出——這不是常規的年度檢查,這是有人遞了料。

  誰遞的,他們猜不到具體是誰。但能在這個時間點、這個精確度上觸發國家級檢查的人,一隻手數得過來。

  檢查的第一步是要求三家公司提交在大夏境內的用戶數據存儲和傳輸的完整報告。期限:七天。

  七天。

  這個期限本身就是一種信號。如果是友好檢查,通常給三十天。七天意味著——別磨蹭。

  西門子大夏區的技術團隊在七天裡加了六個通宵,勉強拼出了一份數據傳輸報告。報告試圖把47PB的數據出境說成是「系統運維所需的正常數據同步」,但法務總監在簽字之前猶豫了很久。

  他知道這個解釋站不住。

  47PB的「正常同步」——全世界沒有一個運維工程師能面不改色地說出這句話。

  消息傳到京海的時候,陳默正在超算中心盯著訓練進度條。

  數據銀行的上傳量在專項檢查通知發布後出現了一次跳躍式增長。原因不複雜——很多正在使用西門子NX的企業,在看到檢查通知後開始擔心自己的數據安全。「我的設計文件是不是已經被西門子拿走了?」這個疑問在行業論壇和微信群里蔓延的速度比任何GG都快。

  恐慌催生行動。大批企業開始把NX里的設計文件導出,遷移到盤古造物系統上。遷移的過程中,數據自然而然地進入了數據銀行。

  第二十三天。總上傳數據量:九千四百萬組。高質量占比:44.7%。

  陳默發的消息比之前任何一次都長,總共三行:

  「一億組的門檻快了。高質量占比還差零點三個百分點。有一個領域的數據缺口很大——精密模具。國內這個行業的頭部企業只有那幾家,都還沒上傳。」

  蘇哲看著這條消息,撥了一個他很久沒打過的號碼。

  電話響了兩聲就接了。

  「蘇書記?」對方的聲音有點意外。

  「老李,在廠里?」

  「在。剛從車間出來。」

  蘇哲嘴角微微動了一下。電話那頭的人是紅星工具機廠的李建國——第一個上傳數據的人。

  「幫我個忙。你認識溫州和東莞做模具的那些老闆嗎?」

  「認識幾個。以前工具機展上碰過面。怎麼了?」

  「幫我約他們吃頓飯。我請客。」

  李建國在電話那頭笑了——粗啞的、帶著機油味的笑聲。

  「蘇書記請吃飯,他們得排著隊來。」

  三天後,京海。

  一家不起眼的本幫菜館的包廂里,蘇哲坐在主位上。左右兩邊坐著七個人——全是長三角和珠三角做精密模具的老闆。最大的一家年產值十二億,最小的一家也有一億八。

  李建國坐在蘇哲旁邊,負責暖場和翻譯——不是語言翻譯,是把蘇哲的官方用語翻譯成車間老闆們聽得懂的大白話。

  飯吃到一半的時候,蘇哲把筷子放下了。

  「各位老闆,我今天請客沒別的事。就想問一個問題——你們的模具設計數據,現在存在哪?」

  七個老闆面面相覷。

  溫州來的趙老闆最先開口,人精瘦,說話快:「在我電腦硬碟里。兩個移動硬碟做備份。」

  東莞的胡老闆接了句:「我們用的NX,數據在西門子的雲上存了一份。」

  蘇哲點了一下頭。「存在西門子云上的那份,你們看過用戶協議的第17.3款嗎?」

  胡老闆的筷子停了。


  蘇哲沒有繼續說。他從包里拿出一份列印好的文件——西門子NX用戶協議第17.3款的中文翻譯,以及工信部法律專家對這一條款的合規性分析。

  文件在七個人手裡傳了一圈。

  包廂里安靜了大約二十秒。

  趙老闆第一個把文件拍在桌上:「我的模具數據被他們拿去訓練AI了?」

  「目前在查。」蘇哲的回答很克制,「但條款寫得很清楚——他們有權這麼做。至於做沒做,國家網信辦在查。」

  胡老闆的臉色已經變了——不是生氣,是後怕。他的公司給一家軍工企業做過配套的彈藥箱模具。那批模具的設計數據如果流到境外——

  「蘇書記,」胡老闆放下筷子,聲音壓得很低,「盤古造物的數據銀行——我的數據上傳之後,保證不出境?」

  「保證。盤古系統的全部數據存儲在國內四個超算節點上。沒有任何跨境鏈路。數據安全審查已經通過了網信辦的最高等級認證。」

  蘇哲說這話的時候語速不快,但每個字都砸得實。

  那頓飯吃了兩個半小時。散場的時候,七個老闆里有五個當場表示願意上傳數據。剩下兩個說回去跟合伙人商量,但語氣也鬆了。

  陳默在第二十八天收到了一批他盼了很久的東西——超過八百萬組精密模具行業的設計數據,涵蓋注塑、衝壓、壓鑄和吹塑四個細分領域。數據質量極高,每一組都附帶了完整的工藝參數和質檢報告。

  他把這批數據灌進訓練框架的那天晚上,模型的損失函數曲線出現了一次明顯的下降。

  收斂加速了。

  凌晨三點,陳默截了一張訓練面板的圖,發給蘇哲。

  沒有文字說明。只有一個綠色的進度條和一個數字:

  **數據總量:1.07億組。**

  蘇哲看到這條消息的時候剛從床上坐起來——他的手機設了陳默的消息免打擾例外。

  一億的門檻過了。

  他回了一個字:「訓。」

  然後他翻到威爾遜的最新情報。Forge發布會倒計時:三十一天。

  時間夠不夠,他不確定。但已經沒有退路了。

  Forge發布會倒計時十五天。

  陳默已經連續在敦煌待了十一天。他把行軍床從中控室挪到了隔壁的設備間——中控室的空調噪音影響他判斷模型輸出的微妙差異。設備間沒有窗戶,白天黑夜全靠手錶分辨。

  訓練框架在一億零七百萬組數據的餵養下推進得很順利。模型在標準零件設計、工藝路線規劃和材料選型三個基礎維度上的表現已經超過了市面上所有商用CAD軟體的輔助功能。陳默甚至開始樂觀——按這個趨勢,兩周後正式版發布的時候,至少能在通用製造領域跟Forge掰一掰手腕。

  然後他看到了那組測試結果。

  航空葉片設計的盲測。陳默讓模型根據一組真實的氣動載荷參數,自主生成渦輪葉片的三維模型和加工方案。模型用了七秒完成輸出。三維模型的外形漂亮得無可挑剔——流線型前緣、變截面葉身、精確的扭轉角分布。

  但加工方案里有一行參數讓陳默的眼皮跳了一下。

  五軸銑削的第三道工序,進給速度標註為每分鐘4200毫米,刀具選型為R6的球頭銑刀。

  陳默不搞機械加工。但他在京海待了快一年,跟紅星廠的人混得夠久,耳朵里灌進去的東西比他自己想像的多。他隱約覺得這個數字不太對勁。

  他打開參考資料庫檢索了一下。

  沒有這個工藝參數組合。

  不是「沒有完全匹配的」——是「完全不存在」。模型憑空編造了一個在現實中無法執行的加工參數。進給速度4200配R6球頭銑刀,在鈦合金曲面上切削——刀具的壽命大概不超過三十秒。

  陳默的手指在鍵盤上懸了五秒,然後他開始批量跑測試。

  一個小時後,結果出來了。

  在複雜曲面生成領域——涉及航空葉片、汽輪機轉子、精密模具型腔這類非規則幾何體的設計——模型的「幻覺」發生率是14.3%。

  每七個方案里,有一個是假的。看起來完美,用起來致命。

章節目錄