第1083章 當數據貨幣化的時候
他在箭頭下方又加了一行:**積分可交易。**
陳默抬頭了。
「企業A是做齒輪的,積攢了大量齒輪加工數據,積分很多但不需要仿真功能。企業B是做整機的,急需仿真資源但手頭數據不多。A可以把積分賣給B。」蘇哲把筆擱下,「數據的所有權不變,還是企業的。盤古系統只獲得訓練使用權。積分的總量跟平台的服務能力掛鉤,不超發。」
陳默沉默了半分鐘。
「這不就是……數據的貨幣化?」
「你可以這麼理解。」
「誰來定價?每組數據值多少積分?」
「你來定。按照數據的維度、完整性、行業稀缺度三個指標做自動化評級。你的算法擅長幹這個。」
陳默想了一會兒。他的手指在桌面上敲了幾下——這是他思考的習慣,跟拉爾森緊張時候的表現一模一樣。
「有一個風險。」他說,「如果評級算法被摸透了,有人會專門造假數據來刷積分。」
「那就加一道人工抽檢。」楊青接話了——他終於想明白了這個方案的邏輯,水泡好像都不那麼疼了,「讓你的團隊每天隨機抽取1%的上傳數據做人工審核。發現造假的,扣光積分,永久拉黑。」
蘇哲點了一下頭。
方案上線的準備工作花了四天。陳默帶團隊寫了數據評級的算法模塊,楊青的高新區管委會出了配套的管理辦法,張志強負責跟法務團隊敲定數據使用權的法律框架。
上線當天的第一個用戶,是紅星工具機廠的李建國。
老李這輩子的手藝全在腦子裡和那幾十本發黃的筆記本上。三十年的刀具加工參數、材料切削經驗、不同工況下的進給量和轉速組合——這些東西以前只能靠師傅帶徒弟傳下去,傳不了幾個人,再過十年人退休了就跟著埋進土裡。
楊青去紅星廠找他的時候,李建國正帶著兩個徒弟在車間裡調試新工具機。
「老李,你那些筆記本上的數據,願不願意上傳到盤古系統?」
李建國關掉主軸,用抹布擦了擦手。
「上傳了給我啥好處?」
楊青把積分方案講了一遍。講到「積分可以兌換高級仿真功能」的時候,李建國的眼睛亮了。
紅星廠的工程師們一直想用盤古系統的高級仿真模塊來優化新型號工具機的熱變形補償算法。那個模塊在收費計劃表里標價每年三十萬。紅星廠帳面上拿不出這筆錢——市財政兜底了重組費用,但日常運營的預算卡得很緊。
「你的意思是,我把筆記本上的東西錄進去,就能白用那個仿真功能?」
「不是白用。是你用你三十年攢的手藝換的。」
李建國抹布一甩。
「錄。」
他花了兩天時間,把自己三十年積累的五千多組刀具加工數據全部錄入系統。每一組數據都包括材料型號、刀具參數、切削速度、進給量、表面粗糙度、刀具壽命和操作員備註——備註欄里寫的全是他自己的經驗心得,比如「45號鋼粗車的時候進給量別超過0.3,超了崩刃」。
積分到帳的那天下午,李建國用積分兌換了高級仿真模塊的一年使用權。
他在廠里食堂吃飯的時候跟工友說了這事。
「我這輩子記了三十年的東西,原來退休了就白瞎了。現在變成積分了,退休了積分還在,還能換東西。值。」
這話不知道怎麼傳出去的。兩天後,紅星廠的六個老師傅全部開了帳號,排著隊往系統里倒數據。
李建國的帶頭效應像投進池塘里的石頭。漣漪一圈圈擴散出去。
第一天,上傳數據量八千組。第三天,十二萬組。第五天,六十四萬組。
到第七天的時候,楊青的後台統計顯示,累計上傳數據量突破了三千萬組。
寧波錦通精工——就是那個投訴過數據溢出、回覆說「無法共享」的企業——的技術副總打電話來問了一個問題:「積分能買斷高級仿真功能的永久使用權嗎?」
楊青在電話里憋著沒笑出來:「可以。但需要一萬五千積分。按你們企業的數據量,大約上傳三萬組高質量數據就夠了。」
掛了電話不到兩個小時,錦通精工的數據就開始往系統里灌了。
陳默在敦煌盯著數據儀錶盤,看著上傳量的曲線像發射的火箭一樣往上躥。
他給蘇哲發了條消息。只有一個數字和一個問號:「4700萬組。夠了嗎?」
蘇哲正在辦公室里看另一份文件。林銳十分鐘前送進來的——威爾遜發來的最新情報更新。
OpenAI和西門子的「Forge」項目進度比預想的更快。已經完成了汽車和航空兩個垂直領域的專項訓練。米國三大車企中的兩家簽了試用協議。預計三個月後正式發布。
蘇哲給陳默回了三個字:「繼續收。」
停了三秒,他又發了第二條消息。
「查一下西門子那個數據條款在大夏的法律效力。如果違法——告他。」
發完這條消息之後,蘇哲把手機扣在桌上。他拿起那份威爾遜的情報,重新看了一遍西門子用戶協議第17.3款的原文翻譯。
「……用戶授權西門子及其關聯方,將用戶在使用本產品過程中創建的數據用於產品改進、人工智慧模型訓練及相關技術開發目的……」
這段話放在歐洲和米國,也許能靠格式合同的慣例糊弄過去。但放在大夏——
蘇哲拉開抽屜,找出法務總監老周上個月整理的一份備忘錄。備忘錄的主題是《大夏數據安全法和個人信息保護法中關於工業數據的適用條款》。
他翻到第三頁,用筆在一段文字下面畫了線:
*「數據處理者處理重要數據,應當在事前進行風險評估,並向有關主管部門報送風險評估報告。」*
西門子在大夏有超過兩萬家企業用戶。這些企業使用NX和Teamcenter產生的設計數據——涉及航空、軍工、核電、高鐵等敏感行業——被西門子通過一行用戶協議的小字拿去訓練AI模型,有沒有做過風險評估?有沒有向大夏主管部門報送評估報告?
蘇哲幾乎可以肯定答案是沒有。
他合上備忘錄,撥了老周的手機。
「老周,你手邊有沒有西門子NX在大夏的標準用戶協議文本?」
「有。去年智慧財產權訴訟的時候備過一份。」
「翻到第17.3款。然後對照《數據安全法》第三十條和第三十一條。寫一份法律意見——如果我們以盤古造物用戶權益保護的名義,向國家網信辦和工信部舉報西門子未經合規審批擅自將大夏企業工業數據用於境外AI訓練,勝算幾成?」
老周在電話那頭沉默了三秒。
「十成。」他的聲音聽起來像剛吞了一顆定心丸。
老周的法律意見書用了兩天寫完。十七頁。措辭極其克制——沒有一句主觀判斷,全是條文引用和事實陳述。但每一段的邏輯鏈條都指向同一個結論:西門子通過格式合同條款,在未經大夏主管部門審批、未進行數據出境安全評估的情況下,將大夏境內企業的工業設計數據傳輸至境外伺服器用於AI模型訓練,違反了《數據安全法》第三十條、第三十一條,以及《個人信息保護法》中關於數據跨境傳輸的相關規定。
更要命的是,這些數據涉及的行業清單——老周做了一個附表——包括航空航天、核電裝備、高速鐵路和軍工電子。全部屬於「重要數據」甚至「核心數據」的範疇。
蘇哲看完法律意見書,沒有簽字。
他把文件擱在桌角,撥了程度的電話。
「幫我查一件事。西門子大夏區的NX軟體伺服器部署在哪,數據同步的出境通道走哪條線路。具體到物理層面——光纜、IDC機房、接入點。」
程度沒多問。他知道蘇哲讓他查東西的時候,問為什麼是多餘的。
四十八小時後,程度的調查結果回來了。比蘇哲預想的更詳細——公安系統在網絡安全執法方面的技術手段,遠不是民間能比的。
西門子NX在大夏的用戶數據通過三條鏈路同步到境外伺服器。第一條走上海的海底光纜,出口節點在崇明島的一個登陸站,終點是新加坡的一個IDC機房。第二條走北京的陸纜,終點在法蘭克福。第三條是備份鏈路,走香港。
三條鏈路的數據流量監控記錄——程度的人從運營商那邊調來的——顯示,過去六個月里,從大夏境內同步出去的數據總量超過了47PB。
47PB。
這個數字是什麼概念?國家圖書館的全部數位化藏書大約是10PB。
蘇哲盯著這個數字看了半分鐘。他拿起筆,在數字旁邊批了兩個字:「留存。」
他沒有立刻動手舉報。
原因很簡單——時機不對。
現在舉報西門子,工信部和網信辦會啟動調查,西門子會被要求暫停數據跨境傳輸。但調查過程中,OpenAI和西門子的「Forge」項目不會停。人家的訓練數據已經拿到手了,調查改變不了既成事實。
他需要的不是一張罰單。他需要的是一記能改變戰局的重拳。
而這記重拳,要等盤古系統的數據量追上去之後再打。
「繼續收數據。」蘇哲對陳默說的這三個字,不是隨便說的。
數據銀行上線第十二天。
累計上傳量突破了七千萬組。增速在放緩——最容易被說服的企業已經上傳了,剩下的硬骨頭是那些規模大、數據多、但顧慮也最重的頭部企業。
陳默在敦煌的超算中心裡跟蘇哲開了一個視頻會議。
「七千萬組的質量分布不均勻。」陳默調出一張餅圖,「高質量數據——就是維度完整、標註規範、行業稀缺度高的——只占23%。剩下七成多是低質量的通用件圖紙和基礎零件數據。訓練大模型用不上。」
「你需要什麼行業的數據?」
「航空結構件、汽車動力總成、精密模具、半導體封裝——這四個垂直領域是湧現效應最明顯的。但這四個領域的頭部企業恰恰是最不願意上傳數據的。」
蘇哲在筆記本上記了四個關鍵詞。
「我來想辦法。」
掛了視頻之後,蘇哲翻出手機通訊錄,找到了一個名字——比雅迪王工。
這個「王工」是比雅迪負責電池事業部研發的副總裁,全固態電池項目簽約的時候跟蘇哲打過幾次交道。千億訂單的甲方,說話有分量。
電話接通後蘇哲沒客套:「王總,盤古造物的數據銀行你聽說了沒有?」
對方笑了一聲:「蘇書記,你打電話來肯定不是問我聽沒聽說。你要我幹什麼?」
「比雅迪手裡有全球最大的動力電池設計資料庫。你們上傳一批數據進來,帶個頭。」
電話那頭沉默了五秒。
「蘇書記,我們的數據可是核心資產——」
「我知道。所以我不白拿。積分你肯定不稀罕——我給你個更實在的東西。盤古系統的下一個版本里會有一個電池熱管理的專用仿真模塊,基於你們的數據訓練出來。這個模塊你們獨家使用一年,一年之後再向其他企業開放。」
「獨家一年?」
「白紙黑字寫在合同里。」
又是五秒沉默。然後對方的語氣變了。
「你讓楊青跟我們研發部對接。數據格式和脫敏標準先談好。」
比亞迪的入場像一枚信號彈。
當比亞迪開始往盤古系統上傳數據的消息在行業圈子裡傳開之後,觀望中的企業坐不住了。
邏輯很樸素——比雅迪都上傳了,數據還能換獨家功能模塊?那我不上傳,等別人把我這個細分領域的模塊做出來了,我連鍋都沒得分了。
這種「恐懼錯過」的心理比任何激勵措施都有效。
第十五天。航空工業集團下屬的成飛,上傳了三萬組航空結構件數據。
第十七天。三聯重工上傳了五萬組工程機械液壓系統數據。
第十九天。大夏晶片國際上傳了一批經過深度脫敏的封裝工藝參數。
陳默抬頭了。
「企業A是做齒輪的,積攢了大量齒輪加工數據,積分很多但不需要仿真功能。企業B是做整機的,急需仿真資源但手頭數據不多。A可以把積分賣給B。」蘇哲把筆擱下,「數據的所有權不變,還是企業的。盤古系統只獲得訓練使用權。積分的總量跟平台的服務能力掛鉤,不超發。」
陳默沉默了半分鐘。
「這不就是……數據的貨幣化?」
「你可以這麼理解。」
「誰來定價?每組數據值多少積分?」
「你來定。按照數據的維度、完整性、行業稀缺度三個指標做自動化評級。你的算法擅長幹這個。」
陳默想了一會兒。他的手指在桌面上敲了幾下——這是他思考的習慣,跟拉爾森緊張時候的表現一模一樣。
「有一個風險。」他說,「如果評級算法被摸透了,有人會專門造假數據來刷積分。」
「那就加一道人工抽檢。」楊青接話了——他終於想明白了這個方案的邏輯,水泡好像都不那麼疼了,「讓你的團隊每天隨機抽取1%的上傳數據做人工審核。發現造假的,扣光積分,永久拉黑。」
蘇哲點了一下頭。
方案上線的準備工作花了四天。陳默帶團隊寫了數據評級的算法模塊,楊青的高新區管委會出了配套的管理辦法,張志強負責跟法務團隊敲定數據使用權的法律框架。
上線當天的第一個用戶,是紅星工具機廠的李建國。
老李這輩子的手藝全在腦子裡和那幾十本發黃的筆記本上。三十年的刀具加工參數、材料切削經驗、不同工況下的進給量和轉速組合——這些東西以前只能靠師傅帶徒弟傳下去,傳不了幾個人,再過十年人退休了就跟著埋進土裡。
楊青去紅星廠找他的時候,李建國正帶著兩個徒弟在車間裡調試新工具機。
「老李,你那些筆記本上的數據,願不願意上傳到盤古系統?」
李建國關掉主軸,用抹布擦了擦手。
「上傳了給我啥好處?」
楊青把積分方案講了一遍。講到「積分可以兌換高級仿真功能」的時候,李建國的眼睛亮了。
紅星廠的工程師們一直想用盤古系統的高級仿真模塊來優化新型號工具機的熱變形補償算法。那個模塊在收費計劃表里標價每年三十萬。紅星廠帳面上拿不出這筆錢——市財政兜底了重組費用,但日常運營的預算卡得很緊。
「你的意思是,我把筆記本上的東西錄進去,就能白用那個仿真功能?」
「不是白用。是你用你三十年攢的手藝換的。」
李建國抹布一甩。
「錄。」
他花了兩天時間,把自己三十年積累的五千多組刀具加工數據全部錄入系統。每一組數據都包括材料型號、刀具參數、切削速度、進給量、表面粗糙度、刀具壽命和操作員備註——備註欄里寫的全是他自己的經驗心得,比如「45號鋼粗車的時候進給量別超過0.3,超了崩刃」。
積分到帳的那天下午,李建國用積分兌換了高級仿真模塊的一年使用權。
他在廠里食堂吃飯的時候跟工友說了這事。
「我這輩子記了三十年的東西,原來退休了就白瞎了。現在變成積分了,退休了積分還在,還能換東西。值。」
這話不知道怎麼傳出去的。兩天後,紅星廠的六個老師傅全部開了帳號,排著隊往系統里倒數據。
李建國的帶頭效應像投進池塘里的石頭。漣漪一圈圈擴散出去。
第一天,上傳數據量八千組。第三天,十二萬組。第五天,六十四萬組。
到第七天的時候,楊青的後台統計顯示,累計上傳數據量突破了三千萬組。
寧波錦通精工——就是那個投訴過數據溢出、回覆說「無法共享」的企業——的技術副總打電話來問了一個問題:「積分能買斷高級仿真功能的永久使用權嗎?」
楊青在電話里憋著沒笑出來:「可以。但需要一萬五千積分。按你們企業的數據量,大約上傳三萬組高質量數據就夠了。」
掛了電話不到兩個小時,錦通精工的數據就開始往系統里灌了。
陳默在敦煌盯著數據儀錶盤,看著上傳量的曲線像發射的火箭一樣往上躥。
他給蘇哲發了條消息。只有一個數字和一個問號:「4700萬組。夠了嗎?」
蘇哲正在辦公室里看另一份文件。林銳十分鐘前送進來的——威爾遜發來的最新情報更新。
OpenAI和西門子的「Forge」項目進度比預想的更快。已經完成了汽車和航空兩個垂直領域的專項訓練。米國三大車企中的兩家簽了試用協議。預計三個月後正式發布。
蘇哲給陳默回了三個字:「繼續收。」
停了三秒,他又發了第二條消息。
「查一下西門子那個數據條款在大夏的法律效力。如果違法——告他。」
發完這條消息之後,蘇哲把手機扣在桌上。他拿起那份威爾遜的情報,重新看了一遍西門子用戶協議第17.3款的原文翻譯。
「……用戶授權西門子及其關聯方,將用戶在使用本產品過程中創建的數據用於產品改進、人工智慧模型訓練及相關技術開發目的……」
這段話放在歐洲和米國,也許能靠格式合同的慣例糊弄過去。但放在大夏——
蘇哲拉開抽屜,找出法務總監老周上個月整理的一份備忘錄。備忘錄的主題是《大夏數據安全法和個人信息保護法中關於工業數據的適用條款》。
他翻到第三頁,用筆在一段文字下面畫了線:
*「數據處理者處理重要數據,應當在事前進行風險評估,並向有關主管部門報送風險評估報告。」*
西門子在大夏有超過兩萬家企業用戶。這些企業使用NX和Teamcenter產生的設計數據——涉及航空、軍工、核電、高鐵等敏感行業——被西門子通過一行用戶協議的小字拿去訓練AI模型,有沒有做過風險評估?有沒有向大夏主管部門報送評估報告?
蘇哲幾乎可以肯定答案是沒有。
他合上備忘錄,撥了老周的手機。
「老周,你手邊有沒有西門子NX在大夏的標準用戶協議文本?」
「有。去年智慧財產權訴訟的時候備過一份。」
「翻到第17.3款。然後對照《數據安全法》第三十條和第三十一條。寫一份法律意見——如果我們以盤古造物用戶權益保護的名義,向國家網信辦和工信部舉報西門子未經合規審批擅自將大夏企業工業數據用於境外AI訓練,勝算幾成?」
老周在電話那頭沉默了三秒。
「十成。」他的聲音聽起來像剛吞了一顆定心丸。
老周的法律意見書用了兩天寫完。十七頁。措辭極其克制——沒有一句主觀判斷,全是條文引用和事實陳述。但每一段的邏輯鏈條都指向同一個結論:西門子通過格式合同條款,在未經大夏主管部門審批、未進行數據出境安全評估的情況下,將大夏境內企業的工業設計數據傳輸至境外伺服器用於AI模型訓練,違反了《數據安全法》第三十條、第三十一條,以及《個人信息保護法》中關於數據跨境傳輸的相關規定。
更要命的是,這些數據涉及的行業清單——老周做了一個附表——包括航空航天、核電裝備、高速鐵路和軍工電子。全部屬於「重要數據」甚至「核心數據」的範疇。
蘇哲看完法律意見書,沒有簽字。
他把文件擱在桌角,撥了程度的電話。
「幫我查一件事。西門子大夏區的NX軟體伺服器部署在哪,數據同步的出境通道走哪條線路。具體到物理層面——光纜、IDC機房、接入點。」
程度沒多問。他知道蘇哲讓他查東西的時候,問為什麼是多餘的。
四十八小時後,程度的調查結果回來了。比蘇哲預想的更詳細——公安系統在網絡安全執法方面的技術手段,遠不是民間能比的。
西門子NX在大夏的用戶數據通過三條鏈路同步到境外伺服器。第一條走上海的海底光纜,出口節點在崇明島的一個登陸站,終點是新加坡的一個IDC機房。第二條走北京的陸纜,終點在法蘭克福。第三條是備份鏈路,走香港。
三條鏈路的數據流量監控記錄——程度的人從運營商那邊調來的——顯示,過去六個月里,從大夏境內同步出去的數據總量超過了47PB。
47PB。
這個數字是什麼概念?國家圖書館的全部數位化藏書大約是10PB。
蘇哲盯著這個數字看了半分鐘。他拿起筆,在數字旁邊批了兩個字:「留存。」
他沒有立刻動手舉報。
原因很簡單——時機不對。
現在舉報西門子,工信部和網信辦會啟動調查,西門子會被要求暫停數據跨境傳輸。但調查過程中,OpenAI和西門子的「Forge」項目不會停。人家的訓練數據已經拿到手了,調查改變不了既成事實。
他需要的不是一張罰單。他需要的是一記能改變戰局的重拳。
而這記重拳,要等盤古系統的數據量追上去之後再打。
「繼續收數據。」蘇哲對陳默說的這三個字,不是隨便說的。
數據銀行上線第十二天。
累計上傳量突破了七千萬組。增速在放緩——最容易被說服的企業已經上傳了,剩下的硬骨頭是那些規模大、數據多、但顧慮也最重的頭部企業。
陳默在敦煌的超算中心裡跟蘇哲開了一個視頻會議。
「七千萬組的質量分布不均勻。」陳默調出一張餅圖,「高質量數據——就是維度完整、標註規範、行業稀缺度高的——只占23%。剩下七成多是低質量的通用件圖紙和基礎零件數據。訓練大模型用不上。」
「你需要什麼行業的數據?」
「航空結構件、汽車動力總成、精密模具、半導體封裝——這四個垂直領域是湧現效應最明顯的。但這四個領域的頭部企業恰恰是最不願意上傳數據的。」
蘇哲在筆記本上記了四個關鍵詞。
「我來想辦法。」
掛了視頻之後,蘇哲翻出手機通訊錄,找到了一個名字——比雅迪王工。
這個「王工」是比雅迪負責電池事業部研發的副總裁,全固態電池項目簽約的時候跟蘇哲打過幾次交道。千億訂單的甲方,說話有分量。
電話接通後蘇哲沒客套:「王總,盤古造物的數據銀行你聽說了沒有?」
對方笑了一聲:「蘇書記,你打電話來肯定不是問我聽沒聽說。你要我幹什麼?」
「比雅迪手裡有全球最大的動力電池設計資料庫。你們上傳一批數據進來,帶個頭。」
電話那頭沉默了五秒。
「蘇書記,我們的數據可是核心資產——」
「我知道。所以我不白拿。積分你肯定不稀罕——我給你個更實在的東西。盤古系統的下一個版本里會有一個電池熱管理的專用仿真模塊,基於你們的數據訓練出來。這個模塊你們獨家使用一年,一年之後再向其他企業開放。」
「獨家一年?」
「白紙黑字寫在合同里。」
又是五秒沉默。然後對方的語氣變了。
「你讓楊青跟我們研發部對接。數據格式和脫敏標準先談好。」
比亞迪的入場像一枚信號彈。
當比亞迪開始往盤古系統上傳數據的消息在行業圈子裡傳開之後,觀望中的企業坐不住了。
邏輯很樸素——比雅迪都上傳了,數據還能換獨家功能模塊?那我不上傳,等別人把我這個細分領域的模塊做出來了,我連鍋都沒得分了。
這種「恐懼錯過」的心理比任何激勵措施都有效。
第十五天。航空工業集團下屬的成飛,上傳了三萬組航空結構件數據。
第十七天。三聯重工上傳了五萬組工程機械液壓系統數據。
第十九天。大夏晶片國際上傳了一批經過深度脫敏的封裝工藝參數。