第344章 那到時候顧叔叔應該就不會再難過了吧
好不容易安撫好奶奶和王舒,肖宿這才回到了書房。
房間裡十分安靜,只能聽見空調送風的低鳴和肖宿踩在地板上的腳步聲。
他在書桌前坐下,重新梳理了一遍剛剛思考的問題。
推演是一回事,真正要做出來又是另一回事。
想要真正做到讓一個人的記憶在機器人身上存在,那麼他要做的,就要橫跨自然語言處理、計算機視覺、知識圖譜、情感計算、腦機接口和精密機械工程等所有領域,建立起一個完整的架構。
而這些,隨便選一個出來,都夠一個頂尖實驗室花上數十幾年去啃了。
更何況他要做的還不是單點突破,而是要把這幾條線全部擰在一起,在每一個交叉節點上同時攻關,還不能讓任何一條線在集成的時候掉鏈子,難度不知道提升了多少倍。
這條路還沒有人踏足過。
肖宿作為第一個人,他需要自己從頭設計一整套全新的架構,從跨平台數據採集與身份對齊的算法管道,到具有長期人格一致性的新型對話模型,從多模態情感表達的統一表徵框架,到適配機械軀體的低延遲交互控制系統,並且確保每一層接口在算法上和工程上都是嚴格兼容的。
這個工程量比他之前做的任何一個課題都要大。
而且他隱隱感覺到,一旦走上了這條路,要解決的就不僅僅是算法和軟體的問題。
要讓這個機器人真正能夠陪伴在顧叔叔身邊,硬體層面也必須做出相應的改造,更長的續航、更自然的觸感、更精細的表情控制。
這些都不是一朝一夕能完成的事情,每往前推進一步,都會牽扯出更大的系統工程。
不過技術上的難題,對肖宿來說,從來都不是難題。
他抬了抬手,撐住了下巴,眉頭微微皺起,思考起接下來的任務。
第一個就是需要確認的關鍵節點,也是整條鏈路里他最需要摸清現狀的環節,就是在個人數據整合與人格建模那邊。
目前全球範圍內,個人數字足跡的全量採集能做到多完整才可行?
不同平台之間的數據孤島有沒有被打通的先例?
從碎片化的行為數據到結構化的人格檔案,中間的建模技術目前走到了哪一步?
有沒有人嘗試過把一個人的全部數字痕跡輸入一個統一的大模型,訓練出一個能夠持續對話且人格高度一致的數字分身?
更關鍵的是,這種數字分身在長期交互中的穩定性如何?會不會在數十輪對話之後出現人格漂移、記憶混亂或者情感反應失真的問題?
這些問題在AI和算法層面他可以自己推導,但是具體的技術邊界和工程現狀不看文獻是憑空想不出來的。
人格模型能有多像本人,不是推導出來的,是拿真實數據訓練完、讓認識本人的人一個一個測出來的。
他打開電腦,給小智下發了搜索指令,很快,屏幕上就按時間倒序列出了全球範圍內與這個內容高度相關的論文、預印本、實驗報告和技術白皮書。
排在最前面的是一篇來自麻省理工學院媒體實驗室的研究報告。
他們在大約三年前啟動了一個名為「長期記憶對話智能體」的項目,將一名志願者長達八年的個人郵件、日記、社交媒體帖子整合為訓練語料,結合大規模預訓練語言模型與檢索增強生成技術,構建了一個能夠以該志願者身份進行日常對話的數字分身。
在為期六周的交互測試中,數字分身在事實回憶類問題上的準確率表現優異,在觀點表達與語言風格上也與本人保持了高度一致。
但報告的後半段也寫得很清楚,所有測試都在文本模態下進行,不涉及語音、不涉及面部表情、不涉及肢體動作。
而且志願者的數據是提前完整交付的,不存在跨平台數據採集的難題。
第六周測試結束之後,研究團隊關閉了系統,模型權重存檔,沒有再繼續運行。
純粹的單模態對話實驗。
沒有任何多模態交互。
肖宿把這篇文章的關鍵參數保存下來,繼續往下翻。
第二篇來自國內一家人工智慧公司在數字人方向的商業部署報告,標題是「基於多模態數據融合的實時數字人系統」。
他們整合了目標個體的語音錄音、視頻採訪素材和公開演講文本,訓練了一個能夠實時語音對話、同步驅動三維面部動畫的數字人。
系統在單次發布會演示中效果驚艷,數字人的聲音、口音、微表情與本人高度相似,在預設話題範圍內的對答流暢自然。
但報告的技術附錄里寫得很克制,系統的長期人格一致性尚未經過充分測試,跨話題的開放域對話能力受限於訓練數據的覆蓋範圍,且整個系統依賴高質量的結構化數據輸入,對於普通個體常見的碎片化、低質量數字足跡缺乏魯棒的處理能力。
高質量數據輸入,預設話題範圍,單次演示。
這些都不是肖宿需要的。
他需要的是一套能夠從普通人日常數字碎片中自動提取、自動整合、自動建模,並且在長期運行中保持人格穩定的系統。
不是一個演示用的數字人,而是一個真正能長期陪伴的機器人。
第三篇時間更近一些,但不是關於技術層面的。
這是史丹福大學虛擬人機互動實驗室在前年年底發表的一篇元分析綜述。
他們系統回顧了全球近十年來所有關於數字人格復現與虛擬陪伴的研究,試圖回答一個核心問題:在親人去世後,使用基於逝者數據的數字分身進行哀傷輔導,其心理效果究竟如何?
結論是複雜的。
在短期內,與逝者的數字分身進行對話確實能夠顯著降低喪親者的急性哀傷反應,尤其是對於突然喪親、未能完成告別儀式的個體而言,數字分身提供了一個釋放未竟之言的出口。
但在長期跟蹤中,研究者發現了明顯分化:一部分用戶能夠在與數字分身相處一段時間後逐漸接受現實,完成心理告別,將數字分身作為一種紀念形式而非替代品;另一部分用戶則出現了延長哀傷障礙的症狀,過度依賴數字分身而無法回歸正常社交生活,將數字分身當成了逝者本人的替代。
這篇綜述讓肖宿沉默了很久。
心理慰藉與情感依賴之間的邊界……
這個邊界不是技術問題,卻比任何技術問題都更難處理。
如果他真的做出了一個擁有顧遠全部記憶與性格的機器人,把它交到顧叔叔手上,顧叔叔會是在哪個群體裡呢?
是能夠藉由這個機器人完成告別、重新走向生活的那一部分,還是會被困在這個永遠不老的數字形象里、再也走不出來的那一部分?
他暫時沒有答案。
但是這不意味著現在就要停下來。
技術本身不回答倫理問題,但至少可以先把選擇的自由做出來。
肖宿的目光從屏幕上移開,落在書桌一角那個深藍色的文件夾上。
如果這個設想真的成功了,那有一天,這個被數據和代碼重新構建起來的人格鏡像,會不會也露出和顧遠照片上一模一樣的笑容?
那到時候顧叔叔應該就不會再難過了吧。
房間裡十分安靜,只能聽見空調送風的低鳴和肖宿踩在地板上的腳步聲。
他在書桌前坐下,重新梳理了一遍剛剛思考的問題。
推演是一回事,真正要做出來又是另一回事。
想要真正做到讓一個人的記憶在機器人身上存在,那麼他要做的,就要橫跨自然語言處理、計算機視覺、知識圖譜、情感計算、腦機接口和精密機械工程等所有領域,建立起一個完整的架構。
而這些,隨便選一個出來,都夠一個頂尖實驗室花上數十幾年去啃了。
更何況他要做的還不是單點突破,而是要把這幾條線全部擰在一起,在每一個交叉節點上同時攻關,還不能讓任何一條線在集成的時候掉鏈子,難度不知道提升了多少倍。
這條路還沒有人踏足過。
肖宿作為第一個人,他需要自己從頭設計一整套全新的架構,從跨平台數據採集與身份對齊的算法管道,到具有長期人格一致性的新型對話模型,從多模態情感表達的統一表徵框架,到適配機械軀體的低延遲交互控制系統,並且確保每一層接口在算法上和工程上都是嚴格兼容的。
這個工程量比他之前做的任何一個課題都要大。
而且他隱隱感覺到,一旦走上了這條路,要解決的就不僅僅是算法和軟體的問題。
要讓這個機器人真正能夠陪伴在顧叔叔身邊,硬體層面也必須做出相應的改造,更長的續航、更自然的觸感、更精細的表情控制。
這些都不是一朝一夕能完成的事情,每往前推進一步,都會牽扯出更大的系統工程。
不過技術上的難題,對肖宿來說,從來都不是難題。
他抬了抬手,撐住了下巴,眉頭微微皺起,思考起接下來的任務。
第一個就是需要確認的關鍵節點,也是整條鏈路里他最需要摸清現狀的環節,就是在個人數據整合與人格建模那邊。
目前全球範圍內,個人數字足跡的全量採集能做到多完整才可行?
不同平台之間的數據孤島有沒有被打通的先例?
從碎片化的行為數據到結構化的人格檔案,中間的建模技術目前走到了哪一步?
有沒有人嘗試過把一個人的全部數字痕跡輸入一個統一的大模型,訓練出一個能夠持續對話且人格高度一致的數字分身?
更關鍵的是,這種數字分身在長期交互中的穩定性如何?會不會在數十輪對話之後出現人格漂移、記憶混亂或者情感反應失真的問題?
這些問題在AI和算法層面他可以自己推導,但是具體的技術邊界和工程現狀不看文獻是憑空想不出來的。
人格模型能有多像本人,不是推導出來的,是拿真實數據訓練完、讓認識本人的人一個一個測出來的。
他打開電腦,給小智下發了搜索指令,很快,屏幕上就按時間倒序列出了全球範圍內與這個內容高度相關的論文、預印本、實驗報告和技術白皮書。
排在最前面的是一篇來自麻省理工學院媒體實驗室的研究報告。
他們在大約三年前啟動了一個名為「長期記憶對話智能體」的項目,將一名志願者長達八年的個人郵件、日記、社交媒體帖子整合為訓練語料,結合大規模預訓練語言模型與檢索增強生成技術,構建了一個能夠以該志願者身份進行日常對話的數字分身。
在為期六周的交互測試中,數字分身在事實回憶類問題上的準確率表現優異,在觀點表達與語言風格上也與本人保持了高度一致。
但報告的後半段也寫得很清楚,所有測試都在文本模態下進行,不涉及語音、不涉及面部表情、不涉及肢體動作。
而且志願者的數據是提前完整交付的,不存在跨平台數據採集的難題。
第六周測試結束之後,研究團隊關閉了系統,模型權重存檔,沒有再繼續運行。
純粹的單模態對話實驗。
沒有任何多模態交互。
肖宿把這篇文章的關鍵參數保存下來,繼續往下翻。
第二篇來自國內一家人工智慧公司在數字人方向的商業部署報告,標題是「基於多模態數據融合的實時數字人系統」。
他們整合了目標個體的語音錄音、視頻採訪素材和公開演講文本,訓練了一個能夠實時語音對話、同步驅動三維面部動畫的數字人。
系統在單次發布會演示中效果驚艷,數字人的聲音、口音、微表情與本人高度相似,在預設話題範圍內的對答流暢自然。
但報告的技術附錄里寫得很克制,系統的長期人格一致性尚未經過充分測試,跨話題的開放域對話能力受限於訓練數據的覆蓋範圍,且整個系統依賴高質量的結構化數據輸入,對於普通個體常見的碎片化、低質量數字足跡缺乏魯棒的處理能力。
高質量數據輸入,預設話題範圍,單次演示。
這些都不是肖宿需要的。
他需要的是一套能夠從普通人日常數字碎片中自動提取、自動整合、自動建模,並且在長期運行中保持人格穩定的系統。
不是一個演示用的數字人,而是一個真正能長期陪伴的機器人。
第三篇時間更近一些,但不是關於技術層面的。
這是史丹福大學虛擬人機互動實驗室在前年年底發表的一篇元分析綜述。
他們系統回顧了全球近十年來所有關於數字人格復現與虛擬陪伴的研究,試圖回答一個核心問題:在親人去世後,使用基於逝者數據的數字分身進行哀傷輔導,其心理效果究竟如何?
結論是複雜的。
在短期內,與逝者的數字分身進行對話確實能夠顯著降低喪親者的急性哀傷反應,尤其是對於突然喪親、未能完成告別儀式的個體而言,數字分身提供了一個釋放未竟之言的出口。
但在長期跟蹤中,研究者發現了明顯分化:一部分用戶能夠在與數字分身相處一段時間後逐漸接受現實,完成心理告別,將數字分身作為一種紀念形式而非替代品;另一部分用戶則出現了延長哀傷障礙的症狀,過度依賴數字分身而無法回歸正常社交生活,將數字分身當成了逝者本人的替代。
這篇綜述讓肖宿沉默了很久。
心理慰藉與情感依賴之間的邊界……
這個邊界不是技術問題,卻比任何技術問題都更難處理。
如果他真的做出了一個擁有顧遠全部記憶與性格的機器人,把它交到顧叔叔手上,顧叔叔會是在哪個群體裡呢?
是能夠藉由這個機器人完成告別、重新走向生活的那一部分,還是會被困在這個永遠不老的數字形象里、再也走不出來的那一部分?
他暫時沒有答案。
但是這不意味著現在就要停下來。
技術本身不回答倫理問題,但至少可以先把選擇的自由做出來。
肖宿的目光從屏幕上移開,落在書桌一角那個深藍色的文件夾上。
如果這個設想真的成功了,那有一天,這個被數據和代碼重新構建起來的人格鏡像,會不會也露出和顧遠照片上一模一樣的笑容?
那到時候顧叔叔應該就不會再難過了吧。