第77章 要讓它學會自己跟自己吵架
周衛國沒有猶豫。
他轉身走出主控中心,在走廊里打了一通電話。三分鐘後,兩名便衣從基地東側的安保室出發,穿過連廊,走向檔案管理中心。
凌晨十一點四十七分。
錢慧芳正在整理明天要歸檔的文件。桌上放著一杯涼透的茶,旁邊是一張她兒子從波士頓寄來的明信片。
明信片上寫著:媽,這邊秋天很漂亮,等你退休了來看看。
門被推開的時候,她抬頭看了一眼。
兩個陌生面孔。沒有制服,但站姿筆直,目光平穩。
她手裡的文件夾掉在了地上。
沒有掙扎。沒有喊叫。甚至沒有辯解。
錢慧芳只是低下頭,把散落的文件一張一張撿起來,按編號疊好,放回了架子上。
然後她站起來,把胸前的工牌摘下來,端端正正地放在桌面中央。
「我能帶那張明信片嗎?」
便衣沒說話,看了一眼周衛國。
周衛國站在門口,沉默了兩秒。
「帶吧。」
錢慧芳把明信片折好,塞進了上衣口袋。
走出檔案中心的時候,她的步子很穩。走廊里的日光燈照在她臉上,四十七歲的女人,頭髮已經有了灰色。
路過主控中心門口時,她停了一下。
門開著。裡面的燈亮著。
她看見了坐在操作台前的林羽。
兩個人對視了不到一秒。
錢慧芳移開了目光,繼續往前走。
林羽轉回屏幕。
王磊小聲問:「她哭了嗎?」
「沒有。」
「那她什麼表情?」
林羽沒回答。
他見過那種表情。不是恐懼,不是悔恨。是一種提前預演過無數遍之後的平靜。
她早就知道會有這一天。
周衛國處理完交接手續,回到主控中心時已經是凌晨一點。
「審訊結果什麼時候出來?」林羽問。
「明天中午之前。但基本可以確認了。」
周衛國坐下來,「她上個月一共傳了三份文件。前兩份是天衍指令集的功耗測試報告。第三份就是我們換過的那份。」
「前兩份是真的。」
「是真的。」
林羽閉了一下眼。
前兩份真文件加上第三份假文件。凱文手裡的信息是七分真、三分假。
這個配比剛好。全假他不會信。大部分真、關鍵處假,他會把假的也當成真的。
「三個月。」林羽說。
周衛國點頭。他知道林羽在說什麼。三個月的窗口期。凱文按照假數據推進研發,等他發現走進死胡同的時候,天眼至少已經完成第一階段的核心訓練。
「你之前說要給她兒子另找實驗室。」
周衛國的聲音沒有情緒,「還算數嗎?」
林羽沉默了幾秒。
「不算。」
周衛國看了他一眼,沒再說話。
他把日誌本翻開,寫了最後一行。
【內部安全隱患已清除。假文檔已通過目標渠道傳至對方。窗口期正式開始倒計時。】
日期。簽名。合上。
凌晨兩點,基地安靜下來。
林羽一個人坐在主控中心,面前的屏幕上是天眼最新的運行日誌。
在他處理錢慧芳的事情時,天眼沒有停止運轉。
夏子衿給它推送了新一批訓練數據——二十段對話,全部圍繞同一個主題:道歉。
有真心的道歉,有敷衍的道歉,有被迫的道歉,有道歉之後繼續犯錯的。
天眼的輸出記錄密密麻麻列了兩頁。
林羽一條一條往下看,速度不快。
第十七條輸出讓他停了下來。
訓練樣本是一段夫妻之間的對話。丈夫忘了結婚紀念日,妻子生氣,丈夫道歉。
任務:判斷道歉是否真誠。
天眼的回答:
【判斷:真誠。依據:道歉後主動提出補救方案,且方案具體、可執行,非泛化承諾。】
【補充觀察:該道歉的真誠度與道歉次數呈負相關。如果同一錯誤重複發生,相同措辭的道歉,真誠度判定應逐次降低。】
【延伸思考:這是否意味著,語言的含義不完全由語言本身決定,還由語言出現的頻率和上下文歷史決定?】
林羽盯著最後一行看了很久。
語言的含義由頻率和歷史決定。
這不是任何一條訓練數據教給它的。
這是它自己總結出來的語言學規律。
他拿起手機,給夏子衿發了一條消息。
【你看第十七條了嗎。】
三十秒後,回復來了。
【看了。它在建立自己的語義衰減模型。】
【同一句話說多了就不值錢了。它懂了。】
林羽把手機放下,靠在椅背上。
天花板上的燈管有一盞在閃。
他閉上眼,腦子裡轉著三件事。
錢慧芳。凱文。天眼。
三條線,三個方向,三個倒計時。
錢慧芳的線已經收了。假文檔進入凱文的系統,三個月倒計時開始。
凱文的線暫時穩住了。他會花時間消化那些七真三假的數據,短期內不會有新動作。
天眼的線,正在加速。
而他需要在凱文反應過來之前,把天眼推到一個不可逆的階段。
不可逆。
這個詞在他腦子裡轉了兩圈。
他睜開眼,重新坐直。
打開一個新的文檔,開始寫。
標題只有三個字。
【階段二。】
階段二的核心,不是讓天眼學會更多知識。
是讓它學會犯錯。
林羽花了一整個上午寫方案。夏子衿在旁邊同步建模。王磊負責把他們的構想翻譯成工程代碼。
下午兩點,方案定稿。
簡單來說,就是在天眼的訓練流程里加入一個新模塊——對抗性自檢。
每當天眼給出一個結論,系統會自動生成一個反面論證,要求天眼自己反駁自己。
如果天眼能反駁成功,說明原結論是對的。
如果反駁失敗,說明原結論有漏洞。
「你要讓它學會自己跟自己吵架?」王磊敲著鍵盤,滿臉困惑。
「辯證思維。」夏子衿說。
「聽起來像精神分裂。」
「對人來說是精神分裂。對AI來說是邏輯閉環。」
林羽把辣條袋子撕開,「一個永遠不懷疑自己的系統,遲早會在某個節點上出致命錯誤。」
「你想讓它學會懷疑自己?」
「我想讓它學會,在懷疑自己之後,依然能做出決策。」
他轉身走出主控中心,在走廊里打了一通電話。三分鐘後,兩名便衣從基地東側的安保室出發,穿過連廊,走向檔案管理中心。
凌晨十一點四十七分。
錢慧芳正在整理明天要歸檔的文件。桌上放著一杯涼透的茶,旁邊是一張她兒子從波士頓寄來的明信片。
明信片上寫著:媽,這邊秋天很漂亮,等你退休了來看看。
門被推開的時候,她抬頭看了一眼。
兩個陌生面孔。沒有制服,但站姿筆直,目光平穩。
她手裡的文件夾掉在了地上。
沒有掙扎。沒有喊叫。甚至沒有辯解。
錢慧芳只是低下頭,把散落的文件一張一張撿起來,按編號疊好,放回了架子上。
然後她站起來,把胸前的工牌摘下來,端端正正地放在桌面中央。
「我能帶那張明信片嗎?」
便衣沒說話,看了一眼周衛國。
周衛國站在門口,沉默了兩秒。
「帶吧。」
錢慧芳把明信片折好,塞進了上衣口袋。
走出檔案中心的時候,她的步子很穩。走廊里的日光燈照在她臉上,四十七歲的女人,頭髮已經有了灰色。
路過主控中心門口時,她停了一下。
門開著。裡面的燈亮著。
她看見了坐在操作台前的林羽。
兩個人對視了不到一秒。
錢慧芳移開了目光,繼續往前走。
林羽轉回屏幕。
王磊小聲問:「她哭了嗎?」
「沒有。」
「那她什麼表情?」
林羽沒回答。
他見過那種表情。不是恐懼,不是悔恨。是一種提前預演過無數遍之後的平靜。
她早就知道會有這一天。
周衛國處理完交接手續,回到主控中心時已經是凌晨一點。
「審訊結果什麼時候出來?」林羽問。
「明天中午之前。但基本可以確認了。」
周衛國坐下來,「她上個月一共傳了三份文件。前兩份是天衍指令集的功耗測試報告。第三份就是我們換過的那份。」
「前兩份是真的。」
「是真的。」
林羽閉了一下眼。
前兩份真文件加上第三份假文件。凱文手裡的信息是七分真、三分假。
這個配比剛好。全假他不會信。大部分真、關鍵處假,他會把假的也當成真的。
「三個月。」林羽說。
周衛國點頭。他知道林羽在說什麼。三個月的窗口期。凱文按照假數據推進研發,等他發現走進死胡同的時候,天眼至少已經完成第一階段的核心訓練。
「你之前說要給她兒子另找實驗室。」
周衛國的聲音沒有情緒,「還算數嗎?」
林羽沉默了幾秒。
「不算。」
周衛國看了他一眼,沒再說話。
他把日誌本翻開,寫了最後一行。
【內部安全隱患已清除。假文檔已通過目標渠道傳至對方。窗口期正式開始倒計時。】
日期。簽名。合上。
凌晨兩點,基地安靜下來。
林羽一個人坐在主控中心,面前的屏幕上是天眼最新的運行日誌。
在他處理錢慧芳的事情時,天眼沒有停止運轉。
夏子衿給它推送了新一批訓練數據——二十段對話,全部圍繞同一個主題:道歉。
有真心的道歉,有敷衍的道歉,有被迫的道歉,有道歉之後繼續犯錯的。
天眼的輸出記錄密密麻麻列了兩頁。
林羽一條一條往下看,速度不快。
第十七條輸出讓他停了下來。
訓練樣本是一段夫妻之間的對話。丈夫忘了結婚紀念日,妻子生氣,丈夫道歉。
任務:判斷道歉是否真誠。
天眼的回答:
【判斷:真誠。依據:道歉後主動提出補救方案,且方案具體、可執行,非泛化承諾。】
【補充觀察:該道歉的真誠度與道歉次數呈負相關。如果同一錯誤重複發生,相同措辭的道歉,真誠度判定應逐次降低。】
【延伸思考:這是否意味著,語言的含義不完全由語言本身決定,還由語言出現的頻率和上下文歷史決定?】
林羽盯著最後一行看了很久。
語言的含義由頻率和歷史決定。
這不是任何一條訓練數據教給它的。
這是它自己總結出來的語言學規律。
他拿起手機,給夏子衿發了一條消息。
【你看第十七條了嗎。】
三十秒後,回復來了。
【看了。它在建立自己的語義衰減模型。】
【同一句話說多了就不值錢了。它懂了。】
林羽把手機放下,靠在椅背上。
天花板上的燈管有一盞在閃。
他閉上眼,腦子裡轉著三件事。
錢慧芳。凱文。天眼。
三條線,三個方向,三個倒計時。
錢慧芳的線已經收了。假文檔進入凱文的系統,三個月倒計時開始。
凱文的線暫時穩住了。他會花時間消化那些七真三假的數據,短期內不會有新動作。
天眼的線,正在加速。
而他需要在凱文反應過來之前,把天眼推到一個不可逆的階段。
不可逆。
這個詞在他腦子裡轉了兩圈。
他睜開眼,重新坐直。
打開一個新的文檔,開始寫。
標題只有三個字。
【階段二。】
階段二的核心,不是讓天眼學會更多知識。
是讓它學會犯錯。
林羽花了一整個上午寫方案。夏子衿在旁邊同步建模。王磊負責把他們的構想翻譯成工程代碼。
下午兩點,方案定稿。
簡單來說,就是在天眼的訓練流程里加入一個新模塊——對抗性自檢。
每當天眼給出一個結論,系統會自動生成一個反面論證,要求天眼自己反駁自己。
如果天眼能反駁成功,說明原結論是對的。
如果反駁失敗,說明原結論有漏洞。
「你要讓它學會自己跟自己吵架?」王磊敲著鍵盤,滿臉困惑。
「辯證思維。」夏子衿說。
「聽起來像精神分裂。」
「對人來說是精神分裂。對AI來說是邏輯閉環。」
林羽把辣條袋子撕開,「一個永遠不懷疑自己的系統,遲早會在某個節點上出致命錯誤。」
「你想讓它學會懷疑自己?」
「我想讓它學會,在懷疑自己之後,依然能做出決策。」