第94章 顯而易見的局限

投票推薦 加入書籤 小說報錯

  肖宿對這些喧囂一無所知。

  他正在實驗室里,調試「小智」系統的新版本。

  周瑾、蘇芮、劉浩然、林硯四個人圍在他身邊,大氣不敢出。

  「肖哥,明天的PPT……」周瑾小聲提醒。

  「準備好了。」肖宿頭也不抬,「昨晚改完了。」

  「那……你要不要提前演練一遍?我們可以當聽眾。」

  「不用。」

  肖宿敲下最後一行代碼,按下運行鍵,「講一遍就行了,浪費時間。」

  屏幕上的程序開始執行,數據流飛快滾動。

  肖宿看著那些跳動的數字和圖形,眼神專注。

  他其實並不緊張。

  數學是清晰的,邏輯是嚴密的,該講的講清楚就行了。

  至於台下坐的是院士還是學生,對他來說沒什麼區別。

  如果真要說有什麼期待……那就是希望提問環節,能有人問出真正有價值的問題。

  ……

  報告會當天下午一點,京大百年講堂外已經排起了長隊。

  不是誇張,是真真正正的長隊,從講堂正門口沿著林蔭道蜿蜒出去上百米,全是拿著學生證或邀請函等待入場的人。

  有京大本校的學生,有從華清、滬交、金陵大學趕來的外校師生,甚至還有幾位白髮蒼蒼的老教授,在助手的攙扶下站在隊伍中。

  「我的天,這陣仗……」

  一個京大數院的大二學生踮著腳往前看,「比明星演唱會還誇張。」

  他旁邊的室友拿著手機狂拍:

  「廢話,這可是肖神!十五歲登上《數學年刊》的男人!你看前面那幾個,是不是華清的姚院士?我在新聞上見過他照片!」

  隊伍前方,姚毅智院士確實站在那裡。

  他穿著樸素的夾克衫,戴著老花鏡,正和身邊的幾個博士生低聲討論著什麼,完全沒在意周圍投來的目光。

  倒是他身後的幾個年輕人有些緊張,畢竟是第一次在這麼多同齡人注視下排隊。

  錢衛華院士來得稍晚一些,帶著國家算力研究院的兩個研究員,直接從工作人員通道進去了。

  總不能真讓院士在外面排隊。

  一點二十分,講堂大門打開,檢票開始。

  人流緩緩湧入。

  八百個座位,不到十分鐘就坐滿了八成。

  前排最好的位置留給了受邀嘉賓和學校領導,姚院士坐在第三排正中央,錢院士在第四排。

  兩人隔著幾排座位點頭致意,算是打過招呼。

  學生們搶座的速度堪比超市大減價。

  有人為了占座連午飯都沒吃,進來後趕緊從包里掏出了麵包和礦泉水。

  有人帶了筆記本、錄音筆、甚至還有帶小型攝像機的。

  雖然按規定不能錄像,但總有人想碰碰運氣。

  講堂里嗡嗡的交談聲像蜂群。

  話題只有一個:肖宿。

  「你說肖神等會兒會緊張嗎?台下這麼多大佬。」

  「緊張?你看佐藤事件他緊張了嗎?直接圍脖甩清單打臉,那叫一個乾脆利落。」

  「也是……不過這次不一樣啊,現場提問,萬一答不上來怎麼辦?」

  「答不上來?兄弟你是沒看肖神的論文吧?他那套理論,我敢說台下能完全聽懂的不超過五十人。還提問呢,能問出像樣問題就不錯了。」

  「臥槽,這麼誇張?那我豈不是來當氣氛組的?」

  「自信點,把『豈不是』去掉。咱們就是來見證歷史的,聽懂多少算多少。」

  一點五十分,陳景明、顧清塵、江明遠跟著一眾京大領導入場,在前排嘉賓席就座。

  江明遠滿臉紅光,看著座無虛席的講堂,心裡已經在盤算今年的招生宣傳片該怎麼剪了。

  一點五十五分,講堂里的燈光暗了下來,只留下講台上的照明。

  嘈雜聲漸漸平息,所有人都屏住呼吸,看向舞台側方的入口。


  一點五十八分,肖宿出現了。

  他還是那身打扮,淺灰色T恤,深色牛仔褲,黑色雙肩包。

  走上講台的步伐平穩,放下背包,插好U盤,打開PPT,調試麥克風。

  整個過程行雲流水,花了不到一分鐘。

  兩點整。

  肖宿抬起頭,看向台下。

  八百多雙眼睛聚焦在他身上,那種被注視的壓力足以讓任何人緊張。

  但他的語氣依舊平穩。

  「我是肖宿,今天講群論在自監督特徵解耦中的應用,以及周氏猜想證明中的方法技巧。」

  沒有開場白,沒有感謝致辭,除了名字外沒有多餘的自我介紹,直接進入正題。

  台下靜了一瞬,然後響起低低的笑聲和議論。

  「這也太直接了吧……」

  「肖神風格,符合人設。」

  「我喜歡,不浪費時間。」

  講台上,肖宿已經點開了PPT第一頁。

  標題很簡單:「群作用下的特徵空間統一表示」。

  「傳統多模態學習的問題在於,不同數據類型的特徵空間是異構的。」

  肖宿的聲音通過麥克風傳遍講堂,清晰而平靜。

  「圖像用卷積神經網絡提取特徵,文本用Transformer,語音用梅爾頻譜。這些特徵向量維度不同,結構不同,度量不同。強行融合就像把蘋果和橘子加在一起算總數,沒有意義。」

  他在白板上畫了兩個不相交的圓圈,分別標註「圖像特徵空間」和「文本特徵空間」。

  「我的思路是,引入群論作為統一框架。」

  肖宿切換PPT,出現了一個複雜的數學結構圖。

  「所有數據模態,經過編碼器映射到同一個群表示空間。在這個空間裡,圖像旋轉、文本語法變換、語音時移,都可以看作群作用。」

  台下,姚毅智院士眼睛一亮,迅速在筆記本上記下幾個關鍵詞。

  「關鍵在於對稱性約束。」

  「每個數據模態都有其內在對稱性。」

  「圖像有旋轉、平移、縮放對稱;文本有語法、語義對稱。」

  「自監督學習的目標,是在保持這些對稱性的前提下,解耦出獨立的特徵因子。」

  他調出了一段代碼演示。

  屏幕上,一個簡單的神經網絡正在訓練,輸入是未標註的圖像和文本對,輸出是解耦後的特徵向量。

  「訓練過程中,系統會自動發現不同模態特徵之間的對應關係。」

  肖宿指著屏幕上的損失函數曲線。

  「這是群等變約束損失,這是特徵解耦損失。兩者結合,就能實現跨模態的自然對齊。」

  錢衛華院士身體前傾,盯著屏幕上的公式。

  他是搞超算出身的,對算法效率極其敏感。

  而肖宿展示的這個框架,計算複雜度明顯低於傳統的多模態融合方法。

  「具體到實現細節……」

  肖宿開始深入技術核心。

  接下來的三十分鐘,他像拆解精密的機械一樣,將整個群論框架一層層剝開。

  從李群在流形上的作用,到特徵空間的纖維叢結構,再到自監督信號的構造方法……

  講堂里的氣氛開始變得有些微妙。

  前十幾分鐘,大部分學生還能勉強跟上,畢竟肖宿講得深入淺出,而且還用了很多直觀的比喻。

  二十分鐘後,大多數學生已經開始眼神渙散了。

  那些「李代數」、「表示論」、「上同調」之類的術語,像天書一樣在頭頂飛舞。

  「我……我聽不懂了。」

  一個數院大三的學生痛苦地捂住臉,「雖然我們已經在上抽象代數了,但肖神講的東西,好像跟教科書上的不是一個次元啊……」

  他旁邊的室友更慘,已經選擇放棄治療,開始在筆記本上畫小人了。

  「沒事,聽不懂正常。我懷疑咱們系一半的教授現在也在硬撐。」


  確實,中後排的教授們表情各異。

  有的頻頻點頭,顯然跟上了思路;有的眉頭緊皺,努力消化那些新穎的概念;還有的已經在翻看提前列印的論文,試圖對照理解了。

  姚毅智院士的筆記本已經寫了三頁。

  他偶爾會停下來思考幾秒,然後快速寫下新的想法。

  身後的博士生們就沒這麼輕鬆了,一個個如臨大敵,拼命想跟上節奏。

  「現在看一個具體應用。」

  肖宿切換到了「小智」系統的演示界面。

  屏幕上出現了那個簡潔的對話窗口。

  肖宿先輸入了一個很簡單的水果分類問題,小智在幾秒鐘的時間裡就能夠自動完成思考並作出回答。

  這看似簡單的一幕,卻讓懂行的人脊背發麻。

  聰明的網友可能要問了,這麼簡單的問答,現在的DeepMind、OpenAI等頂尖機構的AI模型都能輕易做到,有什麼特別的呢?

  答案就在於小智回答肖宿問題的答案,事先並沒有在訓練數據中明確標註,而是系統通過特徵解耦自主「理解」的。

  類似OpenAI這樣的頂尖模型,其實本質上走的是「記憶匹配+概率推測」的路子,它們之所以能給出正確答案,不過是記住了「吃=減少」「收到=增加」的固定關聯,熟記了蘋果對應紅色、橘子對應橙色、梨對應黃/綠的統計規律,靠著海量訓練數據中的樣本匹配,找到最貼合問題的回覆,如同背會了答題模板,卻從未真正理解問題的本質。

  它的數據內容多了,回答的答案正確的概率也上升。

  但是,又因為它的資料庫雜亂的內容太多,導致最後連開發者都無法知道它會給出什麼答案,也就是「黑箱」。

  這也是有些人工智慧會被聰明的網友稱作人工智障的原因。

  它們的局限是顯而易見的。

  無法真正拆解問題中的核心特徵,更無法建立特徵間的獨立關聯,一旦遇到超出訓練樣本的場景,比如顏色特殊的水果、複雜的數量組合,就會出現卡頓、判斷偏差,甚至混淆不同特徵的邊界。

  但肖宿運用群論實現的自監督解耦框架,徹底打破了這種局限。

章節目錄