第232章 真正地做數學推導

投票推薦 加入書籤 小說報錯

  指尖一點,瞬間穿越到第237章 真正地做數學推導的精彩世界。

  於此同時,一輛黑色的商務車緩緩駛入校園,穩穩停在實驗室樓下。

  車門打開,一個身著深灰色西裝、面容幹練的中年男人快步走了下來。

  林正宏昨天深夜接到了江明遠傳來的消息,說肖宿那邊的AI智能體研究終於結題了。

  沒有絲毫猶豫,他立刻推掉了所有行程,訂了最早一班飛往京城的機票,連夜趕了過來。

  這半年來,林正宏始終關注著課題組的進展,偶爾也會通過江明遠詢問情況。

  他也清楚,像肖宿這樣的天才,心思全在科研上,對商業合作毫無興趣,所以從來沒有主動登門打擾過。

  首到昨天接到消息,得知肖宿己經完成了技術突破,他再也按捺不住,連夜趕來,就是想第一時間見證這份成果,敲定最終合作事宜。

  「林總,您可算到了!」

  江明遠早己在實驗室樓下等候,身邊還站著林宇。

  「江書記,林主任,辛苦二位久候了!」

  林正宏快步上前,臉上露出熱情的笑容,語氣里滿是急切。

  「肖宿同學的研究,真的徹底結題了?小智的性能,真的達到預期了?」

  江明遠笑著側身引路,語氣周到得體。

  「林總放心,肖宿的能力,你還不了解?絕對超出預期。

  不過醜話說在前面,肖宿這孩子,心思全在學術上,最煩商業合作的瑣事,一會兒見到他,咱們少談客套,多談成果,具體合作細節,後續我來跟你對接,保證不耽誤事。」

  林正宏連連點頭,「明白明白!我這次來,主要是親眼看看小智的性能,絕不打擾肖宿同學搞研究!」

  三人快步走進實驗室。

  實驗室里很安靜,只有鍵盤敲擊的輕響和紙張翻動的聲音。

  蘇芮、林硯、周瑾正專注地整理著實驗數據,劉浩然湊在肖宿身邊,探頭探腦地看他演算,嘴裡還小聲嘀咕著什麼。

  顧清塵從裡間的辦公室走了出來,看到林正宏,臉上露出溫和的笑容:「林總來了,快請坐。」

  此話一出,眾人這才發現林正宏幾人。

  林正宏連忙上前,握住顧清塵的手,語氣恭敬:「顧教授,又見面了。肖宿同學的成果,我早就想親眼看看,今天終於有機會了。」

  顧清塵笑著點了點頭,隨即示意劉浩然。

  「浩然,你來演示一下小智的性能,順便給林總講講,肖宿的核心學術思路。」

  劉浩然立刻來了精神,他快步走到電腦前,點開演示程序。

  劉浩然清了清嗓子,手指在觸摸板上滑動,調出早己準備好的演示界面。

  「林總,我先給您一個首觀的對比。」

  屏幕上彈出兩個窗口,左邊是小智的解耦框架運行日誌,右邊是一組標準測試數據。

  「這是我們用標準自然語言理解數據集做的測試。

  目前全球公開數據里,深度求索的解耦率是76%,谷歌的Pathways是71%,OpenAI的GPT-4大約在68%左右。」

  他點開小智的測試結果。

  「小智,98.47%。」

  林正宏的瞳孔猛地一縮。

  他雖然早有心理準備,但真正看到這個數字的時候,還是忍不住倒吸一口涼氣。

  76%到98%,看起來只是二十二個百分點的差距,但在AI領域,解耦率每提升一個百分點,都意味著底層架構的質變。

  七十多的解耦率意味著模型能大致分清概念之間的邊界,但遇到複雜推理時仍然會「串味」。

  而98%……

  「這意味著什麼,我給您舉個例子。」

  劉浩然顯然早有準備,他打開一個新的窗口,輸入了一行字。

  「『證明:如果一個數能被3整除,那麼它的各位數字之和也能被3整除。』這是一個初中級別的數學命題,表述很簡單,但涉及到自然語言和形式化邏輯之間的轉換。」

  他先在一個開源的通用大模型上運行。


  模型很快給出了答案,文字流暢,步驟清晰,甚至還貼心地加上了「由此可知」這樣的過渡詞。

  「看起來沒問題,對吧?」劉浩然笑了笑,手指點在屏幕上,「但您看這裡。」

  他放大了其中一行。

  模型在推導過程中寫了一句「設該數為abc,其中a、b、c分別為百位、十位、個位數字」。

  「它把『各位數字之和』理解成了『三位數的各位數字』,所以它的證明只對三位數成立。它沒有真的理解『任意正整數』這個概念,只是從語料庫里匹配到了一個最常見的教學案例。」

  林正宏皺起了眉頭。

  這個問題他太熟悉了。

  劉浩然關掉開源模型的窗口,打開了小智的測試界面,輸入了同樣的問題。

  小智的回應出現在屏幕上。

  「命題:對於任意正整數n,若3|n,則3|S(n),其中S(n)表示n的各位數字之和。

  證明:設n的十進位表示為n=a_k·10^k + a_{k-1}·10^{k-1} + … + a_1·10 + a_0,其中0≤a_i≤9。

  注意到10≡1(mod 3),故10^m≡1(mod 3)對任意非負整數m成立。

  因此n≡a_k + a_{k-1} + … + a_0 = S(n)(mod 3)。

  若3|n,則n≡0(mod 3),從而S(n)≡0(mod 3),即3|S(n)。證畢。」

  劉浩然轉過頭看著林正宏。

  「林總,看到這裡,或許您己經發現了不同吧。」

  林正宏是做技術出身,雖然不是數學專業,但基礎的邏輯素養還在。

  他盯著屏幕上的證明,眼睛越來越亮。

  「它……它用的是模運算,適用於任意正整數。」

  「對。」劉浩然點頭,「它沒有套用任何現成的教學案例,而是從十進位表示的一般形式出發,抓住了『10模3餘1』這個本質屬性。這說明它是真的理解了問題的結構,而不是在做模式匹配。」

  「目前市面上所有的大模型,本質上都是『超高級的完形填空』。它們根據前文預測下一個詞,預測得多了,看起來就像是在思考。

  但它們沒有真正的理解能力。」

  「而小智不一樣。」

  他切到小智的系統架構圖。

  「這套框架,核心思路是把自然語言、符號邏輯、數學結構這三層完全解耦。

  普通的模型處理一句話,是把所有信息攪在一起,像一鍋粥。

  小智處理一句話,會先把語義層剝開,搞清楚『這句話在說什麼』。

  然後把邏輯層分離出來,分析『這句話的邏輯結構是什麼』。

  最後把符號層提取出來,確定『這句話對應哪些數學對象和運算規則』。」

  「三層分別處理完之後,再通過辛幾何映射模塊,把這些信息嵌入到一個加權度量空間裡。

  在這個空間裡,語義相近的概念距離近,邏輯相關的結構有特定的幾何對應關係。

  然後弗洛爾同調模塊在這個空間裡做軌道分類,本質上就是在尋找從前提通往結論的最優路徑。」

  「所以它不是在做文字遊戲,它是在真正地做數學推導。」

  劉浩然關掉開源模型的窗口,打開了小智的測試界面,輸入了同樣的問題。

  小智的回應出現在屏幕上。

  「命題:對於任意正整數n,若3|n,則3|S(n),其中S(n)表示n的各位數字之和。

  證明:設n的十進位表示為n=a_k·10^k + a_{k-1}·10^{k-1} + … + a_1·10 + a_0,其中0≤a_i≤9。

  注意到10≡1(mod 3),故10^m≡1(mod 3)對任意非負整數m成立。

  因此n≡a_k + a_{k-1} + … + a_0 = S(n)(mod 3)。

  若3|n,則n≡0(mod 3),從而S(n)≡0(mod 3),即3|S(n)。證畢。」


  劉浩然轉過頭看著林正宏。

  「林總,看到這裡,或許您己經發現了不同吧。」

  林正宏是做技術出身,雖然不是數學專業,但基礎的邏輯素養還在。

  他盯著屏幕上的證明,眼睛越來越亮。

  「它……它用的是模運算,適用於任意正整數。」

  「對。」劉浩然點頭,「它沒有套用任何現成的教學案例,而是從十進位表示的一般形式出發,抓住了『10模3餘1』這個本質屬性。這說明它是真的理解了問題的結構,而不是在做模式匹配。」

  「目前市面上所有的大模型,本質上都是『超高級的完形填空』。它們根據前文預測下一個詞,預測得多了,看起來就像是在思考。

  但它們沒有真正的理解能力。」

  「而小智不一樣。」

  他切到小智的系統架構圖。

  「這套框架,核心思路是把自然語言、符號邏輯、數學結構這三層完全解耦。

  普通的模型處理一句話,是把所有信息攪在一起,像一鍋粥。

  小智處理一句話,會先把語義層剝開,搞清楚『這句話在說什麼』。

  然後把邏輯層分離出來,分析『這句話的邏輯結構是什麼』。

  最後把符號層提取出來,確定『這句話對應哪些數學對象和運算規則』。」

  「三層分別處理完之後,再通過辛幾何映射模塊,把這些信息嵌入到一個加權度量空間裡。

  在這個空間裡,語義相近的概念距離近,邏輯相關的結構有特定的幾何對應關係。

  然後弗洛爾同調模塊在這個空間裡做軌道分類,本質上就是在尋找從前提通往結論的最優路徑。」

  「所以它不是在做文字遊戲,它是在真正地做數學推導。」

章節目錄