第232章真正地做數學推導

投票推薦加入書籤小說報錯

指尖一點，瞬間穿越到第237章真正地做數學推導的精彩世界。

於此同時，一輛黑色的商務車緩緩駛入校園，穩穩停在實驗室樓下。

車門打開，一個身著深灰色西裝、面容幹練的中年男人快步走了下來。

林正宏昨天深夜接到了江明遠傳來的消息，說肖宿那邊的AI智能體研究終於結題了。

沒有絲毫猶豫，他立刻推掉了所有行程，訂了最早一班飛往京城的機票，連夜趕了過來。

這半年來，林正宏始終關注著課題組的進展，偶爾也會通過江明遠詢問情況。

他也清楚，像肖宿這樣的天才，心思全在科研上，對商業合作毫無興趣，所以從來沒有主動登門打擾過。

首到昨天接到消息，得知肖宿己經完成了技術突破，他再也按捺不住，連夜趕來，就是想第一時間見證這份成果，敲定最終合作事宜。

「林總，您可算到了！」

江明遠早己在實驗室樓下等候，身邊還站著林宇。

「江書記，林主任，辛苦二位久候了！」

林正宏快步上前，臉上露出熱情的笑容，語氣里滿是急切。

「肖宿同學的研究，真的徹底結題了？小智的性能，真的達到預期了？」

江明遠笑著側身引路，語氣周到得體。

「林總放心，肖宿的能力，你還不了解？絕對超出預期。

不過醜話說在前面，肖宿這孩子，心思全在學術上，最煩商業合作的瑣事，一會兒見到他，咱們少談客套，多談成果，具體合作細節，後續我來跟你對接，保證不耽誤事。」

林正宏連連點頭，「明白明白！我這次來，主要是親眼看看小智的性能，絕不打擾肖宿同學搞研究！」

三人快步走進實驗室。

實驗室里很安靜，只有鍵盤敲擊的輕響和紙張翻動的聲音。

蘇芮、林硯、周瑾正專注地整理著實驗數據，劉浩然湊在肖宿身邊，探頭探腦地看他演算，嘴裡還小聲嘀咕著什麼。

顧清塵從裡間的辦公室走了出來，看到林正宏，臉上露出溫和的笑容：「林總來了，快請坐。」

此話一出，眾人這才發現林正宏幾人。

林正宏連忙上前，握住顧清塵的手，語氣恭敬：「顧教授，又見面了。肖宿同學的成果，我早就想親眼看看，今天終於有機會了。」

顧清塵笑著點了點頭，隨即示意劉浩然。

「浩然，你來演示一下小智的性能，順便給林總講講，肖宿的核心學術思路。」

劉浩然立刻來了精神，他快步走到電腦前，點開演示程序。

劉浩然清了清嗓子，手指在觸摸板上滑動，調出早己準備好的演示界面。

「林總，我先給您一個首觀的對比。」

屏幕上彈出兩個窗口，左邊是小智的解耦框架運行日誌，右邊是一組標準測試數據。

「這是我們用標準自然語言理解數據集做的測試。

目前全球公開數據里，深度求索的解耦率是76%，谷歌的Pathways是71%，OpenAI的GPT-4大約在68%左右。」

他點開小智的測試結果。

「小智，98.47%。」

林正宏的瞳孔猛地一縮。

他雖然早有心理準備，但真正看到這個數字的時候，還是忍不住倒吸一口涼氣。

76%到98%，看起來只是二十二個百分點的差距，但在AI領域，解耦率每提升一個百分點，都意味著底層架構的質變。

七十多的解耦率意味著模型能大致分清概念之間的邊界，但遇到複雜推理時仍然會「串味」。

而98%……

「這意味著什麼，我給您舉個例子。」

劉浩然顯然早有準備，他打開一個新的窗口，輸入了一行字。

「『證明：如果一個數能被3整除，那麼它的各位數字之和也能被3整除。』這是一個初中級別的數學命題，表述很簡單，但涉及到自然語言和形式化邏輯之間的轉換。」

他先在一個開源的通用大模型上運行。

模型很快給出了答案，文字流暢，步驟清晰，甚至還貼心地加上了「由此可知」這樣的過渡詞。

「看起來沒問題，對吧？」劉浩然笑了笑，手指點在屏幕上，「但您看這裡。」

他放大了其中一行。

模型在推導過程中寫了一句「設該數為abc，其中a、b、c分別為百位、十位、個位數字」。

「它把『各位數字之和』理解成了『三位數的各位數字』，所以它的證明只對三位數成立。它沒有真的理解『任意正整數』這個概念，只是從語料庫里匹配到了一個最常見的教學案例。」

林正宏皺起了眉頭。

這個問題他太熟悉了。

劉浩然關掉開源模型的窗口，打開了小智的測試界面，輸入了同樣的問題。

小智的回應出現在屏幕上。

「命題：對於任意正整數n，若3|n，則3|S(n)，其中S(n)表示n的各位數字之和。

證明：設n的十進位表示為n=a_k·10^k + a_{k-1}·10^{k-1} + … + a_1·10 + a_0，其中0≤a_i≤9。

注意到10≡1(mod 3)，故10^m≡1(mod 3)對任意非負整數m成立。

因此n≡a_k + a_{k-1} + … + a_0 = S(n)(mod 3)。

若3|n，則n≡0(mod 3)，從而S(n)≡0(mod 3)，即3|S(n)。證畢。」

劉浩然轉過頭看著林正宏。

「林總，看到這裡，或許您己經發現了不同吧。」

林正宏是做技術出身，雖然不是數學專業，但基礎的邏輯素養還在。

他盯著屏幕上的證明，眼睛越來越亮。

「它……它用的是模運算，適用於任意正整數。」

「對。」劉浩然點頭，「它沒有套用任何現成的教學案例，而是從十進位表示的一般形式出發，抓住了『10模3餘1』這個本質屬性。這說明它是真的理解了問題的結構，而不是在做模式匹配。」

「目前市面上所有的大模型，本質上都是『超高級的完形填空』。它們根據前文預測下一個詞，預測得多了，看起來就像是在思考。

但它們沒有真正的理解能力。」

「而小智不一樣。」

他切到小智的系統架構圖。

「這套框架，核心思路是把自然語言、符號邏輯、數學結構這三層完全解耦。

普通的模型處理一句話，是把所有信息攪在一起，像一鍋粥。

小智處理一句話，會先把語義層剝開，搞清楚『這句話在說什麼』。

然後把邏輯層分離出來，分析『這句話的邏輯結構是什麼』。

最後把符號層提取出來，確定『這句話對應哪些數學對象和運算規則』。」

「三層分別處理完之後，再通過辛幾何映射模塊，把這些信息嵌入到一個加權度量空間裡。

在這個空間裡，語義相近的概念距離近，邏輯相關的結構有特定的幾何對應關係。

然後弗洛爾同調模塊在這個空間裡做軌道分類，本質上就是在尋找從前提通往結論的最優路徑。」

「所以它不是在做文字遊戲，它是在真正地做數學推導。」

劉浩然關掉開源模型的窗口，打開了小智的測試界面，輸入了同樣的問題。

小智的回應出現在屏幕上。

「命題：對於任意正整數n，若3|n，則3|S(n)，其中S(n)表示n的各位數字之和。

證明：設n的十進位表示為n=a_k·10^k + a_{k-1}·10^{k-1} + … + a_1·10 + a_0，其中0≤a_i≤9。

注意到10≡1(mod 3)，故10^m≡1(mod 3)對任意非負整數m成立。

因此n≡a_k + a_{k-1} + … + a_0 = S(n)(mod 3)。

若3|n，則n≡0(mod 3)，從而S(n)≡0(mod 3)，即3|S(n)。證畢。」

劉浩然轉過頭看著林正宏。

「林總，看到這裡，或許您己經發現了不同吧。」

林正宏是做技術出身，雖然不是數學專業，但基礎的邏輯素養還在。

他盯著屏幕上的證明，眼睛越來越亮。

「它……它用的是模運算，適用於任意正整數。」

「對。」劉浩然點頭，「它沒有套用任何現成的教學案例，而是從十進位表示的一般形式出發，抓住了『10模3餘1』這個本質屬性。這說明它是真的理解了問題的結構，而不是在做模式匹配。」

「目前市面上所有的大模型，本質上都是『超高級的完形填空』。它們根據前文預測下一個詞，預測得多了，看起來就像是在思考。

但它們沒有真正的理解能力。」

「而小智不一樣。」

他切到小智的系統架構圖。

「這套框架，核心思路是把自然語言、符號邏輯、數學結構這三層完全解耦。

普通的模型處理一句話，是把所有信息攪在一起，像一鍋粥。

小智處理一句話，會先把語義層剝開，搞清楚『這句話在說什麼』。

然後把邏輯層分離出來，分析『這句話的邏輯結構是什麼』。

最後把符號層提取出來，確定『這句話對應哪些數學對象和運算規則』。」

「三層分別處理完之後，再通過辛幾何映射模塊，把這些信息嵌入到一個加權度量空間裡。

在這個空間裡，語義相近的概念距離近，邏輯相關的結構有特定的幾何對應關係。

然後弗洛爾同調模塊在這個空間裡做軌道分類，本質上就是在尋找從前提通往結論的最優路徑。」

「所以它不是在做文字遊戲，它是在真正地做數學推導。」

溫馨提示：按回車[Enter]鍵返回書目，按 ←鍵返回上一頁，按 →鍵進入下一頁，加入書籤方便您下次繼續閱讀。

第232章 真正地做數學推導

第232章真正地做數學推導