第374章好戲上演

投票推薦加入書籤小說報錯

從圖表上可以看出，O1模型的得分，明顯高於其他AI模型，呈現出一種「一騎絕塵」的姿態。

真的是這樣嗎？

嘿嘿！

蘇陽看著屏幕上奧特曼的表演，呵呵笑。

「這些所謂的專業測試，也就只能騙一騙那些不懂技術的普通網民罷了。

原因很簡單，這樣的測試，完全是可以刷題。

只要提前讓AI模型學習大量的類似題目，它就能在測試中取得高分。但這並不代表它真的具備了強大的推理能力，更像是一種應試技巧而已。

與此同時，OpenAI的發布會現場，奧特曼還在滔滔不絕地吹噓著O1模型在數學基準測試上的優異表現。

「在GSM8K測試中，」奧特曼指著大屏幕上一張圖表，「O1模型的得分達到了驚人的95.4%！這比排名第二的模型高出了近5個百分點！這是一個巨大的差距！這意味著什麼？這意味著，O1模型在解決數學應用題方面，已經達到了接近人類專家的水平。」

奧特曼不斷地強調O1模型在各種數學基準測試上的出色表現，試圖營造出一種「OpenAI再次站在了人工智慧技術最前沿」的氛圍。看他自信滿滿的表情，仿佛在告訴全世界：OpenAI才是人工智慧領域的王者。

直播間的評論區里，讚嘆聲再次占據了主導地位。許多網友被O1模型在數學基準測試上的出色表現所折服，紛紛表示驚嘆和讚賞。

「太強了！OpenAI果然是AI領域的領導者。」

「95.4%！這簡直是不可思議！」

「O1模型已經超越人類了！」

「OpenAI又一次改變了世界！」

但是，那些質疑的聲音，並沒有完全消失。一些網友仍然堅持認為，O1模型與磐石科技的小糰子AI模型相比，並沒有明顯的優勢。他們認為，這些數學基準測試，並不能完全代表AI模型的真實能力，更像是一種「應試教育」的產物。

「這些測試，小糰子也能輕鬆刷到高分吧。」

「光看測試成績有什麼用？還是要看實際應用。」

「OpenAI是不是在自娛自樂？」

「感覺O1模型並沒有什麼突破性的進展。」

面對這些質疑，奧特曼決定用一個現場演示來徹底征服所有人。

「為了讓大家更直觀地了解O1模型的推理能力，」奧特曼說道，「我們現在就讓O1模型現場解答一道高數題。」

他看向了MR李。

MR李在操作。

與此同時，蘇陽對團團說道：「團團，好戲，可以開演了。」

「收到。」

發布會現場，技術員已經將一道複雜的高等數學題輸入到了O1模型中。這是一道關於傅立葉變換的題目，需要用到多種積分技巧和變換公式，難度相當高。

奧特曼站在一旁，臉上帶著自信的微笑，等待著O1模型給出完美的解答。

O1模型開始進行推演。

然而，令人意想不到的事情發生了。

第一次，O1模型推演到一半，突然卡住了，屏幕上顯示出一堆亂碼，然後……死機了。

溫馨提示：按回車[Enter]鍵返回書目，按 ←鍵返回上一頁，按 →鍵進入下一頁，加入書籤方便您下次繼續閱讀。

第374章 好戲上演

第374章好戲上演