第374章 好戲上演

投票推薦 加入書籤 小說報錯

  從圖表上可以看出,O1模型的得分,明顯高於其他AI模型,呈現出一種「一騎絕塵」的姿態。

  真的是這樣嗎?

  嘿嘿!

  蘇陽看著屏幕上奧特曼的表演,呵呵笑。

  「這些所謂的專業測試,也就只能騙一騙那些不懂技術的普通網民罷了。

  原因很簡單,這樣的測試,完全是可以刷題。

  只要提前讓AI模型學習大量的類似題目,它就能在測試中取得高分。但這並不代表它真的具備了強大的推理能力,更像是一種應試技巧而已。

  與此同時,OpenAI的發布會現場,奧特曼還在滔滔不絕地吹噓著O1模型在數學基準測試上的優異表現。

  「在GSM8K測試中,」奧特曼指著大屏幕上一張圖表,「O1模型的得分達到了驚人的95.4%!這比排名第二的模型高出了近5個百分點!這是一個巨大的差距!這意味著什麼?這意味著,O1模型在解決數學應用題方面,已經達到了接近人類專家的水平。」

  奧特曼不斷地強調O1模型在各種數學基準測試上的出色表現,試圖營造出一種「OpenAI再次站在了人工智慧技術最前沿」的氛圍。看他自信滿滿的表情,仿佛在告訴全世界:OpenAI才是人工智慧領域的王者。

  直播間的評論區里,讚嘆聲再次占據了主導地位。許多網友被O1模型在數學基準測試上的出色表現所折服,紛紛表示驚嘆和讚賞。

  「太強了!OpenAI果然是AI領域的領導者。」

  「95.4%!這簡直是不可思議!」

  「O1模型已經超越人類了!」

  「OpenAI又一次改變了世界!」

  但是,那些質疑的聲音,並沒有完全消失。一些網友仍然堅持認為,O1模型與磐石科技的小糰子AI模型相比,並沒有明顯的優勢。他們認為,這些數學基準測試,並不能完全代表AI模型的真實能力,更像是一種「應試教育」的產物。

  「這些測試,小糰子也能輕鬆刷到高分吧。」

  「光看測試成績有什麼用?還是要看實際應用。」

  「OpenAI是不是在自娛自樂?」

  「感覺O1模型並沒有什麼突破性的進展。」

  面對這些質疑,奧特曼決定用一個現場演示來徹底征服所有人。

  「為了讓大家更直觀地了解O1模型的推理能力,」奧特曼說道,「我們現在就讓O1模型現場解答一道高數題。」

  他看向了MR李。

  MR李在操作。

  與此同時,蘇陽對團團說道:「團團,好戲,可以開演了。」

  「收到。」

  發布會現場,技術員已經將一道複雜的高等數學題輸入到了O1模型中。這是一道關於傅立葉變換的題目,需要用到多種積分技巧和變換公式,難度相當高。

  奧特曼站在一旁,臉上帶著自信的微笑,等待著O1模型給出完美的解答。

  O1模型開始進行推演。

  然而,令人意想不到的事情發生了。

  第一次,O1模型推演到一半,突然卡住了,屏幕上顯示出一堆亂碼,然後……死機了。

章節目錄