第276章 國產AI橫空出世

投票推薦 加入書籤 小說報錯

  「好吧,我去看看。」團長掛斷了電話。

  朋友雲林說的這麼厲害,也勾起了團長的好奇心。

  電腦上搜索「小糰子」,進入了官網。

  「先看看是不是真的像雲林說的那樣,性能超過了GPT4.0。」團長心想。

  他先嘗試著讓小糰子寫一個簡單的程序,結果小糰子很快就完成了,而且代碼規範,邏輯清晰。

  有點東西。

  至少編程方面不比GPT弱。

  接著,他又給小糰子出了幾道高難度的邏輯推理題,這些題目GPT4.0一樣會出錯。

  然而,小糰子卻輕鬆地給出了正確的答案。

  「哎呀,還真有點東西啊!」

  團長開始認真起來,他決定接下來要對小糰子進行一個更全面的測試。

  只有全方面的測試,才能真正的評測出一個AI的能力。

  團長測試過很多號稱超過GPT的AI模型,有的剛開始確實會給人帶來驚喜,但繼續測試下去,就會發現各種問題,有的甚至是為了宣傳效果,專門針對某些測試題進行了優化和訓練,實際上並沒有那麼強大。

  想到這裡,團長打開了一個自己製作的專門用於測試AI性能的測試題庫。這個題庫包含了各種類型的題目,涵蓋了語言理解、邏輯推理、數學計算、編程能力、圖形識別等多個方面,難度也層層遞進。

  接下來,團長將測試題目一次全給了小糰子。

  幾分鐘後,小糰子給出了全部的答案。

  對照標準答案,小糰子得到了85分。而同樣的測試題,GPT4.0的得分只有75分。

  「哇靠!」

  團長激動的臉色紅了,這個測試結果,他是沒有預料到的。

  小糰子的得分竟然比GPT4.0高出了整整10分。

  「這怎麼可能?」團長既興奮,又心裡存疑。

  深吸一口氣,平復了一下激動的心情,決定繼續進行測試。

  他加大了測試的難度和廣度,包括了英文、日文等多種語言的理解能力;進一步測試了小糰子的邏輯推理和數學計算,以及多模態能力等等。

  這一測試,就一直持續到了晚上八點。

  期間,團長連晚飯都顧不上吃,完全沉浸在了對小糰子的測試中。

  連續測試了七八個小時,團長眼裡有血絲,可他的精神是亢奮的。

  經過了如此詳細和全面的測試,他得出了一個讓他自己都感到震驚的結論:

  小糰子在中文、英文等多種語言的理解能力,邏輯推理能力,數學計算能力,編程能力,以及圖形識別、多媒體處理能力等多個方面,都全面超越了GPT4.0。

  這個結果,要不是他自己親自測試出來的,換做任何一個人告訴他,團長都絕對不會相信。

  「國產大模型,居然真的超越了GPT!」團長喃喃自語,說話聲音因為興奮有些顫抖。

  「先吃點東西吧,晚飯都沒吃。」

  團長的妻子端著一碗熱氣騰騰的麵條走了進來。

  「等一會兒,馬上就好了。」團長手指飛快地在鍵盤上敲擊,對測試視頻進行最後的剪輯。

  又過了一會兒,第一個測試視頻剪輯完成。

  團長迫不及待地登錄了自己的B站帳號,將視頻上傳並發布——《全面碾壓GPT4.0!國產大模型「小糰子」橫空出世!》

  作為B站上擁有百萬粉絲的知名AI科普博主,團長在AI 科技圈的影響力不容小覷。

  視頻一經發布,立刻就引起了眾多網友的關注。

  「真的假的?國產大模型超越GPT4.0了?」

  「樓主不會是在開玩笑吧?」

  「期待!趕緊去試試!」

  「我剛才測試了一下,『小糰子』確實很強,比GPT4.0好用多了!」

  「支持國產!希望『小糰子』越來越好!」

  ……

  有好奇的,有質疑的,也有興奮的,還有已經測試過「小糰子」並表示認可的。


  評論區里,各種聲音交織在一起,熱鬧非凡。

  與此同時,蘇陽剛沖完涼,從洗手間出來,一邊擦著頭髮,一邊對團團說道:「團團,匯報一下『小糰子』的最新情況。」

  「爸爸,小糰子的用戶數量已經突破20萬了。」

  這個成績蘇陽自己是滿意的。

  真要說起來,GPT剛問世的時候,不到半個月的時間在全球積累了上億的用戶。

  相比20萬用戶,還不夠看。

  蘇陽也不急。

  他相信小糰子的實力,慢慢來。

  「睡覺了,團團晚安!」蘇陽打了個哈欠。

  「爸爸晚安!」

  熄燈,睡覺。

章節目錄