第276章 國產AI橫空出世
「好吧,我去看看。」團長掛斷了電話。
朋友雲林說的這麼厲害,也勾起了團長的好奇心。
電腦上搜索「小糰子」,進入了官網。
「先看看是不是真的像雲林說的那樣,性能超過了GPT4.0。」團長心想。
他先嘗試著讓小糰子寫一個簡單的程序,結果小糰子很快就完成了,而且代碼規範,邏輯清晰。
有點東西。
至少編程方面不比GPT弱。
接著,他又給小糰子出了幾道高難度的邏輯推理題,這些題目GPT4.0一樣會出錯。
然而,小糰子卻輕鬆地給出了正確的答案。
「哎呀,還真有點東西啊!」
團長開始認真起來,他決定接下來要對小糰子進行一個更全面的測試。
只有全方面的測試,才能真正的評測出一個AI的能力。
團長測試過很多號稱超過GPT的AI模型,有的剛開始確實會給人帶來驚喜,但繼續測試下去,就會發現各種問題,有的甚至是為了宣傳效果,專門針對某些測試題進行了優化和訓練,實際上並沒有那麼強大。
想到這裡,團長打開了一個自己製作的專門用於測試AI性能的測試題庫。這個題庫包含了各種類型的題目,涵蓋了語言理解、邏輯推理、數學計算、編程能力、圖形識別等多個方面,難度也層層遞進。
接下來,團長將測試題目一次全給了小糰子。
幾分鐘後,小糰子給出了全部的答案。
對照標準答案,小糰子得到了85分。而同樣的測試題,GPT4.0的得分只有75分。
「哇靠!」
團長激動的臉色紅了,這個測試結果,他是沒有預料到的。
小糰子的得分竟然比GPT4.0高出了整整10分。
「這怎麼可能?」團長既興奮,又心裡存疑。
深吸一口氣,平復了一下激動的心情,決定繼續進行測試。
他加大了測試的難度和廣度,包括了英文、日文等多種語言的理解能力;進一步測試了小糰子的邏輯推理和數學計算,以及多模態能力等等。
這一測試,就一直持續到了晚上八點。
期間,團長連晚飯都顧不上吃,完全沉浸在了對小糰子的測試中。
連續測試了七八個小時,團長眼裡有血絲,可他的精神是亢奮的。
經過了如此詳細和全面的測試,他得出了一個讓他自己都感到震驚的結論:
小糰子在中文、英文等多種語言的理解能力,邏輯推理能力,數學計算能力,編程能力,以及圖形識別、多媒體處理能力等多個方面,都全面超越了GPT4.0。
這個結果,要不是他自己親自測試出來的,換做任何一個人告訴他,團長都絕對不會相信。
「國產大模型,居然真的超越了GPT!」團長喃喃自語,說話聲音因為興奮有些顫抖。
「先吃點東西吧,晚飯都沒吃。」
團長的妻子端著一碗熱氣騰騰的麵條走了進來。
「等一會兒,馬上就好了。」團長手指飛快地在鍵盤上敲擊,對測試視頻進行最後的剪輯。
又過了一會兒,第一個測試視頻剪輯完成。
團長迫不及待地登錄了自己的B站帳號,將視頻上傳並發布——《全面碾壓GPT4.0!國產大模型「小糰子」橫空出世!》
作為B站上擁有百萬粉絲的知名AI科普博主,團長在AI 科技圈的影響力不容小覷。
視頻一經發布,立刻就引起了眾多網友的關注。
「真的假的?國產大模型超越GPT4.0了?」
「樓主不會是在開玩笑吧?」
「期待!趕緊去試試!」
「我剛才測試了一下,『小糰子』確實很強,比GPT4.0好用多了!」
「支持國產!希望『小糰子』越來越好!」
……
有好奇的,有質疑的,也有興奮的,還有已經測試過「小糰子」並表示認可的。
評論區里,各種聲音交織在一起,熱鬧非凡。
與此同時,蘇陽剛沖完涼,從洗手間出來,一邊擦著頭髮,一邊對團團說道:「團團,匯報一下『小糰子』的最新情況。」
「爸爸,小糰子的用戶數量已經突破20萬了。」
這個成績蘇陽自己是滿意的。
真要說起來,GPT剛問世的時候,不到半個月的時間在全球積累了上億的用戶。
相比20萬用戶,還不夠看。
蘇陽也不急。
他相信小糰子的實力,慢慢來。
「睡覺了,團團晚安!」蘇陽打了個哈欠。
「爸爸晚安!」
熄燈,睡覺。
朋友雲林說的這麼厲害,也勾起了團長的好奇心。
電腦上搜索「小糰子」,進入了官網。
「先看看是不是真的像雲林說的那樣,性能超過了GPT4.0。」團長心想。
他先嘗試著讓小糰子寫一個簡單的程序,結果小糰子很快就完成了,而且代碼規範,邏輯清晰。
有點東西。
至少編程方面不比GPT弱。
接著,他又給小糰子出了幾道高難度的邏輯推理題,這些題目GPT4.0一樣會出錯。
然而,小糰子卻輕鬆地給出了正確的答案。
「哎呀,還真有點東西啊!」
團長開始認真起來,他決定接下來要對小糰子進行一個更全面的測試。
只有全方面的測試,才能真正的評測出一個AI的能力。
團長測試過很多號稱超過GPT的AI模型,有的剛開始確實會給人帶來驚喜,但繼續測試下去,就會發現各種問題,有的甚至是為了宣傳效果,專門針對某些測試題進行了優化和訓練,實際上並沒有那麼強大。
想到這裡,團長打開了一個自己製作的專門用於測試AI性能的測試題庫。這個題庫包含了各種類型的題目,涵蓋了語言理解、邏輯推理、數學計算、編程能力、圖形識別等多個方面,難度也層層遞進。
接下來,團長將測試題目一次全給了小糰子。
幾分鐘後,小糰子給出了全部的答案。
對照標準答案,小糰子得到了85分。而同樣的測試題,GPT4.0的得分只有75分。
「哇靠!」
團長激動的臉色紅了,這個測試結果,他是沒有預料到的。
小糰子的得分竟然比GPT4.0高出了整整10分。
「這怎麼可能?」團長既興奮,又心裡存疑。
深吸一口氣,平復了一下激動的心情,決定繼續進行測試。
他加大了測試的難度和廣度,包括了英文、日文等多種語言的理解能力;進一步測試了小糰子的邏輯推理和數學計算,以及多模態能力等等。
這一測試,就一直持續到了晚上八點。
期間,團長連晚飯都顧不上吃,完全沉浸在了對小糰子的測試中。
連續測試了七八個小時,團長眼裡有血絲,可他的精神是亢奮的。
經過了如此詳細和全面的測試,他得出了一個讓他自己都感到震驚的結論:
小糰子在中文、英文等多種語言的理解能力,邏輯推理能力,數學計算能力,編程能力,以及圖形識別、多媒體處理能力等多個方面,都全面超越了GPT4.0。
這個結果,要不是他自己親自測試出來的,換做任何一個人告訴他,團長都絕對不會相信。
「國產大模型,居然真的超越了GPT!」團長喃喃自語,說話聲音因為興奮有些顫抖。
「先吃點東西吧,晚飯都沒吃。」
團長的妻子端著一碗熱氣騰騰的麵條走了進來。
「等一會兒,馬上就好了。」團長手指飛快地在鍵盤上敲擊,對測試視頻進行最後的剪輯。
又過了一會兒,第一個測試視頻剪輯完成。
團長迫不及待地登錄了自己的B站帳號,將視頻上傳並發布——《全面碾壓GPT4.0!國產大模型「小糰子」橫空出世!》
作為B站上擁有百萬粉絲的知名AI科普博主,團長在AI 科技圈的影響力不容小覷。
視頻一經發布,立刻就引起了眾多網友的關注。
「真的假的?國產大模型超越GPT4.0了?」
「樓主不會是在開玩笑吧?」
「期待!趕緊去試試!」
「我剛才測試了一下,『小糰子』確實很強,比GPT4.0好用多了!」
「支持國產!希望『小糰子』越來越好!」
……
有好奇的,有質疑的,也有興奮的,還有已經測試過「小糰子」並表示認可的。
評論區里,各種聲音交織在一起,熱鬧非凡。
與此同時,蘇陽剛沖完涼,從洗手間出來,一邊擦著頭髮,一邊對團團說道:「團團,匯報一下『小糰子』的最新情況。」
「爸爸,小糰子的用戶數量已經突破20萬了。」
這個成績蘇陽自己是滿意的。
真要說起來,GPT剛問世的時候,不到半個月的時間在全球積累了上億的用戶。
相比20萬用戶,還不夠看。
蘇陽也不急。
他相信小糰子的實力,慢慢來。
「睡覺了,團團晚安!」蘇陽打了個哈欠。
「爸爸晚安!」
熄燈,睡覺。