第635章 李飛飛的斷言

投票推薦 加入書籤 小說報錯

  「這40%的正確率,確實能打,但這是通用模型沒做微調跑出來的數據。」

  「這絕對不是咱們實力的天花板。」

  郭長征敲了敲桌子,給幾個年輕人降降溫。

  「你想想,為了去榜單上當個顯眼包,白白浪費一次提交機會。」

  「等後面咱們訓練出準確度更高的專用模型,結果發現手裡只剩四次機會了,虧不虧?」

  楚一航非常贊同郭長征的觀點,也跟著勸鍾柏。

  「郭老師說得對,穩住咱們能贏。」

  「五次提交機會太寶貴了,不能一開局為了裝杯就隨便浪費掉。」

  楚一航搓了搓下巴。

  「咱們得沉得住氣。」

  鍾柏聽完,徹底收起了那股想出風頭的浮躁勁,乖乖離開了電腦桌。

  「懂了,苟住發育。那咱們接下來這三個月從哪下手?」

  郭長征轉身走到白板前,拿起黑色馬克筆。

  「干咱們該乾的具體工作。」

  「先把這通用模型的輸出層改了,剔除多餘的四千個類別,專門針對比賽的一千個分類做訓練。」

  幾個人立刻進入了工作狀態。

  鍾柏負責修改網絡輸出層的代碼結構。

  葉言開始編寫過濾多餘分類的數據清洗腳本。

  楚一航則坐在電腦前,監控著九章平台的顯存調度,為接下來的微調訓練預留算力通道。

  教研室里剛才的激動情緒一掃而空,只剩下連串的鍵盤敲擊聲。

  ……

  史丹福大學的人工智慧實驗室里,大衛用力敲打著回車鍵。

  屏幕上彈出一行紅色的錯誤提示,伴隨著一聲警告音。

  大衛抓了抓頭髮,把鍵盤推到一邊。

  約翰坐在旁邊的工位上,轉動椅子滑了過來。

  「又報錯了?」約翰看著大衛的屏幕。

  「內存溢出。」大衛指著屏幕上的代碼行,「這數據量完全超出了現有設備的承受極限。」

  約翰湊近看了一眼後台的運行日誌。

  「這套圖片分類的數據集太大了,一百萬張圖片,我們的算法根本跑不動。」約翰連連搖頭。

  兩人都是李飛飛團隊的博士。

  雖然作為主辦方團隊的成員,但是兩人也報名參加了比賽。

  兩人正愁眉苦臉,李飛飛拿著一個裝滿黑咖啡的馬克杯走了進來。

  大衛趕緊轉頭看向李飛飛。

  「飛飛教授,你覺得這次數據集的比賽,第一名大概能達到怎樣的程度?」大衛開口詢問。

  李飛飛拉過一把辦公椅,在大衛身邊坐下。

  她把馬克杯放在桌上,看著屏幕上的錯誤日誌。

  「大家不要灰心,我們內部其實已經用各種傳統數值方法做過測試了。」李飛飛語氣平緩。

  大衛立刻來了精神,坐直了身子。

  「教授,測試結果怎麼樣?」大衛追問。

  李飛飛喝了一口咖啡,放下杯子。

  「根據我們跑出的結果,這套數據集的極限應該可以超過30%。」李飛飛說出了數字。

  約翰在旁邊計算了一下。

  「您是指 top 1 的正確率?」約翰確認道。

  李飛飛點了點頭。

  「是的。至於 top 5 的正確率,可以超過70%。」李飛飛補充。

  大衛皺起眉頭,手指在桌面上敲擊。

  「超過30%?我們在特徵提取上花了這麼多時間,結果還差這麼多?」大衛顯得有些沮喪。

  李飛飛看著大衛的眼睛。

  「大衛,科學研究不能只看眼前的得失。目前我們嘗試了所有不同的算法,確實只能達到這個程度。」

  李飛飛站起身,走到實驗室中央的白板前。

  「但是,我對其他參賽團隊很有信心。」李飛飛說。

  「為什麼?」約翰不解地問。

  「因為現在這個數據集完全開放了。它會激發全球所有頂尖研究人員的熱情。」李飛飛解釋道。

  大衛嘆了口氣。

  「光有熱情沒用啊,算力跟不上,大家都在用傳統的支持向量機做分類,上限就在那裡。」大衛反駁。

  李飛飛笑了笑,「這就要感謝英偉達了。他們這次提供了非常大的幫助。」。

  約翰撇了撇嘴。

  「老黃這次確實花了不少錢,幾萬美元的獎金呢。」約翰調侃道。

  大衛跟著附和。

  「就是,重賞之下必有勇夫。很多人估計連夜都在改代碼,就為了搶這筆獎金。」

  李飛飛走回座位。

  「不僅僅是獎金。英偉達設置的賽制非常吸引人,這種實時排名會帶來很大的競爭壓力。」

  李飛飛繼續分析。

  「這些條件加在一起,能幫助比賽吸引更多頂尖團隊來提交數據。有競爭,才能取得更高的成績。」

  大衛還是覺得不樂觀。

  「可是教授,您覺得第一名到底能考多少分?」大衛又回到了最初的問題。

  李飛飛在心裡盤算了一下。

  「按照目前的學術發展速度,我預測,top 1 正確率能到32%。」李飛飛給出了具體的數值。

  「top 5 正確率能到75%。」李飛飛繼續說道。

  約翰把這兩個數字記錄在筆記本上。

  「這就到頂了嗎?」約翰問。

  李飛飛點頭。

  「對,這就是目前的極限了。」李飛飛語氣肯定。

  「為什麼不能更高?」大衛追問。

  「畢竟以目前的技術水平,據我所知,應該還沒有達到那種脫胎換骨的程度。」李飛飛解釋。

  李飛飛端起咖啡杯。

  「沒有新技術的加入,單靠優化現有算法,32%就是很難突破的瓶頸。」

  大衛靠在椅背上。

  「那這個比賽還有什麼意義?大家只是在小數點後兩位互相競爭。」大衛抱怨道。

  李飛飛拍了拍大衛的肩膀。

  「不要著急。我覺得,如果這個比賽未來幾年一直辦下去,一定會產生質的改變。」李飛飛語氣中充滿期待。

  大衛無奈地重新拉過鍵盤。

  「好吧,那我繼續去改參數。看看能不能把正確率從25%提高到30%。」大衛重新投入工作。

  ……

  同一時間,加拿大多倫多大學。

  教研室的角落裡,亞歷克斯正盯著電腦屏幕上緩慢跳動的進度條,煩躁地抓了抓頭髮。

  伊利亞坐在旁邊,機械地敲擊著鍵盤。

  「這組數據的預訓練還要跑多久?」伊利亞頭也不回地問。

  亞歷克斯嘆了口氣,敲了一下回車鍵。

  「按照現在的運算速度,大概還需要一個星期。這還是不出任何內存報錯的情況。」亞歷克斯語氣里滿是絕望。

  長時間的等待讓人抓狂,亞歷克斯切出編譯器,打算看點科技新聞換換腦子。

  一條關於ImageNet視覺識別挑戰賽的通告彈了出來。

章節目錄