第650章 榜首易主
視線轉回到被玉泉路扛把子打擊了的亞歷克斯身上。
接下來的兩周的時間,在多倫多大學的教研室里,完全是用空掉的咖啡紙杯和成堆的外賣盒堆出來的。
2010年2月5日。
亞歷克斯盯著電腦屏幕上的進度條,布滿血絲的雙眼死死盯著最後跳動的幾個數字。
機箱裡的英偉達顯卡風扇正在瘋狂咆哮。
「跑完了!終於跑完了!」亞歷克斯有些激動地說道。
屏幕上顯示著剛剛出爐的測試集預測結果。
Top-1正確率:60.2%。
Top-5正確率:76.4%。
「老天,這條路走通了。」亞歷克斯雙手捂住臉,狠狠地搓了兩下,試圖確認自己是不是因為熬夜太多出現了幻覺。
傑弗里·辛頓正好端著馬克杯走進教研室,聽到動靜後停下腳步。
「你的顯卡要爆炸了嗎?」辛頓指了指那台轟鳴的主機。
亞歷克斯並沒有理會辛頓的問題,而是轉過身,語氣有些激動。
「老闆,你絕對想不到這個數字是多少。第一版模型,訓練和預測全部完成了。」
辛頓放下杯子,走到電腦前。
他扶了一下眼鏡,湊近屏幕看清了那兩行數據。
整個教研室突然安靜下來,只有顯卡風扇還在不知疲倦地轉動。
「60.2%?」辛頓轉頭看向亞歷克斯,「你確定跑的是ImageNet的測試集,而不是什麼簡單的數據集?」
「絕對是ImageNet,我用全部參數跑了一遍,英偉達的並行計算能力幫了大忙,如果沒有GPU,這玩意兒起碼要算上幾個月。」亞歷克斯快速敲擊著鍵盤,調出詳細的日誌文件。
辛頓拉過一把椅子坐下,逐行檢查著日誌里的訓練疊代過程。
「不僅跑通了深度神經網絡,而且這在驗證集上的表現實在太驚艷了。」辛頓敲了敲桌子。
「去看看排行榜,那個中國隊伍現在的成績是多少?」辛頓繼續問道。
亞歷克斯立刻打開瀏覽器,輸入ImageNet比賽的後台網址。
頁面加載出來後,「玉泉路扛把子」這個名字依然高掛在榜首。
成績依然是59.8%。
「他們這兩周沒有任何動作,估計是算力不夠,卡在瓶頸期了。」亞歷克斯盯著那個有些滑稽的隊名。
「教授,以我們目前在驗證集上的跑分,只要測試集不出現大翻車,很有希望能超過他們!」亞歷克斯語氣里滿是自信。
「那還等什麼?」辛頓點點頭,「把測試集的預測結果傳上去,讓他們看看多倫多大學的實力。」
亞歷克斯迅速將預測結果整理成指定格式的數據文件。
按照ImageNet的比賽規則,參賽團隊手裡沒有測試集的真實標籤。
大家只能把預測出來的結果文件上傳給官方伺服器。
最終能拿多少分,得等官方後台計算完正確率,統一刷新榜單才能揭曉。
亞歷克斯點下上傳按鈕。
網絡狀態欄轉了幾圈後,頁面彈出了「提交成功」的提示。
按照之前驗證集的數據推算,他覺得這次肯定能把「玉泉路扛把子」踹下神壇,把第一名的寶座搶過來。
一天後。
ImageNet的排行榜迎來了最新的數據刷新。
史丹福大學人工智慧實驗室里。
陳冉端著一杯冰美式,習慣性地在後台刷新了一下數據。
過去的兩周里,他的郵箱幾乎被全球各地的科研團隊塞爆了。
郵件的內容驚人的一致:投訴。
大家都在質疑那個「玉泉路扛把子」的59.8%是數據造假。
有些脾氣暴躁的歐洲學者甚至在郵件里揚言,如果不取消這個隊伍的成績,他們就要退出比賽。
陳冉回覆郵件回得手指頭都要抽筋了,每天都在重複解釋測試集絕對安全,對方沒有作弊。
他盯著屏幕,右手食指再次按下了F5刷新鍵。
頁面閃爍了一下。
後台自動計算的,還沒有人工確認的榜單里,榜首的名字變了。
第一名:AlexNet。
Top-1正確率:60.1%。
第二名:玉泉路扛把子。
Top-1正確率:59.8%。
陳冉端著冰美式的手停在半空中,冰塊在塑料杯里晃蕩出清脆的響聲。
「又來一個?」陳冉放下杯子,立刻調出AlexNet的提交記錄。
他仔細核對了對方的參數量和預測結果,確認這又是一份真實有效的數據。
陳冉拿起桌上的座機,撥通了李飛飛的內部號碼。
「教授,榜單有大變動,您最好親自來看一眼。」陳冉對著話筒快速說道。
兩分鐘後,李飛飛快步走進實驗室,站在陳冉的工位後方。
「那個中國隊伍又提交新數據了?」李飛飛看著屏幕。
「不是他們,是一支新隊伍,名字叫AlexNet,把『玉泉路扛把子』擠下去了。」陳冉指著屏幕上的兩組數據。
李飛飛雙手環抱在胸前,看著那兩個咬得很緊的正確率。
「60.1%和59.8%。」李飛飛分析道,「從第三方視角來看,這兩組數據實在太接近了。」
「教授,外面那些質疑造假的聲音,這下應該會消停了吧?」陳冉問道。
「何止是消停,整個學術界估計要炸鍋了。」李飛飛指著屏幕,「之前只有一支隊伍遙遙領先,大家可以說那是造假,是測試集泄露。現在出現了第二支隊伍,成績在同一個量級,這就證明了一件事。」
「有一種我們未知的技術路線,確確實實能夠達到這種恐怖的正確率。」陳冉接話道。
「沒錯。」李飛飛點頭,「去查一下AlexNet的註冊信息。」
陳冉敲了幾下鍵盤:「查到了,IP位址來自加拿大,機構填的是多倫多大學。」
「多倫多?」李飛飛思索片刻,「看來在這個未知的賽道上,已經有人開始飆車了。」
幾小時後,全球各大高校的計算機實驗室里,無數科研人員也看到了更新後的榜單。
前幾天還在論壇里大喊「玉泉路扛把子」是騙子的人,此刻全都閉嘴了。
取而代之的是一種名為「這怎麼可能」的恐慌情緒。
大家都在傳統算法里苦苦掙扎,好不容易提升個0.1%都要開香檳慶祝。
現在這兩個隊伍直接把正確率拉升了一倍。
這感覺就像是大家都在用長矛打獵,突然有兩個人開著武裝直升機出來掃射。
根本不在同一個時代。
接下來的兩周的時間,在多倫多大學的教研室里,完全是用空掉的咖啡紙杯和成堆的外賣盒堆出來的。
2010年2月5日。
亞歷克斯盯著電腦屏幕上的進度條,布滿血絲的雙眼死死盯著最後跳動的幾個數字。
機箱裡的英偉達顯卡風扇正在瘋狂咆哮。
「跑完了!終於跑完了!」亞歷克斯有些激動地說道。
屏幕上顯示著剛剛出爐的測試集預測結果。
Top-1正確率:60.2%。
Top-5正確率:76.4%。
「老天,這條路走通了。」亞歷克斯雙手捂住臉,狠狠地搓了兩下,試圖確認自己是不是因為熬夜太多出現了幻覺。
傑弗里·辛頓正好端著馬克杯走進教研室,聽到動靜後停下腳步。
「你的顯卡要爆炸了嗎?」辛頓指了指那台轟鳴的主機。
亞歷克斯並沒有理會辛頓的問題,而是轉過身,語氣有些激動。
「老闆,你絕對想不到這個數字是多少。第一版模型,訓練和預測全部完成了。」
辛頓放下杯子,走到電腦前。
他扶了一下眼鏡,湊近屏幕看清了那兩行數據。
整個教研室突然安靜下來,只有顯卡風扇還在不知疲倦地轉動。
「60.2%?」辛頓轉頭看向亞歷克斯,「你確定跑的是ImageNet的測試集,而不是什麼簡單的數據集?」
「絕對是ImageNet,我用全部參數跑了一遍,英偉達的並行計算能力幫了大忙,如果沒有GPU,這玩意兒起碼要算上幾個月。」亞歷克斯快速敲擊著鍵盤,調出詳細的日誌文件。
辛頓拉過一把椅子坐下,逐行檢查著日誌里的訓練疊代過程。
「不僅跑通了深度神經網絡,而且這在驗證集上的表現實在太驚艷了。」辛頓敲了敲桌子。
「去看看排行榜,那個中國隊伍現在的成績是多少?」辛頓繼續問道。
亞歷克斯立刻打開瀏覽器,輸入ImageNet比賽的後台網址。
頁面加載出來後,「玉泉路扛把子」這個名字依然高掛在榜首。
成績依然是59.8%。
「他們這兩周沒有任何動作,估計是算力不夠,卡在瓶頸期了。」亞歷克斯盯著那個有些滑稽的隊名。
「教授,以我們目前在驗證集上的跑分,只要測試集不出現大翻車,很有希望能超過他們!」亞歷克斯語氣里滿是自信。
「那還等什麼?」辛頓點點頭,「把測試集的預測結果傳上去,讓他們看看多倫多大學的實力。」
亞歷克斯迅速將預測結果整理成指定格式的數據文件。
按照ImageNet的比賽規則,參賽團隊手裡沒有測試集的真實標籤。
大家只能把預測出來的結果文件上傳給官方伺服器。
最終能拿多少分,得等官方後台計算完正確率,統一刷新榜單才能揭曉。
亞歷克斯點下上傳按鈕。
網絡狀態欄轉了幾圈後,頁面彈出了「提交成功」的提示。
按照之前驗證集的數據推算,他覺得這次肯定能把「玉泉路扛把子」踹下神壇,把第一名的寶座搶過來。
一天後。
ImageNet的排行榜迎來了最新的數據刷新。
史丹福大學人工智慧實驗室里。
陳冉端著一杯冰美式,習慣性地在後台刷新了一下數據。
過去的兩周里,他的郵箱幾乎被全球各地的科研團隊塞爆了。
郵件的內容驚人的一致:投訴。
大家都在質疑那個「玉泉路扛把子」的59.8%是數據造假。
有些脾氣暴躁的歐洲學者甚至在郵件里揚言,如果不取消這個隊伍的成績,他們就要退出比賽。
陳冉回覆郵件回得手指頭都要抽筋了,每天都在重複解釋測試集絕對安全,對方沒有作弊。
他盯著屏幕,右手食指再次按下了F5刷新鍵。
頁面閃爍了一下。
後台自動計算的,還沒有人工確認的榜單里,榜首的名字變了。
第一名:AlexNet。
Top-1正確率:60.1%。
第二名:玉泉路扛把子。
Top-1正確率:59.8%。
陳冉端著冰美式的手停在半空中,冰塊在塑料杯里晃蕩出清脆的響聲。
「又來一個?」陳冉放下杯子,立刻調出AlexNet的提交記錄。
他仔細核對了對方的參數量和預測結果,確認這又是一份真實有效的數據。
陳冉拿起桌上的座機,撥通了李飛飛的內部號碼。
「教授,榜單有大變動,您最好親自來看一眼。」陳冉對著話筒快速說道。
兩分鐘後,李飛飛快步走進實驗室,站在陳冉的工位後方。
「那個中國隊伍又提交新數據了?」李飛飛看著屏幕。
「不是他們,是一支新隊伍,名字叫AlexNet,把『玉泉路扛把子』擠下去了。」陳冉指著屏幕上的兩組數據。
李飛飛雙手環抱在胸前,看著那兩個咬得很緊的正確率。
「60.1%和59.8%。」李飛飛分析道,「從第三方視角來看,這兩組數據實在太接近了。」
「教授,外面那些質疑造假的聲音,這下應該會消停了吧?」陳冉問道。
「何止是消停,整個學術界估計要炸鍋了。」李飛飛指著屏幕,「之前只有一支隊伍遙遙領先,大家可以說那是造假,是測試集泄露。現在出現了第二支隊伍,成績在同一個量級,這就證明了一件事。」
「有一種我們未知的技術路線,確確實實能夠達到這種恐怖的正確率。」陳冉接話道。
「沒錯。」李飛飛點頭,「去查一下AlexNet的註冊信息。」
陳冉敲了幾下鍵盤:「查到了,IP位址來自加拿大,機構填的是多倫多大學。」
「多倫多?」李飛飛思索片刻,「看來在這個未知的賽道上,已經有人開始飆車了。」
幾小時後,全球各大高校的計算機實驗室里,無數科研人員也看到了更新後的榜單。
前幾天還在論壇里大喊「玉泉路扛把子」是騙子的人,此刻全都閉嘴了。
取而代之的是一種名為「這怎麼可能」的恐慌情緒。
大家都在傳統算法里苦苦掙扎,好不容易提升個0.1%都要開香檳慶祝。
現在這兩個隊伍直接把正確率拉升了一倍。
這感覺就像是大家都在用長矛打獵,突然有兩個人開著武裝直升機出來掃射。
根本不在同一個時代。