第633章 ImageNet挑戰賽開啟,賽制堪比天梯排位

投票推薦 加入書籤 小說報錯

  時間進入2009年12月中旬。

  牆上的電子掛鍾跳到上午十點整。

  對於寫字樓里的上班族來說,年底只意味著寫不完的年終總結。

  但對於京城郵電大學計算機系教研室里的人來說,今天是個大日子。

  郭長征站在電腦屏幕前。

  楚一航坐在椅子上,右手握著滑鼠,左手習慣性地搓著下巴上的絡腮鬍。

  旁邊站著研究生鍾柏、江深和葉言。

  電腦瀏覽器上,ImageNet視覺識別挑戰賽的官方網站正式開放訪問。

  楚一航點擊刷新按鈕。

  原本只有倒計時的頁面瞬間變了模樣,深藍色的導航欄加載出來。

  賽題和規則文檔連結出現在頁面正中央。

  鍾柏趕緊湊近屏幕,指著其中一行英文。

  「上面說,開放了一百二十萬張圖像,作為訓練集?這數據量有點離譜吧。」

  楚一航摸了摸下巴。

  「以前的視覺識別比賽,搞個幾萬張圖片就算頂格配置了。」

  「這次一上來就直接放出百萬級別的數據集,跨度太驚人了。」

  「主辦方這明擺著是鼓勵大家別走尋常路,逼著所有參賽隊伍去點新的科技樹啊。」

  「而且這是明示大家,要用GPU去處理圖片,傳統的CPU干冒煙了,也處理不過來這麼多圖片。」

  葉言在旁邊點頭贊同,補充說明。

  「確實,要是繼續用傳統的老算法去跑這百萬張圖像的特徵,算到比賽結束都跑不完第一輪。」

  「除了訓練集,還有五萬張驗證集圖片,這部分是帶標籤答案的,是讓方便我們對自己的模型,先內部評估一下。」

  「算是模擬試卷。」

  楚一航繼續往下念規則。

  「十五萬張測試集圖片,答案不公開。」

  「這就是這個比賽真正的考題了。」

  「我們需要用自己的算法,預測這十五萬張測試集的標籤,然後上傳到官網。」

  郭長征看著比賽周期說明。

  「比賽為期三個月,到明年3月15日截止。」

  鍾柏指著「Upload」按鈕旁邊的一行小字。

  「這上面寫著,比賽期間可以隨時提交預測結果。」

  「官網會根據提交的結果,動態更新每個團隊的當前排名。」

  葉言愣了一下。

  「實時排名?還能這樣玩?」

  楚一航樂了,拍了拍大腿。

  「這哪是搞學術,這純純是網遊里的天梯排位賽啊。」

  鍾柏也跟著分析。

  「以前的學術比賽,都是大家蒙頭搞幾個月。」

  「最後一天統一提交,組委會再花幾天時間評閱,最後放榜。」

  郭長征思索著這種新賽制帶來的變化。

  「實時更新排名,意味著所有參賽隊伍都能看到別人的進度。」

  「這就倒逼著大家一刻不能停,只要被人超了,就得繼續優化模型重新跑。」

  葉言接著念規則。

  「整個比賽期間,每個帳號最多只能上傳五次預測結果。」

  「最終成績,取五次中得分最高的那一次。」

  楚一航嘖了一聲。

  「五次機會,這不就是排位賽里的保級賽機制嗎?用完就只能幹瞪眼看別人上分了。」

  鍾柏繼續看排名機制的具體算法。

  「榜單分為Top-1正確率和Top-5正確率兩個實時排名。」

  楚一航看著那兩條榜單規則,直接樂了。

  「這賽事主辦方也太懂年輕人了,硬生生把沉悶的學術比賽做出了電子競技的刺激感。」

  葉言在一旁興奮地搓了搓手。

  「確實有意思,以前搞研究只能自己一個隊伍悶頭死磕代碼,毫無互動可言。」


  「現在搞出實時排行榜和提交次數限制,直接變成了全網極客在線大亂鬥。」

  鍾柏的勝負欲完全被勾起來了,聲音都不自覺地拔高。

  「這麼一來,咱們上傳成績的時間節點就非常講究了,還得跟全世界的其他隊伍玩心理戰。」

  郭長征看著幾個幹勁十足的年輕人,笑著點頭。

  「這種賽制把競爭完全擺在明面上,確實能最大程度逼出大家的好勝心。」

  楚一航雙手在鍵盤上快速敲擊了兩下,眼神里全是躍躍欲試。

  「那還等什麼?我已經迫不及待想下場,好好蹂躪他們了。」

  ……

  至於為什麼這次比賽的賽制,會如此有意思,還要說回兩周前。

  遠在魔都的高檔寫字樓里。

  英偉達中國大區總經理張建忠的桌面上,放著ImageNet賽事的最終贊助確認書。

  秘書小劉站在辦公桌對面,正在匯報賽事的媒體宣發情況。

  「張總,ImageNet官網已經按照我們的要求,把實時排行榜功能上線了。」

  張建忠翻看著文件。

  「李飛飛教授那邊沒再提出什麼異議吧?」

  小劉搖頭。

  「沒有。他們團隊的資金缺口很大,亞馬遜的眾包標註平台收費很高。」

  「我們這筆贊助解了他們的燃眉之急,對於賽制修改的要求,他們全盤接受了。」

  張建忠拿筆在文件上籤下名字。

  實時排行榜這個點子,就是他本人向總部提議,並要求加進ImageNet比賽里的。

  傳統的學術比賽太過沉悶,圈外人根本不關心。

  既然英偉達贊助這次比賽的核心訴求就是熱度,那就需要一種能讓媒體持續報導、能讓參賽者產生焦慮感和競爭欲的機制。

  排行榜就是最好的焦慮製造機。

  為了放大這種競爭欲,英偉達不僅贊助了賽事運營,還單獨設立了三萬美元的冠軍獎金。

  小劉提出一個疑問。

  「張總,官網還開通了論文和代碼同步公開的功能。」

  「這也是我們提的訴求。」

  「您就這麼確信,排在前面的隊伍,會用我們英偉達的CUDA架構嗎。」

  張建忠靠在椅背上。

  「這不需要確信,這是概率學。」

  「目前市面上能提供大規模並行計算能力,且被學術界廣泛接受的,就只有我們的顯卡。」

  「高校那些傳統的圖像特徵提取算法,處理幾千張圖片還行。」

  「面對一百二十萬張的龐大數據集,傳統的CPU計算模式根本跑不動。」

  小劉接著問。

  「萬一有人用AMD的顯卡呢?」

  張建忠笑了笑。

  「硬體只是軀殼,生態才是靈魂。」

  「AMD沒有CUDA這樣成熟的底層調用架構。」

  「研究員拿了AMD的卡,連最基礎的矩陣運算庫都要自己從頭寫。」

  「三個月的比賽時間,光寫底層代碼都不夠,還比什麼賽?」

  小劉翻開手裡的另一份簡報。

  「那盛夏科技前兩個月推出的那個九章計算平台呢?」

  張建忠聽到這個名字,手指在桌面上敲了兩下。

  「九章確實是個變數,它能兼容AMD的硬體。」

  「但一個推出才兩個月的新平台,很多高校的老師,甚至都沒聽過它的名字。」

  「研究員們習慣了我們英偉達的工具鏈,誰會冒著比賽失利的風險,去踩一個新平台的坑?」

  張建忠對目前的局勢判斷非常清晰。

  英偉達通過幾年的高校贊助,已經完成了用戶習慣的初步綁定。

  這三萬美元的獎金,就是用來收割這批高校用戶的成果的。

  只要前幾名使用了CUDA並在官網上公開技術論文或者源碼,那就是對英偉達最好的免費GG。

章節目錄