第633章 ImageNet挑戰賽開啟,賽制堪比天梯排位
時間進入2009年12月中旬。
牆上的電子掛鍾跳到上午十點整。
對於寫字樓里的上班族來說,年底只意味著寫不完的年終總結。
但對於京城郵電大學計算機系教研室里的人來說,今天是個大日子。
郭長征站在電腦屏幕前。
楚一航坐在椅子上,右手握著滑鼠,左手習慣性地搓著下巴上的絡腮鬍。
旁邊站著研究生鍾柏、江深和葉言。
電腦瀏覽器上,ImageNet視覺識別挑戰賽的官方網站正式開放訪問。
楚一航點擊刷新按鈕。
原本只有倒計時的頁面瞬間變了模樣,深藍色的導航欄加載出來。
賽題和規則文檔連結出現在頁面正中央。
鍾柏趕緊湊近屏幕,指著其中一行英文。
「上面說,開放了一百二十萬張圖像,作為訓練集?這數據量有點離譜吧。」
楚一航摸了摸下巴。
「以前的視覺識別比賽,搞個幾萬張圖片就算頂格配置了。」
「這次一上來就直接放出百萬級別的數據集,跨度太驚人了。」
「主辦方這明擺著是鼓勵大家別走尋常路,逼著所有參賽隊伍去點新的科技樹啊。」
「而且這是明示大家,要用GPU去處理圖片,傳統的CPU干冒煙了,也處理不過來這麼多圖片。」
葉言在旁邊點頭贊同,補充說明。
「確實,要是繼續用傳統的老算法去跑這百萬張圖像的特徵,算到比賽結束都跑不完第一輪。」
「除了訓練集,還有五萬張驗證集圖片,這部分是帶標籤答案的,是讓方便我們對自己的模型,先內部評估一下。」
「算是模擬試卷。」
楚一航繼續往下念規則。
「十五萬張測試集圖片,答案不公開。」
「這就是這個比賽真正的考題了。」
「我們需要用自己的算法,預測這十五萬張測試集的標籤,然後上傳到官網。」
郭長征看著比賽周期說明。
「比賽為期三個月,到明年3月15日截止。」
鍾柏指著「Upload」按鈕旁邊的一行小字。
「這上面寫著,比賽期間可以隨時提交預測結果。」
「官網會根據提交的結果,動態更新每個團隊的當前排名。」
葉言愣了一下。
「實時排名?還能這樣玩?」
楚一航樂了,拍了拍大腿。
「這哪是搞學術,這純純是網遊里的天梯排位賽啊。」
鍾柏也跟著分析。
「以前的學術比賽,都是大家蒙頭搞幾個月。」
「最後一天統一提交,組委會再花幾天時間評閱,最後放榜。」
郭長征思索著這種新賽制帶來的變化。
「實時更新排名,意味著所有參賽隊伍都能看到別人的進度。」
「這就倒逼著大家一刻不能停,只要被人超了,就得繼續優化模型重新跑。」
葉言接著念規則。
「整個比賽期間,每個帳號最多只能上傳五次預測結果。」
「最終成績,取五次中得分最高的那一次。」
楚一航嘖了一聲。
「五次機會,這不就是排位賽里的保級賽機制嗎?用完就只能幹瞪眼看別人上分了。」
鍾柏繼續看排名機制的具體算法。
「榜單分為Top-1正確率和Top-5正確率兩個實時排名。」
楚一航看著那兩條榜單規則,直接樂了。
「這賽事主辦方也太懂年輕人了,硬生生把沉悶的學術比賽做出了電子競技的刺激感。」
葉言在一旁興奮地搓了搓手。
「確實有意思,以前搞研究只能自己一個隊伍悶頭死磕代碼,毫無互動可言。」
「現在搞出實時排行榜和提交次數限制,直接變成了全網極客在線大亂鬥。」
鍾柏的勝負欲完全被勾起來了,聲音都不自覺地拔高。
「這麼一來,咱們上傳成績的時間節點就非常講究了,還得跟全世界的其他隊伍玩心理戰。」
郭長征看著幾個幹勁十足的年輕人,笑著點頭。
「這種賽制把競爭完全擺在明面上,確實能最大程度逼出大家的好勝心。」
楚一航雙手在鍵盤上快速敲擊了兩下,眼神里全是躍躍欲試。
「那還等什麼?我已經迫不及待想下場,好好蹂躪他們了。」
……
至於為什麼這次比賽的賽制,會如此有意思,還要說回兩周前。
遠在魔都的高檔寫字樓里。
英偉達中國大區總經理張建忠的桌面上,放著ImageNet賽事的最終贊助確認書。
秘書小劉站在辦公桌對面,正在匯報賽事的媒體宣發情況。
「張總,ImageNet官網已經按照我們的要求,把實時排行榜功能上線了。」
張建忠翻看著文件。
「李飛飛教授那邊沒再提出什麼異議吧?」
小劉搖頭。
「沒有。他們團隊的資金缺口很大,亞馬遜的眾包標註平台收費很高。」
「我們這筆贊助解了他們的燃眉之急,對於賽制修改的要求,他們全盤接受了。」
張建忠拿筆在文件上籤下名字。
實時排行榜這個點子,就是他本人向總部提議,並要求加進ImageNet比賽里的。
傳統的學術比賽太過沉悶,圈外人根本不關心。
既然英偉達贊助這次比賽的核心訴求就是熱度,那就需要一種能讓媒體持續報導、能讓參賽者產生焦慮感和競爭欲的機制。
排行榜就是最好的焦慮製造機。
為了放大這種競爭欲,英偉達不僅贊助了賽事運營,還單獨設立了三萬美元的冠軍獎金。
小劉提出一個疑問。
「張總,官網還開通了論文和代碼同步公開的功能。」
「這也是我們提的訴求。」
「您就這麼確信,排在前面的隊伍,會用我們英偉達的CUDA架構嗎。」
張建忠靠在椅背上。
「這不需要確信,這是概率學。」
「目前市面上能提供大規模並行計算能力,且被學術界廣泛接受的,就只有我們的顯卡。」
「高校那些傳統的圖像特徵提取算法,處理幾千張圖片還行。」
「面對一百二十萬張的龐大數據集,傳統的CPU計算模式根本跑不動。」
小劉接著問。
「萬一有人用AMD的顯卡呢?」
張建忠笑了笑。
「硬體只是軀殼,生態才是靈魂。」
「AMD沒有CUDA這樣成熟的底層調用架構。」
「研究員拿了AMD的卡,連最基礎的矩陣運算庫都要自己從頭寫。」
「三個月的比賽時間,光寫底層代碼都不夠,還比什麼賽?」
小劉翻開手裡的另一份簡報。
「那盛夏科技前兩個月推出的那個九章計算平台呢?」
張建忠聽到這個名字,手指在桌面上敲了兩下。
「九章確實是個變數,它能兼容AMD的硬體。」
「但一個推出才兩個月的新平台,很多高校的老師,甚至都沒聽過它的名字。」
「研究員們習慣了我們英偉達的工具鏈,誰會冒著比賽失利的風險,去踩一個新平台的坑?」
張建忠對目前的局勢判斷非常清晰。
英偉達通過幾年的高校贊助,已經完成了用戶習慣的初步綁定。
這三萬美元的獎金,就是用來收割這批高校用戶的成果的。
只要前幾名使用了CUDA並在官網上公開技術論文或者源碼,那就是對英偉達最好的免費GG。
牆上的電子掛鍾跳到上午十點整。
對於寫字樓里的上班族來說,年底只意味著寫不完的年終總結。
但對於京城郵電大學計算機系教研室里的人來說,今天是個大日子。
郭長征站在電腦屏幕前。
楚一航坐在椅子上,右手握著滑鼠,左手習慣性地搓著下巴上的絡腮鬍。
旁邊站著研究生鍾柏、江深和葉言。
電腦瀏覽器上,ImageNet視覺識別挑戰賽的官方網站正式開放訪問。
楚一航點擊刷新按鈕。
原本只有倒計時的頁面瞬間變了模樣,深藍色的導航欄加載出來。
賽題和規則文檔連結出現在頁面正中央。
鍾柏趕緊湊近屏幕,指著其中一行英文。
「上面說,開放了一百二十萬張圖像,作為訓練集?這數據量有點離譜吧。」
楚一航摸了摸下巴。
「以前的視覺識別比賽,搞個幾萬張圖片就算頂格配置了。」
「這次一上來就直接放出百萬級別的數據集,跨度太驚人了。」
「主辦方這明擺著是鼓勵大家別走尋常路,逼著所有參賽隊伍去點新的科技樹啊。」
「而且這是明示大家,要用GPU去處理圖片,傳統的CPU干冒煙了,也處理不過來這麼多圖片。」
葉言在旁邊點頭贊同,補充說明。
「確實,要是繼續用傳統的老算法去跑這百萬張圖像的特徵,算到比賽結束都跑不完第一輪。」
「除了訓練集,還有五萬張驗證集圖片,這部分是帶標籤答案的,是讓方便我們對自己的模型,先內部評估一下。」
「算是模擬試卷。」
楚一航繼續往下念規則。
「十五萬張測試集圖片,答案不公開。」
「這就是這個比賽真正的考題了。」
「我們需要用自己的算法,預測這十五萬張測試集的標籤,然後上傳到官網。」
郭長征看著比賽周期說明。
「比賽為期三個月,到明年3月15日截止。」
鍾柏指著「Upload」按鈕旁邊的一行小字。
「這上面寫著,比賽期間可以隨時提交預測結果。」
「官網會根據提交的結果,動態更新每個團隊的當前排名。」
葉言愣了一下。
「實時排名?還能這樣玩?」
楚一航樂了,拍了拍大腿。
「這哪是搞學術,這純純是網遊里的天梯排位賽啊。」
鍾柏也跟著分析。
「以前的學術比賽,都是大家蒙頭搞幾個月。」
「最後一天統一提交,組委會再花幾天時間評閱,最後放榜。」
郭長征思索著這種新賽制帶來的變化。
「實時更新排名,意味著所有參賽隊伍都能看到別人的進度。」
「這就倒逼著大家一刻不能停,只要被人超了,就得繼續優化模型重新跑。」
葉言接著念規則。
「整個比賽期間,每個帳號最多只能上傳五次預測結果。」
「最終成績,取五次中得分最高的那一次。」
楚一航嘖了一聲。
「五次機會,這不就是排位賽里的保級賽機制嗎?用完就只能幹瞪眼看別人上分了。」
鍾柏繼續看排名機制的具體算法。
「榜單分為Top-1正確率和Top-5正確率兩個實時排名。」
楚一航看著那兩條榜單規則,直接樂了。
「這賽事主辦方也太懂年輕人了,硬生生把沉悶的學術比賽做出了電子競技的刺激感。」
葉言在一旁興奮地搓了搓手。
「確實有意思,以前搞研究只能自己一個隊伍悶頭死磕代碼,毫無互動可言。」
「現在搞出實時排行榜和提交次數限制,直接變成了全網極客在線大亂鬥。」
鍾柏的勝負欲完全被勾起來了,聲音都不自覺地拔高。
「這麼一來,咱們上傳成績的時間節點就非常講究了,還得跟全世界的其他隊伍玩心理戰。」
郭長征看著幾個幹勁十足的年輕人,笑著點頭。
「這種賽制把競爭完全擺在明面上,確實能最大程度逼出大家的好勝心。」
楚一航雙手在鍵盤上快速敲擊了兩下,眼神里全是躍躍欲試。
「那還等什麼?我已經迫不及待想下場,好好蹂躪他們了。」
……
至於為什麼這次比賽的賽制,會如此有意思,還要說回兩周前。
遠在魔都的高檔寫字樓里。
英偉達中國大區總經理張建忠的桌面上,放著ImageNet賽事的最終贊助確認書。
秘書小劉站在辦公桌對面,正在匯報賽事的媒體宣發情況。
「張總,ImageNet官網已經按照我們的要求,把實時排行榜功能上線了。」
張建忠翻看著文件。
「李飛飛教授那邊沒再提出什麼異議吧?」
小劉搖頭。
「沒有。他們團隊的資金缺口很大,亞馬遜的眾包標註平台收費很高。」
「我們這筆贊助解了他們的燃眉之急,對於賽制修改的要求,他們全盤接受了。」
張建忠拿筆在文件上籤下名字。
實時排行榜這個點子,就是他本人向總部提議,並要求加進ImageNet比賽里的。
傳統的學術比賽太過沉悶,圈外人根本不關心。
既然英偉達贊助這次比賽的核心訴求就是熱度,那就需要一種能讓媒體持續報導、能讓參賽者產生焦慮感和競爭欲的機制。
排行榜就是最好的焦慮製造機。
為了放大這種競爭欲,英偉達不僅贊助了賽事運營,還單獨設立了三萬美元的冠軍獎金。
小劉提出一個疑問。
「張總,官網還開通了論文和代碼同步公開的功能。」
「這也是我們提的訴求。」
「您就這麼確信,排在前面的隊伍,會用我們英偉達的CUDA架構嗎。」
張建忠靠在椅背上。
「這不需要確信,這是概率學。」
「目前市面上能提供大規模並行計算能力,且被學術界廣泛接受的,就只有我們的顯卡。」
「高校那些傳統的圖像特徵提取算法,處理幾千張圖片還行。」
「面對一百二十萬張的龐大數據集,傳統的CPU計算模式根本跑不動。」
小劉接著問。
「萬一有人用AMD的顯卡呢?」
張建忠笑了笑。
「硬體只是軀殼,生態才是靈魂。」
「AMD沒有CUDA這樣成熟的底層調用架構。」
「研究員拿了AMD的卡,連最基礎的矩陣運算庫都要自己從頭寫。」
「三個月的比賽時間,光寫底層代碼都不夠,還比什麼賽?」
小劉翻開手裡的另一份簡報。
「那盛夏科技前兩個月推出的那個九章計算平台呢?」
張建忠聽到這個名字,手指在桌面上敲了兩下。
「九章確實是個變數,它能兼容AMD的硬體。」
「但一個推出才兩個月的新平台,很多高校的老師,甚至都沒聽過它的名字。」
「研究員們習慣了我們英偉達的工具鏈,誰會冒著比賽失利的風險,去踩一個新平台的坑?」
張建忠對目前的局勢判斷非常清晰。
英偉達通過幾年的高校贊助,已經完成了用戶習慣的初步綁定。
這三萬美元的獎金,就是用來收割這批高校用戶的成果的。
只要前幾名使用了CUDA並在官網上公開技術論文或者源碼,那就是對英偉達最好的免費GG。