第646章 殺出的黑馬(上)
視線轉回盛夏科技,京城。
有人為了盛夏OS應用商店廢寢忘食,有人為了Tensorflow和九章的推廣四處奔忙,時間過得很快,一轉眼,已經是2010年。
中關村大街上的積雪還沒化乾淨,寫字樓里的燈總是亮著。
新世紀的頭十年就這麼悄無聲息地翻篇了,沒有煙花,沒有慶典,甚至沒人發一條煽情的簡訊。
科技圈的人都在忙。
忙著升級系統,忙著調試參數,忙著和時差那頭的人開電話會。
誰有空慶祝?
2010年1月22日,星期五這天。
郭長征推開教研室的門,暖氣撲面而來,眼鏡片上立刻蒙了一層白霧。
他摘下眼鏡擦了擦,看見楚一航已經坐在工位上了。
楚一航面前擺著兩個顯示器,左邊是代碼窗口,右邊是一個網頁。
網頁上是一張表格。
郭長征把包往桌上一扔:「又看?」
楚一航沒回頭,聲音悶悶的:「習慣了,每天第一件事。」
他說的是ImageNet的排行榜。
這個比賽已經開賽一個多月了。
楚一航點了刷新。
頁面重新加載,排行榜從上到下,已經排列著二十多個隊伍的成績。
排在第一名的隊伍,暫時的最高Top-1正確率只有29%,Top-5正確率只有69%。
「這也太拉胯了。楚一航搖了搖頭,滿臉的自信。
「這水平,我在鍵盤上撒把米,找只雞過來啄兩下,猜出來的正確率都比他高。」
郭長征瞪了楚一航一眼:「一航,不要這麼刻薄。人家能跑出結果,說明工程實現能力沒問題,只是算法選型遇到了天花板。」
「不過這成績的確低了點,放我們最通用那版模型上都不夠打的。」
「確實。」楚一航往後一靠,椅子發出嘎吱一聲,「我估計現在大部分隊伍還在用傳統的特徵提取那一套,SIFT加SVM什麼的,能跑到這個數已經不錯了。」
「之前我們用TensorFlow搭的那個基礎版本,Top-1就能到40%吧?」
「40.2%,我記著呢。」
郭長征笑了:「你這腦子是硬碟啊?」
這時候門被推開了。
江深端著一杯豆漿走進來,脖子上掛著耳機線,一看就是從宿舍直接過來的。
「早。」
「早。」
江深把豆漿放在桌上,熟練地打開自己的電腦:「看了嗎?排行榜。」
「剛看過,沒啥變化。」楚一航說。
「我再看一眼。」
江深也打開了ImageNet的官網。
頁面加載出來。
他愣了一下。
「等等。」
郭長征和楚一航同時轉頭。
江深指著屏幕:「你們確定剛才看的是這個數?」
楚一航皺眉:「什麼?」
他刷新了一下自己的頁面。
頁面重新加載。
然後他也愣住了。
排行榜第一行的數字變了。
Top-1正確率:59.8%。
Top-5正確率:76.3%。
楚一航以為自己看錯了,又刷新了一遍。
還是這個數。
59.8%。
他看了一眼第二名的成績——Top-1正確率29%,Top-5正確率69%。
是刷新前第一名的成績。
說明就在剛剛,有一支新的隊伍,來到了榜首,並且吊打了榜單上的其他隊伍。
正確率差了一倍還帶拐彎。
楚一航沉默了大概三秒鐘。
「……臥槽。」
郭長征也看到了。他沒有說話,只是把眼鏡摘下來又擦了一遍,重新戴上,然後盯著屏幕看了很久。
江深的聲音有點干:「這是哪路神仙?」
三個人同時去看第一名的隊伍名稱。
不是英文。
不是某個美國名校的實驗室縮寫。
六個漢字。
「玉泉路扛把子。」
教研室安靜了大約兩秒。
然後楚一航笑出了聲。
不是嘲笑,是真的被逗樂了那種笑。
「玉泉路?」他說,「如果是京城的玉泉路,我懷疑是中科院自動化所那幫人。」
郭長征想了一下:「玉泉路那邊確實有中科院的幾個所,自動化所、計算所都在那附近。」
「這名字起得也太……」江深一時沒找到合適的形容詞。
「太有網感了。」楚一航替他補上了,「一看就是常混論壇的人起的。」
「但成績是真的猛。」郭長征說。
59.8%的Top-1正確率。
他們現在的模型在測試集上跑到多少來著?
郭長征打開內部的測試記錄表。
他們最新的一個版本,Top-1正確率是63.1%。
雖然是在模擬試題上的成績,不過也比這個「玉泉路扛把子」高了三個多點。
估計在真正的測試集上,成績應該也差不多。
但問題是——他們的模型還沒上傳。
楚一航顯然也想到了同一件事,他轉過頭來看郭長征:「老郭,我們是不是也該放一個版本上去了?」
郭長征沒立刻回答。
這時候門又被推開了,葉言和鍾柏一起走進來。葉言手裡拿著一疊列印出來的訓練日誌,鍾柏背著雙肩包,眼睛還有點腫——一看就是昨晚又熬夜了。
「都來了?」葉言把訓練日誌放在桌上,「聊什麼呢?」
「排行榜更新了。」江深說。
葉言和鍾柏同時湊過來。
「我看看。」
幾秒後,葉言的反應和當初的楚一航如出一轍:「臥槽。」
鍾柏則推了推眼鏡,認真地看了一遍參數:「這個正確率……不像是傳統方法能做出來的。」
「你也覺得?」郭長征看了他一眼。
「肯定是神經網絡。」鍾柏的語氣很篤定,「SIFT加SVM那套東西的天花板我見過,到不了這個數。」
楚一航點頭:「分析得對。」
許言也從隔壁座位探過頭來,「我們乾脆把現在的模型傳上去吧?」
「我們最新的版本比他們高好幾個點呢。」
「對。」江深附和,「讓他們看看什麼叫真正的技術。」
楚一航看向郭長征:「郭老師怎麼說?」
郭長征的手指在桌面上輕輕敲了兩下。
「再等等。」
「還等?」許言有點急,「再等黃花菜都涼了。」
郭長征搖頭:「不是這個意思。你們想想,現在才開賽一個月,大部分隊伍可能連模型都沒搭完。這個『玉泉路扛把子』是動作快,先把第一版傳上去了,占了榜首。」
他頓了頓,繼續說:「但比賽還有兩個月才結束,真正的大魚都在後面。我們現在把最好的模型傳上去,等於提前亮出了底牌。」
楚一航若有所思:「你是說……讓別人有參照物?」
「對。你放一個63%的模型上去,後面的人就會拼命追。」
許言張了張嘴,想說什麼,但發現郭長征說得有道理。
「那我們就乾等著?」江深有點不甘心。
「誰說乾等著?」郭長征笑了,「我們繼續調。葉言,昨晚那一版訓練到什麼程度了?」
有人為了盛夏OS應用商店廢寢忘食,有人為了Tensorflow和九章的推廣四處奔忙,時間過得很快,一轉眼,已經是2010年。
中關村大街上的積雪還沒化乾淨,寫字樓里的燈總是亮著。
新世紀的頭十年就這麼悄無聲息地翻篇了,沒有煙花,沒有慶典,甚至沒人發一條煽情的簡訊。
科技圈的人都在忙。
忙著升級系統,忙著調試參數,忙著和時差那頭的人開電話會。
誰有空慶祝?
2010年1月22日,星期五這天。
郭長征推開教研室的門,暖氣撲面而來,眼鏡片上立刻蒙了一層白霧。
他摘下眼鏡擦了擦,看見楚一航已經坐在工位上了。
楚一航面前擺著兩個顯示器,左邊是代碼窗口,右邊是一個網頁。
網頁上是一張表格。
郭長征把包往桌上一扔:「又看?」
楚一航沒回頭,聲音悶悶的:「習慣了,每天第一件事。」
他說的是ImageNet的排行榜。
這個比賽已經開賽一個多月了。
楚一航點了刷新。
頁面重新加載,排行榜從上到下,已經排列著二十多個隊伍的成績。
排在第一名的隊伍,暫時的最高Top-1正確率只有29%,Top-5正確率只有69%。
「這也太拉胯了。楚一航搖了搖頭,滿臉的自信。
「這水平,我在鍵盤上撒把米,找只雞過來啄兩下,猜出來的正確率都比他高。」
郭長征瞪了楚一航一眼:「一航,不要這麼刻薄。人家能跑出結果,說明工程實現能力沒問題,只是算法選型遇到了天花板。」
「不過這成績的確低了點,放我們最通用那版模型上都不夠打的。」
「確實。」楚一航往後一靠,椅子發出嘎吱一聲,「我估計現在大部分隊伍還在用傳統的特徵提取那一套,SIFT加SVM什麼的,能跑到這個數已經不錯了。」
「之前我們用TensorFlow搭的那個基礎版本,Top-1就能到40%吧?」
「40.2%,我記著呢。」
郭長征笑了:「你這腦子是硬碟啊?」
這時候門被推開了。
江深端著一杯豆漿走進來,脖子上掛著耳機線,一看就是從宿舍直接過來的。
「早。」
「早。」
江深把豆漿放在桌上,熟練地打開自己的電腦:「看了嗎?排行榜。」
「剛看過,沒啥變化。」楚一航說。
「我再看一眼。」
江深也打開了ImageNet的官網。
頁面加載出來。
他愣了一下。
「等等。」
郭長征和楚一航同時轉頭。
江深指著屏幕:「你們確定剛才看的是這個數?」
楚一航皺眉:「什麼?」
他刷新了一下自己的頁面。
頁面重新加載。
然後他也愣住了。
排行榜第一行的數字變了。
Top-1正確率:59.8%。
Top-5正確率:76.3%。
楚一航以為自己看錯了,又刷新了一遍。
還是這個數。
59.8%。
他看了一眼第二名的成績——Top-1正確率29%,Top-5正確率69%。
是刷新前第一名的成績。
說明就在剛剛,有一支新的隊伍,來到了榜首,並且吊打了榜單上的其他隊伍。
正確率差了一倍還帶拐彎。
楚一航沉默了大概三秒鐘。
「……臥槽。」
郭長征也看到了。他沒有說話,只是把眼鏡摘下來又擦了一遍,重新戴上,然後盯著屏幕看了很久。
江深的聲音有點干:「這是哪路神仙?」
三個人同時去看第一名的隊伍名稱。
不是英文。
不是某個美國名校的實驗室縮寫。
六個漢字。
「玉泉路扛把子。」
教研室安靜了大約兩秒。
然後楚一航笑出了聲。
不是嘲笑,是真的被逗樂了那種笑。
「玉泉路?」他說,「如果是京城的玉泉路,我懷疑是中科院自動化所那幫人。」
郭長征想了一下:「玉泉路那邊確實有中科院的幾個所,自動化所、計算所都在那附近。」
「這名字起得也太……」江深一時沒找到合適的形容詞。
「太有網感了。」楚一航替他補上了,「一看就是常混論壇的人起的。」
「但成績是真的猛。」郭長征說。
59.8%的Top-1正確率。
他們現在的模型在測試集上跑到多少來著?
郭長征打開內部的測試記錄表。
他們最新的一個版本,Top-1正確率是63.1%。
雖然是在模擬試題上的成績,不過也比這個「玉泉路扛把子」高了三個多點。
估計在真正的測試集上,成績應該也差不多。
但問題是——他們的模型還沒上傳。
楚一航顯然也想到了同一件事,他轉過頭來看郭長征:「老郭,我們是不是也該放一個版本上去了?」
郭長征沒立刻回答。
這時候門又被推開了,葉言和鍾柏一起走進來。葉言手裡拿著一疊列印出來的訓練日誌,鍾柏背著雙肩包,眼睛還有點腫——一看就是昨晚又熬夜了。
「都來了?」葉言把訓練日誌放在桌上,「聊什麼呢?」
「排行榜更新了。」江深說。
葉言和鍾柏同時湊過來。
「我看看。」
幾秒後,葉言的反應和當初的楚一航如出一轍:「臥槽。」
鍾柏則推了推眼鏡,認真地看了一遍參數:「這個正確率……不像是傳統方法能做出來的。」
「你也覺得?」郭長征看了他一眼。
「肯定是神經網絡。」鍾柏的語氣很篤定,「SIFT加SVM那套東西的天花板我見過,到不了這個數。」
楚一航點頭:「分析得對。」
許言也從隔壁座位探過頭來,「我們乾脆把現在的模型傳上去吧?」
「我們最新的版本比他們高好幾個點呢。」
「對。」江深附和,「讓他們看看什麼叫真正的技術。」
楚一航看向郭長征:「郭老師怎麼說?」
郭長征的手指在桌面上輕輕敲了兩下。
「再等等。」
「還等?」許言有點急,「再等黃花菜都涼了。」
郭長征搖頭:「不是這個意思。你們想想,現在才開賽一個月,大部分隊伍可能連模型都沒搭完。這個『玉泉路扛把子』是動作快,先把第一版傳上去了,占了榜首。」
他頓了頓,繼續說:「但比賽還有兩個月才結束,真正的大魚都在後面。我們現在把最好的模型傳上去,等於提前亮出了底牌。」
楚一航若有所思:「你是說……讓別人有參照物?」
「對。你放一個63%的模型上去,後面的人就會拼命追。」
許言張了張嘴,想說什麼,但發現郭長征說得有道理。
「那我們就乾等著?」江深有點不甘心。
「誰說乾等著?」郭長征笑了,「我們繼續調。葉言,昨晚那一版訓練到什麼程度了?」