第648章 殺出的黑馬(下)

投票推薦 加入書籤 小說報錯

  發件人是系統後台,收件人是陳冉。

  陳冉的視線直接略過了前面的格式化文字,落在了中間的幾個數字上。

  Top-1正確率:59.8%。

  Top-5正確率:76.3%。

  陳冉手裡的咖啡杯停在了半空。

  他盯著屏幕看了足足十秒鐘。

  然後他把咖啡杯放回桌面上,發出「砰」的一聲悶響。

  陳冉的第一反應是後台的計算腳本出了Bug。

  這種事情以前不是沒發生過,某個隊伍提交的文件格式不對,導致Python腳本在讀取數組的時候發生了錯位,直接算出了一個99%的離譜數據。

  59.8%,這個數字已經完全超出了陳冉對當前人類計算機視覺技術水平的認知。

  把29%直接翻一倍還多,這就好比大家都在騎自行車比賽,突然有個人開著跑車衝進了賽道。

  陳冉立刻關掉郵件,打開瀏覽器,直接登入ImageNet的後台管理系統。

  他熟練地敲擊鍵盤,調出了原始的提交記錄。

  頁面刷新。

  提交時間:下午四點十二分。

  提交ID:玉泉路扛把子。

  陳冉看著這個充滿中國網際網路濃厚中二氣息的ID名字,嘴角抽搐了一下。

  他點開計算日誌,從頭到尾看了一遍。

  沒有數組錯位。

  沒有格式錯誤。

  所有的預測標籤和測試集圖片編號一一對應,嚴絲合縫。

  陳冉不信邪,他打開終端,直接連上伺服器,找到那個隊伍提交的Excel文件。

  他調出自己寫的備用驗證腳本,在命令行里輸入參數,按下回車。

  屏幕上開始瘋狂滾動進度條。

  陳冉雙手離開鍵盤,死死盯著屏幕最後一行即將彈出的結果。

  五秒鐘後,腳本運行結束。

  Top-1:59.82%。

  Top-5:76.31%。

  陳冉站了起來,椅子往後滑動,撞到了後面的文件櫃。

  他沒有按流程先更新排行榜,而是直接拔下筆記本電腦的電源線,單手托著電腦,快步走出自己的工位。

  他穿過走廊,徑直走向李飛飛的辦公室。

  辦公室的門虛掩著。

  陳冉連門都沒敲,直接推門走了進去。

  李飛飛正坐在辦公桌前,手裡拿著一支紅筆,正在審閱一篇頂級期刊的論文審稿意見。

  聽到推門聲,她抬起頭。

  陳冉平時是個很講究學術禮儀的人,今天這種莽撞的舉動讓李飛飛感到有些意外。

  「李老師。」陳冉的聲音有些發緊。

  李飛飛看著陳冉有些僵硬的表情,放下了手裡的紅筆。

  「出什麼事了?」李飛飛問。

  「您需要看一下這個。」陳冉快步走到辦公桌前,把筆記本電腦放在桌面上,屏幕轉向李飛飛。

  屏幕上正是那份提交記錄的完整頁面。

  李飛飛的目光落在屏幕上。

  她先是看到了Top-1正確率那一欄。

  59.8%。

  然後視線右移,看到了Top-5正確率。

  76.3%。

  最後,她的目光向上,停在了那個名為「玉泉路扛把子」的隊伍名稱上。

  辦公室里安靜得只能聽到筆記本電腦散熱風扇轉動的聲音。

  李飛飛盯著屏幕看了將近半分鐘,沒有說話。

  陳冉站在一旁,連呼吸都放輕了。

  「你重新跑過驗證腳本了嗎?」李飛飛終於開口,聲音很平靜。

  「跑過了,用的我本地獨立的腳本,避開了系統原本的緩存。」陳冉立刻回答。

  「結果一樣?」

  「對。」陳冉說。


  李飛飛沉默了幾秒鐘。

  「你現在把原始的提交數據發到我的郵箱。」李飛飛站起身,「然後去把約翰和大衛叫到會議室來。」

  「好的。」陳冉拿起電腦,轉身就往外走。

  五分鐘後,李飛飛辦公室旁邊的小會議室里。

  四個人圍坐在橢圓形的會議桌前。

  面前各有一台打開的筆記本電腦。

  約翰是史丹福大學人工智慧實驗室的資深研究人員,平時主要負責算法優化。

  大衛則是數據架構方面的專家,主要參與圖片分類數據集的底層構建。

  兩個人被陳冉火急火燎地叫過來,還沒搞清楚狀況。

  「看看你們郵箱裡剛收到的郵件。」李飛飛說。

  約翰點開郵件,下載了附件,打開。

  大衛也做著同樣的動作。

  「這是一個預測結果的表格?」約翰看著滿屏幕的數字和標籤,「誰提交的?」

  「一個叫『玉泉路扛把子』的隊伍。」陳冉在旁邊解釋。

  約翰看了看表格右側的匯總數據。

  「Top-1,59.8%?」約翰笑了一聲,「陳,你們後台的評測腳本又崩了?上次那個算出99%的隊伍也是這麼搞的吧。」

  「沒崩。」陳冉語氣嚴肅,「我剛才用備用腳本跑過了,數據是真的。」

  約翰臉上的笑容消失了。

  他轉過頭,看著陳冉。

  「你在開玩笑嗎?」約翰問,「現在的榜首才29%。你告訴我有人直接干到了接近60%?」

  「所以我把你們叫來。」李飛飛看著兩人,「我們需要進行徹底的排查。這個數字如果在榜單上公布出去,整個學術界都會炸鍋。在確認它無懈可擊之前,我們不能輕舉妄動。」

  「大衛,你去檢查測試集文件的校驗值。」李飛飛開始分配任務,「確認伺服器上的測試集數據沒有被替換過,或者被植入了後門。」

  大衛點頭,立刻在終端里輸入SSH連接命令。

  「約翰,你負責用本地最新的腳本,一行一行地重新跑一遍正確率驗證。不要用任何現成的封裝庫,自己寫底層邏輯跑。」李飛飛繼續說。

  約翰拉過鍵盤,打開了一個新的代碼編輯器窗口。

  「陳冉,你去查後台。」李飛飛看向自己的博士生,「我要知道這個ID的註冊信息、登錄IP、提交日誌,任何能查到的痕跡都給我挖出來。」

  會議室里只剩下噼里啪啦的鍵盤敲擊聲。

  每個人都在全神貫注地盯著自己的屏幕。

  時間一分一秒地過去。

  十分鐘後,大衛第一個停下手裡的動作。

  「測試集文件沒有任何問題。」大衛看著終端輸出的結果。

  李飛飛微微點頭,看向約翰。

  約翰還在盯著屏幕上不斷跳動的代碼輸出。

  又過了五分鐘,約翰長出一口氣,靠在了椅背上。

  「算出來了。」約翰揉了揉脖子。

  「結果?」大衛問。

  「完全一致。」約翰把屏幕轉過來,「這就是一份實打實的預測結果。」

  李飛飛的視線轉向陳冉。

  陳冉看著後台調出來的數據報表,臉色有些古怪。

  「查到了什麼?」李飛飛問。

  「註冊郵箱是一個QQ郵箱帳號。」陳冉說。

  「QQ郵箱?」約翰愣了一下,「中國那邊的?」

  「對,騰訊公司的郵箱服務。」陳冉解釋,「註冊時間就在ImageNet比賽開始前三天。除此之外,後台沒有任何其他信息。連隊伍所屬機構那一欄都空著。」

章節目錄