第635章 李飛飛的斷言
「這40%的正確率,確實能打,但這是通用模型沒做微調跑出來的數據。」
「這絕對不是咱們實力的天花板。」
郭長征敲了敲桌子,給幾個年輕人降降溫。
「你想想,為了去榜單上當個顯眼包,白白浪費一次提交機會。」
「等後面咱們訓練出準確度更高的專用模型,結果發現手裡只剩四次機會了,虧不虧?」
楚一航非常贊同郭長征的觀點,也跟著勸鍾柏。
「郭老師說得對,穩住咱們能贏。」
「五次提交機會太寶貴了,不能一開局為了裝杯就隨便浪費掉。」
楚一航搓了搓下巴。
「咱們得沉得住氣。」
鍾柏聽完,徹底收起了那股想出風頭的浮躁勁,乖乖離開了電腦桌。
「懂了,苟住發育。那咱們接下來這三個月從哪下手?」
郭長征轉身走到白板前,拿起黑色馬克筆。
「干咱們該乾的具體工作。」
「先把這通用模型的輸出層改了,剔除多餘的四千個類別,專門針對比賽的一千個分類做訓練。」
幾個人立刻進入了工作狀態。
鍾柏負責修改網絡輸出層的代碼結構。
葉言開始編寫過濾多餘分類的數據清洗腳本。
楚一航則坐在電腦前,監控著九章平台的顯存調度,為接下來的微調訓練預留算力通道。
教研室里剛才的激動情緒一掃而空,只剩下連串的鍵盤敲擊聲。
……
史丹福大學的人工智慧實驗室里,大衛用力敲打著回車鍵。
屏幕上彈出一行紅色的錯誤提示,伴隨著一聲警告音。
大衛抓了抓頭髮,把鍵盤推到一邊。
約翰坐在旁邊的工位上,轉動椅子滑了過來。
「又報錯了?」約翰看著大衛的屏幕。
「內存溢出。」大衛指著屏幕上的代碼行,「這數據量完全超出了現有設備的承受極限。」
約翰湊近看了一眼後台的運行日誌。
「這套圖片分類的數據集太大了,一百萬張圖片,我們的算法根本跑不動。」約翰連連搖頭。
兩人都是李飛飛團隊的博士。
雖然作為主辦方團隊的成員,但是兩人也報名參加了比賽。
兩人正愁眉苦臉,李飛飛拿著一個裝滿黑咖啡的馬克杯走了進來。
大衛趕緊轉頭看向李飛飛。
「飛飛教授,你覺得這次數據集的比賽,第一名大概能達到怎樣的程度?」大衛開口詢問。
李飛飛拉過一把辦公椅,在大衛身邊坐下。
她把馬克杯放在桌上,看著屏幕上的錯誤日誌。
「大家不要灰心,我們內部其實已經用各種傳統數值方法做過測試了。」李飛飛語氣平緩。
大衛立刻來了精神,坐直了身子。
「教授,測試結果怎麼樣?」大衛追問。
李飛飛喝了一口咖啡,放下杯子。
「根據我們跑出的結果,這套數據集的極限應該可以超過30%。」李飛飛說出了數字。
約翰在旁邊計算了一下。
「您是指 top 1 的正確率?」約翰確認道。
李飛飛點了點頭。
「是的。至於 top 5 的正確率,可以超過70%。」李飛飛補充。
大衛皺起眉頭,手指在桌面上敲擊。
「超過30%?我們在特徵提取上花了這麼多時間,結果還差這麼多?」大衛顯得有些沮喪。
李飛飛看著大衛的眼睛。
「大衛,科學研究不能只看眼前的得失。目前我們嘗試了所有不同的算法,確實只能達到這個程度。」
李飛飛站起身,走到實驗室中央的白板前。
「但是,我對其他參賽團隊很有信心。」李飛飛說。
「為什麼?」約翰不解地問。
「因為現在這個數據集完全開放了。它會激發全球所有頂尖研究人員的熱情。」李飛飛解釋道。
大衛嘆了口氣。
「光有熱情沒用啊,算力跟不上,大家都在用傳統的支持向量機做分類,上限就在那裡。」大衛反駁。
李飛飛笑了笑,「這就要感謝英偉達了。他們這次提供了非常大的幫助。」。
約翰撇了撇嘴。
「老黃這次確實花了不少錢,幾萬美元的獎金呢。」約翰調侃道。
大衛跟著附和。
「就是,重賞之下必有勇夫。很多人估計連夜都在改代碼,就為了搶這筆獎金。」
李飛飛走回座位。
「不僅僅是獎金。英偉達設置的賽制非常吸引人,這種實時排名會帶來很大的競爭壓力。」
李飛飛繼續分析。
「這些條件加在一起,能幫助比賽吸引更多頂尖團隊來提交數據。有競爭,才能取得更高的成績。」
大衛還是覺得不樂觀。
「可是教授,您覺得第一名到底能考多少分?」大衛又回到了最初的問題。
李飛飛在心裡盤算了一下。
「按照目前的學術發展速度,我預測,top 1 正確率能到32%。」李飛飛給出了具體的數值。
「top 5 正確率能到75%。」李飛飛繼續說道。
約翰把這兩個數字記錄在筆記本上。
「這就到頂了嗎?」約翰問。
李飛飛點頭。
「對,這就是目前的極限了。」李飛飛語氣肯定。
「為什麼不能更高?」大衛追問。
「畢竟以目前的技術水平,據我所知,應該還沒有達到那種脫胎換骨的程度。」李飛飛解釋。
李飛飛端起咖啡杯。
「沒有新技術的加入,單靠優化現有算法,32%就是很難突破的瓶頸。」
大衛靠在椅背上。
「那這個比賽還有什麼意義?大家只是在小數點後兩位互相競爭。」大衛抱怨道。
李飛飛拍了拍大衛的肩膀。
「不要著急。我覺得,如果這個比賽未來幾年一直辦下去,一定會產生質的改變。」李飛飛語氣中充滿期待。
大衛無奈地重新拉過鍵盤。
「好吧,那我繼續去改參數。看看能不能把正確率從25%提高到30%。」大衛重新投入工作。
……
同一時間,加拿大多倫多大學。
教研室的角落裡,亞歷克斯正盯著電腦屏幕上緩慢跳動的進度條,煩躁地抓了抓頭髮。
伊利亞坐在旁邊,機械地敲擊著鍵盤。
「這組數據的預訓練還要跑多久?」伊利亞頭也不回地問。
亞歷克斯嘆了口氣,敲了一下回車鍵。
「按照現在的運算速度,大概還需要一個星期。這還是不出任何內存報錯的情況。」亞歷克斯語氣里滿是絕望。
長時間的等待讓人抓狂,亞歷克斯切出編譯器,打算看點科技新聞換換腦子。
一條關於ImageNet視覺識別挑戰賽的通告彈了出來。
「這絕對不是咱們實力的天花板。」
郭長征敲了敲桌子,給幾個年輕人降降溫。
「你想想,為了去榜單上當個顯眼包,白白浪費一次提交機會。」
「等後面咱們訓練出準確度更高的專用模型,結果發現手裡只剩四次機會了,虧不虧?」
楚一航非常贊同郭長征的觀點,也跟著勸鍾柏。
「郭老師說得對,穩住咱們能贏。」
「五次提交機會太寶貴了,不能一開局為了裝杯就隨便浪費掉。」
楚一航搓了搓下巴。
「咱們得沉得住氣。」
鍾柏聽完,徹底收起了那股想出風頭的浮躁勁,乖乖離開了電腦桌。
「懂了,苟住發育。那咱們接下來這三個月從哪下手?」
郭長征轉身走到白板前,拿起黑色馬克筆。
「干咱們該乾的具體工作。」
「先把這通用模型的輸出層改了,剔除多餘的四千個類別,專門針對比賽的一千個分類做訓練。」
幾個人立刻進入了工作狀態。
鍾柏負責修改網絡輸出層的代碼結構。
葉言開始編寫過濾多餘分類的數據清洗腳本。
楚一航則坐在電腦前,監控著九章平台的顯存調度,為接下來的微調訓練預留算力通道。
教研室里剛才的激動情緒一掃而空,只剩下連串的鍵盤敲擊聲。
……
史丹福大學的人工智慧實驗室里,大衛用力敲打著回車鍵。
屏幕上彈出一行紅色的錯誤提示,伴隨著一聲警告音。
大衛抓了抓頭髮,把鍵盤推到一邊。
約翰坐在旁邊的工位上,轉動椅子滑了過來。
「又報錯了?」約翰看著大衛的屏幕。
「內存溢出。」大衛指著屏幕上的代碼行,「這數據量完全超出了現有設備的承受極限。」
約翰湊近看了一眼後台的運行日誌。
「這套圖片分類的數據集太大了,一百萬張圖片,我們的算法根本跑不動。」約翰連連搖頭。
兩人都是李飛飛團隊的博士。
雖然作為主辦方團隊的成員,但是兩人也報名參加了比賽。
兩人正愁眉苦臉,李飛飛拿著一個裝滿黑咖啡的馬克杯走了進來。
大衛趕緊轉頭看向李飛飛。
「飛飛教授,你覺得這次數據集的比賽,第一名大概能達到怎樣的程度?」大衛開口詢問。
李飛飛拉過一把辦公椅,在大衛身邊坐下。
她把馬克杯放在桌上,看著屏幕上的錯誤日誌。
「大家不要灰心,我們內部其實已經用各種傳統數值方法做過測試了。」李飛飛語氣平緩。
大衛立刻來了精神,坐直了身子。
「教授,測試結果怎麼樣?」大衛追問。
李飛飛喝了一口咖啡,放下杯子。
「根據我們跑出的結果,這套數據集的極限應該可以超過30%。」李飛飛說出了數字。
約翰在旁邊計算了一下。
「您是指 top 1 的正確率?」約翰確認道。
李飛飛點了點頭。
「是的。至於 top 5 的正確率,可以超過70%。」李飛飛補充。
大衛皺起眉頭,手指在桌面上敲擊。
「超過30%?我們在特徵提取上花了這麼多時間,結果還差這麼多?」大衛顯得有些沮喪。
李飛飛看著大衛的眼睛。
「大衛,科學研究不能只看眼前的得失。目前我們嘗試了所有不同的算法,確實只能達到這個程度。」
李飛飛站起身,走到實驗室中央的白板前。
「但是,我對其他參賽團隊很有信心。」李飛飛說。
「為什麼?」約翰不解地問。
「因為現在這個數據集完全開放了。它會激發全球所有頂尖研究人員的熱情。」李飛飛解釋道。
大衛嘆了口氣。
「光有熱情沒用啊,算力跟不上,大家都在用傳統的支持向量機做分類,上限就在那裡。」大衛反駁。
李飛飛笑了笑,「這就要感謝英偉達了。他們這次提供了非常大的幫助。」。
約翰撇了撇嘴。
「老黃這次確實花了不少錢,幾萬美元的獎金呢。」約翰調侃道。
大衛跟著附和。
「就是,重賞之下必有勇夫。很多人估計連夜都在改代碼,就為了搶這筆獎金。」
李飛飛走回座位。
「不僅僅是獎金。英偉達設置的賽制非常吸引人,這種實時排名會帶來很大的競爭壓力。」
李飛飛繼續分析。
「這些條件加在一起,能幫助比賽吸引更多頂尖團隊來提交數據。有競爭,才能取得更高的成績。」
大衛還是覺得不樂觀。
「可是教授,您覺得第一名到底能考多少分?」大衛又回到了最初的問題。
李飛飛在心裡盤算了一下。
「按照目前的學術發展速度,我預測,top 1 正確率能到32%。」李飛飛給出了具體的數值。
「top 5 正確率能到75%。」李飛飛繼續說道。
約翰把這兩個數字記錄在筆記本上。
「這就到頂了嗎?」約翰問。
李飛飛點頭。
「對,這就是目前的極限了。」李飛飛語氣肯定。
「為什麼不能更高?」大衛追問。
「畢竟以目前的技術水平,據我所知,應該還沒有達到那種脫胎換骨的程度。」李飛飛解釋。
李飛飛端起咖啡杯。
「沒有新技術的加入,單靠優化現有算法,32%就是很難突破的瓶頸。」
大衛靠在椅背上。
「那這個比賽還有什麼意義?大家只是在小數點後兩位互相競爭。」大衛抱怨道。
李飛飛拍了拍大衛的肩膀。
「不要著急。我覺得,如果這個比賽未來幾年一直辦下去,一定會產生質的改變。」李飛飛語氣中充滿期待。
大衛無奈地重新拉過鍵盤。
「好吧,那我繼續去改參數。看看能不能把正確率從25%提高到30%。」大衛重新投入工作。
……
同一時間,加拿大多倫多大學。
教研室的角落裡,亞歷克斯正盯著電腦屏幕上緩慢跳動的進度條,煩躁地抓了抓頭髮。
伊利亞坐在旁邊,機械地敲擊著鍵盤。
「這組數據的預訓練還要跑多久?」伊利亞頭也不回地問。
亞歷克斯嘆了口氣,敲了一下回車鍵。
「按照現在的運算速度,大概還需要一個星期。這還是不出任何內存報錯的情況。」亞歷克斯語氣里滿是絕望。
長時間的等待讓人抓狂,亞歷克斯切出編譯器,打算看點科技新聞換換腦子。
一條關於ImageNet視覺識別挑戰賽的通告彈了出來。