第57章 投稿!(求追讀)
而填肉的素材,實驗數據、方法細節、模型架構等這些都是他親手做出來的東西,沒有人比他更熟悉。
蘇舟打開電腦,新建了一個LaTeX文檔,按照IEEE雙欄排版的模板配置好格式。
然後,他在草稿紙上列了個提綱。
提綱列完,蘇舟深吸一口氣,開始動筆。
說實話,寫第一段的時候,蘇舟還是卡殼了。
腦子裡的想法像一團糾纏在一起的耳機線,知道裡面有東西,但就是扯不出一個頭來。
但當他敲下第一個單詞之後,後面的內容像水流一樣湧出來了。
他太了解自己做的東西了。
每一行代碼是怎麼寫的,每一個模型是怎麼訓練的,每一組實驗數據是怎麼跑出來的,這些東西就長在他腦子裡。
唯一的障礙是學術英語的表達,但這個問題也比他想像的要小。
他和牛頓相處了一段時間後,英文讀寫能力早就被反覆錘鍊過了。
論文的語言不需要華麗,只需要精準。
這正是蘇舟的長項。
接下來幾天,蘇舟過上了一種堪稱自虐的雙線生活。
白天在學校應付月考。
晚上回到家,蘇舟把自己關進房間,繼續寫論文。
方法描述部分最耗時間。他需要用數學語言精確地描述網絡的每一層結構、前向傳播過程、損失函數的設計思路和梯度更新策略。
每一個公式他都反覆推敲,確保邏輯上沒有任何跳躍。
圖靈說的那句話他記在心裡,審稿人會從各個角度找漏洞。
那他就提前把漏洞堵死。
實驗部分是蘇舟寫得最順的。
畢竟數據都是現成的。
他在PASCAL VOC等公開數據集上跑出的檢測精度和推理速度遠超當時的主流方法。
對比實驗表格一列出來,數字本身就是最好的論證。
消融實驗也按照馮·諾依曼的建議做了,逐一去掉多尺度特徵融合模塊、注意力機制、自適應錨框策略,觀察下降幅度。
結果表明,每一個模塊都有顯著貢獻。
到第六天,初稿終於完成了!
蘇舟從頭到尾讀了一遍,然後開始改。
香農說得對,好論文是改出來的。
他改了三遍措辭,改了兩遍公式排版,改了一遍圖表配色,最後把參考文獻格式統一檢查了一遍。
八頁正文,密密麻麻的雙欄排版,四張架構圖,六張實驗結果表,三張可視化對比圖。
完成。
蘇舟看著屏幕上的PDF,沉默了很久。
這是他人生中寫的第一篇學術論文。
十三歲。
第一次。
他沒有教授做他的導師,沒有龐大的課題組,也沒有高大上的實驗室。
他的實驗室就是臥室那台組裝電腦,他的導師是42群里一群不同時代的天才。
蘇舟把論文另存為最終版,打開了CVPR 2008的在線投稿系統。
CMT的界面在瀏覽器中加載出來,藍灰色的頁面設計樸素得近乎簡陋。
蘇舟註冊了帳號,填寫個人信息和論文信息,然後上傳PDF。
進度條緩緩移動。
12%……36%……58%……87%……100%。
Submission Successful.
Your paper ID is: CVPR-2008-3847
You will receive a confirmation email shortly.
蘇舟盯著屏幕上那行綠色的成功提示,長長地呼了一口氣。
投出去了。
不管結果如何,這一步邁出去了。
幾天後,德國,慕尼黑工業大學,計算機視覺與機器學習實驗室。
克勞斯·施密特教授坐在他寬大的辦公桌前,面前攤著三份列印出來的論文,右手邊是一杯已經涼透的黑咖啡。
他灰白頭髮梳得一絲不苟,金絲邊眼鏡架在鼻樑上,一雙灰藍色的眼睛透著常年做學術養成的銳利。
施密特教授是CVPR的資深審稿人,每年都會收到十到十五篇審稿邀請,在計算機視覺領域,尤其是目標檢測與圖像分割方向,他的名字在歐洲學術圈幾乎無人不知。
他的桌上有三份待審稿件,都是CVPR 2008編輯部分配過來的。
第一篇來自MIT,關於圖像分割的。
第二篇來自CMU,關於特徵提取的。
第三篇來自……
施密特教授眯起眼睛,看了看作者信息。
Zhou Su. Chongming High School, China.
他的眉頭幾乎是下意識地皺了起來。
「High School?「他低聲重複了一遍,以為自己看錯了。
沒看錯。
確實是High School。
他又看了看標題《 A Deep Neural Network Framework for Real-Time Object Detection and Scene Understanding》。
神經網絡、實時目標檢測、場景理解。
施密特教授靠回椅背,摘下眼鏡擦了擦。
這個方向他了解。
當下學術界的主流觀點是,深度神經網絡在計算機視覺任務上的表現遠不如傳統的特徵工程方法。
卷積網絡雖然在手寫數字識別上效果不錯,但要擴展到更複雜的視覺任務,計算資源和數據量都是巨大的瓶頸。
一個來自華國高中的作者,單槍匹馬做深度學習?
施密特教授嘴角微微牽了一下,說不清是譏諷還是困惑。
「馬庫斯。」他抬起頭,叫住了正從門口經過的學生。
「教授?」
施密特教授把那份論文從桌上拎起來,遞過去。
「幫我預審一下這篇。」
馬庫斯接過來,掃了一眼標題和作者信息,表情和施密特教授如出一轍。
「Mingde High School?這是……中學?」
「看起來是。」施密特教授聳了聳肩,「可能是系統填寫錯誤,也可能真的是個中學老師投的,無論如何,先看一下有沒有基本的學術價值,不用花太多時間,意思一下就行。」
他拿起那杯涼咖啡抿了一口,皺了皺眉放下。
「華國人在深度學習這個方向上目前沒有太多積累,投頂會的論文大多是跟風之作,缺乏原創性,這篇的作者我從來沒聽說過,單位還是個中學,大概率是湊數的。」
「明白了。」馬庫斯點了點頭,把論文夾進自己的文件夾。
施密特教授再看了一眼論文的標題。
《基於深度神經網絡的實時目標檢測與場景理解》。
呵,多大的口氣。
施密特教授無聲地笑了一下,端起那杯涼透的黑咖啡又勉強咽了一口。
現在的計算機視覺圈子真是越來越浮躁了,什麼人都敢往CVPR這種頂級會議投論文。
現在可是2008年。整個學術界的共識是什麼?
最頂尖的學者們都在致力於用更優雅的數學模型去手工設計特徵提取器,通過嚴密的概率圖模型去推導像素間的關係,這才是真正考驗研究者數學和算法功底的正道。
至於深度神經網絡?
那不過是個上世紀八九十年代炒作過一陣,後來被理論證明存在致命缺陷的死胡同罷了。
「實時目標檢測……」施密特教授搖了搖頭。
轉回去繼續看MIT那篇,沒再多想。
在他多年的審稿經驗中,這種來歷不明的投稿見過太多了。
大部分連初審都過不了。
p.s.月初了,小作者求追讀求月票和推薦~
蘇舟打開電腦,新建了一個LaTeX文檔,按照IEEE雙欄排版的模板配置好格式。
然後,他在草稿紙上列了個提綱。
提綱列完,蘇舟深吸一口氣,開始動筆。
說實話,寫第一段的時候,蘇舟還是卡殼了。
腦子裡的想法像一團糾纏在一起的耳機線,知道裡面有東西,但就是扯不出一個頭來。
但當他敲下第一個單詞之後,後面的內容像水流一樣湧出來了。
他太了解自己做的東西了。
每一行代碼是怎麼寫的,每一個模型是怎麼訓練的,每一組實驗數據是怎麼跑出來的,這些東西就長在他腦子裡。
唯一的障礙是學術英語的表達,但這個問題也比他想像的要小。
他和牛頓相處了一段時間後,英文讀寫能力早就被反覆錘鍊過了。
論文的語言不需要華麗,只需要精準。
這正是蘇舟的長項。
接下來幾天,蘇舟過上了一種堪稱自虐的雙線生活。
白天在學校應付月考。
晚上回到家,蘇舟把自己關進房間,繼續寫論文。
方法描述部分最耗時間。他需要用數學語言精確地描述網絡的每一層結構、前向傳播過程、損失函數的設計思路和梯度更新策略。
每一個公式他都反覆推敲,確保邏輯上沒有任何跳躍。
圖靈說的那句話他記在心裡,審稿人會從各個角度找漏洞。
那他就提前把漏洞堵死。
實驗部分是蘇舟寫得最順的。
畢竟數據都是現成的。
他在PASCAL VOC等公開數據集上跑出的檢測精度和推理速度遠超當時的主流方法。
對比實驗表格一列出來,數字本身就是最好的論證。
消融實驗也按照馮·諾依曼的建議做了,逐一去掉多尺度特徵融合模塊、注意力機制、自適應錨框策略,觀察下降幅度。
結果表明,每一個模塊都有顯著貢獻。
到第六天,初稿終於完成了!
蘇舟從頭到尾讀了一遍,然後開始改。
香農說得對,好論文是改出來的。
他改了三遍措辭,改了兩遍公式排版,改了一遍圖表配色,最後把參考文獻格式統一檢查了一遍。
八頁正文,密密麻麻的雙欄排版,四張架構圖,六張實驗結果表,三張可視化對比圖。
完成。
蘇舟看著屏幕上的PDF,沉默了很久。
這是他人生中寫的第一篇學術論文。
十三歲。
第一次。
他沒有教授做他的導師,沒有龐大的課題組,也沒有高大上的實驗室。
他的實驗室就是臥室那台組裝電腦,他的導師是42群里一群不同時代的天才。
蘇舟把論文另存為最終版,打開了CVPR 2008的在線投稿系統。
CMT的界面在瀏覽器中加載出來,藍灰色的頁面設計樸素得近乎簡陋。
蘇舟註冊了帳號,填寫個人信息和論文信息,然後上傳PDF。
進度條緩緩移動。
12%……36%……58%……87%……100%。
Submission Successful.
Your paper ID is: CVPR-2008-3847
You will receive a confirmation email shortly.
蘇舟盯著屏幕上那行綠色的成功提示,長長地呼了一口氣。
投出去了。
不管結果如何,這一步邁出去了。
幾天後,德國,慕尼黑工業大學,計算機視覺與機器學習實驗室。
克勞斯·施密特教授坐在他寬大的辦公桌前,面前攤著三份列印出來的論文,右手邊是一杯已經涼透的黑咖啡。
他灰白頭髮梳得一絲不苟,金絲邊眼鏡架在鼻樑上,一雙灰藍色的眼睛透著常年做學術養成的銳利。
施密特教授是CVPR的資深審稿人,每年都會收到十到十五篇審稿邀請,在計算機視覺領域,尤其是目標檢測與圖像分割方向,他的名字在歐洲學術圈幾乎無人不知。
他的桌上有三份待審稿件,都是CVPR 2008編輯部分配過來的。
第一篇來自MIT,關於圖像分割的。
第二篇來自CMU,關於特徵提取的。
第三篇來自……
施密特教授眯起眼睛,看了看作者信息。
Zhou Su. Chongming High School, China.
他的眉頭幾乎是下意識地皺了起來。
「High School?「他低聲重複了一遍,以為自己看錯了。
沒看錯。
確實是High School。
他又看了看標題《 A Deep Neural Network Framework for Real-Time Object Detection and Scene Understanding》。
神經網絡、實時目標檢測、場景理解。
施密特教授靠回椅背,摘下眼鏡擦了擦。
這個方向他了解。
當下學術界的主流觀點是,深度神經網絡在計算機視覺任務上的表現遠不如傳統的特徵工程方法。
卷積網絡雖然在手寫數字識別上效果不錯,但要擴展到更複雜的視覺任務,計算資源和數據量都是巨大的瓶頸。
一個來自華國高中的作者,單槍匹馬做深度學習?
施密特教授嘴角微微牽了一下,說不清是譏諷還是困惑。
「馬庫斯。」他抬起頭,叫住了正從門口經過的學生。
「教授?」
施密特教授把那份論文從桌上拎起來,遞過去。
「幫我預審一下這篇。」
馬庫斯接過來,掃了一眼標題和作者信息,表情和施密特教授如出一轍。
「Mingde High School?這是……中學?」
「看起來是。」施密特教授聳了聳肩,「可能是系統填寫錯誤,也可能真的是個中學老師投的,無論如何,先看一下有沒有基本的學術價值,不用花太多時間,意思一下就行。」
他拿起那杯涼咖啡抿了一口,皺了皺眉放下。
「華國人在深度學習這個方向上目前沒有太多積累,投頂會的論文大多是跟風之作,缺乏原創性,這篇的作者我從來沒聽說過,單位還是個中學,大概率是湊數的。」
「明白了。」馬庫斯點了點頭,把論文夾進自己的文件夾。
施密特教授再看了一眼論文的標題。
《基於深度神經網絡的實時目標檢測與場景理解》。
呵,多大的口氣。
施密特教授無聲地笑了一下,端起那杯涼透的黑咖啡又勉強咽了一口。
現在的計算機視覺圈子真是越來越浮躁了,什麼人都敢往CVPR這種頂級會議投論文。
現在可是2008年。整個學術界的共識是什麼?
最頂尖的學者們都在致力於用更優雅的數學模型去手工設計特徵提取器,通過嚴密的概率圖模型去推導像素間的關係,這才是真正考驗研究者數學和算法功底的正道。
至於深度神經網絡?
那不過是個上世紀八九十年代炒作過一陣,後來被理論證明存在致命缺陷的死胡同罷了。
「實時目標檢測……」施密特教授搖了搖頭。
轉回去繼續看MIT那篇,沒再多想。
在他多年的審稿經驗中,這種來歷不明的投稿見過太多了。
大部分連初審都過不了。
p.s.月初了,小作者求追讀求月票和推薦~