第178章 豪華團隊
第178章 豪華團隊
周昀一時間有些懵逼,雖說他也早就覺得自己可以畢業了,但是以他現在的身份,畢業不畢業對他來說也就是那一紙文憑罷了,所以他對於畢業的事情也不怎麼著急,不過現在看來,老師倒是比他更加著急。
「提前答辯嗎?我都行啊,不過我才剛讀博士沒到一年,會有什麼問題嗎?」
鄧永華聽著周昀的話,忍不住在電話那頭失笑:「問題?最大的問題就是你自己不上心,別人讀博掰著手指頭算畢業日期,你倒好,還得我們這些老師反過來催你。」
他語氣帶著調侃,但隨即轉為認真:「學術界年齡向來不是問題,關鍵在於成果,而你的成果非常紮實,學校有破格選拔的規定,就是為這種情況準備的,你師公親自點頭,院裡一路綠燈,程序上你完全不用擔心。」
周昀在電話這頭撓了撓頭,實話實說:「老師,我倒不是擔心程序,我是覺得現在手頭項目剛剛有點起色,千頭萬緒,我怕分散太多精力,而且,說實話,」他頓了頓,「那張文憑,對我現在做的事情,影響好像不大。」
「哎,周昀啊周昀,你技術上的頭腦是一流的,怎麼有時候在這事上就轉不過彎來?」
他耐心解釋道:「是,以你現在的貢獻和能力,在李主任那邊,在項目里,有沒有博士學位,確實不影響你幹活,但你想過沒有?未來呢?等到項目要推向全國,需要你站到更前台去講解、
去協調更多資源的時候?
或者,當某些場合需要論資排輩、需要拿個名分才能鎮住場子的時候?那一紙文憑,它不僅僅是一張紙,它是一個通行證,是一個能讓很多不必要的麻煩自動消失的底氣。」
鄧永華語重心長:「把它拿到手,是把你應得的東西落到實處,是給你自己,也是給一直支持你的人,減去許多未來的潛在麻煩。這叫名正言順,懂嗎?」
周昀沉默了片刻,他明白導師的意思。他可以不看重,但這個體系認這個。
提前拿到博士學位,能讓他更專注於事情本身,減少許多無謂的質疑和阻力。
「我明白了,老師,我馬上去準備。」本來他還想著畢業論文就隨便找幾個做過的工作拼湊一下就好,畢竟他的一些工作有些雖然沒發到知名會議或者期刊上,但質量也都是有保證的,作為他的畢業論文綽綽有餘,不過鄧永華的一番話讓他改變了一些想法。
聽到學生終於轉過彎來,鄧永華語氣緩和了:「這就對了,寫好初稿後發給我看一下,論文答辯,對你來說,難度不大,正常寫就好了。」
「好的,老師,我會儘快弄好,不過項目這邊,正是最關鍵的時候,所以答辯時間我看看後面的安排再給您一個答覆。」
「好,時間上會協調好,不會讓你難做的。」
「嗯,謝謝老師。」
掛斷電話,周昀看著窗外,微微呼出一口氣,好吧,看來在工作之餘還要搞一搞他的畢業論文,不過寫論文相比於做項目,對現在的周昀來說前者更像是放鬆。
隨後,周昀將今天的工作整理了一下,便靠在椅背上,開始思考這次畢業論文的選題,閉目沉思了片刻,他打開一個空白的文檔,敲下一行標題。
《NDN的輕量化與可擴展性研究:從理論到生態構建》,雖然他的NDN已經出來不短的時間了,但是因為其上手難度相較於之前的attention更複雜,還需要受制於Aetos平台,所以發展起來也相對緩慢,所有突破性的進展幾乎都是靠著周昀和他在學校實驗室的幾個成員來完成的。
所以這次,他打算將NDN降低一些,讓更多人都能了解它,使用它,只有這樣,其生態才能越來越好。
NDN架構自提出以來,以其仿生的動態結構演化能力和在複雜任務中展現出的卓越適應性與組合泛化潛力,引起了學術界的廣泛關注,但是相較於此前如Transformer等即插即用」的架構,NDN在實際推廣中面臨著顯著的挑戰,其一,理論門檻高,其核心概念對研究者構成了較高的認知負荷:
其二,實現依賴強,高效的NDN實現嚴重依賴Aetos等特定高性能計算平台,限制了其普及;
其三,生態工具鏈缺失,缺乏易於上手的訓練框架、調試工具和預訓練模型,導致研究與應用成本高昂。
Aetos相關的部分現在已經在抓緊追趕了,但是像這樣龐大的工程,終究是需要時間的。
所以周昀的論文的核心構想,圍繞「降維」與「賦能」兩個主軸展開,首先是提出輕量級NDN核心—Lite—NDNCore,他計劃定義一套精簡但完備的NDN操作原語,將複雜的動態生長過程封裝為幾個直觀的「生長策略」模塊。如「基於梯度的局部生長」、「基於注意力的全局連接」
研究者無需理解底層所有數學細節,即可通過組合這些模塊快速搭建實驗模型。
同時引入靜態—動態混合架構,針對某些對計算效率要求極高的子任務,他計劃探索一種混合模式,即模型主體部分仍保持靜態以保障效率,僅在關鍵的、需要適應性的部分引入NDN動態模塊,這也算是給廣大學者們一個過渡的選擇。
第二設計NDN虛擬中間表示—NDN—VIR,他計劃設計一種獨立於Aetos平台的中間表示層,將NDN的動態計算圖翻譯成標準運算符的組合,這使得NDN模型理論上可以在PyTorch、TensorFlow等主流框架上進行訓練和推理,打破了平台枷鎖,當然,其訓練效率肯定和Aetos有差別。
最後一個就是計劃開發一個配套的可視化工具,能夠直觀展示NDN模型的動態生長過程、知識沉積的狀態以及各模塊的活躍度,這將極大降低理解和調試NDN模型的難度。
並且針對NDN擅長處理的任務特性,他計劃整理並開源一套標準評測數據集和自動化評測腳本,為不同NDN變體的公平比較奠定基礎。
最後他計劃發布一系列在不同基礎任務上預訓練好的小型NDN模型作為「種子」。
其他研究者可以像使用BERT的預訓練權重一樣,在這些「種子」上進行微調或繼續生長,從而大幅降低從零開始訓練NDN的成本和時間。
確定了想法,周昀沒有絲毫拖延,對他而言,構想與執行之間的界限向來模糊,他立刻行動起來,在代碼庫里創建了一個新的私有項目——「Project
Prometheus。
接下來的幾周,周昀進入了另一種工作模式,白天,他依然是「九州」二期的總協調,晚上他則專心搞自己的畢業論文。
大概一個月之後,他的畢業論文成果差不多了,只剩下整理論文了。
他的所有畢業論文相關的成果都被他整理到了一起,和他之前計劃好的一樣,主要的成果一共四個,這也差不多是大多數博士論文的工作量要求,第一個就是Lite—NDNCore,這是一個輕量級、模塊化的Python庫,研究者現在只需通過幾行直觀的代碼,即可調用封裝好的生長策略,這套核心庫將NDN的入門門檻從理解複雜數學降低到了會調用API和配置參數,第二個是NDN—VIR編譯器Beta版,它成功地將NDN獨特的動態計算圖,編譯成了PyTorch和TensorFlow能夠識別和執行的靜態計算圖序列,雖然效率相較於原生Aetos平台有約30%—50%的損失,但它在標準GPU上的成功運行,標誌著NDN徹底打破了平台枷鎖,第三,NDN—Vis可視化工具,這是一個功能強大的交互式Web工具。研究者可以上傳自己的NDN模型運行日誌,工具便能以動態、可視化的方式重現網絡的生長全過程:
拓撲演化動畫:可以清晰地看到神經元和連接如何隨著訓練過程而增生、修剪和重組。
知識沉積熱力圖:以熱力圖形式展示不同類別的知識在沉積層中的分布與強度。
模塊活躍度流圖:實時顯示不同功能模塊在處理任務時的活躍程度和信息流動。
這個工具將NDN從黑箱變成了玻璃箱,極大降低了理解和調試難度。
第四個成果是NDN—Bench評測套件與預訓練「種子」,周的整理並開源了涵蓋持續學習,組合泛化和少樣本適應等任務的標準化數據集與自動化評測腳本。
同時,他發布了五個在不同領域,圖像分類、文本理解、時序預測預訓練好的「種子模型」。
這些模型文件不大,任何研究者都可以直接下載,並像使用BERT等預訓練模型一樣,在其基礎上進行微調或讓其繼續生長,將啟動成本從數月和巨額算力降低到了幾分鐘和一塊消費級GPU。
這有點像是之前的微調,但是兩者之間還是有些不一樣的,他的博士論文便是以上述四大成果為核心。
又是兩周過後,周的將博士論文寫好了。
將博士論文的最終稿通讀了一遍,確認了所有圖表、參考文獻和附錄都沒問題之後,打了個電話給鄧永華,電話很快被接起。
「老師,論文準備好了。」
「好!我這邊立刻啟動答辯流程,不過你得有個心理準備,你這次的答辯陣容估計不會簡單,你師公很可能會親自到場,還會邀請一兩位國內人工智慧領域的頂尖學者來旁聽。」
周昀對此倒是沒有什麼感覺,畢竟九州計劃手底下他就有很多頂尖學者,都習慣了。
不過他還是回應道:「我明白,老師。我會準備好。」
掛斷與周昀的電話,鄧永華直接聯繫了他的老師。
「老師,周昀的論文已經準備好了,答辯團隊這邊,您有什麼指示嗎?」
電話那頭的老院士似乎早有考量,「永華,周昀這孩子的工作,你我都清楚,其意義已超出一篇博士論文,所以,這場答辯,不能僅僅是走個過場,我們需要的是真正能看懂、能挑刺、能提出建設性甚至尖銳問題的大家,他們的認可,才具有真正的分量。」
他略微停頓,心裡過了一遍名單,隨後緩緩報出幾個名字:「理論計算機科學這邊,陳國棟院士必須請到,他是國內複雜系統形式化驗證的大牛,有他把關NDN—VIR編譯器和你學生提出的那些形式化模型,根基才算紮實,機器學習理論層面,吳立民教授是不二人選,他是少數既能洞察理論本質,又不拘泥於傳統框架的學者,但若能得到他的認可,也算不錯。」
「還有,」老院士話鋒一轉,「我打算親自邀請吳思源院士。」
「計算神經科學的那位?」鄧永華微微一驚,這位院士的研究領域更偏向生物本質,與純計算機架構看似有些距離。
「正是。」老院士解釋道,「NDN架構的靈感源於神經發育,那麼它的生物合理性、其對神經科學的潛在啟發和反哺,就需要這個領域最頂尖的學者來評判,吳思源院士的到場,能將這場答辯的格局,從單純的計算機領域,提升到交叉學科前沿探索的層面。」
「產業界的眼光也不能缺位,我會試著聯繫一些工業界的朋友,他們站在技術落地的最前沿,問題會聚焦於實用性、可擴展性和潛在的技術瓶頸。」
聽完這份名單,鄧永華心中不由得有些咂舌,這幾乎囊括了與NDN相關的所有頂級視角:理論基石、機器學***、交叉學科評判、產業界審視。
讓他自己坐在這個答辯席上,面對這幾位目光如炬、提問往往直指要害的大學問家,他都不敢保證自己能完全從容應對,畢竟以他們的學識、眼光和威望,足以讓任何一點不嚴謹、不紮實之處無所遁形。
然而,這股下意識的緊張感只持續了短短几秒,他的腦海中立刻浮現出周昀那雙總是沉靜如水的眼睛。
不由得自嘲一句,我在擔心什麼?
是擔心周昀的理論基礎不夠紮實?他有些好笑地搖了搖頭,想到這裡,鄧永華心中的那點不安煙消雲散。
一時間,他倒是有些期待起來這次的答辯了。
周昀一時間有些懵逼,雖說他也早就覺得自己可以畢業了,但是以他現在的身份,畢業不畢業對他來說也就是那一紙文憑罷了,所以他對於畢業的事情也不怎麼著急,不過現在看來,老師倒是比他更加著急。
「提前答辯嗎?我都行啊,不過我才剛讀博士沒到一年,會有什麼問題嗎?」
鄧永華聽著周昀的話,忍不住在電話那頭失笑:「問題?最大的問題就是你自己不上心,別人讀博掰著手指頭算畢業日期,你倒好,還得我們這些老師反過來催你。」
他語氣帶著調侃,但隨即轉為認真:「學術界年齡向來不是問題,關鍵在於成果,而你的成果非常紮實,學校有破格選拔的規定,就是為這種情況準備的,你師公親自點頭,院裡一路綠燈,程序上你完全不用擔心。」
周昀在電話這頭撓了撓頭,實話實說:「老師,我倒不是擔心程序,我是覺得現在手頭項目剛剛有點起色,千頭萬緒,我怕分散太多精力,而且,說實話,」他頓了頓,「那張文憑,對我現在做的事情,影響好像不大。」
「哎,周昀啊周昀,你技術上的頭腦是一流的,怎麼有時候在這事上就轉不過彎來?」
他耐心解釋道:「是,以你現在的貢獻和能力,在李主任那邊,在項目里,有沒有博士學位,確實不影響你幹活,但你想過沒有?未來呢?等到項目要推向全國,需要你站到更前台去講解、
去協調更多資源的時候?
或者,當某些場合需要論資排輩、需要拿個名分才能鎮住場子的時候?那一紙文憑,它不僅僅是一張紙,它是一個通行證,是一個能讓很多不必要的麻煩自動消失的底氣。」
鄧永華語重心長:「把它拿到手,是把你應得的東西落到實處,是給你自己,也是給一直支持你的人,減去許多未來的潛在麻煩。這叫名正言順,懂嗎?」
周昀沉默了片刻,他明白導師的意思。他可以不看重,但這個體系認這個。
提前拿到博士學位,能讓他更專注於事情本身,減少許多無謂的質疑和阻力。
「我明白了,老師,我馬上去準備。」本來他還想著畢業論文就隨便找幾個做過的工作拼湊一下就好,畢竟他的一些工作有些雖然沒發到知名會議或者期刊上,但質量也都是有保證的,作為他的畢業論文綽綽有餘,不過鄧永華的一番話讓他改變了一些想法。
聽到學生終於轉過彎來,鄧永華語氣緩和了:「這就對了,寫好初稿後發給我看一下,論文答辯,對你來說,難度不大,正常寫就好了。」
「好的,老師,我會儘快弄好,不過項目這邊,正是最關鍵的時候,所以答辯時間我看看後面的安排再給您一個答覆。」
「好,時間上會協調好,不會讓你難做的。」
「嗯,謝謝老師。」
掛斷電話,周昀看著窗外,微微呼出一口氣,好吧,看來在工作之餘還要搞一搞他的畢業論文,不過寫論文相比於做項目,對現在的周昀來說前者更像是放鬆。
隨後,周昀將今天的工作整理了一下,便靠在椅背上,開始思考這次畢業論文的選題,閉目沉思了片刻,他打開一個空白的文檔,敲下一行標題。
《NDN的輕量化與可擴展性研究:從理論到生態構建》,雖然他的NDN已經出來不短的時間了,但是因為其上手難度相較於之前的attention更複雜,還需要受制於Aetos平台,所以發展起來也相對緩慢,所有突破性的進展幾乎都是靠著周昀和他在學校實驗室的幾個成員來完成的。
所以這次,他打算將NDN降低一些,讓更多人都能了解它,使用它,只有這樣,其生態才能越來越好。
NDN架構自提出以來,以其仿生的動態結構演化能力和在複雜任務中展現出的卓越適應性與組合泛化潛力,引起了學術界的廣泛關注,但是相較於此前如Transformer等即插即用」的架構,NDN在實際推廣中面臨著顯著的挑戰,其一,理論門檻高,其核心概念對研究者構成了較高的認知負荷:
其二,實現依賴強,高效的NDN實現嚴重依賴Aetos等特定高性能計算平台,限制了其普及;
其三,生態工具鏈缺失,缺乏易於上手的訓練框架、調試工具和預訓練模型,導致研究與應用成本高昂。
Aetos相關的部分現在已經在抓緊追趕了,但是像這樣龐大的工程,終究是需要時間的。
所以周昀的論文的核心構想,圍繞「降維」與「賦能」兩個主軸展開,首先是提出輕量級NDN核心—Lite—NDNCore,他計劃定義一套精簡但完備的NDN操作原語,將複雜的動態生長過程封裝為幾個直觀的「生長策略」模塊。如「基於梯度的局部生長」、「基於注意力的全局連接」
研究者無需理解底層所有數學細節,即可通過組合這些模塊快速搭建實驗模型。
同時引入靜態—動態混合架構,針對某些對計算效率要求極高的子任務,他計劃探索一種混合模式,即模型主體部分仍保持靜態以保障效率,僅在關鍵的、需要適應性的部分引入NDN動態模塊,這也算是給廣大學者們一個過渡的選擇。
第二設計NDN虛擬中間表示—NDN—VIR,他計劃設計一種獨立於Aetos平台的中間表示層,將NDN的動態計算圖翻譯成標準運算符的組合,這使得NDN模型理論上可以在PyTorch、TensorFlow等主流框架上進行訓練和推理,打破了平台枷鎖,當然,其訓練效率肯定和Aetos有差別。
最後一個就是計劃開發一個配套的可視化工具,能夠直觀展示NDN模型的動態生長過程、知識沉積的狀態以及各模塊的活躍度,這將極大降低理解和調試NDN模型的難度。
並且針對NDN擅長處理的任務特性,他計劃整理並開源一套標準評測數據集和自動化評測腳本,為不同NDN變體的公平比較奠定基礎。
最後他計劃發布一系列在不同基礎任務上預訓練好的小型NDN模型作為「種子」。
其他研究者可以像使用BERT的預訓練權重一樣,在這些「種子」上進行微調或繼續生長,從而大幅降低從零開始訓練NDN的成本和時間。
確定了想法,周昀沒有絲毫拖延,對他而言,構想與執行之間的界限向來模糊,他立刻行動起來,在代碼庫里創建了一個新的私有項目——「Project
Prometheus。
接下來的幾周,周昀進入了另一種工作模式,白天,他依然是「九州」二期的總協調,晚上他則專心搞自己的畢業論文。
大概一個月之後,他的畢業論文成果差不多了,只剩下整理論文了。
他的所有畢業論文相關的成果都被他整理到了一起,和他之前計劃好的一樣,主要的成果一共四個,這也差不多是大多數博士論文的工作量要求,第一個就是Lite—NDNCore,這是一個輕量級、模塊化的Python庫,研究者現在只需通過幾行直觀的代碼,即可調用封裝好的生長策略,這套核心庫將NDN的入門門檻從理解複雜數學降低到了會調用API和配置參數,第二個是NDN—VIR編譯器Beta版,它成功地將NDN獨特的動態計算圖,編譯成了PyTorch和TensorFlow能夠識別和執行的靜態計算圖序列,雖然效率相較於原生Aetos平台有約30%—50%的損失,但它在標準GPU上的成功運行,標誌著NDN徹底打破了平台枷鎖,第三,NDN—Vis可視化工具,這是一個功能強大的交互式Web工具。研究者可以上傳自己的NDN模型運行日誌,工具便能以動態、可視化的方式重現網絡的生長全過程:
拓撲演化動畫:可以清晰地看到神經元和連接如何隨著訓練過程而增生、修剪和重組。
知識沉積熱力圖:以熱力圖形式展示不同類別的知識在沉積層中的分布與強度。
模塊活躍度流圖:實時顯示不同功能模塊在處理任務時的活躍程度和信息流動。
這個工具將NDN從黑箱變成了玻璃箱,極大降低了理解和調試難度。
第四個成果是NDN—Bench評測套件與預訓練「種子」,周的整理並開源了涵蓋持續學習,組合泛化和少樣本適應等任務的標準化數據集與自動化評測腳本。
同時,他發布了五個在不同領域,圖像分類、文本理解、時序預測預訓練好的「種子模型」。
這些模型文件不大,任何研究者都可以直接下載,並像使用BERT等預訓練模型一樣,在其基礎上進行微調或讓其繼續生長,將啟動成本從數月和巨額算力降低到了幾分鐘和一塊消費級GPU。
這有點像是之前的微調,但是兩者之間還是有些不一樣的,他的博士論文便是以上述四大成果為核心。
又是兩周過後,周的將博士論文寫好了。
將博士論文的最終稿通讀了一遍,確認了所有圖表、參考文獻和附錄都沒問題之後,打了個電話給鄧永華,電話很快被接起。
「老師,論文準備好了。」
「好!我這邊立刻啟動答辯流程,不過你得有個心理準備,你這次的答辯陣容估計不會簡單,你師公很可能會親自到場,還會邀請一兩位國內人工智慧領域的頂尖學者來旁聽。」
周昀對此倒是沒有什麼感覺,畢竟九州計劃手底下他就有很多頂尖學者,都習慣了。
不過他還是回應道:「我明白,老師。我會準備好。」
掛斷與周昀的電話,鄧永華直接聯繫了他的老師。
「老師,周昀的論文已經準備好了,答辯團隊這邊,您有什麼指示嗎?」
電話那頭的老院士似乎早有考量,「永華,周昀這孩子的工作,你我都清楚,其意義已超出一篇博士論文,所以,這場答辯,不能僅僅是走個過場,我們需要的是真正能看懂、能挑刺、能提出建設性甚至尖銳問題的大家,他們的認可,才具有真正的分量。」
他略微停頓,心裡過了一遍名單,隨後緩緩報出幾個名字:「理論計算機科學這邊,陳國棟院士必須請到,他是國內複雜系統形式化驗證的大牛,有他把關NDN—VIR編譯器和你學生提出的那些形式化模型,根基才算紮實,機器學習理論層面,吳立民教授是不二人選,他是少數既能洞察理論本質,又不拘泥於傳統框架的學者,但若能得到他的認可,也算不錯。」
「還有,」老院士話鋒一轉,「我打算親自邀請吳思源院士。」
「計算神經科學的那位?」鄧永華微微一驚,這位院士的研究領域更偏向生物本質,與純計算機架構看似有些距離。
「正是。」老院士解釋道,「NDN架構的靈感源於神經發育,那麼它的生物合理性、其對神經科學的潛在啟發和反哺,就需要這個領域最頂尖的學者來評判,吳思源院士的到場,能將這場答辯的格局,從單純的計算機領域,提升到交叉學科前沿探索的層面。」
「產業界的眼光也不能缺位,我會試著聯繫一些工業界的朋友,他們站在技術落地的最前沿,問題會聚焦於實用性、可擴展性和潛在的技術瓶頸。」
聽完這份名單,鄧永華心中不由得有些咂舌,這幾乎囊括了與NDN相關的所有頂級視角:理論基石、機器學***、交叉學科評判、產業界審視。
讓他自己坐在這個答辯席上,面對這幾位目光如炬、提問往往直指要害的大學問家,他都不敢保證自己能完全從容應對,畢竟以他們的學識、眼光和威望,足以讓任何一點不嚴謹、不紮實之處無所遁形。
然而,這股下意識的緊張感只持續了短短几秒,他的腦海中立刻浮現出周昀那雙總是沉靜如水的眼睛。
不由得自嘲一句,我在擔心什麼?
是擔心周昀的理論基礎不夠紮實?他有些好笑地搖了搖頭,想到這裡,鄧永華心中的那點不安煙消雲散。
一時間,他倒是有些期待起來這次的答辯了。