第76章 實則不然

投票推薦 加入書籤 小說報錯

  要說現場能勉強跟得上周昀思路的,除了早就看過論文的鄧永華和林院長,那就只有車偉強和那位浙大的答辯老師了,

  至於其他三位老師,也聽不明白的,但是卻他們不得不硬著頭皮去聽,因為他們是答辯老師,等會兒可能需要提問題,

  這就讓他們有點汗流浹背了,他們也擔心等會兒自己提的問題會不會鬧出笑話,更別說林院長還坐在後面旁聽。

  當PPT放到最後一頁的時候,周昀朝台下微微鞠了一躬。

  「以上就是我的主要研究內容,請各位老師批評指正。」

  頓時,整個會議室陷入了一種詭異的寂靜,有點大學課堂上老師請學生站起來回答問題,然後大家都默不作聲的感覺。

  台下第一排,三位沒聽懂的老師都很有默契的互相對視了一眼,露出了尷尬的微笑。

  終於,那位浙大老師打破了沉默,讓另外三位答辯老師如釋重負:「周昀同學,你的畢業論文非常優秀,

  我對你的分成最優傳輸框架很感興趣,你提到使用Gromov-Wasserstein距離來處理模態間的幾何不一致,

  但能否更深入地解釋一下在非歐幾里得度量空間中,為什麼又要通過Fused Gromov-Wasserstein變體來平衡內容和結構對齊?

  此外,在高維嵌入中,你如何通過譜正則化來確保求解的數值穩定性?」

  此時的周昀已經完全地進入了狀態,他點了點頭:「非常好的問題,GW距離確實擅長捕捉跨域結構相似性,

  但對於多模態語義對齊,我們需要同時考慮特徵內容和關係結構,因此我採用了FGW,它結合了經典OT的內容傳輸和GW的結構匹配。」

  他說著走到講台旁邊,拉過一旁的白板,拿起筆開始邊寫邊講:「FGW的定義為:FGW_α(μ,ν, C_X, C_Y, D)=(1-α) OT(μ,ν, D)+α GW(μ,ν, C_X, C_Y),

  其中α∈[0,1]是融合參數,D是內容成本矩陣(如||x-y||^p),C_X和C_Y是各自模態的內部相似矩陣,

  在非歐幾里得空間中,比如視覺嵌入的球面流形或語言的超雙曲空間,我將度量泛化為Riemannian度量

  ......

  不知道這是否能解決您的第一個問題?」

  浙大老師點點頭:「可以了。」

  周昀點點頭,將白板上的內容擦去:「好,那接下來我回答您的第二個問題。」

  馬克筆不斷在白板上寫下各種奇怪的符號,至少在一些旁聽的老師和學生眼裡是這樣的。

  「對於高維嵌入的數值穩定性,維度災難會導致C_X和C_Y的譜不穩定,我引入了譜正則化:對相似矩陣施加核範數罰項,min ||C||*+λ||C - K||F^2

  ......

  這樣就能這確保了在噪聲環境下,FGW的梯度下降不會發散,實驗中在ImageNet-1K上的魯棒性提升了15%。」

  浙大老師並沒有第一時間回答,而是重新翻到了論文的對應頁面,看了一會兒才朝著周昀點了點頭,眼裡滿是對周昀的欣賞:「我沒問題了。」

  此時,車偉強也放下了手裡的筆,朝周昀笑了笑:「周昀同學,你的論文寫得非常紮實,理論深度就算是我都有些自愧不如,

  不過你能否解釋一下關於你在多模態融合中提到的Schrödinger橋框架,在高維嵌入中,你如何處理SB路徑優化的非凸性問題以保證收斂?」

  旁聽學生中有車偉強的學生,當他們看到老師臉上的笑容時,心中浮現出三個字——科幻片!

  入學一兩年以來,他們從來沒見過車偉強在他們面前笑過。

  果然,人和人之間的差距有時候比人和狗都大。

  「沒問題。」周昀微微點頭,拿筆開始在白板寫下公式:「Schrödinger橋(SB)通過最小化相對熵求解從視覺模態μ到語言模態ν的最優隨機路徑:

  SB(μ,ν)= inf_{P: P_0=μ, P_1=ν} KL(P || Q),其中Q是布朗運動參考路徑,

  為了融入時間序列對齊,我將動態時間規整(DTW)引入SB框架,構建時間依賴的傳輸計劃。


  ......

  推導上,SB的密度滿足Fokker-Planck方程:∂p_t/∂t =-(1/2)Δp_t - div(p_t v_t),其中v_t是最優速度場......」

  車偉強聽後,點了點頭:「所以,你是用DTW給SB加了個時間對齊的先驗,相當於在路徑上加了個正則項,強制X和Y同步?就像是用動態規劃把時間軸拉直。」

  周昀笑著搖了搖頭:「實則不然,剛剛我在PPT里也有講到,我的做法是將DTW成本嵌入Girsanov變換,優化聯合分布P_t和γ,使得路徑既滿足時間對齊又保留SB的擴散特性,

  數學上,軟DTW的梯度∂DTW/∂γ通過Sinkhorn-like疊代計算:

  A_γ^{(k+1)}= softmax(-c(X,Y)/δ+ log A_γ^{(k)})

  ......」

  說著他又在白板上寫下一行公式。

  車偉強愣了愣,啞然一笑:「哈哈,倒是我想簡單了,那我也沒問題了。」

  這一幕看的前面答辯完的學生一愣一愣的。

  不是說好了只答不辯嗎?

  而且這個叫周昀的又是什麼情況?這還是研究生嗎?博士生都沒這麼誇張吧?

  看著寫滿了數學公式的白板,幾位研三的學生感覺自己好像在聽天書。

  學生如此,老師其實也沒好到哪裡去,特別是前排的答辯老師。

  靠左邊的答辯老師偷偷抹了下額角並不存在的汗,心中也是大為震撼:「現在的研究生都已經到這種程度了?」

  還好有另外兩位老師提了問題,他也不用硬著頭皮提問了,這倒是讓他鬆了一口氣。

  坐在鄧永華旁邊的林院長對周昀地表現也是非常滿意。

  不過這時候,壓力全部來到了今天上午最後一個答辯的學生身上。

  周昀之前的學生都已經答辯過了,就算周昀的表現再優秀,也很難影響到他們,但是最後一位學生就不一樣了。

  對比不可怕,但是誰菜誰尷尬。

  很明顯,最後一位學生相較於周昀來說就是比較菜的那一個。

  但老師已經點到了他的名字,他不得不硬著頭皮走上講台。

  結果也是不出意料,有著周昀這塊珠玉在前,幾位老師的興趣也被提了起來,看論文也就更加細緻了一些。

  問的問題也刁鑽了許多,哪怕是這位學生覺得自己已經準備得還可以了,也被問地汗流浹背。

章節目錄