第67章 Q&A

投票推薦 加入書籤 小說報錯

  主持人簡短地走了個過場,就輪到了周昀。

  他拉了拉衣角,帶著電腦從容上台,會場內的燈光柔和地聚焦在講台上,調整了一下麥克風的位置,

  身後的巨幕亮起,出現了論文標題,不過下面的作者一欄只有兩個名字,一個是周昀,另一個就是鄧永華,這在所有的論文分享中都是不太常見的。

  台下,看著如此年輕的周昀,不少人都感覺十分詫異,他們低頭翻閱起會議手冊,這上面有周昀工作的簡單介紹。

  前排靠著過道的位置,何凱明靜靜地坐著,這篇論文就是他審的,當時他就對周昀挺感興趣的,

  後來結果公布的時候他還特意看了一眼周昀的學校,沒想到是國內一所不知名雙非,

  國內的科研環境不說很差,但也絕對稱不上優秀,不然他也不會在MIT任教,能在這樣的環境下完成這樣的工作,這讓他對周昀的興趣更大了。

  「大家好,今天我將介紹我在高效邊緣智能推理方面的工作,AgileEdge,當前邊緣設備上的AI模型推理的核心問題在於:波動的帶寬、異構的計算資源、以及多樣化的延遲約束。

  這也就導致了現有的靜態模型壓縮方法或者資源分配策略,往往無法實現全局最優,甚至在變化的環境中表現糟糕......」

  周昀一邊介紹著自己的工作一邊觀察台下人們的反應,前排的何凱明他自然是一上台就看到了。

  他也沒想到這樣的大佬居然會親自來聽他的報告,一時間還有點受寵若驚。

  大概講了一分鐘,他就有點進入狀態了,完全沉浸在了自己的思路當中。

  台下的人都聽得非常認真,時不時還在手裡的本子上記錄著什麼。

  十幾分鐘的時間過的飛快,周昀的匯報很快就進入了尾聲:「……綜上所述,AgileEdge為Edge AI提供了一種高效、自適應的協同優化解決方案,

  能夠在動態的邊緣環境下,儘可能地保留模型原有的性能,謝謝大家!」

  隨後朝著台下微微鞠了一躬。

  接下來就是Q&A環節。

  坐在前排的何凱明舉起了手,周昀自然不可能當作沒看到。

  「何教授,您請問。」

  工作人員立刻小跑著將麥克風遞了過去。

  坐在後排的人這才發現,提問的人居然是何凱明,一時間,所有人的目光都聚焦在兩人身上。

  何凱明接過話筒微微點頭:「很有趣的工作,事實上我之前就已經看過了這篇文章,AgileEdge在模型的壓縮算法上的設計思路非常巧妙,

  但是我有一個問題,你的壓縮算法是基於AI調教AI的思想,那你該如何保證用於調教AI的AI做出的決策是最優的?

  這個負責調教的AI,其魯棒性又由誰來保證和監督?如果是這樣的話,是否又需要一個AI來負責監督,這樣是不是會陷入一個『無限遞歸驗證』的循環?

  那麼你如何在理論上保證這種『自我優化』過程的收斂性和可靠性,而不僅僅是在你的實驗數據上表現良好?」

  其他人聽到這個問題都不由地感嘆,不愧是大佬,提出的問題總是這麼尖銳。

  如果周昀無法回答這個問題,這篇文章的嚴謹性就會受到質疑。

  何凱明也很好奇周昀會怎麼回答這個問題,於是他看向台上,結果對方的反應倒是有些出乎他的預料。

  周昀的眼神中沒有絲毫的慌亂,反倒是有些......興奮?

  其實這個問題周昀自己也問過自己,他本來還想著如果沒人提出這個問題,自己是不是要在報告的時候提一下,畢竟這個點確實非常重要。

  不過最後還是沒有加到前面的報告裡,主要是之前報告要講的都已經確定了,再加上這一段,時間上可能會超。

  現在有人提出來,正合他的心意。

  「何教授,非常感謝您如此深刻的提問,這確實是我的工作中最需要謹慎對待的部分。

  您提到的『無限遞歸』風險,在任何自指系統中都是理論上存在的。

  為了規避這一點並確保系統的收斂與可靠,我們引入了一個基於博弈論和不動點理論的混合數學框架。」

  這就是為什麼周昀在一開始要學習數學的原因了,一個良好的數學功底,真的能在很多時候幫忙解決一些關鍵性的問題。


  周昀看了眼時間,應該夠了。

  他用電腦創建了一個白板,然後開始用滑鼠作畫,雖然有點抽象,但是配合他的講解,也算能勉強看的懂。

  「首先,我們將『被壓縮的AI模型』與『負責調教的AI元模型』之間的關係,形式化為一個非零和合作博弈。

  『被壓縮的AI模型』選擇一組模型參數θ目標是在給定的壓縮約束下最小化任務損失函數 L_task(θ),

  而『負責調教的AI元模型』選擇一種壓縮策略φ,目標是最小化一個元損失函數 L_meta(φ,θ),

  這樣就能得到一個組合的懲罰項,也就是一般模型里的損失函數L_meta(φ,θ)= L_task(θ')+λ* R(φ),

  我們並不追求一個無限遞歸的最優,而是試圖找到一個平衡,這正是一個納什均衡點的概念。

  之後我設計了一個交替優化算法來逼近這個均衡點,其疊代過程可以假設地抽象為一個映射T:(θ_k,φ_k)->(θ_{k+1},φ_{k+1})

  ......

  經過以上的過程,我們就可以證明T確實是壓縮映射,根據Banach不動點定理,

  這個映射就存在唯一的不動點,並且無論從任何初始點開始疊代,

  該算法都會以線性收斂速度全局收斂到這個唯一的不動點(θ*,φ*)。

  而這個不動點正是我們尋求的納什均衡。」

  其實說到一半的時候大部分人就已經跟不上周昀的思路了,畢竟不是數學系的,

  對於這種數學證明,大部分人都不是特別擅長,更別說周昀這個證明也沒那麼簡單。

  不過何凱明倒是能跟得上,畢竟他在從事計算機的研究之前,是水木大學物理系的學生,數學功底也會強一點。

  周昀說完,再次向何凱明微微點頭示意:「不知道這個解釋是否回答了您的問題?」

章節目錄