第136章 借你導師面子用用
第136章 借你導師面子用用
駱余馨是個懂得審時度勢,更是個懂得如何抓住機會的人。起碼在喬源看來這是駱余馨最大的優點。
最大的缺點則是這女人過於不把自己當外人了。進他的房間跟進自己房間一樣自然。
喬源忍不住提醒了一句:「師姐,你房間是在隔壁呢。」
「我知道啊,我是來看著你幫我把算法封裝好,然後放伺服器上的。你還年輕還有時間揮霍,但我可已經老了。」
駱余馨很自然地說道。
「誰說你老了?」
「你啊!上次你還說你媽不讓你跟老女人談戀愛。」
果然女人都是記仇的!
說出那句話到現在快半年了,這女人竟然還記得。
「我那是開玩笑的,再說你不回去把設計好的算法給我,我怎麼幫你驗證?
」
「你蠢還是我蠢?算法我放郵箱附件里了,直接用你的電腦登錄我的郵箱下載不就行了?」
喬源覺得不能再暗示了,這女人似乎聽不懂他的潛台詞。
「但是這是我的房間啊。學姐,這大晚上的咱們倆單獨在一個房間,萬一被別人看到不好吧?尤其是你,還單身呢。」
掏心掏肺的話換來的卻是駱余馨的冷笑。
「呦,現在你知道男女單處一室不好了?那在江大的時候,你為什麼天天賴在我辦公室里?那個時候你怎麼不想著為我聲譽著想了?」
「我那是白天,而且那是行政樓的辦公室,又不是寢室。」喬源據理力爭道。
「第一,你晚上沒去過我的辦公室嗎?好像通宵都有吧?第二,辦公室跟寢室有什麼區別嗎?如果你有什麼不軌之心,難道我還真能打得贏你?」
依然字字句句都是道理,懟得喬源啞口無言。
只能說去年他就不該圖方便,借駱余馨的辦公室用的。
最終還是妥協,默默的打開了電腦,讓駱余馨登錄了郵箱。
接下來的事情就簡單了,喬源開始輕車熟路的布置環境,封裝算法。
駱余馨則半點不客氣的搬了張凳子,坐到了喬源的身邊,像個監工般盯著喬源做事。
這讓喬源略微有些不適,主要是稍微離得近了些。但沒辦法,他的筆記本電腦屏幕不大,離得太遠的確看不清晰。
於是喬源乾脆一邊忙著搞定算法,一邊隨口跟駱余馨聊了起來。
「我打算聽你的,趁著現在事情還不多,組織一個團隊,設計一個人工智慧出來。」
「挺不錯的決定,那就儘快做計劃唄。你什麼時候能把項目策劃書做出來?」
喬源隨便問了一句,倒是讓駱余馨變得積極起來。
「項目策劃書?」喬源愣了愣。
「不然呢?首先你要確定做一個什麼樣的人工智慧吧?智能駕駛?語言大模型?又或者其他類型,簡單來說就是你的業務目標。
確定之後你要有個目標吧?比如成功指標是多少?準確率,召回率,響應時間,單位請求成本————
接下來就說技術選擇了,你是要傳統式的ML,還是要做生成式的AI?
這些都確定之後你才知道團隊需要些什麼人吧?比如做大模型你起碼需要找算法工程師做結構吧?需要數據工程師構建訓練集——.
然後根據這些大概算出需要多少研發資金。總不能你嘴巴一張一合,就把人工智慧做出來了吧?」
雖然駱余馨的話不好聽,但喬源還是感覺很驚異。
今天來了京城之後,不管是華清那邊的袁老,還是陸院士、譚教授,明顯都希望他儘快投入到數學研究之中。
他本以為自己提到這個事情,駱余馨也會持反對的態度。畢竟真要做這個,肯定會延緩目前課題的研究進度。
但沒想到這女人竟然比他還激進。在他說出教授們看來肯定不太正確的想法之後,就給出一堆的建議。
於是喬源狐疑的問道:「你覺得我的想法可行?」
駱余馨歪著腦袋看著喬源,說道:「你想做就做唄。陸院士都讓你叫老師了,這種機會你還不趕緊把握住?
當然首先你要明確自己到底想要做什麼,如果你壓根就沒有計劃只是突然腦子一熱,我覺得還是先老老實實上課吧。」
喬源一邊熟練的操作著電腦對駱余馨的算法封裝,一邊認真的介紹道:「目標很明確,我想做一個學術智能助手。
框架肯定是要做的,平日裡主要給它餵各種文獻。目標是能夠快速的從文海中找到有價值的文獻。
所以不止是準確跟速度,更需要它具備一定的學術審美跟學術分辨能力。
這就包括了能識別創新性、評估嚴謹性的同時能夠自動生成高質量摘要。
所以你說的成功指標大概就是我的滿意度,還有推薦列表排序的綜合質量。
嗯,或者再加一個驚喜發現率?
比如能在arXiv這種預發表網站上,找出之前沒有發現的,卻極具創新意識的高價值論文。」
話音落下,喬源久久沒等到身邊女人的回應。
趁著操作間隙下意識的扭頭看了眼,直接被嚇了一跳——————
這才發現駱學姐正歪著腦袋死死的盯著他,關鍵距離他大概就一個拳頭距離。
「怎麼了?」喬源下意識的向後躲了躲,隨後問了句。
「沒什麼,我就想觀察下你是不是認真的?」駱余馨湊在他面前說道。
「當然是認真的。磨刀不誤砍柴工啊。」喬源答了句。
「如果真能做出這樣的人工智慧,那可就逆天了。甚至以後期刊都不需要審稿人,你的這個AI都可以審稿了!」
駱余馨說道。
喬源想了想,然後突然笑了。
「還記得不?上次我接受採訪吐槽了懂乎。然後懂乎的一個經理打電話說我提交的認證審核信息不知道什麼原因被AI否了。
所以哪可能這麼厲害?創新的理論需要新的範式。我們最多也只能拿已有論文去訓練。
創新的論文往往會有新的框架跟理論體系。所以用這玩意兒來審稿肯定是不行的。
我只是希望它能把那些很水的論文給分辨出來。從龐雜的文獻庫里找出真正有用的論文。」
駱余馨點了點頭,隨後狐疑的看向喬源,問道:「目標這麼明確說明你仔細考慮過了?聊聊?」
喬源點了點頭,說道:「的確想過一些。首先核心檢索層,我覺得可以施加一個語義擴散噪聲,首先用嵌入式模型把論文映射到向量空間。
不一樣的地方在於它不是直接檢索最接近的東西。而是在向量空間裡進行語義的隨機遊走。
比如我讓它找幾何分析的創新論文,它會有一個思維擴散,偏微分方程、信息幾何甚至拓撲量子場等等各個區域都會同步檢索。」
駱余馨點了點頭,立刻開口追問道:「找到了,然後呢?如何實現所謂的學術審美?」
「哎————」
喬源嘆了口氣,才開口說道:「的確想過一些,不過都是些不太成熟的想法。」
「比如訓練模型的時候除了基礎的論文指標,比如引用量、期刊聲望加成等等這些,再增加一個反共性的識別器。
給一些引用量不高,但方法新穎,又或者爭議很大思想超前的文獻增加權重?
至於論文過濾這塊,需要這個人工智慧不止判斷對錯,還要識別價值。這的確挺難。
這需要AI能夠對比跟計算已知結論的複雜表述比例,可以檢測符號濫用,以及擁有論證鏈冗餘度分析的能力————
我知道這系統挺複雜的,所以就是想試試而已。但萬一成功了,以後可就方便多了。」
駱余馨建議道:「不如直接跟微軟合作?你知道微軟的lean不?這證明器他們做了十多年了。」
這顯然是有的放矢。
畢竟喬源是微軟求而不得的男人,還有對面大人物的聯繫方式。肯定有得聊。
喬源搖了搖頭,說道:「還是算了吧。我跟微軟不熟,真要合作很麻煩。
而且有這個想法後我專門去了解過lean。其實我的思路跟微軟完全不一樣。
他們的lean嚴格意義上來說是做減法。把數學模糊的部分全部去掉,只留下邏輯骨架。
我要設計的AI則是需要它能理解論文作者的直覺跟思想脈絡。當然證明過程也是需要考慮的————算了,我直接跟你說數學命題吧。
一個由數學文獻構成的拓撲空間K,對於任意給定的研究前沿子流形M,總存在一個唯一的最有噪聲分布η*,使得沿著由η*生成的隨機路徑,首次擊中一個更高維度的創新子流形M「的期望時間最小化。
也就是————咦,這裡竟然沒有黑板。」
喬源說著說著,就想直接把他腦子裡浮現出的公式給寫下來。
可惜了這裡不是江大的辦公室。
駱余馨隨手從兜里掏出了一支筆遞給了喬源。
喬源接過筆,直接拿起桌上的一個本子,寫下了一串公式。
「我覺得可以讓η的強度σ*由知識空間K在M處的曲率張量R和研究者的認知函數f共同決定。
當然這個函數的關係我還沒想好。不過可以等AI著手設計之後再考慮這些。」
說完,喬源看向駱余馨問道:「是不是有點異想天開了?」
駱余馨沒直接回答這個問題,而是反問道:「你怎麼想到的?」
喬源答道:「有為雅典娜的凝視項目。我覺得既然分布優化系統最終會收斂到最優解分布。
那麼設計一個系統在疊代海量文獻過程中,內部價值判斷標準應該也能收斂到一個穩定狀態。
無非就是要找到一個絕佳的平衡點。既然能搞定雅典娜的凝視,沒道理做不出這樣一個AI。
當然效果如何我現在也不敢保證。不過我覺得可以嘗試一下。哪怕效果不及預期,應該也能有所幫助。」
「咻————」
駱余馨撮唇吹了聲口哨,氣流拂面而過,好在很有溫度,不像外面的西北風那般割人,還挺舒服。
喬源一臉莫名其妙的看著這女人,畢竟當一個女人比男人更會耍流氓的時候,多少會讓當事人感覺有些不適。
「幹了,如果真有用,那我以後可就輕鬆了。相當於有一個團隊幫忙搜索文獻。」
聽到這句話,喬源點了點頭,剛想開口,又被這女人打斷。
「不過第一步還得你落實。首先你得定義一個價值吧?把你所謂的學術美感或者說學術價值做一個數學模型出來。
如果真像你說的,要讓模型能有學術審美,這個模型可就有點複雜了。相當於定義一個思想熵,嘖嘖————
從這個角度來說,你這個思想熵還能衡量一篇論文能在多大程度上打破當前學術領域的認知均衡。
這很不簡單啊?喬源,你有這個信心沒啊?」
什麼叫反客為主?
這就是了!
喬源盯著駱余馨半晌,都沒搞清楚這女人怎麼如此絲滑的對他發號施令了!
需要免費給他打十年工的好像是這位學姐才對。
雖然這個最核心的問題肯定還是需要他來解決。但起碼應該由他來分配任務。
「咳咳————駱學姐————」
「不用說了,我懂。讓我想想啊,首先你需要一個助手,然後我們需要一個算法工程師團隊。
你要做知識結構流形,就還得有做微分幾何跟拓撲學研究的專家。回頭我去博後流動站找幾個人。
涉及到Fokker—Planck方程及其穩態解,需要隨機分析跟懂統計物理的研究員。這些人估計得去找相關教授。
另外還需要數據工程師構建跟管理訓練數據集。最後就是搞自然語言處理跟表示學習的算法工程師了。這部分可以直接找幾個研究生來做,直接去找他們的導師借。
這麼算下來,加上還要考慮到效率的話,我們大概需要組建一個十五到二十人左右的團隊來實現你的想法。
接下來我去幫你組建團隊吧。畢竟你在這裡人生地不熟的,也不認得幾個人。」
喬源沉默地點了點頭。
雖然這女人似乎有點反客為主上癮了,但毫無疑問的是,這個安排很合理。
「你別光點頭啊。我可沒那麼大的面子。你得把你家老師面子借我用用。」
駱余馨是個懂得審時度勢,更是個懂得如何抓住機會的人。起碼在喬源看來這是駱余馨最大的優點。
最大的缺點則是這女人過於不把自己當外人了。進他的房間跟進自己房間一樣自然。
喬源忍不住提醒了一句:「師姐,你房間是在隔壁呢。」
「我知道啊,我是來看著你幫我把算法封裝好,然後放伺服器上的。你還年輕還有時間揮霍,但我可已經老了。」
駱余馨很自然地說道。
「誰說你老了?」
「你啊!上次你還說你媽不讓你跟老女人談戀愛。」
果然女人都是記仇的!
說出那句話到現在快半年了,這女人竟然還記得。
「我那是開玩笑的,再說你不回去把設計好的算法給我,我怎麼幫你驗證?
」
「你蠢還是我蠢?算法我放郵箱附件里了,直接用你的電腦登錄我的郵箱下載不就行了?」
喬源覺得不能再暗示了,這女人似乎聽不懂他的潛台詞。
「但是這是我的房間啊。學姐,這大晚上的咱們倆單獨在一個房間,萬一被別人看到不好吧?尤其是你,還單身呢。」
掏心掏肺的話換來的卻是駱余馨的冷笑。
「呦,現在你知道男女單處一室不好了?那在江大的時候,你為什麼天天賴在我辦公室里?那個時候你怎麼不想著為我聲譽著想了?」
「我那是白天,而且那是行政樓的辦公室,又不是寢室。」喬源據理力爭道。
「第一,你晚上沒去過我的辦公室嗎?好像通宵都有吧?第二,辦公室跟寢室有什麼區別嗎?如果你有什麼不軌之心,難道我還真能打得贏你?」
依然字字句句都是道理,懟得喬源啞口無言。
只能說去年他就不該圖方便,借駱余馨的辦公室用的。
最終還是妥協,默默的打開了電腦,讓駱余馨登錄了郵箱。
接下來的事情就簡單了,喬源開始輕車熟路的布置環境,封裝算法。
駱余馨則半點不客氣的搬了張凳子,坐到了喬源的身邊,像個監工般盯著喬源做事。
這讓喬源略微有些不適,主要是稍微離得近了些。但沒辦法,他的筆記本電腦屏幕不大,離得太遠的確看不清晰。
於是喬源乾脆一邊忙著搞定算法,一邊隨口跟駱余馨聊了起來。
「我打算聽你的,趁著現在事情還不多,組織一個團隊,設計一個人工智慧出來。」
「挺不錯的決定,那就儘快做計劃唄。你什麼時候能把項目策劃書做出來?」
喬源隨便問了一句,倒是讓駱余馨變得積極起來。
「項目策劃書?」喬源愣了愣。
「不然呢?首先你要確定做一個什麼樣的人工智慧吧?智能駕駛?語言大模型?又或者其他類型,簡單來說就是你的業務目標。
確定之後你要有個目標吧?比如成功指標是多少?準確率,召回率,響應時間,單位請求成本————
接下來就說技術選擇了,你是要傳統式的ML,還是要做生成式的AI?
這些都確定之後你才知道團隊需要些什麼人吧?比如做大模型你起碼需要找算法工程師做結構吧?需要數據工程師構建訓練集——.
然後根據這些大概算出需要多少研發資金。總不能你嘴巴一張一合,就把人工智慧做出來了吧?」
雖然駱余馨的話不好聽,但喬源還是感覺很驚異。
今天來了京城之後,不管是華清那邊的袁老,還是陸院士、譚教授,明顯都希望他儘快投入到數學研究之中。
他本以為自己提到這個事情,駱余馨也會持反對的態度。畢竟真要做這個,肯定會延緩目前課題的研究進度。
但沒想到這女人竟然比他還激進。在他說出教授們看來肯定不太正確的想法之後,就給出一堆的建議。
於是喬源狐疑的問道:「你覺得我的想法可行?」
駱余馨歪著腦袋看著喬源,說道:「你想做就做唄。陸院士都讓你叫老師了,這種機會你還不趕緊把握住?
當然首先你要明確自己到底想要做什麼,如果你壓根就沒有計劃只是突然腦子一熱,我覺得還是先老老實實上課吧。」
喬源一邊熟練的操作著電腦對駱余馨的算法封裝,一邊認真的介紹道:「目標很明確,我想做一個學術智能助手。
框架肯定是要做的,平日裡主要給它餵各種文獻。目標是能夠快速的從文海中找到有價值的文獻。
所以不止是準確跟速度,更需要它具備一定的學術審美跟學術分辨能力。
這就包括了能識別創新性、評估嚴謹性的同時能夠自動生成高質量摘要。
所以你說的成功指標大概就是我的滿意度,還有推薦列表排序的綜合質量。
嗯,或者再加一個驚喜發現率?
比如能在arXiv這種預發表網站上,找出之前沒有發現的,卻極具創新意識的高價值論文。」
話音落下,喬源久久沒等到身邊女人的回應。
趁著操作間隙下意識的扭頭看了眼,直接被嚇了一跳——————
這才發現駱學姐正歪著腦袋死死的盯著他,關鍵距離他大概就一個拳頭距離。
「怎麼了?」喬源下意識的向後躲了躲,隨後問了句。
「沒什麼,我就想觀察下你是不是認真的?」駱余馨湊在他面前說道。
「當然是認真的。磨刀不誤砍柴工啊。」喬源答了句。
「如果真能做出這樣的人工智慧,那可就逆天了。甚至以後期刊都不需要審稿人,你的這個AI都可以審稿了!」
駱余馨說道。
喬源想了想,然後突然笑了。
「還記得不?上次我接受採訪吐槽了懂乎。然後懂乎的一個經理打電話說我提交的認證審核信息不知道什麼原因被AI否了。
所以哪可能這麼厲害?創新的理論需要新的範式。我們最多也只能拿已有論文去訓練。
創新的論文往往會有新的框架跟理論體系。所以用這玩意兒來審稿肯定是不行的。
我只是希望它能把那些很水的論文給分辨出來。從龐雜的文獻庫里找出真正有用的論文。」
駱余馨點了點頭,隨後狐疑的看向喬源,問道:「目標這麼明確說明你仔細考慮過了?聊聊?」
喬源點了點頭,說道:「的確想過一些。首先核心檢索層,我覺得可以施加一個語義擴散噪聲,首先用嵌入式模型把論文映射到向量空間。
不一樣的地方在於它不是直接檢索最接近的東西。而是在向量空間裡進行語義的隨機遊走。
比如我讓它找幾何分析的創新論文,它會有一個思維擴散,偏微分方程、信息幾何甚至拓撲量子場等等各個區域都會同步檢索。」
駱余馨點了點頭,立刻開口追問道:「找到了,然後呢?如何實現所謂的學術審美?」
「哎————」
喬源嘆了口氣,才開口說道:「的確想過一些,不過都是些不太成熟的想法。」
「比如訓練模型的時候除了基礎的論文指標,比如引用量、期刊聲望加成等等這些,再增加一個反共性的識別器。
給一些引用量不高,但方法新穎,又或者爭議很大思想超前的文獻增加權重?
至於論文過濾這塊,需要這個人工智慧不止判斷對錯,還要識別價值。這的確挺難。
這需要AI能夠對比跟計算已知結論的複雜表述比例,可以檢測符號濫用,以及擁有論證鏈冗餘度分析的能力————
我知道這系統挺複雜的,所以就是想試試而已。但萬一成功了,以後可就方便多了。」
駱余馨建議道:「不如直接跟微軟合作?你知道微軟的lean不?這證明器他們做了十多年了。」
這顯然是有的放矢。
畢竟喬源是微軟求而不得的男人,還有對面大人物的聯繫方式。肯定有得聊。
喬源搖了搖頭,說道:「還是算了吧。我跟微軟不熟,真要合作很麻煩。
而且有這個想法後我專門去了解過lean。其實我的思路跟微軟完全不一樣。
他們的lean嚴格意義上來說是做減法。把數學模糊的部分全部去掉,只留下邏輯骨架。
我要設計的AI則是需要它能理解論文作者的直覺跟思想脈絡。當然證明過程也是需要考慮的————算了,我直接跟你說數學命題吧。
一個由數學文獻構成的拓撲空間K,對於任意給定的研究前沿子流形M,總存在一個唯一的最有噪聲分布η*,使得沿著由η*生成的隨機路徑,首次擊中一個更高維度的創新子流形M「的期望時間最小化。
也就是————咦,這裡竟然沒有黑板。」
喬源說著說著,就想直接把他腦子裡浮現出的公式給寫下來。
可惜了這裡不是江大的辦公室。
駱余馨隨手從兜里掏出了一支筆遞給了喬源。
喬源接過筆,直接拿起桌上的一個本子,寫下了一串公式。
「我覺得可以讓η的強度σ*由知識空間K在M處的曲率張量R和研究者的認知函數f共同決定。
當然這個函數的關係我還沒想好。不過可以等AI著手設計之後再考慮這些。」
說完,喬源看向駱余馨問道:「是不是有點異想天開了?」
駱余馨沒直接回答這個問題,而是反問道:「你怎麼想到的?」
喬源答道:「有為雅典娜的凝視項目。我覺得既然分布優化系統最終會收斂到最優解分布。
那麼設計一個系統在疊代海量文獻過程中,內部價值判斷標準應該也能收斂到一個穩定狀態。
無非就是要找到一個絕佳的平衡點。既然能搞定雅典娜的凝視,沒道理做不出這樣一個AI。
當然效果如何我現在也不敢保證。不過我覺得可以嘗試一下。哪怕效果不及預期,應該也能有所幫助。」
「咻————」
駱余馨撮唇吹了聲口哨,氣流拂面而過,好在很有溫度,不像外面的西北風那般割人,還挺舒服。
喬源一臉莫名其妙的看著這女人,畢竟當一個女人比男人更會耍流氓的時候,多少會讓當事人感覺有些不適。
「幹了,如果真有用,那我以後可就輕鬆了。相當於有一個團隊幫忙搜索文獻。」
聽到這句話,喬源點了點頭,剛想開口,又被這女人打斷。
「不過第一步還得你落實。首先你得定義一個價值吧?把你所謂的學術美感或者說學術價值做一個數學模型出來。
如果真像你說的,要讓模型能有學術審美,這個模型可就有點複雜了。相當於定義一個思想熵,嘖嘖————
從這個角度來說,你這個思想熵還能衡量一篇論文能在多大程度上打破當前學術領域的認知均衡。
這很不簡單啊?喬源,你有這個信心沒啊?」
什麼叫反客為主?
這就是了!
喬源盯著駱余馨半晌,都沒搞清楚這女人怎麼如此絲滑的對他發號施令了!
需要免費給他打十年工的好像是這位學姐才對。
雖然這個最核心的問題肯定還是需要他來解決。但起碼應該由他來分配任務。
「咳咳————駱學姐————」
「不用說了,我懂。讓我想想啊,首先你需要一個助手,然後我們需要一個算法工程師團隊。
你要做知識結構流形,就還得有做微分幾何跟拓撲學研究的專家。回頭我去博後流動站找幾個人。
涉及到Fokker—Planck方程及其穩態解,需要隨機分析跟懂統計物理的研究員。這些人估計得去找相關教授。
另外還需要數據工程師構建跟管理訓練數據集。最後就是搞自然語言處理跟表示學習的算法工程師了。這部分可以直接找幾個研究生來做,直接去找他們的導師借。
這麼算下來,加上還要考慮到效率的話,我們大概需要組建一個十五到二十人左右的團隊來實現你的想法。
接下來我去幫你組建團隊吧。畢竟你在這裡人生地不熟的,也不認得幾個人。」
喬源沉默地點了點頭。
雖然這女人似乎有點反客為主上癮了,但毫無疑問的是,這個安排很合理。
「你別光點頭啊。我可沒那麼大的面子。你得把你家老師面子借我用用。」