第122章 招兵買馬
第122章 招兵買馬
這些硬體已經安裝好一星期了。
現在這8TB的數據,將被閔欣柔的BPE算法切分成無數個Token,用來首次大規模訓練榛果Seek的核心大語言模型。
等消化完這些數據後,榛果Seek將產生真正的蛻變。
閔欣柔清楚這件事的重要性。
所以她一刻也不敢放鬆,就抱著書包朝機房走去。
「機房裡冷,一定要穿厚一點。」
吳辰看著她纖細的背景,忍不住叮囑了一句。
「老師,我身體很好的。」
閔欣柔朝他笑了笑,然後就跑進了機房。
這段數據由於要調試伺服器集群和訓練模型,吳辰和閔欣柔兩人要時刻在機房守著。
主要是他目前實在沒有其他信的過的人。
不過這種日子只要再堅持三天就好。
等模型訓練完成後,榛果問答社區就能正式發布了。
回到辦公室,吳辰聽到陳蓓桃正在不停的指點江山。
「這裡應該放一排綠植,這裡應該搞個零食飲料角,還有還有這裡,要擺一個大大的展櫃,裡面全部放滿明日香的手辦!」
姜楠在旁邊默默的聽著。
不過看她的神情,應該是已經走神了。
吳辰也不知道她們是怎麼成為閨蜜的。
見他回來,陳蓓桃立即興奮的招手。
「大佬大佬,我們去吃肯德基吧,今天送多啦A夢的聯名款玩具耶~」
「不急。」
吳辰擺了擺手,招呼姜楠和陳蓓桃坐在沙發上。
吳辰幫她們各自倒了杯水,然後問道:「你的圖像特徵提取研究的怎麼樣了?」
陳蓓桃沒想到他突然就問起正事。
不過她也很快就進入了狀態,略帶沮喪的回答起來。
「還是老樣子,主要卡在複雜背景下的邊緣檢測精度上,我嘗試了好幾種改進的卷積核,但要麼算力要求太高,要麼精度提升不明顯————
吳辰默默的聽著。
雖然兩人在QQ上交流的也很多,但還是不如現場方便。
聽完後,吳辰直接道:「不要手工特徵提取了,就用卷積神經網絡,大膽一點增加網絡的深度,讓機器自己去學習特徵。」
陳蓓桃的理解能力很強。
一聽吳辰說增加深度,就意識到這是要解決梯度消失的問題。
而她此前一直因為擔心網絡退化而不敢加層數,所以一直還在死磕傳統的SIFT算子和SVM分類器。
「大佬,你真是太牛辣!」
陳蓓桃一下激動了起來。
她左右望了望,跳著對吳辰道:「大佬,你的那個計算陣列呢,我有個好點子想試試!」
吳辰淡定的喝了口茶。
「在用,這幾天都沒法給你用,最快也要下星期了。」
「可下星期就太晚了,而且到時候京大要開中期考核匯報會,我估計來不了。」
陳蓓桃失望道。
然後她眼珠子一轉,落在了姜楠身上。
「好姐妹,你去陪大佬睡覺吧,把計算陣列讓給我————哎呦哎呦,輕點啊可惡,太太,你也不想你丈夫的研究失去我這個天才吧?」
半晌後,姜楠才鬆開了揪她耳朵的手。
陳蓓桃嚶嚶嚶了好一陣才算緩過勁來。
吳辰等她們鬧夠了,才終於說出了自己的想法。
「你這樣從京大到杭城很不方便,所以不如直接來這邊吧,我這邊有兩個實驗室正好適合你研究的方向,你來做負責人。」
「啊?」
陳蓓桃呆了呆。
就連姜楠臉上也露出一絲驚訝。
小和山工業大學和京大的地位,就跟北大河和黃河差不多。
北大河是吳辰老家城市邊的一條小河。
所以吳辰邀請陳蓓桃來做自己底下的一個實驗室主任,屬實是很冒昧了。
果然,就連陳蓓桃也眯了眯眼睛,傲嬌的抬起頭。
「也不是不可以喔,但大佬你能給我開出什麼條件呢?」
「不低於京大的薪酬待遇,正高待遇,獨立實驗室,以及算力支持。」
吳辰說。
他這個條件可以說很有誠意了。
但陳倍桃搖了搖頭,擺了個傲嬌的表情。
「不行喔。」
「那我要是說,我能夠讓你目前的圖像研究領先世界五年,甚至讓你成為像Hinton那樣的祖師奶呢?」
「真的?」
陳蓓桃猛的瞪大了眼睛:「大佬你打算怎麼做鴨?」
Hinton就是傑弗里.辛頓,深度學習之父,神經網絡領域的泰斗,是陳蓓桃的偶像。
吳辰沒有回答,而是轉頭問姜楠。
「你餓了沒有?」
「餓了,想吃肯德基。」
姜楠說。
「那走。」
吳辰說著就作勢起身。
姜楠則緊跟上了他。
「不要啊,大佬,姜姜,你們別走鴨~」
陳蓓桃一下跳起來撲在姜楠懷中。
攔住姜楠後,她可憐楚楚的看向吳辰。
「大佬,我來你這裡,求您收留了我叭!」
「是嗎,可您這尊大佛好像看不上咱這小廟嘛。」
「我那不是矜持一下嘛,不然顯得像白給一樣,嘻嘻~」
陳蓓桃吐了吐舌頭。
她也沒想到吳辰一點都不給拉扯的機會。
「行吧,那你準備一下,我這邊時間很急。」
吳辰說。
他也不是不近人情的人,不會非要逼著陳蓓桃在京大和他這裡二選一。
所以最終的結果,就是陳蓓桃以客座研究員和聯合實驗室主任的雙重身份加入他的團隊。
主要工作時間在杭城,但保留京大的研究職位和導師關係。
這樣對她來說,既能保留在京大的學籍和資源,又能名正言順地使用這邊的算力。
可謂是雙贏。
有了陳蓓桃的加入後,高等智能研究院的架子總算是搭了起來。
目前其下總共有四個研究所。
第一個是自然語言處理與認知智能研究所,由吳辰親自兼任所長,共建方是搜狗、天涯社區、微軟。
主要的研究方向是基礎理論研究。
目前孵化中的產品,包括榛果問答社區、輸入法預測、情感分析以及VibeCoding。
陳蓓桃負責的兩個實驗室,則分別是智能語音與多模態交互研究所和圖像處理與機器視覺實驗室。
智能語音與多模態交互研究所的共建方是科大訊飛。
研究方向,則是語音糾錯、語義補全,以及未來的多模態人工智慧。
所謂多模態,就是包括了文字、圖像、語音、視頻等多方面的融合感知。
另一個圖像處理與機器視覺實驗室,共建方則是蘋果。
這也是陳蓓桃真正感興趣的方向。
吳辰給她定下的研究方向,是FaceID、圖像識別、圖片鑒黃和未來的自動駕駛視覺。
這些都是需要長期積累的研究項目,吳辰只要等著他們研究好後摘桃子就行了。
最後一個,則是高性能計算與系統架構中心。
吳辰思考良久後,還是將它的負責人定為了黃瑞傑。
共建方,則是AMD和蘋果。
主要研究方向,則是分布式訓練框架和OpenCL指令集優化,相對來說更偏向於硬體底層。
吳辰的考慮是多方面的。
由於各種原因,目前硬體想要做出決定性的突破還很難,所以和國外需要保持良好的關係。
但這些人情世幫吳辰並不想花費太多的精力。
而黃瑞傑上次在運動會時給他的印象不錯,首先在人品上是過關的。
其次,黃瑞傑也和王宏發決裂了,屬於同一陣線的人,在立場上沒問題。
最後,則是是他本身的能力足夠完成吳辰指定的研究目標。
至此,高等研究院下屬的四個實驗室,都安排好了吳辰的自己人。
而在他的統籌安排下,很快第一項產品發布了。
榛果問答社區!
這些硬體已經安裝好一星期了。
現在這8TB的數據,將被閔欣柔的BPE算法切分成無數個Token,用來首次大規模訓練榛果Seek的核心大語言模型。
等消化完這些數據後,榛果Seek將產生真正的蛻變。
閔欣柔清楚這件事的重要性。
所以她一刻也不敢放鬆,就抱著書包朝機房走去。
「機房裡冷,一定要穿厚一點。」
吳辰看著她纖細的背景,忍不住叮囑了一句。
「老師,我身體很好的。」
閔欣柔朝他笑了笑,然後就跑進了機房。
這段數據由於要調試伺服器集群和訓練模型,吳辰和閔欣柔兩人要時刻在機房守著。
主要是他目前實在沒有其他信的過的人。
不過這種日子只要再堅持三天就好。
等模型訓練完成後,榛果問答社區就能正式發布了。
回到辦公室,吳辰聽到陳蓓桃正在不停的指點江山。
「這裡應該放一排綠植,這裡應該搞個零食飲料角,還有還有這裡,要擺一個大大的展櫃,裡面全部放滿明日香的手辦!」
姜楠在旁邊默默的聽著。
不過看她的神情,應該是已經走神了。
吳辰也不知道她們是怎麼成為閨蜜的。
見他回來,陳蓓桃立即興奮的招手。
「大佬大佬,我們去吃肯德基吧,今天送多啦A夢的聯名款玩具耶~」
「不急。」
吳辰擺了擺手,招呼姜楠和陳蓓桃坐在沙發上。
吳辰幫她們各自倒了杯水,然後問道:「你的圖像特徵提取研究的怎麼樣了?」
陳蓓桃沒想到他突然就問起正事。
不過她也很快就進入了狀態,略帶沮喪的回答起來。
「還是老樣子,主要卡在複雜背景下的邊緣檢測精度上,我嘗試了好幾種改進的卷積核,但要麼算力要求太高,要麼精度提升不明顯————
吳辰默默的聽著。
雖然兩人在QQ上交流的也很多,但還是不如現場方便。
聽完後,吳辰直接道:「不要手工特徵提取了,就用卷積神經網絡,大膽一點增加網絡的深度,讓機器自己去學習特徵。」
陳蓓桃的理解能力很強。
一聽吳辰說增加深度,就意識到這是要解決梯度消失的問題。
而她此前一直因為擔心網絡退化而不敢加層數,所以一直還在死磕傳統的SIFT算子和SVM分類器。
「大佬,你真是太牛辣!」
陳蓓桃一下激動了起來。
她左右望了望,跳著對吳辰道:「大佬,你的那個計算陣列呢,我有個好點子想試試!」
吳辰淡定的喝了口茶。
「在用,這幾天都沒法給你用,最快也要下星期了。」
「可下星期就太晚了,而且到時候京大要開中期考核匯報會,我估計來不了。」
陳蓓桃失望道。
然後她眼珠子一轉,落在了姜楠身上。
「好姐妹,你去陪大佬睡覺吧,把計算陣列讓給我————哎呦哎呦,輕點啊可惡,太太,你也不想你丈夫的研究失去我這個天才吧?」
半晌後,姜楠才鬆開了揪她耳朵的手。
陳蓓桃嚶嚶嚶了好一陣才算緩過勁來。
吳辰等她們鬧夠了,才終於說出了自己的想法。
「你這樣從京大到杭城很不方便,所以不如直接來這邊吧,我這邊有兩個實驗室正好適合你研究的方向,你來做負責人。」
「啊?」
陳蓓桃呆了呆。
就連姜楠臉上也露出一絲驚訝。
小和山工業大學和京大的地位,就跟北大河和黃河差不多。
北大河是吳辰老家城市邊的一條小河。
所以吳辰邀請陳蓓桃來做自己底下的一個實驗室主任,屬實是很冒昧了。
果然,就連陳蓓桃也眯了眯眼睛,傲嬌的抬起頭。
「也不是不可以喔,但大佬你能給我開出什麼條件呢?」
「不低於京大的薪酬待遇,正高待遇,獨立實驗室,以及算力支持。」
吳辰說。
他這個條件可以說很有誠意了。
但陳倍桃搖了搖頭,擺了個傲嬌的表情。
「不行喔。」
「那我要是說,我能夠讓你目前的圖像研究領先世界五年,甚至讓你成為像Hinton那樣的祖師奶呢?」
「真的?」
陳蓓桃猛的瞪大了眼睛:「大佬你打算怎麼做鴨?」
Hinton就是傑弗里.辛頓,深度學習之父,神經網絡領域的泰斗,是陳蓓桃的偶像。
吳辰沒有回答,而是轉頭問姜楠。
「你餓了沒有?」
「餓了,想吃肯德基。」
姜楠說。
「那走。」
吳辰說著就作勢起身。
姜楠則緊跟上了他。
「不要啊,大佬,姜姜,你們別走鴨~」
陳蓓桃一下跳起來撲在姜楠懷中。
攔住姜楠後,她可憐楚楚的看向吳辰。
「大佬,我來你這裡,求您收留了我叭!」
「是嗎,可您這尊大佛好像看不上咱這小廟嘛。」
「我那不是矜持一下嘛,不然顯得像白給一樣,嘻嘻~」
陳蓓桃吐了吐舌頭。
她也沒想到吳辰一點都不給拉扯的機會。
「行吧,那你準備一下,我這邊時間很急。」
吳辰說。
他也不是不近人情的人,不會非要逼著陳蓓桃在京大和他這裡二選一。
所以最終的結果,就是陳蓓桃以客座研究員和聯合實驗室主任的雙重身份加入他的團隊。
主要工作時間在杭城,但保留京大的研究職位和導師關係。
這樣對她來說,既能保留在京大的學籍和資源,又能名正言順地使用這邊的算力。
可謂是雙贏。
有了陳蓓桃的加入後,高等智能研究院的架子總算是搭了起來。
目前其下總共有四個研究所。
第一個是自然語言處理與認知智能研究所,由吳辰親自兼任所長,共建方是搜狗、天涯社區、微軟。
主要的研究方向是基礎理論研究。
目前孵化中的產品,包括榛果問答社區、輸入法預測、情感分析以及VibeCoding。
陳蓓桃負責的兩個實驗室,則分別是智能語音與多模態交互研究所和圖像處理與機器視覺實驗室。
智能語音與多模態交互研究所的共建方是科大訊飛。
研究方向,則是語音糾錯、語義補全,以及未來的多模態人工智慧。
所謂多模態,就是包括了文字、圖像、語音、視頻等多方面的融合感知。
另一個圖像處理與機器視覺實驗室,共建方則是蘋果。
這也是陳蓓桃真正感興趣的方向。
吳辰給她定下的研究方向,是FaceID、圖像識別、圖片鑒黃和未來的自動駕駛視覺。
這些都是需要長期積累的研究項目,吳辰只要等著他們研究好後摘桃子就行了。
最後一個,則是高性能計算與系統架構中心。
吳辰思考良久後,還是將它的負責人定為了黃瑞傑。
共建方,則是AMD和蘋果。
主要研究方向,則是分布式訓練框架和OpenCL指令集優化,相對來說更偏向於硬體底層。
吳辰的考慮是多方面的。
由於各種原因,目前硬體想要做出決定性的突破還很難,所以和國外需要保持良好的關係。
但這些人情世幫吳辰並不想花費太多的精力。
而黃瑞傑上次在運動會時給他的印象不錯,首先在人品上是過關的。
其次,黃瑞傑也和王宏發決裂了,屬於同一陣線的人,在立場上沒問題。
最後,則是是他本身的能力足夠完成吳辰指定的研究目標。
至此,高等研究院下屬的四個實驗室,都安排好了吳辰的自己人。
而在他的統籌安排下,很快第一項產品發布了。
榛果問答社區!