第21章 大佬簡直是外掛
[我看看,回頭找你。]
蓓蓓:[嗯嗯,大佬不急,我也先去學習你的文章辣!]
關掉對話框,吳辰打開陳蓓桃寫的這篇文章,仔細研讀了起來。
除了理論外,裡面還有大量計算和模型,他不得不一邊計算,一邊編程驗證。
直到凌晨四點,吳辰才算是搞懂了整篇文章的核心思想。
距離真正的殘差網絡還差一點,但也只差一點。
沒有完成最後的那一步,不是因為陳蓓桃能力不足,而是時代的局限性。
畢竟2008年的當前,深層神經網絡的梯度消失問題還沒被解決,計算資源也遠遠達不到訓練超深模型的要求。
甚至連AlexNet都還沒出現,更別說殘差網絡了。
一個讓學術圈看不到前景的理論,一項讓投資人得不到回報的研究,註定只能是天才突然興起的一個念頭。
如果按原本的時間線,陳蓓桃絕對想不出自己做出了什麼成果。
如果不是吳辰提起,她估計都想不起來自己還研究過這東西。
但現在,吳辰點上了最後那一點殘缺的龍睛。
恆等映射算法。
它可以構建快捷連接,讓梯度無損穿越超深度網絡的核心,可以說沒有它,再深的網絡也無法被有效訓練,人工智慧大模型的深度將永遠被禁錮在淺層。
做完這一切,吳辰呼出了系統面板。
【宿主:吳辰】
【當前宿主基礎信息如下:】
【智力:1級(15%->25%)】
【體力:1級(1%)】
【技能等級】
【人工智慧:1級(0%)-> 1級(5%)】
【材料學:0級(0%)】
【化學:0級(0%)】
【物理:0級(0%)】
【工程學:0級(22%)】
【能源學:0級(0%)】
【樣品商城:復仇一號,小姜1號,啟明一號,小姜2號】
【可用生產圖紙:啟明一號,小姜1號,小姜2號】
【技能點:2.827】
不愧是天才大佬。
如果讓他自己從零開始將殘差網絡研究出來,恐怕要花費的時間一星期都不止。
而現在有現成的東西照著去做,幾個小時就讓他的智力提升了10%,人工智慧提升了5%。
簡直就是自己的外掛加速器啊。
想了想,吳辰將補全的文檔發給了陳蓓桃,然後又列了幾個自己上輩子沒了解的理論過去。
[變分推斷在生成模型中的理論收斂性、圖論在生物分子網絡建模中的優化算法、隨機矩陣理論對於神經網絡初始化的指導意義、信息幾何在模型表達能力分析中的應用,你有空研究一下這些方向。]
發完以後,吳辰想了想又補充了一句。
[別在SNN上花時間了。]
陳蓓桃沒有回消息,也不知道是睡了還是沉浸在研究中。
吳辰也沒再去管,只是看著自己2.827的技能點思考了起來。
小姜2號必須要趕快投產,這樣才能儘快實現技術變現,獲得更多的技能點。
到時候用來購買樣品或者生產線,甚至直接加點在個人屬性上,都是不錯的選擇。
要是自己瘋狂堆技能點,把體力點到10級,是不是能一拳打穿王宏發的狗頭?
拋開這種奇怪的想法,吳辰洗漱一番後上床睡覺。
-----------------
接下來的幾天,他儘量保持規整的作息。
每天早上六點起床跑步,晚上10點鐘就上床睡覺,將已經混亂的生物鐘調整過來。
畢竟一學期的早八不是鬧著玩的。
要是開學後上課遲到,那就是重大教學事故。
讓王宏發抓住兩三次的話,那吳辰基本上可以滾蛋了。
不過這樣規律的生活也有好處。
他的體力等級每天都以1%的速度在緩慢增長。
但最讓他意外的驚喜,卻是陳蓓桃。
這位真大佬竟然真的放棄SNN,轉而去研究吳辰提供給他的幾個方向。
然後在一星期不到的時間,硬生生的完成了基於圖卷積網絡的分子性質預測和變分推斷收斂性證明的研究。
當她將這兩篇論文發給吳辰的時候,字裡行間還有些慚愧。
蓓蓓:[大佬大佬對不起,我實在是太笨了,一周只做這麼點,下周一定更努力!]
[……加油。]
吳辰一時不知道該說什麼,只能默默回一句加油。
讓他自己從頭來做,三個月能做這些都已經是神速了。
將她的研究吸收後,吳辰的人工智慧等級又增加了一點。
【人工智慧:1級(5%)-> 1級(10%)】
如果陳蓓桃每周都能完成這麼高質量的工作,那他豈不是躺著都能升級?
可惜陳蓓桃有自己的本職工作,而且這兩個方向正好是她研究過的,所以才能這麼快。
其他的研究就只能慢慢磨了。
但無論如何,陳蓓桃這兩項關鍵的算法研究,再加上吳辰自己對位置編碼的研究,終於算是徹底完成了繼word2Vec後,通往Transformer架構的另一個關鍵點:
注意力機制的數學基礎框架!
完成了它,就相當於為注意力機制的落地掃清了理論障礙,讓後續的多頭注意力、位置編碼等核心組件有了嚴謹的數學支撐,不再是單純的工程嘗試。
只要再將多頭注意力的並行計算優化、位置編碼的高效實現方案、層歸一化的工程化改進、前饋網絡的激活函數適配、跨層注意力交互機制這幾個大理論完成,那2025年的人工智慧就能提前面世了!
屆時,他將親自向世人宣告人工智慧時代的到來!
當然,這並不是一件容易的事。
但如果自己能聚集起來一群像陳蓓桃這樣的聰明人,那這個未來,應該不會太遠。
-----------------
不過在吳辰開啟偉大航路之前,他根本沒機會遇到那麼多聰明人,而是要和一群萌萌噠大一新生打成一片。
不管他在外邊開公司也好,投論文也罷,他都要面對身為一個老師的本職任務:
教書,育人。
其實能進入小和山工業大學的學生,在學習能力還是沒有問題的。
但是對計算機學院的老師們來說,這個問題很大。
因為有許多學生,連基本的電腦都不會用!
這種事情發生在兩個階段。
一種是發生在21世紀初的幾年,那時候窮,除了去網吧,能在家中買一台電腦的家庭都不算多,更別說來自偏遠地區的學生了。
另一種則是二十年後,有不少大學生是只會玩手機,不會用電腦。
而吳辰負責的C語言專業課,就面臨著第一種情況。
一早上5節課,兩個班總共60人,也只有3個學生配置好了基礎開發環境。
吳辰倒是沒有不耐煩,不過下課的時候也有一絲無力感,想睡覺。
做個負責任的老師不是一件容易的事,所以有些人要麼選擇摸魚,要麼選擇專心搞科研。
上課?
交給助教不就好了?
如果非要選擇,發論文和拉課題經費才是頭等大事。
吳辰當然不會做出這種事。
中午去學校食堂隨便吃了口飯,他便提前來到了要上課的實驗室。
下午是大三的學生,情況應該會好很多。
到了以後,吳辰便打開講台上的教學機開始做準備。
剛弄了沒一會兒,外邊便傳來了腳步聲,是有上課的學生來了。
吳辰看了一眼電腦右下角的時間。
12點50。
下午是1點30上課,大三的學生已經老油條了,很少會提前這麼久來教室。
看來遇到好學生了。
吳辰胡思亂想著,抬頭朝門口看去。
然後就和一雙明媚的眼睛對視在了一起。
好漂亮的女孩子!
看清楚臉後,就連吳辰也在心底讚嘆了一聲。
蓓蓓:[嗯嗯,大佬不急,我也先去學習你的文章辣!]
關掉對話框,吳辰打開陳蓓桃寫的這篇文章,仔細研讀了起來。
除了理論外,裡面還有大量計算和模型,他不得不一邊計算,一邊編程驗證。
直到凌晨四點,吳辰才算是搞懂了整篇文章的核心思想。
距離真正的殘差網絡還差一點,但也只差一點。
沒有完成最後的那一步,不是因為陳蓓桃能力不足,而是時代的局限性。
畢竟2008年的當前,深層神經網絡的梯度消失問題還沒被解決,計算資源也遠遠達不到訓練超深模型的要求。
甚至連AlexNet都還沒出現,更別說殘差網絡了。
一個讓學術圈看不到前景的理論,一項讓投資人得不到回報的研究,註定只能是天才突然興起的一個念頭。
如果按原本的時間線,陳蓓桃絕對想不出自己做出了什麼成果。
如果不是吳辰提起,她估計都想不起來自己還研究過這東西。
但現在,吳辰點上了最後那一點殘缺的龍睛。
恆等映射算法。
它可以構建快捷連接,讓梯度無損穿越超深度網絡的核心,可以說沒有它,再深的網絡也無法被有效訓練,人工智慧大模型的深度將永遠被禁錮在淺層。
做完這一切,吳辰呼出了系統面板。
【宿主:吳辰】
【當前宿主基礎信息如下:】
【智力:1級(15%->25%)】
【體力:1級(1%)】
【技能等級】
【人工智慧:1級(0%)-> 1級(5%)】
【材料學:0級(0%)】
【化學:0級(0%)】
【物理:0級(0%)】
【工程學:0級(22%)】
【能源學:0級(0%)】
【樣品商城:復仇一號,小姜1號,啟明一號,小姜2號】
【可用生產圖紙:啟明一號,小姜1號,小姜2號】
【技能點:2.827】
不愧是天才大佬。
如果讓他自己從零開始將殘差網絡研究出來,恐怕要花費的時間一星期都不止。
而現在有現成的東西照著去做,幾個小時就讓他的智力提升了10%,人工智慧提升了5%。
簡直就是自己的外掛加速器啊。
想了想,吳辰將補全的文檔發給了陳蓓桃,然後又列了幾個自己上輩子沒了解的理論過去。
[變分推斷在生成模型中的理論收斂性、圖論在生物分子網絡建模中的優化算法、隨機矩陣理論對於神經網絡初始化的指導意義、信息幾何在模型表達能力分析中的應用,你有空研究一下這些方向。]
發完以後,吳辰想了想又補充了一句。
[別在SNN上花時間了。]
陳蓓桃沒有回消息,也不知道是睡了還是沉浸在研究中。
吳辰也沒再去管,只是看著自己2.827的技能點思考了起來。
小姜2號必須要趕快投產,這樣才能儘快實現技術變現,獲得更多的技能點。
到時候用來購買樣品或者生產線,甚至直接加點在個人屬性上,都是不錯的選擇。
要是自己瘋狂堆技能點,把體力點到10級,是不是能一拳打穿王宏發的狗頭?
拋開這種奇怪的想法,吳辰洗漱一番後上床睡覺。
-----------------
接下來的幾天,他儘量保持規整的作息。
每天早上六點起床跑步,晚上10點鐘就上床睡覺,將已經混亂的生物鐘調整過來。
畢竟一學期的早八不是鬧著玩的。
要是開學後上課遲到,那就是重大教學事故。
讓王宏發抓住兩三次的話,那吳辰基本上可以滾蛋了。
不過這樣規律的生活也有好處。
他的體力等級每天都以1%的速度在緩慢增長。
但最讓他意外的驚喜,卻是陳蓓桃。
這位真大佬竟然真的放棄SNN,轉而去研究吳辰提供給他的幾個方向。
然後在一星期不到的時間,硬生生的完成了基於圖卷積網絡的分子性質預測和變分推斷收斂性證明的研究。
當她將這兩篇論文發給吳辰的時候,字裡行間還有些慚愧。
蓓蓓:[大佬大佬對不起,我實在是太笨了,一周只做這麼點,下周一定更努力!]
[……加油。]
吳辰一時不知道該說什麼,只能默默回一句加油。
讓他自己從頭來做,三個月能做這些都已經是神速了。
將她的研究吸收後,吳辰的人工智慧等級又增加了一點。
【人工智慧:1級(5%)-> 1級(10%)】
如果陳蓓桃每周都能完成這麼高質量的工作,那他豈不是躺著都能升級?
可惜陳蓓桃有自己的本職工作,而且這兩個方向正好是她研究過的,所以才能這麼快。
其他的研究就只能慢慢磨了。
但無論如何,陳蓓桃這兩項關鍵的算法研究,再加上吳辰自己對位置編碼的研究,終於算是徹底完成了繼word2Vec後,通往Transformer架構的另一個關鍵點:
注意力機制的數學基礎框架!
完成了它,就相當於為注意力機制的落地掃清了理論障礙,讓後續的多頭注意力、位置編碼等核心組件有了嚴謹的數學支撐,不再是單純的工程嘗試。
只要再將多頭注意力的並行計算優化、位置編碼的高效實現方案、層歸一化的工程化改進、前饋網絡的激活函數適配、跨層注意力交互機制這幾個大理論完成,那2025年的人工智慧就能提前面世了!
屆時,他將親自向世人宣告人工智慧時代的到來!
當然,這並不是一件容易的事。
但如果自己能聚集起來一群像陳蓓桃這樣的聰明人,那這個未來,應該不會太遠。
-----------------
不過在吳辰開啟偉大航路之前,他根本沒機會遇到那麼多聰明人,而是要和一群萌萌噠大一新生打成一片。
不管他在外邊開公司也好,投論文也罷,他都要面對身為一個老師的本職任務:
教書,育人。
其實能進入小和山工業大學的學生,在學習能力還是沒有問題的。
但是對計算機學院的老師們來說,這個問題很大。
因為有許多學生,連基本的電腦都不會用!
這種事情發生在兩個階段。
一種是發生在21世紀初的幾年,那時候窮,除了去網吧,能在家中買一台電腦的家庭都不算多,更別說來自偏遠地區的學生了。
另一種則是二十年後,有不少大學生是只會玩手機,不會用電腦。
而吳辰負責的C語言專業課,就面臨著第一種情況。
一早上5節課,兩個班總共60人,也只有3個學生配置好了基礎開發環境。
吳辰倒是沒有不耐煩,不過下課的時候也有一絲無力感,想睡覺。
做個負責任的老師不是一件容易的事,所以有些人要麼選擇摸魚,要麼選擇專心搞科研。
上課?
交給助教不就好了?
如果非要選擇,發論文和拉課題經費才是頭等大事。
吳辰當然不會做出這種事。
中午去學校食堂隨便吃了口飯,他便提前來到了要上課的實驗室。
下午是大三的學生,情況應該會好很多。
到了以後,吳辰便打開講台上的教學機開始做準備。
剛弄了沒一會兒,外邊便傳來了腳步聲,是有上課的學生來了。
吳辰看了一眼電腦右下角的時間。
12點50。
下午是1點30上課,大三的學生已經老油條了,很少會提前這麼久來教室。
看來遇到好學生了。
吳辰胡思亂想著,抬頭朝門口看去。
然後就和一雙明媚的眼睛對視在了一起。
好漂亮的女孩子!
看清楚臉後,就連吳辰也在心底讚嘆了一聲。