第5章 開小灶
第一封信來自費恩管家。
內容很長,信里除了事無巨細的問候和關懷外,還包含了大段的內容。
林簡嘗試著總結提煉了一下,內容大概可以說是:
「好好學習,不然回來削你。」
「害!」林簡搖頭,打開了另外一封信。
「今晚有空來找一下我。」
內容很短,但這個措辭屬實是……而末尾的署名更讓林簡震驚到了。
拉爾森教授。
……
令人開心的複習時間總是過得很快,一下午的時間在不知不覺中度過。
林簡匆匆在食堂解決了一下晚飯。
說起來,異世界的食堂還挺好吃的,也不知道是不是因為學院食堂賣的比較貴的原因……
算了,不管了,反正奧古斯都家有錢,每個月的生活費完全足夠自己大吃大喝了。
沒過多久,林簡敲響了面前的門。
門開,站在後面的是拉爾森教授。
「希望不會太耽誤你準備補考,奧古斯都。」沒有太多的寒暄,拉爾森教授示意林簡跟著他走進去。
「關於你上次提到的,獎懲機制……」拉爾森教授開門見山,「我自己思考了一下,但思路還不夠清晰,或許你有什麼更多的想法嗎?」
林簡心想,這才多久的時間,你就想自己推導出另一個世界無數學者花了數年時間的成果嗎……
還好這幾天的複習,讓自己對符文學和能量迴路學也算有了些了解,這次應該能應付過去。
「教授,根據我的了解,目前的符文構裝體只能刻板地執行預設指令」林簡努力搜刮著前世關於強化學習的碎片知識,謹慎措辭,「卻不能處理突發狀況。」
「以走迷宮為例,構裝體要麼依靠事先輸入的地圖,要麼依靠精密的路線規劃。」
「萬一地圖出錯了,或者壓根沒規划過路線,」林簡做了個撞擊的手勢,「它就只會一頭撞上牆壁。」
「為了解決這個問題,我們首先需要給構裝體安裝可以識別牆壁的模塊。」林簡繼續闡述,再次搬出了那個比喻,「就像訓練雪橇犬,當它撞上牆壁時,就會受到懲罰,而當它面對牆壁選擇出正確路徑時,就會受到獎勵。」
「然後根據受到的獎勵或懲罰,調整構裝體的邏輯迴路參數。」
「這個方法的關鍵在於不斷試錯,最終讓構裝體自己總結出最優的前進策略,而不是簡單地被塞進去一張現成的地圖。」
「所以……你構想的構裝體根本不是工具,而是一個可以自我成長的……『學徒』?」拉爾森教授沉思,「繼續說下去。」
林簡嘆氣,只能繼續在腦中努力回憶著那些知識,不禁暗自感慨,穿越前的自己是不是選錯研究方向了……
他走到辦公室角落的書架旁,拿起一塊符文石當道具比劃著名。
「首先,我們要明確構裝體的『狀態』。」林簡指著符文石的周圍,「比如現在這個房間裡,牆壁,通道,障礙物……它通過傳感器可以感知到當前所處環境裡所有的內容,稱為它此時的狀態。」
「然後,構裝體在某個狀態下,會採取『行動』,例如前進,左轉,右轉或者後退。」
「接下來就是關鍵的獎懲機制,或者叫它『獎勵函數』。每次構裝體根據狀態選擇一個行動,都會得到一個反饋。」
「比如,它成功避開牆壁走了三步,就給它施加獎勵,而如果它因為轉向撞牆了,就給它施加懲罰。」
「而在不斷的試錯過程中,這個機制也將引導著構裝體學習一個關鍵的東西,『策略』。策略就是它學到的規則:在不同的狀態下,選擇什麼樣的行動能獲得更長期的獎勵,而不只圖眼前的甜頭。」
拉爾森教授手中的羽毛筆在飛速書寫著,「對!動態反饋……根據行動的結果調整自己的行為偏好。」
……
時間在兩人你來我往的問答中飛快的流逝。
一開始拉爾森教授覺得面前的少年只是一時的靈感,或許在構裝體研究中有一些天賦,叫他過來也僅僅只是希望看看可不可以再提供一些靈感。
但當林簡講到那些關於馬爾科夫決策過程和貝爾曼公式的內容時,他才意識到,這絕不僅僅只是有些天賦那麼簡單了。
畢竟數學推導可完全不只是一時靈感就可以誕生的東西。
在兩人的對話中,拉爾森教授看著林簡的眼睛越來越亮,數學基礎在現代魔法體系中可以說是最重要的一環,不知道有多少憧憬著魔法的人倒在了數學這一關上。
而面前這位少年在數學上的天賦……或許可以用恐怖來形容。
聯想到關於這位廢柴少年的那些流言蜚語,拉爾森教授的眼睛死死盯著林簡道:
「奧古斯都,或許以你的出身,即使不能成為千塔的正式學生,也可以擁有享受不完的榮華富貴,所以你才不重視那場考試。但相信我,你在魔法上有著別人想像不到的天賦……」
「呵,這就被震驚到了?我要是告訴你,這些知識只是我在通宵跑實驗無聊的時候,溜達去隔壁組看他們用來打遊戲的算法而已,你怕不是要把我釘上魔導試驗台,當成實驗素材處理了吧。」林簡在心裡冷笑。
「另外,這玩意很吃算力的,我們可是每天都眼巴巴地盼著老闆能多添幾台伺服器和顯卡,這可沒有那麼好實現哦。」
「額……教授,我只是突發奇想。您知道的,我以前也沒怎麼接觸過這些。」但面子上還是要謙虛一下的。
「你的天賦毋庸置疑。」拉爾森教授搖了搖頭,道「耽誤了你一些時間,你在複習上有什麼問題嗎,正好我可以給你做下答疑。」
「就等著你這句話呢。」林簡心想,「你再不提的話,我可要主動提了。」
林簡在問完了這兩天複習中的疑問後,又厚著臉皮問了一句,「教授,上次的那個藥劑……」
「我這裡也沒有了。」
「啊?那個藥劑這麼貴重嗎,以您的身份不應該……」
拉爾森教授聽後也是一怔:「倒不是貴不貴重的問題,但那個藥劑的效果也僅僅只是摒除雜念而已。見習法師可能買不起,但對可以熟練冥想的正式法師來說,這種藥劑完全是雞肋。學院裡一般沒人存這東西,我去外面購買的話,怕是趕不上你補考用了。」
拉爾森教授再次疑問:「你完全不懂冥想嗎?」
林簡聽完也怔住了,冥想……原主的記憶里,冥想好像是用來讓自己睡得更香的手段。
內容很長,信里除了事無巨細的問候和關懷外,還包含了大段的內容。
林簡嘗試著總結提煉了一下,內容大概可以說是:
「好好學習,不然回來削你。」
「害!」林簡搖頭,打開了另外一封信。
「今晚有空來找一下我。」
內容很短,但這個措辭屬實是……而末尾的署名更讓林簡震驚到了。
拉爾森教授。
……
令人開心的複習時間總是過得很快,一下午的時間在不知不覺中度過。
林簡匆匆在食堂解決了一下晚飯。
說起來,異世界的食堂還挺好吃的,也不知道是不是因為學院食堂賣的比較貴的原因……
算了,不管了,反正奧古斯都家有錢,每個月的生活費完全足夠自己大吃大喝了。
沒過多久,林簡敲響了面前的門。
門開,站在後面的是拉爾森教授。
「希望不會太耽誤你準備補考,奧古斯都。」沒有太多的寒暄,拉爾森教授示意林簡跟著他走進去。
「關於你上次提到的,獎懲機制……」拉爾森教授開門見山,「我自己思考了一下,但思路還不夠清晰,或許你有什麼更多的想法嗎?」
林簡心想,這才多久的時間,你就想自己推導出另一個世界無數學者花了數年時間的成果嗎……
還好這幾天的複習,讓自己對符文學和能量迴路學也算有了些了解,這次應該能應付過去。
「教授,根據我的了解,目前的符文構裝體只能刻板地執行預設指令」林簡努力搜刮著前世關於強化學習的碎片知識,謹慎措辭,「卻不能處理突發狀況。」
「以走迷宮為例,構裝體要麼依靠事先輸入的地圖,要麼依靠精密的路線規劃。」
「萬一地圖出錯了,或者壓根沒規划過路線,」林簡做了個撞擊的手勢,「它就只會一頭撞上牆壁。」
「為了解決這個問題,我們首先需要給構裝體安裝可以識別牆壁的模塊。」林簡繼續闡述,再次搬出了那個比喻,「就像訓練雪橇犬,當它撞上牆壁時,就會受到懲罰,而當它面對牆壁選擇出正確路徑時,就會受到獎勵。」
「然後根據受到的獎勵或懲罰,調整構裝體的邏輯迴路參數。」
「這個方法的關鍵在於不斷試錯,最終讓構裝體自己總結出最優的前進策略,而不是簡單地被塞進去一張現成的地圖。」
「所以……你構想的構裝體根本不是工具,而是一個可以自我成長的……『學徒』?」拉爾森教授沉思,「繼續說下去。」
林簡嘆氣,只能繼續在腦中努力回憶著那些知識,不禁暗自感慨,穿越前的自己是不是選錯研究方向了……
他走到辦公室角落的書架旁,拿起一塊符文石當道具比劃著名。
「首先,我們要明確構裝體的『狀態』。」林簡指著符文石的周圍,「比如現在這個房間裡,牆壁,通道,障礙物……它通過傳感器可以感知到當前所處環境裡所有的內容,稱為它此時的狀態。」
「然後,構裝體在某個狀態下,會採取『行動』,例如前進,左轉,右轉或者後退。」
「接下來就是關鍵的獎懲機制,或者叫它『獎勵函數』。每次構裝體根據狀態選擇一個行動,都會得到一個反饋。」
「比如,它成功避開牆壁走了三步,就給它施加獎勵,而如果它因為轉向撞牆了,就給它施加懲罰。」
「而在不斷的試錯過程中,這個機制也將引導著構裝體學習一個關鍵的東西,『策略』。策略就是它學到的規則:在不同的狀態下,選擇什麼樣的行動能獲得更長期的獎勵,而不只圖眼前的甜頭。」
拉爾森教授手中的羽毛筆在飛速書寫著,「對!動態反饋……根據行動的結果調整自己的行為偏好。」
……
時間在兩人你來我往的問答中飛快的流逝。
一開始拉爾森教授覺得面前的少年只是一時的靈感,或許在構裝體研究中有一些天賦,叫他過來也僅僅只是希望看看可不可以再提供一些靈感。
但當林簡講到那些關於馬爾科夫決策過程和貝爾曼公式的內容時,他才意識到,這絕不僅僅只是有些天賦那麼簡單了。
畢竟數學推導可完全不只是一時靈感就可以誕生的東西。
在兩人的對話中,拉爾森教授看著林簡的眼睛越來越亮,數學基礎在現代魔法體系中可以說是最重要的一環,不知道有多少憧憬著魔法的人倒在了數學這一關上。
而面前這位少年在數學上的天賦……或許可以用恐怖來形容。
聯想到關於這位廢柴少年的那些流言蜚語,拉爾森教授的眼睛死死盯著林簡道:
「奧古斯都,或許以你的出身,即使不能成為千塔的正式學生,也可以擁有享受不完的榮華富貴,所以你才不重視那場考試。但相信我,你在魔法上有著別人想像不到的天賦……」
「呵,這就被震驚到了?我要是告訴你,這些知識只是我在通宵跑實驗無聊的時候,溜達去隔壁組看他們用來打遊戲的算法而已,你怕不是要把我釘上魔導試驗台,當成實驗素材處理了吧。」林簡在心裡冷笑。
「另外,這玩意很吃算力的,我們可是每天都眼巴巴地盼著老闆能多添幾台伺服器和顯卡,這可沒有那麼好實現哦。」
「額……教授,我只是突發奇想。您知道的,我以前也沒怎麼接觸過這些。」但面子上還是要謙虛一下的。
「你的天賦毋庸置疑。」拉爾森教授搖了搖頭,道「耽誤了你一些時間,你在複習上有什麼問題嗎,正好我可以給你做下答疑。」
「就等著你這句話呢。」林簡心想,「你再不提的話,我可要主動提了。」
林簡在問完了這兩天複習中的疑問後,又厚著臉皮問了一句,「教授,上次的那個藥劑……」
「我這裡也沒有了。」
「啊?那個藥劑這麼貴重嗎,以您的身份不應該……」
拉爾森教授聽後也是一怔:「倒不是貴不貴重的問題,但那個藥劑的效果也僅僅只是摒除雜念而已。見習法師可能買不起,但對可以熟練冥想的正式法師來說,這種藥劑完全是雞肋。學院裡一般沒人存這東西,我去外面購買的話,怕是趕不上你補考用了。」
拉爾森教授再次疑問:「你完全不懂冥想嗎?」
林簡聽完也怔住了,冥想……原主的記憶里,冥想好像是用來讓自己睡得更香的手段。