第160章 橘子大模型(第二更)

投票推薦 加入書籤 小說報錯

  第160章 橘子大模型(第二更)

  做一個人工智慧,不是方豫給柚子吩咐一下就可以的。

  可能是出於安全方面的考慮,塞卡利斯在創造柚子的時候,並沒有給這個球添加自主創新意識。

  只有柚子的所有人對它下達明確的指令,他才會就指令進行下一步的信息收集與演算。

  對於一個系統性的任務,柚子需要主人給他把系統性任務分解成為一個個獨立而明確的任務。

  如果方豫只是告訴它:柚子,做一個通用型人工智慧出來。

  它會完全不知所措,也無從著手,它不會去主動分析這個任務需要什麼樣的前置知識,也不會創造性的去執行這個任務。

  這樣一來,就需要方豫自己先對人工智慧大模型有相當的了解才可以。

  給柚子指明一個方向,分解任務,柚子執行。

  如果執行成功,那就是搞成了,如果不成功,說明方豫對人工智慧的理解有問題,方向不對,就需要換方向。

  歸根究底,柚子這麼懶也是有原因的!

  「現在,把我剛才說的方案做一個初步推演,然後把推演結果告訴我。」方豫一邊給柚子下指令,一邊噼里啪啦的在電腦上改總結。

  柚子寫的階段總結太超前了,方豫得刪除一部分,還得改錯一部分,再交給童永山。

  現在方豫已經在童永山心目中建立起了計科高手的印象,索性一階段童永山就沒再找任何計科專業的大佬合作,而是直接和柚子科技達成的合作研究意向。

  至於說柚子科技是誰的,童永山更不在乎。

  就算這家公司就是自己這個學生的又能怎樣?有一個肯投幾千萬在科研上的二代學生不香嗎?

  要是被其他教授知道,早就嫉妒壞了吧?

  「主人,ResNet與DBN的結合對處理長距離依賴關係的能力應不會有任何提高,我們需要更換模型組合。」經過短時間的運算,柚子閃著銀白色的星光回答道。

  「那就替換一下,看看哪些模型之間能擦出火花來。」方豫在伺服器上圈定了模型範圍,交給柚子進行演算。

  模糊演算是柚子本身所具備的法則之一,本質其實是預言學派的一些基礎理論在柚子身上的應用。

  與計算機模型中提取關鍵因子進行模糊演算的方式完全不同,相比起來,柚子的模糊演算準確性要高得多。

  「找到了!」沒過多久,柚子就發出了振奮的聲音。

  「《帶注意力的序列到序列》中提到的注意力機制模型與位置編碼技術和LSTM、CNN、FFN等神經網絡的結合,可以形成新的框架,經過訓練後添加其他模型,可以形成目前測算中效率最高的大模型。」柚子迅速在方豫的電腦屏幕上投出了相應內容。

  「我會把這些模型放到我自己的框架內,由我的框架進行重組。」

  說著,柚子身上的銀色星光逐漸變成了一條緩慢流轉的光帶,這是柚子在用自己的本體幫助陣列伺服器進行輔助運算,再把輔助運算的結果傳輸至伺服器網絡。

  只要找對了路,柚子的運算能力遠非現如今任何一台超級計算機所能相提並論的。

  不過三分鐘,身上流淌的銀色光帶便重新變回了點點銀色星光。

  「框架重組完成,底層法則添加完畢,上傳伺服器系統後進行初次學習。」柚子平鋪直敘的聲音傳來,似乎變了一個球,跟電影裡的人工智慧一樣。

  方豫不為所動搓了搓手指:「好好說話!」

  柚子明顯一激靈,語氣諂媚:「主人,大概還要30秒,新的框架就能上傳至伺服器,其後就可以做模型數據訓練了。」

  話說著,體積並不大的框架模型已經完整上傳至伺服器機組,伺服器內的柚子分身就開始往新框架中添加處理過的數據。

  12組GPU伺服器、196顆TeslaM60算力全開,伺服器的散熱風扇以一萬五千轉的速度旋轉著,將熱量排至這不足五十平米的空間中。

  「目前已完成40GB的數據清洗,現在開始用這部分數據進行第一次訓練,這個模型需要30萬步的疊代可以完成收斂,預計將耗時3小時21分。」

  隨後,方豫的屏幕上出現了一個3小時21分20秒的倒計時。

  方豫搓了搓手,在屋子裡走了兩圈,心情既期待又激動。

  如果這個模型經過數據訓練,能夠表現出一定的分析處理能力和交流能力,就意味著,自己真的搞出了一個可用的人工智慧大模型!

  你說是柚子搞的?

  屁,老子是通訊作者懂不懂?

  確定研究方向、劃分研究階段、指導研究內容,老子乾的就是導師的活兒。

  課題完成了,導師就做了這些,誰敢說這課題不是導師搞的?

  科研懂不懂?科研的事情,能說是壓榨嗎?能說是剝削嗎?能說是黑心嗎?

  這種說法,完全無視科研領軍人物的貢獻呀!

  你說童永山不給老子一作?

  呔!你這黑了心的老賊!學閥!不要臉的黑心導師!

  方豫轉了兩圈,為了平復自己的情緒,乾脆又跑到威斯汀,和那四個正準備逃跑的海賊世界的入侵者又大戰了一場。

  海賊世界的入侵者被入侵的快不行了。

  三個小時後退房時,四個人都是O字腿。

  方豫再次回到機房的時候,40G的模型數據已經訓練完畢了。

  「主人,40G的數據已經訓練完畢,其中20G是周文數據,20G是盎文數據。從收斂情況上看,這次訓練是成功了,我們可以針對這個模型進行一些測試。」

  方豫的電腦屏幕上出現了一個簡易的對話框,這是柚子剛剛製作的一個UI界面。

  「伱好。」方豫在對話框中輸入了兩個周文。

  「我不好。」對話框中瞬間出現三個字。

  艹?什麼情況?你這數據清洗的有問題啊,用什麼數據訓練的?

  柚子一臉汗,「這個,這個,可能用來訓練的數據有點問題,我再清洗一遍啊。」

  伺服器又瘋狂運轉了幾分鐘,40g的數據便又清洗完成。

  「重新訓練大約需要1小時20分鐘。」柚子的聲音有些尷尬。

  方豫無奈,看看天色,已經下午四點了。

  本來還想著去拳擊社虐虐菜裝個逼,看來也沒時間了。

  還是在這等著吧。

  方豫不是浪費時間的人,一個小時二十分鐘,足夠他複習一門待考科目的。

  終於,倒計時結束。

  方豫再次在對話框中輸入你好兩個字。

  「你好,請問有什麼可以幫您?」這次回復就正常多了。

  「你叫什麼名字?」方豫又敲出一行文字。

  模型中規中矩的回答:「我還沒有名字,我是柚子科技開發的一款基於多重神經網絡的大模型,你想叫我什麼?」

  方豫想了想,嘴邊露出一絲微笑:「既然你是柚子開發的,那就叫你橘子吧。」

  (本章完)

章節目錄