第447章 與明訊合作

投票推薦 加入書籤 小說報錯

  「馬總,您好,叫我過來是有什麼吩咐嗎?」湯智曉禮貌地點了點頭。

  「智曉,你來看看這個。」馬明把那份文檔遞了過去。

  湯智曉接過來,扶了扶眼鏡,目光落在標題上時,眉毛幾不可查地挑了一下。

  顯然,「深度學習」這個新名詞引起了他的注意。

  他看得很快,但又很仔細。

  一開始,他還站著,身體微微前傾。

  看著看著,他不知不覺地拉開一張椅子坐了下來。

  再然後,他的腰背挺得筆直,幾乎是趴在桌子上,手指順著紙上的數學公式一行一行地移動,嘴裡還念念有詞,全是些外人聽不懂的術語。

  辦公室里的空氣仿佛凝固了。

  馬宇騰倒是不急。他端起茶杯喝了一口,靠在沙發上等著。

  對方這種反應,說明將裡面的內容看了進去。

  馬明一直盯著湯智曉的表情變化,從疑惑到專注,從專注到凝重。

  終於,湯智曉翻到了最後一頁。

  他長長地呼出了一口氣,把文檔放下來。

  然後又拿起來。

  從第一頁重新開始看。

  這一遍他看得更慢,手指在幾個關鍵公式上來回摩挲,腦袋輕微地點著,不知道在跟誰確認什麼。

  馬明忍不住了:「怎麼樣?」

  湯智曉沒理他。

  馬明嘴角抽了抽,轉頭看馬宇騰。

  馬宇騰笑了一下,做了個稍安勿躁的手勢。

  又過了將近十分鐘,湯智曉終於第二遍看完了。

  他抬頭的時候,眼鏡片後面那雙眼睛的神色跟十分鐘前判若兩人。

  「馬總……」

  湯智曉看著馬宇騰和馬明,喉結動了動。

  「這份東西,誰寫的?」

  「「我提了些方向性的想法,」馬宇騰語氣隨意。

  「裡面的數學論證和推導,主要是我愛人完成的。」

  湯智曉的嘴巴微微張開。

  他一開始以為這又是哪個領導拍腦袋想出來的「宏偉藍圖」。

  卻沒想到裡面竟然是如此嚴謹、完整、且具有開創性的理論框架。

  從概念定義,到網絡結構,再到訓練方法,最後是堅實無比的數學基礎,這簡直就是一篇可以直接發表在頂刊上的開山之作!

  「不可思議……簡直是天才般的構想!」湯智曉激動地站了起來。

  「『無監督逐層預訓練』,這個方法,完美地解決了深層網絡訓練時梯度彌散的難題!這……這將開啟一個全新的時代!」

  他看著馬宇騰,眼神里全是敬佩。

  馬明坐直了身體,他明白湯智曉的水平,既然對方都對這份文件的內容讚不絕口,證明他之前的看法沒有錯。

  湯智曉看著馬宇騰的眼神變了,他沒想到這位國內知名的雷霆工業集團總裁,居然對人工智慧這個前沿領域,也有著如此恐怖的技術積累和洞察力。

  馬宇騰坦然地接受了這份讚美。

  雖然核心思想來自未來,但在這個時空,這份文檔的作者確實是他和鍾虹。

  「湯博士,你覺得這套理論有實際應用的可能性嗎?」

  馬宇騰把話題拉了回來。

  「有!太有了!」湯智曉毫不猶豫地回答。

  「這不僅僅是可能性的問題,它就是我們一直在尋找的答案!有了這個框架,我們之前那些像沒頭蒼蠅一樣的研究,立刻就有了明確的方向!」

  「很好。」馬宇騰點了點頭,這正是他想要的結果。

  他身體前傾,看著湯智曉和馬明,說出了自己今天真正的目的。

  「我希望你們的團隊,能在這套深度學習的理論基礎上,儘快研發出一套新的模型架構。」

  「這套架構,要能很好地處理時序數據。它不能只看孤立的、靜態的一幀圖像,而是要能理解一個連續的序列中,不同元素之間的關聯和上下文。比如,一段視頻里,前一秒的車輛位置和速度,與後一秒的行為預測之間的關係。」


  馬宇騰沒有提「Transformer」這個名字,但他描述的,正是其核心思想——自注意力機制。

  「我需要這套技術,為我們雷霆工業準備研發的自動駕駛系統,提供算法支持。」

  「自動駕駛?」馬明和湯智曉幾乎同時出聲。

  湯智曉把手裡的文檔放回桌上,直起腰板。

  「自動駕駛?」

  他重複了一遍這個詞,聲音裡帶著明顯的遲疑。

  「馬總,這個方向,說句不好聽的,目前學術界自己都還停留在前期探索的階段,工業界更沒人敢碰。原因很簡單,計算機視覺的識別能力遠遠不夠。別說動態的交通場景了。」

  馬宇騰沒有立刻反駁,而是仔細分析道。

  「現在的計算機視覺不行,是因為算法模型太淺,特徵提取的能力不夠。」

  他指著桌上那份文檔。

  「特徵提取做不到位,當然什麼都認不准。但你剛才自己也說了,這套卷積神經網絡加上深度訓練之後,提取能力會有質的飛躍。」

  「再疊加我剛才說的那種對序列數據的理解能力後,它就不再是逐幀比對像素了。它開始理解上下文,理解空間關係,理解因果。」

  「網絡可以做得極深,深度意味著理解力。湯博士,這個道理你比我清楚。」

  湯智曉沒有馬上接話。

  他低下頭,翻開文檔里關於序列數據處理的那幾頁,手指在紙面上劃了幾道。

  辦公室里安靜了好一陣。

  「理論上……有可能。」

  他推了推眼鏡,語速放慢了不少。

  「但問題在兩個地方。第一,訓練這種規模的模型,需要的數據量是天文數字。光靠實驗室採集,十年也湊不夠。第二,目前的晶片算力不夠,即使利用最先進的GPU也無法實現處理行駛過程中視覺數據的能力。」

  馬宇騰看向馬明。

  「數據的問題,明訊網絡每天有上億用戶產生的行為數據,這些暫且不說。雷霆汽車未來的產品,每一台車上都會裝車載攝像頭和傳感器。車跑在路上,就是在幫我們采數據。等大量用戶在使用過程中,積累下來的真實道路數據,足夠我們使用了。」

  他頓了一下。

  「至於算力,按照摩爾定律,晶片每十八個月的性能翻一番。我們不需要等到算力完全夠用的那天才開始動手。模型架構和算法先做出來,數據先存起來。等硬體追上來了,我們就能進入到實際的測試當中。」

章節目錄