第447章 與明訊合作
「馬總,您好,叫我過來是有什麼吩咐嗎?」湯智曉禮貌地點了點頭。
「智曉,你來看看這個。」馬明把那份文檔遞了過去。
湯智曉接過來,扶了扶眼鏡,目光落在標題上時,眉毛幾不可查地挑了一下。
顯然,「深度學習」這個新名詞引起了他的注意。
他看得很快,但又很仔細。
一開始,他還站著,身體微微前傾。
看著看著,他不知不覺地拉開一張椅子坐了下來。
再然後,他的腰背挺得筆直,幾乎是趴在桌子上,手指順著紙上的數學公式一行一行地移動,嘴裡還念念有詞,全是些外人聽不懂的術語。
辦公室里的空氣仿佛凝固了。
馬宇騰倒是不急。他端起茶杯喝了一口,靠在沙發上等著。
對方這種反應,說明將裡面的內容看了進去。
馬明一直盯著湯智曉的表情變化,從疑惑到專注,從專注到凝重。
終於,湯智曉翻到了最後一頁。
他長長地呼出了一口氣,把文檔放下來。
然後又拿起來。
從第一頁重新開始看。
這一遍他看得更慢,手指在幾個關鍵公式上來回摩挲,腦袋輕微地點著,不知道在跟誰確認什麼。
馬明忍不住了:「怎麼樣?」
湯智曉沒理他。
馬明嘴角抽了抽,轉頭看馬宇騰。
馬宇騰笑了一下,做了個稍安勿躁的手勢。
又過了將近十分鐘,湯智曉終於第二遍看完了。
他抬頭的時候,眼鏡片後面那雙眼睛的神色跟十分鐘前判若兩人。
「馬總……」
湯智曉看著馬宇騰和馬明,喉結動了動。
「這份東西,誰寫的?」
「「我提了些方向性的想法,」馬宇騰語氣隨意。
「裡面的數學論證和推導,主要是我愛人完成的。」
湯智曉的嘴巴微微張開。
他一開始以為這又是哪個領導拍腦袋想出來的「宏偉藍圖」。
卻沒想到裡面竟然是如此嚴謹、完整、且具有開創性的理論框架。
從概念定義,到網絡結構,再到訓練方法,最後是堅實無比的數學基礎,這簡直就是一篇可以直接發表在頂刊上的開山之作!
「不可思議……簡直是天才般的構想!」湯智曉激動地站了起來。
「『無監督逐層預訓練』,這個方法,完美地解決了深層網絡訓練時梯度彌散的難題!這……這將開啟一個全新的時代!」
他看著馬宇騰,眼神里全是敬佩。
馬明坐直了身體,他明白湯智曉的水平,既然對方都對這份文件的內容讚不絕口,證明他之前的看法沒有錯。
湯智曉看著馬宇騰的眼神變了,他沒想到這位國內知名的雷霆工業集團總裁,居然對人工智慧這個前沿領域,也有著如此恐怖的技術積累和洞察力。
馬宇騰坦然地接受了這份讚美。
雖然核心思想來自未來,但在這個時空,這份文檔的作者確實是他和鍾虹。
「湯博士,你覺得這套理論有實際應用的可能性嗎?」
馬宇騰把話題拉了回來。
「有!太有了!」湯智曉毫不猶豫地回答。
「這不僅僅是可能性的問題,它就是我們一直在尋找的答案!有了這個框架,我們之前那些像沒頭蒼蠅一樣的研究,立刻就有了明確的方向!」
「很好。」馬宇騰點了點頭,這正是他想要的結果。
他身體前傾,看著湯智曉和馬明,說出了自己今天真正的目的。
「我希望你們的團隊,能在這套深度學習的理論基礎上,儘快研發出一套新的模型架構。」
「這套架構,要能很好地處理時序數據。它不能只看孤立的、靜態的一幀圖像,而是要能理解一個連續的序列中,不同元素之間的關聯和上下文。比如,一段視頻里,前一秒的車輛位置和速度,與後一秒的行為預測之間的關係。」
馬宇騰沒有提「Transformer」這個名字,但他描述的,正是其核心思想——自注意力機制。
「我需要這套技術,為我們雷霆工業準備研發的自動駕駛系統,提供算法支持。」
「自動駕駛?」馬明和湯智曉幾乎同時出聲。
湯智曉把手裡的文檔放回桌上,直起腰板。
「自動駕駛?」
他重複了一遍這個詞,聲音裡帶著明顯的遲疑。
「馬總,這個方向,說句不好聽的,目前學術界自己都還停留在前期探索的階段,工業界更沒人敢碰。原因很簡單,計算機視覺的識別能力遠遠不夠。別說動態的交通場景了。」
馬宇騰沒有立刻反駁,而是仔細分析道。
「現在的計算機視覺不行,是因為算法模型太淺,特徵提取的能力不夠。」
他指著桌上那份文檔。
「特徵提取做不到位,當然什麼都認不准。但你剛才自己也說了,這套卷積神經網絡加上深度訓練之後,提取能力會有質的飛躍。」
「再疊加我剛才說的那種對序列數據的理解能力後,它就不再是逐幀比對像素了。它開始理解上下文,理解空間關係,理解因果。」
「網絡可以做得極深,深度意味著理解力。湯博士,這個道理你比我清楚。」
湯智曉沒有馬上接話。
他低下頭,翻開文檔里關於序列數據處理的那幾頁,手指在紙面上劃了幾道。
辦公室里安靜了好一陣。
「理論上……有可能。」
他推了推眼鏡,語速放慢了不少。
「但問題在兩個地方。第一,訓練這種規模的模型,需要的數據量是天文數字。光靠實驗室採集,十年也湊不夠。第二,目前的晶片算力不夠,即使利用最先進的GPU也無法實現處理行駛過程中視覺數據的能力。」
馬宇騰看向馬明。
「數據的問題,明訊網絡每天有上億用戶產生的行為數據,這些暫且不說。雷霆汽車未來的產品,每一台車上都會裝車載攝像頭和傳感器。車跑在路上,就是在幫我們采數據。等大量用戶在使用過程中,積累下來的真實道路數據,足夠我們使用了。」
他頓了一下。
「至於算力,按照摩爾定律,晶片每十八個月的性能翻一番。我們不需要等到算力完全夠用的那天才開始動手。模型架構和算法先做出來,數據先存起來。等硬體追上來了,我們就能進入到實際的測試當中。」
「智曉,你來看看這個。」馬明把那份文檔遞了過去。
湯智曉接過來,扶了扶眼鏡,目光落在標題上時,眉毛幾不可查地挑了一下。
顯然,「深度學習」這個新名詞引起了他的注意。
他看得很快,但又很仔細。
一開始,他還站著,身體微微前傾。
看著看著,他不知不覺地拉開一張椅子坐了下來。
再然後,他的腰背挺得筆直,幾乎是趴在桌子上,手指順著紙上的數學公式一行一行地移動,嘴裡還念念有詞,全是些外人聽不懂的術語。
辦公室里的空氣仿佛凝固了。
馬宇騰倒是不急。他端起茶杯喝了一口,靠在沙發上等著。
對方這種反應,說明將裡面的內容看了進去。
馬明一直盯著湯智曉的表情變化,從疑惑到專注,從專注到凝重。
終於,湯智曉翻到了最後一頁。
他長長地呼出了一口氣,把文檔放下來。
然後又拿起來。
從第一頁重新開始看。
這一遍他看得更慢,手指在幾個關鍵公式上來回摩挲,腦袋輕微地點著,不知道在跟誰確認什麼。
馬明忍不住了:「怎麼樣?」
湯智曉沒理他。
馬明嘴角抽了抽,轉頭看馬宇騰。
馬宇騰笑了一下,做了個稍安勿躁的手勢。
又過了將近十分鐘,湯智曉終於第二遍看完了。
他抬頭的時候,眼鏡片後面那雙眼睛的神色跟十分鐘前判若兩人。
「馬總……」
湯智曉看著馬宇騰和馬明,喉結動了動。
「這份東西,誰寫的?」
「「我提了些方向性的想法,」馬宇騰語氣隨意。
「裡面的數學論證和推導,主要是我愛人完成的。」
湯智曉的嘴巴微微張開。
他一開始以為這又是哪個領導拍腦袋想出來的「宏偉藍圖」。
卻沒想到裡面竟然是如此嚴謹、完整、且具有開創性的理論框架。
從概念定義,到網絡結構,再到訓練方法,最後是堅實無比的數學基礎,這簡直就是一篇可以直接發表在頂刊上的開山之作!
「不可思議……簡直是天才般的構想!」湯智曉激動地站了起來。
「『無監督逐層預訓練』,這個方法,完美地解決了深層網絡訓練時梯度彌散的難題!這……這將開啟一個全新的時代!」
他看著馬宇騰,眼神里全是敬佩。
馬明坐直了身體,他明白湯智曉的水平,既然對方都對這份文件的內容讚不絕口,證明他之前的看法沒有錯。
湯智曉看著馬宇騰的眼神變了,他沒想到這位國內知名的雷霆工業集團總裁,居然對人工智慧這個前沿領域,也有著如此恐怖的技術積累和洞察力。
馬宇騰坦然地接受了這份讚美。
雖然核心思想來自未來,但在這個時空,這份文檔的作者確實是他和鍾虹。
「湯博士,你覺得這套理論有實際應用的可能性嗎?」
馬宇騰把話題拉了回來。
「有!太有了!」湯智曉毫不猶豫地回答。
「這不僅僅是可能性的問題,它就是我們一直在尋找的答案!有了這個框架,我們之前那些像沒頭蒼蠅一樣的研究,立刻就有了明確的方向!」
「很好。」馬宇騰點了點頭,這正是他想要的結果。
他身體前傾,看著湯智曉和馬明,說出了自己今天真正的目的。
「我希望你們的團隊,能在這套深度學習的理論基礎上,儘快研發出一套新的模型架構。」
「這套架構,要能很好地處理時序數據。它不能只看孤立的、靜態的一幀圖像,而是要能理解一個連續的序列中,不同元素之間的關聯和上下文。比如,一段視頻里,前一秒的車輛位置和速度,與後一秒的行為預測之間的關係。」
馬宇騰沒有提「Transformer」這個名字,但他描述的,正是其核心思想——自注意力機制。
「我需要這套技術,為我們雷霆工業準備研發的自動駕駛系統,提供算法支持。」
「自動駕駛?」馬明和湯智曉幾乎同時出聲。
湯智曉把手裡的文檔放回桌上,直起腰板。
「自動駕駛?」
他重複了一遍這個詞,聲音裡帶著明顯的遲疑。
「馬總,這個方向,說句不好聽的,目前學術界自己都還停留在前期探索的階段,工業界更沒人敢碰。原因很簡單,計算機視覺的識別能力遠遠不夠。別說動態的交通場景了。」
馬宇騰沒有立刻反駁,而是仔細分析道。
「現在的計算機視覺不行,是因為算法模型太淺,特徵提取的能力不夠。」
他指著桌上那份文檔。
「特徵提取做不到位,當然什麼都認不准。但你剛才自己也說了,這套卷積神經網絡加上深度訓練之後,提取能力會有質的飛躍。」
「再疊加我剛才說的那種對序列數據的理解能力後,它就不再是逐幀比對像素了。它開始理解上下文,理解空間關係,理解因果。」
「網絡可以做得極深,深度意味著理解力。湯博士,這個道理你比我清楚。」
湯智曉沒有馬上接話。
他低下頭,翻開文檔里關於序列數據處理的那幾頁,手指在紙面上劃了幾道。
辦公室里安靜了好一陣。
「理論上……有可能。」
他推了推眼鏡,語速放慢了不少。
「但問題在兩個地方。第一,訓練這種規模的模型,需要的數據量是天文數字。光靠實驗室採集,十年也湊不夠。第二,目前的晶片算力不夠,即使利用最先進的GPU也無法實現處理行駛過程中視覺數據的能力。」
馬宇騰看向馬明。
「數據的問題,明訊網絡每天有上億用戶產生的行為數據,這些暫且不說。雷霆汽車未來的產品,每一台車上都會裝車載攝像頭和傳感器。車跑在路上,就是在幫我們采數據。等大量用戶在使用過程中,積累下來的真實道路數據,足夠我們使用了。」
他頓了一下。
「至於算力,按照摩爾定律,晶片每十八個月的性能翻一番。我們不需要等到算力完全夠用的那天才開始動手。模型架構和算法先做出來,數據先存起來。等硬體追上來了,我們就能進入到實際的測試當中。」