第608章 AI走入死胡同?
郭長征聽完,沒有立刻回答,而是深深地看了一眼夏冬。
他心裡非常驚訝,一個大一剛結束的本科生,居然能一針見血地指出當前人工智慧的瓶頸。
現在的學術界,絕大多數人都在瘋狂地優化那些複雜的數學公式。
大家都在比拼誰能設計出更精妙的人工特徵提取方法。
很少有人去反思,這條路本身是不是從一開始就選錯了。
郭長征嘆了口氣,靠在椅背上。
「夏冬,你觀察得很敏銳。你說的這個問題,確實是現在學術界的一大痛點。」
「我們現在的主流路線,其實走入了一個過度追求數學完美的誤區。」
郭長征開始講解:「大家覺得一個模型好不好,首先看它的數學證明漂不漂亮。」
「支持向量機為什麼火?因為它背後有一套嚴密的統計學習理論支撐。」
「你可以用公式清清楚楚地證明它為什麼能工作,它的誤差上界在哪裡。」
夏冬適時地接話:「但是現實世界的數據是不講數學邏輯的,它們充滿了噪聲和不確定性。」
郭長徵用力地點頭,聲音提高了幾分:「完全正確!」
「所以我一直認為,基於規則和人工特徵的路線,走不遠。」郭長征表達了自己的立場。
夏冬順勢問道:「那郭老師覺得,未來的出路在哪裡?」
郭長征沉默了片刻,似乎在斟酌用詞。
「你應該聽說過人工神經網絡吧?」郭長征問道。
夏冬點點頭,裝作只了解皮毛的樣子:「之前聽過,剛剛在課堂上,老師你也講了。但好像現在不太受歡迎?」
郭長征苦笑了一下:「不是不太受歡迎,是被主流學術界打入冷宮了。」
「上個世紀八十年代,神經網絡火過一陣子,但很快就遭遇了寒冬。」
「原因很簡單,它解釋不清楚。」郭長征解釋道。
「你把數據丟進去,它經過幾層神經元的計算,給你一個結果。」
「但是中間到底發生了什麼?那些權重參數代表什麼物理意義?沒人知道。」
郭長徵用手指敲了敲桌面:「這在講究嚴謹的學術界是致命的。大家叫它『黑盒』。」
「發論文的時候,評審專家會問你,為什麼你的網絡結構是這樣設計的?為什麼要有三層而不是四層?」
「你回答不上來,你就發不了頂會。」
夏冬靜靜地聽著,他知道郭長征說的是事實。
在深度學習全面爆發之前,神經網絡確實經歷了漫長且壓抑的低谷期。
郭長征繼續說道:「但我一直覺得,我們不需要去解釋它。」
這句話引起了夏冬的極大興趣,這和後來那些科技巨頭們的做法不謀而合。
郭長征語氣變得有些興奮:「你想想人類是怎麼學習的?」
「一個小孩子認識貓,是因為他父母給他列出了貓的數學方程嗎?」
夏冬配合地搖頭:「不是,是因為父母指著很多隻貓告訴他,這是貓。」
「對!」郭長征拍了一下大腿。
「小孩子看了幾百隻、幾千隻貓之後,他的大腦里自動就形成了貓的認知。」
「他不需要知道貓耳朵的幾何角度,他只要看一眼就能認出來。」
郭長征做了一個總結:「學習的過程,本來就是一種經驗的積累,而不是邏輯的推演。」
夏冬在心裡給郭長征默默點了個贊。
在2009年,能有這種認知的人,絕對是具有戰略眼光的技術先驅。
郭長征接著拋出了他的核心理念:「所以我信奉一個詞:大力出奇蹟。」
他看著夏冬,一字一句地說:「不要去搞那些花里胡哨的人工規則。」
「只要我們有足夠大的數據量,把成百上千萬張圖片餵給神經網絡。」
「讓網絡自己去調整權重,自己去尋找特徵。」
「只要數據夠多,網絡層數夠深,它最終的效果,絕對會碾壓那些人工設計的算法。」
這段話,完全命中了未來深度學習爆發的核心本質。
夏冬知道,再過一段時間,當ImageNet數據集發布,當AlexNet在圖像識別大賽上以壓倒性優勢奪冠時,整個世界都會明白這個道理。
大數據加上深度神經網絡,這就是未來十幾年人工智慧唯一的正解。
而郭長征,在這個時間節點,已經極其精準地看透了這一切。
「老師,你的想法非常超前。」夏冬由衷地說道。
他沒有用任何誇張的詞彙,只是陳述了一個客觀事實。
郭長征聽到這句認可,臉上的興奮卻迅速退去,取而代之的是深深的無奈。
他重新靠回椅背上,端起紙杯喝了一大口水。
「超前有什麼用?這只是一種理論上的推想。」郭長征語氣低落。
夏冬明知故問:「既然方向是對的,為什麼不去實踐呢?」
郭長征苦笑連連:「實踐?拿什麼實踐?」
他豎起一根手指:「第一,數據。你去哪裡找上百萬張標註好的圖片?」
「現在的網際網路數據雖然多,但都是雜亂無章的,沒有經過清洗和分類,根本沒法用來訓練模型。」
夏冬沒有說話,他知道這是實情。構建高質量的大型數據集,需要耗費極大的人力和財力。
郭長征豎起第二根手指,加重了語氣:「第二,算力。這也是最致命的一點。」
「要訓練你剛才說的那種能夠自己提取特徵的深度神經網絡,計算量是極其恐怖的。」
「涉及到海量的矩陣乘法運算。」
郭長征指了指辦公桌上的電腦:「就靠現在這些CPU?你跑一個最基礎的多層網絡,數據量一上來,可能都要跑上幾天。」
「等幾天出一個結果,如果發現參數設置錯了,又要重頭再來。」
「這種試錯成本,哪個實驗室承擔得起?」
夏冬順著郭長征的思路問道:「難道就沒有更適合做矩陣運算的硬體嗎?」
郭長征點點頭:「有,顯卡。也就是GPU,它的架構天生適合併發運算。」
「其實我知道英偉達搞的那個CUDA架構,這算是一條路。」郭長征眉頭微皺。
「前陣子英偉達的工作人員還專門聯繫過我,說可以提供免費的顯卡給我做科研。」
「能白嫖設備,我當然去試了。但我花時間研究了一段時間CUDA後,發現根本行不通。」
郭長征擺了擺手,表情顯得有些頭疼。
「那玩意兒現在沒有現成的庫可以調用,開發起來極其麻煩。」
「我要把構想的深度算法硬生生跑在CUDA上面,技術難度比較高,簡直是純純的折磨自己。」
「不過嘛……」郭長征話鋒一轉,語氣裡帶了幾分興致。
「最近盛夏科技,搞出了一個叫TensorFlow的框架,這東西倒是挺好的。」
夏冬心裡暗自發笑,表面上卻不動聲色地聽著。
「我最近也一直在學習這個TensorFlow。」郭長征如實說道。
「只是我要做的神經網絡比較複雜,目前還在琢磨怎麼利用好這個TensorFlow。」
【四章奉上!小說的兩個短劇要上了,可以小說右下角,進「更多改編」預約,也可以到紅果app搜書名,預約短劇。因為短劇播放量高,作者也有錢分哈哈】
他心裡非常驚訝,一個大一剛結束的本科生,居然能一針見血地指出當前人工智慧的瓶頸。
現在的學術界,絕大多數人都在瘋狂地優化那些複雜的數學公式。
大家都在比拼誰能設計出更精妙的人工特徵提取方法。
很少有人去反思,這條路本身是不是從一開始就選錯了。
郭長征嘆了口氣,靠在椅背上。
「夏冬,你觀察得很敏銳。你說的這個問題,確實是現在學術界的一大痛點。」
「我們現在的主流路線,其實走入了一個過度追求數學完美的誤區。」
郭長征開始講解:「大家覺得一個模型好不好,首先看它的數學證明漂不漂亮。」
「支持向量機為什麼火?因為它背後有一套嚴密的統計學習理論支撐。」
「你可以用公式清清楚楚地證明它為什麼能工作,它的誤差上界在哪裡。」
夏冬適時地接話:「但是現實世界的數據是不講數學邏輯的,它們充滿了噪聲和不確定性。」
郭長徵用力地點頭,聲音提高了幾分:「完全正確!」
「所以我一直認為,基於規則和人工特徵的路線,走不遠。」郭長征表達了自己的立場。
夏冬順勢問道:「那郭老師覺得,未來的出路在哪裡?」
郭長征沉默了片刻,似乎在斟酌用詞。
「你應該聽說過人工神經網絡吧?」郭長征問道。
夏冬點點頭,裝作只了解皮毛的樣子:「之前聽過,剛剛在課堂上,老師你也講了。但好像現在不太受歡迎?」
郭長征苦笑了一下:「不是不太受歡迎,是被主流學術界打入冷宮了。」
「上個世紀八十年代,神經網絡火過一陣子,但很快就遭遇了寒冬。」
「原因很簡單,它解釋不清楚。」郭長征解釋道。
「你把數據丟進去,它經過幾層神經元的計算,給你一個結果。」
「但是中間到底發生了什麼?那些權重參數代表什麼物理意義?沒人知道。」
郭長徵用手指敲了敲桌面:「這在講究嚴謹的學術界是致命的。大家叫它『黑盒』。」
「發論文的時候,評審專家會問你,為什麼你的網絡結構是這樣設計的?為什麼要有三層而不是四層?」
「你回答不上來,你就發不了頂會。」
夏冬靜靜地聽著,他知道郭長征說的是事實。
在深度學習全面爆發之前,神經網絡確實經歷了漫長且壓抑的低谷期。
郭長征繼續說道:「但我一直覺得,我們不需要去解釋它。」
這句話引起了夏冬的極大興趣,這和後來那些科技巨頭們的做法不謀而合。
郭長征語氣變得有些興奮:「你想想人類是怎麼學習的?」
「一個小孩子認識貓,是因為他父母給他列出了貓的數學方程嗎?」
夏冬配合地搖頭:「不是,是因為父母指著很多隻貓告訴他,這是貓。」
「對!」郭長征拍了一下大腿。
「小孩子看了幾百隻、幾千隻貓之後,他的大腦里自動就形成了貓的認知。」
「他不需要知道貓耳朵的幾何角度,他只要看一眼就能認出來。」
郭長征做了一個總結:「學習的過程,本來就是一種經驗的積累,而不是邏輯的推演。」
夏冬在心裡給郭長征默默點了個贊。
在2009年,能有這種認知的人,絕對是具有戰略眼光的技術先驅。
郭長征接著拋出了他的核心理念:「所以我信奉一個詞:大力出奇蹟。」
他看著夏冬,一字一句地說:「不要去搞那些花里胡哨的人工規則。」
「只要我們有足夠大的數據量,把成百上千萬張圖片餵給神經網絡。」
「讓網絡自己去調整權重,自己去尋找特徵。」
「只要數據夠多,網絡層數夠深,它最終的效果,絕對會碾壓那些人工設計的算法。」
這段話,完全命中了未來深度學習爆發的核心本質。
夏冬知道,再過一段時間,當ImageNet數據集發布,當AlexNet在圖像識別大賽上以壓倒性優勢奪冠時,整個世界都會明白這個道理。
大數據加上深度神經網絡,這就是未來十幾年人工智慧唯一的正解。
而郭長征,在這個時間節點,已經極其精準地看透了這一切。
「老師,你的想法非常超前。」夏冬由衷地說道。
他沒有用任何誇張的詞彙,只是陳述了一個客觀事實。
郭長征聽到這句認可,臉上的興奮卻迅速退去,取而代之的是深深的無奈。
他重新靠回椅背上,端起紙杯喝了一大口水。
「超前有什麼用?這只是一種理論上的推想。」郭長征語氣低落。
夏冬明知故問:「既然方向是對的,為什麼不去實踐呢?」
郭長征苦笑連連:「實踐?拿什麼實踐?」
他豎起一根手指:「第一,數據。你去哪裡找上百萬張標註好的圖片?」
「現在的網際網路數據雖然多,但都是雜亂無章的,沒有經過清洗和分類,根本沒法用來訓練模型。」
夏冬沒有說話,他知道這是實情。構建高質量的大型數據集,需要耗費極大的人力和財力。
郭長征豎起第二根手指,加重了語氣:「第二,算力。這也是最致命的一點。」
「要訓練你剛才說的那種能夠自己提取特徵的深度神經網絡,計算量是極其恐怖的。」
「涉及到海量的矩陣乘法運算。」
郭長征指了指辦公桌上的電腦:「就靠現在這些CPU?你跑一個最基礎的多層網絡,數據量一上來,可能都要跑上幾天。」
「等幾天出一個結果,如果發現參數設置錯了,又要重頭再來。」
「這種試錯成本,哪個實驗室承擔得起?」
夏冬順著郭長征的思路問道:「難道就沒有更適合做矩陣運算的硬體嗎?」
郭長征點點頭:「有,顯卡。也就是GPU,它的架構天生適合併發運算。」
「其實我知道英偉達搞的那個CUDA架構,這算是一條路。」郭長征眉頭微皺。
「前陣子英偉達的工作人員還專門聯繫過我,說可以提供免費的顯卡給我做科研。」
「能白嫖設備,我當然去試了。但我花時間研究了一段時間CUDA後,發現根本行不通。」
郭長征擺了擺手,表情顯得有些頭疼。
「那玩意兒現在沒有現成的庫可以調用,開發起來極其麻煩。」
「我要把構想的深度算法硬生生跑在CUDA上面,技術難度比較高,簡直是純純的折磨自己。」
「不過嘛……」郭長征話鋒一轉,語氣裡帶了幾分興致。
「最近盛夏科技,搞出了一個叫TensorFlow的框架,這東西倒是挺好的。」
夏冬心裡暗自發笑,表面上卻不動聲色地聽著。
「我最近也一直在學習這個TensorFlow。」郭長征如實說道。
「只是我要做的神經網絡比較複雜,目前還在琢磨怎麼利用好這個TensorFlow。」
【四章奉上!小說的兩個短劇要上了,可以小說右下角,進「更多改編」預約,也可以到紅果app搜書名,預約短劇。因為短劇播放量高,作者也有錢分哈哈】