第1966章 平衡的藝術2
賈瀞雯看著那份測試報告,眉頭皺起來。
百分之六十二,意味著每三句話里就有一句識別錯誤。
這樣的產品,根本沒法用。
「瓶頸在哪兒?」她問。
「數據。」張濤說,「語音識別需要大量標註好的語音數據。
我們沒有這方面的積累,要從零開始收集。
還有算法,現有模型對噪聲、口音的適應性很差。」
賈瀞雯記下這些,當晚就匯報給了陳浩。
陳浩聽完,沉默了一會兒。
「百分之六十二,比我預期的好一點。」他說,「我本來以為會更差。」
「那怎麼辦?」賈瀞雯問。
「別急。」陳浩說,「語音識別是長期工程。
先收集數據,優化模型。
我把手頭一些資料發給你,可能有用。」
幾天後,賈瀞雯收到一個壓縮包。
裡面是幾十篇論文和技術文檔,都是關於語音識別的最新研究。
有些是英文的,有些是中文的,還有一些是手寫的筆記——陳浩的字跡。
她把這些資料轉給張濤。
張濤看了之後,興奮地打電話來:「賈總,這些資料太及時了!有幾篇論文正好解決了我們遇到的問題。」
接下來的幾個月,語音搜索團隊邊學邊做。
數據從幾萬條積累到幾十萬條,模型從簡單到複雜。
準確率從百分之六十二慢慢爬到百分之六十七、六十九。
但到了百分之七十,又卡住了。
「七十是個坎。」張濤在評審會上說,「再往上,需要的計算量和數據量成倍增加。
我們現有的算力不夠,數據也不夠。」
「需要什麼?」賈瀞雯問。
「至少再翻一倍的伺服器,還要更多的標註數據。」張濤說,「投入可能要翻番。」
賈瀞雯算了一下。
翻番意味著把移動GG聯盟的全部盈餘都投進去,甚至還要從其他項目抽資源。
她猶豫了。
當晚的視頻,她把這個難題拋給陳浩。
陳浩聽完,沒馬上回答。
他拿起筆,在紙上畫著什麼。
「瀞雯,我想到一個思路。」他說,「傳統的語音識別,是把聲音轉成文字,再用搜索去匹配。
但有沒有可能,跳過一個環節?」
「什麼意思?」
「直接建立聲音特徵和搜索結果之間的關聯。」陳浩說,「比如用戶說『天氣預報』,系統不是先識別成『天氣預報』這幾個字,再搜天氣。
而是直接從聲音特徵匹配到天氣這個意圖。」
賈瀞雯想了想:「聽起來很抽象。
技術上能實現嗎?」
「需要算法創新。」陳浩說,「我寫個框架發給你,讓團隊看看。」
兩天後,一份長達二十頁的手寫文檔發到賈瀞雯郵箱。
陳浩用鉛筆畫的流程圖,密密麻麻的注釋,還有一些數學公式。
她轉給張濤。
一周後的評審會,張濤興奮得聲音都在抖。
「賈總,陳總的思路通了!」他指著屏幕上的新數據,「我們試了新的算法框架,準確率直接跳到百分之七十六!而且計算量還降低了百分之三十!」
「怎麼做到的?」賈瀞雯問。
「他提出的那個端到端模型,跳過了中間的文字轉換環節。」張濤解釋,「聲音特徵直接匹配用戶意圖,少了中間步驟,誤差也少了。
我們還在優化,理論上能到百分之八十以上。」
會議室里一片驚嘆。
賈瀞雯看著那些數據,心裡湧起一種複雜的感覺。
陳浩不在現場,不參與日常研發,但他總能點破那層迷霧。
當晚的視頻,她把這個消息告訴陳浩。
「團隊說,你的思路通了。」她說,「準確率跳到百分之七十六。」
陳浩笑了:「是他們技術好。
我只是畫了個草圖。」
「草圖就夠了。」賈瀞雯說,「每次我們卡住,你總能找到方向。」
兩人隔著屏幕對視。
陳浩的眼神很溫和。
「瀞雯,你知道為什麼嗎?」他說,「因為我在外面,看得更清。
你們在水裡游,我在岸上看。
哪裡水深,哪裡水淺,哪裡該拐彎,我看得比你清楚。」
「那你什麼時候下水?」賈瀞雯問。
陳浩搖頭:「我不下水。
我就該在岸上。
你游你的,我指我的。
這就是我們的分工。」
賈瀞雯想了想,笑了。
是啊,這就是他們的分工。
她帶著團隊在水裡游,他在岸上看方向。
一個負責執行,一個負責遠見。
少了誰都不行。
「好。」她說,「那我繼續遊了。」
「游吧。」陳浩說,「遇到看不清的地方,就喊我。」
掛了視頻,賈瀞雯站在窗前。
窗外是北京的夜色,萬家燈火。
她想起五年前,語音搜索還只是一個概念。
現在,團隊已經能做出百分之七十六準確率的原型。
五年後呢?也許用戶真的可以對著手機說話,百度就能聽懂。
這條路很長,很難。
但方向對了,就不怕慢。
她轉身回到辦公桌前,繼續看那份技術報告。
窗外夜色漸深。
辦公室里,鍵盤聲輕輕響起。
【跪求禮物,免費的為愛發電也行!】
百分之六十二,意味著每三句話里就有一句識別錯誤。
這樣的產品,根本沒法用。
「瓶頸在哪兒?」她問。
「數據。」張濤說,「語音識別需要大量標註好的語音數據。
我們沒有這方面的積累,要從零開始收集。
還有算法,現有模型對噪聲、口音的適應性很差。」
賈瀞雯記下這些,當晚就匯報給了陳浩。
陳浩聽完,沉默了一會兒。
「百分之六十二,比我預期的好一點。」他說,「我本來以為會更差。」
「那怎麼辦?」賈瀞雯問。
「別急。」陳浩說,「語音識別是長期工程。
先收集數據,優化模型。
我把手頭一些資料發給你,可能有用。」
幾天後,賈瀞雯收到一個壓縮包。
裡面是幾十篇論文和技術文檔,都是關於語音識別的最新研究。
有些是英文的,有些是中文的,還有一些是手寫的筆記——陳浩的字跡。
她把這些資料轉給張濤。
張濤看了之後,興奮地打電話來:「賈總,這些資料太及時了!有幾篇論文正好解決了我們遇到的問題。」
接下來的幾個月,語音搜索團隊邊學邊做。
數據從幾萬條積累到幾十萬條,模型從簡單到複雜。
準確率從百分之六十二慢慢爬到百分之六十七、六十九。
但到了百分之七十,又卡住了。
「七十是個坎。」張濤在評審會上說,「再往上,需要的計算量和數據量成倍增加。
我們現有的算力不夠,數據也不夠。」
「需要什麼?」賈瀞雯問。
「至少再翻一倍的伺服器,還要更多的標註數據。」張濤說,「投入可能要翻番。」
賈瀞雯算了一下。
翻番意味著把移動GG聯盟的全部盈餘都投進去,甚至還要從其他項目抽資源。
她猶豫了。
當晚的視頻,她把這個難題拋給陳浩。
陳浩聽完,沒馬上回答。
他拿起筆,在紙上畫著什麼。
「瀞雯,我想到一個思路。」他說,「傳統的語音識別,是把聲音轉成文字,再用搜索去匹配。
但有沒有可能,跳過一個環節?」
「什麼意思?」
「直接建立聲音特徵和搜索結果之間的關聯。」陳浩說,「比如用戶說『天氣預報』,系統不是先識別成『天氣預報』這幾個字,再搜天氣。
而是直接從聲音特徵匹配到天氣這個意圖。」
賈瀞雯想了想:「聽起來很抽象。
技術上能實現嗎?」
「需要算法創新。」陳浩說,「我寫個框架發給你,讓團隊看看。」
兩天後,一份長達二十頁的手寫文檔發到賈瀞雯郵箱。
陳浩用鉛筆畫的流程圖,密密麻麻的注釋,還有一些數學公式。
她轉給張濤。
一周後的評審會,張濤興奮得聲音都在抖。
「賈總,陳總的思路通了!」他指著屏幕上的新數據,「我們試了新的算法框架,準確率直接跳到百分之七十六!而且計算量還降低了百分之三十!」
「怎麼做到的?」賈瀞雯問。
「他提出的那個端到端模型,跳過了中間的文字轉換環節。」張濤解釋,「聲音特徵直接匹配用戶意圖,少了中間步驟,誤差也少了。
我們還在優化,理論上能到百分之八十以上。」
會議室里一片驚嘆。
賈瀞雯看著那些數據,心裡湧起一種複雜的感覺。
陳浩不在現場,不參與日常研發,但他總能點破那層迷霧。
當晚的視頻,她把這個消息告訴陳浩。
「團隊說,你的思路通了。」她說,「準確率跳到百分之七十六。」
陳浩笑了:「是他們技術好。
我只是畫了個草圖。」
「草圖就夠了。」賈瀞雯說,「每次我們卡住,你總能找到方向。」
兩人隔著屏幕對視。
陳浩的眼神很溫和。
「瀞雯,你知道為什麼嗎?」他說,「因為我在外面,看得更清。
你們在水裡游,我在岸上看。
哪裡水深,哪裡水淺,哪裡該拐彎,我看得比你清楚。」
「那你什麼時候下水?」賈瀞雯問。
陳浩搖頭:「我不下水。
我就該在岸上。
你游你的,我指我的。
這就是我們的分工。」
賈瀞雯想了想,笑了。
是啊,這就是他們的分工。
她帶著團隊在水裡游,他在岸上看方向。
一個負責執行,一個負責遠見。
少了誰都不行。
「好。」她說,「那我繼續遊了。」
「游吧。」陳浩說,「遇到看不清的地方,就喊我。」
掛了視頻,賈瀞雯站在窗前。
窗外是北京的夜色,萬家燈火。
她想起五年前,語音搜索還只是一個概念。
現在,團隊已經能做出百分之七十六準確率的原型。
五年後呢?也許用戶真的可以對著手機說話,百度就能聽懂。
這條路很長,很難。
但方向對了,就不怕慢。
她轉身回到辦公桌前,繼續看那份技術報告。
窗外夜色漸深。
辦公室里,鍵盤聲輕輕響起。
【跪求禮物,免費的為愛發電也行!】