第1966章 平衡的藝術2

投票推薦 加入書籤 小說報錯

  賈瀞雯看著那份測試報告,眉頭皺起來。

  百分之六十二,意味著每三句話里就有一句識別錯誤。

  這樣的產品,根本沒法用。

  「瓶頸在哪兒?」她問。

  「數據。」張濤說,「語音識別需要大量標註好的語音數據。

  我們沒有這方面的積累,要從零開始收集。

  還有算法,現有模型對噪聲、口音的適應性很差。」

  賈瀞雯記下這些,當晚就匯報給了陳浩。

  陳浩聽完,沉默了一會兒。

  「百分之六十二,比我預期的好一點。」他說,「我本來以為會更差。」

  「那怎麼辦?」賈瀞雯問。

  「別急。」陳浩說,「語音識別是長期工程。

  先收集數據,優化模型。

  我把手頭一些資料發給你,可能有用。」

  幾天後,賈瀞雯收到一個壓縮包。

  裡面是幾十篇論文和技術文檔,都是關於語音識別的最新研究。

  有些是英文的,有些是中文的,還有一些是手寫的筆記——陳浩的字跡。

  她把這些資料轉給張濤。

  張濤看了之後,興奮地打電話來:「賈總,這些資料太及時了!有幾篇論文正好解決了我們遇到的問題。」

  接下來的幾個月,語音搜索團隊邊學邊做。

  數據從幾萬條積累到幾十萬條,模型從簡單到複雜。

  準確率從百分之六十二慢慢爬到百分之六十七、六十九。

  但到了百分之七十,又卡住了。

  「七十是個坎。」張濤在評審會上說,「再往上,需要的計算量和數據量成倍增加。

  我們現有的算力不夠,數據也不夠。」

  「需要什麼?」賈瀞雯問。

  「至少再翻一倍的伺服器,還要更多的標註數據。」張濤說,「投入可能要翻番。」

  賈瀞雯算了一下。

  翻番意味著把移動GG聯盟的全部盈餘都投進去,甚至還要從其他項目抽資源。

  她猶豫了。

  當晚的視頻,她把這個難題拋給陳浩。

  陳浩聽完,沒馬上回答。

  他拿起筆,在紙上畫著什麼。

  「瀞雯,我想到一個思路。」他說,「傳統的語音識別,是把聲音轉成文字,再用搜索去匹配。

  但有沒有可能,跳過一個環節?」

  「什麼意思?」

  「直接建立聲音特徵和搜索結果之間的關聯。」陳浩說,「比如用戶說『天氣預報』,系統不是先識別成『天氣預報』這幾個字,再搜天氣。

  而是直接從聲音特徵匹配到天氣這個意圖。」

  賈瀞雯想了想:「聽起來很抽象。

  技術上能實現嗎?」

  「需要算法創新。」陳浩說,「我寫個框架發給你,讓團隊看看。」

  兩天後,一份長達二十頁的手寫文檔發到賈瀞雯郵箱。

  陳浩用鉛筆畫的流程圖,密密麻麻的注釋,還有一些數學公式。

  她轉給張濤。

  一周後的評審會,張濤興奮得聲音都在抖。

  「賈總,陳總的思路通了!」他指著屏幕上的新數據,「我們試了新的算法框架,準確率直接跳到百分之七十六!而且計算量還降低了百分之三十!」

  「怎麼做到的?」賈瀞雯問。

  「他提出的那個端到端模型,跳過了中間的文字轉換環節。」張濤解釋,「聲音特徵直接匹配用戶意圖,少了中間步驟,誤差也少了。

  我們還在優化,理論上能到百分之八十以上。」

  會議室里一片驚嘆。

  賈瀞雯看著那些數據,心裡湧起一種複雜的感覺。

  陳浩不在現場,不參與日常研發,但他總能點破那層迷霧。

  當晚的視頻,她把這個消息告訴陳浩。


  「團隊說,你的思路通了。」她說,「準確率跳到百分之七十六。」

  陳浩笑了:「是他們技術好。

  我只是畫了個草圖。」

  「草圖就夠了。」賈瀞雯說,「每次我們卡住,你總能找到方向。」

  兩人隔著屏幕對視。

  陳浩的眼神很溫和。

  「瀞雯,你知道為什麼嗎?」他說,「因為我在外面,看得更清。

  你們在水裡游,我在岸上看。

  哪裡水深,哪裡水淺,哪裡該拐彎,我看得比你清楚。」

  「那你什麼時候下水?」賈瀞雯問。

  陳浩搖頭:「我不下水。

  我就該在岸上。

  你游你的,我指我的。

  這就是我們的分工。」

  賈瀞雯想了想,笑了。

  是啊,這就是他們的分工。

  她帶著團隊在水裡游,他在岸上看方向。

  一個負責執行,一個負責遠見。

  少了誰都不行。

  「好。」她說,「那我繼續遊了。」

  「游吧。」陳浩說,「遇到看不清的地方,就喊我。」

  掛了視頻,賈瀞雯站在窗前。

  窗外是北京的夜色,萬家燈火。

  她想起五年前,語音搜索還只是一個概念。

  現在,團隊已經能做出百分之七十六準確率的原型。

  五年後呢?也許用戶真的可以對著手機說話,百度就能聽懂。

  這條路很長,很難。

  但方向對了,就不怕慢。

  她轉身回到辦公桌前,繼續看那份技術報告。

  窗外夜色漸深。

  辦公室里,鍵盤聲輕輕響起。

  【跪求禮物,免費的為愛發電也行!】

章節目錄