第117章 行業手術刀

投票推薦 加入書籤 小說報錯

  第117章 行業手術刀

  第二天。

  周日。

  小和山工業大學。

  圖文信息中心第一學術報告廳。

  籌備許久的聯合實驗室項目終於開始了。

  參會的除了京大來的學者外,還有搜狗的王小川,天涯社區的邢明,科大訊飛的劉慶峰等人。

  除了這些本土企業外,微軟、AMD和蘋果也都如期前來捧場。

  而小和山工業大學這邊也給夠了面子。

  不僅喊來了市科技局的主管領導,甚至還有省教育廳專門負責高校科研的處長。

  所以原本一個簡單的聯合實驗室成立儀式,竟然有種向著行業峰值發展的趨勢。

  在各位領導講話完畢後,終於輪到吳辰上場了。

  今天他沒有穿著短袖和牛仔褲,甚至不是姜楠之前給他的那件休閒西裝。

  而是昨晚逛街時,姜楠和陳蓓桃兩人挑了很多遍的一套正式西裝。

  不過在吳辰看來,好像和賣保險的哥也沒區別。

  說完開場的客套話後,吳辰直接講起了這次會議的主題。

  「————今天我們不談遙遠的概念,只展示一項已經初步落地,並且立刻能為各位的業務注入活力的技術。」

  「首先是關於語義理解和糾錯。」

  「我們都知道,國內用戶當前主要使用拼音輸入法。」

  「雖然相對智能ABC,搜狗和訊飛智能輸入法已經做到了更進一步的智能,但離真正的智能,還有一些差距。」

  「例如用戶輸入:wo iang qu i zao。」

  「傳統的輸入法,會輸出:我想去洗棗。」

  「而使用語音輸入,這個問題更加明顯,例如下面的例子。」

  」【jin tian tian qi bu cuo。】」

  「目前的輸入法,識別出的結果是:【驚天天氣不錯。】」

  「雖然我們能理解意思,但用屍體驗卻明顯說不上好,所以在目前激烈的競爭中,很難做到一家獨大。」

  「針對這個痛點,我做出了如下改進。」

  「輸入法的輸出,不能是簡單的詞庫匹配,而是讓最終的輸出結果,通過用戶一句話完整的語義,來進行後糾錯!」

  吳辰運行了提前準備好的程序。

  瞬間,錯誤被自動修正了。

  同樣輸入【woiangquizao】,輸出的結果先是【我想去洗棗】,然後又瞬間糾正為【我想去洗澡】。

  同樣針對語言輸入的【jintiantianqibucuo】,也在不到半秒的時間後,輸出為【今天天氣不錯】。

  甚至吳辰還用方言測試了一下,效果依然完美。

  台下,搜狗的王小川和科大訊飛的劉慶峰兩人面面相覷,眼神中都透露著一股興奮————

  和恐懼。

  做為輸入法行業的大佬,他們明顯看出來,吳辰和他們的技術完全不一樣。

  這種錯誤糾正本身不難,他們也能做到。

  但問題在於實時性和上下文的理解深度。

  現在的輸入法技術是基於統計模型的(N—gram)。

  也就是根據上一個詞猜下一個詞,說白了就是近視眼。

  而吳辰展示的技術,仿佛有一雙能看透過去現在未來的眼睛。

  它看完了整句話,理解了洗澡和洗棗的邏輯差異後,才做出的修改。

  這不是傳統的概率猜測。

  這是理解!

  本來今天他們過來,本來是準備投資一項技術的。

  但現在讓他們沒想到的是,吳辰已經完成了這項技術!

  如果他直接下場做輸入法的話,那他們將面臨著一個前所未有的對手!

  天涯的負責人刑明正好坐在他們旁邊。

  看著兩人的表情,刑明不禁偷笑出了聲。

  這幫搞技術的平時總覺得自己高人一等,看不起他們做社區的。


  結果在絕對的降維打擊面前,他們那引以為傲的核心技術,跟小學生差不多。

  不過留給王小川和劉慶峰震驚的時間並不多。

  留給刑明快樂吃瓜的時間也不多。

  因為吳辰很快就翻到了下一頁PPT,似乎這只是一項輕描淡寫的技術。

  「接下來,則是我們要思考的另一個問題。」

  「既然我們已經能知道用戶的輸入,那麼能否知道他們到底在說什麼?」

  「大家都知道,當今世界網絡飛速發展,我們可以和世界各地的人們在網際網路上暢通無阻的交流。」

  「但除了正常交流外,總有些人想破壞這個和諧的環境。」

  「因此內容的審查,就成了一項極其高昂的成本開支。」

  「比如這樣一段話:」

  「【這屆專家真是太有良心了,建議我們現在不要買房,真是為了我們好,等房價漲到天上去我們再買,那時候才顯身份嘛】。

  「它看似是在讚揚專家,用的都是肯定詞彙。」

  「但實際上卻是極度的反諷,表達了對專家言論的憤怒和對高房價的無奈。」

  「當前的解決手段,主要還是利用關鍵詞審核和屏蔽。」

  「但群眾的智慧是無限的,這種方法很容易通過諧音梗或者是分字來表達。」

  「例如【好】字,就可以分解為【女子】。」

  「這就對網絡社區的環境審查造成了極其嚴重的挑戰。」

  「那麼解決方案呢,目前雖然能有簡單的語文情感傾向判斷,但卻沒有任何實用價值。」

  「而我則針對這一痛點,提供了一種情感分析和長文本理解的技術。」

  「簡單來說,就是它不僅能識別表面的關鍵詞,還能探究用戶的真正意圖。

  「」

  「最終的效果,就是針對上面的那句話,可以得到如下結果。」

  「情感傾向:負面(諷刺/憤怒)」

  「違規風險:高。」

  「核心摘要:對房價表達了不滿,並攻擊專家言論,存在煽動情緒風險。」

  吳辰的這一頁PPT還沒講完,刑明就已經坐不住了。

  身為天涯社區的負責人,他太知道天涯現在面臨的監管壓力有多大了。

  奧運年之後,審核標準空前嚴格,天涯有數百人的審核團隊,每天三班倒盯著屏幕看。

  如果這項技術能夠投入實用的話,他一年能省下多少人工審核的錢啊!

  而且最關鍵的是,還能精準投送GG!

  刑明瞬間激動的就想跳起來衝上去哪,然後問吳辰要不要股份,要不要女人,要不要大House。

  只要他能將這項技術賣給自己,他什麼都可以做!

  看到他激動的模樣,王小川和劉慶峰對視一眼後,同時撇了撇嘴。

  別看天涯現在如日中天,但他們難道不想分一杯羹嗎?

  搜狗連百度都敢硬剛,區區一個天涯又能怎樣。

  而且天涯能拿的錢比他們還多嗎?

  相對國內眾廠商的浮躁,微軟,AMD和蘋果這些廠商的代表就要淡定的多。

  像大衛和馬克這樣的老熟人,已經和吳辰建立了深度的合作。

  而且更重要的是他們有錢。

  國內廠商掏多少,他們可以掏雙倍的價格!

  不過在他們看來,吳辰這次展現出來的技術雖然驚艷,但卻還沒到初看word2Vec和openGL架構時的激動。

  一是因為國外的網際網路環境更開放一些。

  二是因為不管輸入法還是中文社區的情感分析,對他們這些全球化巨頭來說,只是錦上添花的本地化業務,並非核心命脈。

  他們更關心這項技術在通用領域的潛力。

  不過當吳辰切換到下一頁PPT時,所有人都不由的坐直了身體,然後發出了低低的驚呼聲。

章節目錄