第117章 行業手術刀
第117章 行業手術刀
第二天。
周日。
小和山工業大學。
圖文信息中心第一學術報告廳。
籌備許久的聯合實驗室項目終於開始了。
參會的除了京大來的學者外,還有搜狗的王小川,天涯社區的邢明,科大訊飛的劉慶峰等人。
除了這些本土企業外,微軟、AMD和蘋果也都如期前來捧場。
而小和山工業大學這邊也給夠了面子。
不僅喊來了市科技局的主管領導,甚至還有省教育廳專門負責高校科研的處長。
所以原本一個簡單的聯合實驗室成立儀式,竟然有種向著行業峰值發展的趨勢。
在各位領導講話完畢後,終於輪到吳辰上場了。
今天他沒有穿著短袖和牛仔褲,甚至不是姜楠之前給他的那件休閒西裝。
而是昨晚逛街時,姜楠和陳蓓桃兩人挑了很多遍的一套正式西裝。
不過在吳辰看來,好像和賣保險的哥也沒區別。
說完開場的客套話後,吳辰直接講起了這次會議的主題。
「————今天我們不談遙遠的概念,只展示一項已經初步落地,並且立刻能為各位的業務注入活力的技術。」
「首先是關於語義理解和糾錯。」
「我們都知道,國內用戶當前主要使用拼音輸入法。」
「雖然相對智能ABC,搜狗和訊飛智能輸入法已經做到了更進一步的智能,但離真正的智能,還有一些差距。」
「例如用戶輸入:wo iang qu i zao。」
「傳統的輸入法,會輸出:我想去洗棗。」
「而使用語音輸入,這個問題更加明顯,例如下面的例子。」
」【jin tian tian qi bu cuo。】」
「目前的輸入法,識別出的結果是:【驚天天氣不錯。】」
「雖然我們能理解意思,但用屍體驗卻明顯說不上好,所以在目前激烈的競爭中,很難做到一家獨大。」
「針對這個痛點,我做出了如下改進。」
「輸入法的輸出,不能是簡單的詞庫匹配,而是讓最終的輸出結果,通過用戶一句話完整的語義,來進行後糾錯!」
吳辰運行了提前準備好的程序。
瞬間,錯誤被自動修正了。
同樣輸入【woiangquizao】,輸出的結果先是【我想去洗棗】,然後又瞬間糾正為【我想去洗澡】。
同樣針對語言輸入的【jintiantianqibucuo】,也在不到半秒的時間後,輸出為【今天天氣不錯】。
甚至吳辰還用方言測試了一下,效果依然完美。
台下,搜狗的王小川和科大訊飛的劉慶峰兩人面面相覷,眼神中都透露著一股興奮————
和恐懼。
做為輸入法行業的大佬,他們明顯看出來,吳辰和他們的技術完全不一樣。
這種錯誤糾正本身不難,他們也能做到。
但問題在於實時性和上下文的理解深度。
現在的輸入法技術是基於統計模型的(N—gram)。
也就是根據上一個詞猜下一個詞,說白了就是近視眼。
而吳辰展示的技術,仿佛有一雙能看透過去現在未來的眼睛。
它看完了整句話,理解了洗澡和洗棗的邏輯差異後,才做出的修改。
這不是傳統的概率猜測。
這是理解!
本來今天他們過來,本來是準備投資一項技術的。
但現在讓他們沒想到的是,吳辰已經完成了這項技術!
如果他直接下場做輸入法的話,那他們將面臨著一個前所未有的對手!
天涯的負責人刑明正好坐在他們旁邊。
看著兩人的表情,刑明不禁偷笑出了聲。
這幫搞技術的平時總覺得自己高人一等,看不起他們做社區的。
結果在絕對的降維打擊面前,他們那引以為傲的核心技術,跟小學生差不多。
不過留給王小川和劉慶峰震驚的時間並不多。
留給刑明快樂吃瓜的時間也不多。
因為吳辰很快就翻到了下一頁PPT,似乎這只是一項輕描淡寫的技術。
「接下來,則是我們要思考的另一個問題。」
「既然我們已經能知道用戶的輸入,那麼能否知道他們到底在說什麼?」
「大家都知道,當今世界網絡飛速發展,我們可以和世界各地的人們在網際網路上暢通無阻的交流。」
「但除了正常交流外,總有些人想破壞這個和諧的環境。」
「因此內容的審查,就成了一項極其高昂的成本開支。」
「比如這樣一段話:」
「【這屆專家真是太有良心了,建議我們現在不要買房,真是為了我們好,等房價漲到天上去我們再買,那時候才顯身份嘛】。
「它看似是在讚揚專家,用的都是肯定詞彙。」
「但實際上卻是極度的反諷,表達了對專家言論的憤怒和對高房價的無奈。」
「當前的解決手段,主要還是利用關鍵詞審核和屏蔽。」
「但群眾的智慧是無限的,這種方法很容易通過諧音梗或者是分字來表達。」
「例如【好】字,就可以分解為【女子】。」
「這就對網絡社區的環境審查造成了極其嚴重的挑戰。」
「那麼解決方案呢,目前雖然能有簡單的語文情感傾向判斷,但卻沒有任何實用價值。」
「而我則針對這一痛點,提供了一種情感分析和長文本理解的技術。」
「簡單來說,就是它不僅能識別表面的關鍵詞,還能探究用戶的真正意圖。
「」
「最終的效果,就是針對上面的那句話,可以得到如下結果。」
「情感傾向:負面(諷刺/憤怒)」
「違規風險:高。」
「核心摘要:對房價表達了不滿,並攻擊專家言論,存在煽動情緒風險。」
吳辰的這一頁PPT還沒講完,刑明就已經坐不住了。
身為天涯社區的負責人,他太知道天涯現在面臨的監管壓力有多大了。
奧運年之後,審核標準空前嚴格,天涯有數百人的審核團隊,每天三班倒盯著屏幕看。
如果這項技術能夠投入實用的話,他一年能省下多少人工審核的錢啊!
而且最關鍵的是,還能精準投送GG!
刑明瞬間激動的就想跳起來衝上去哪,然後問吳辰要不要股份,要不要女人,要不要大House。
只要他能將這項技術賣給自己,他什麼都可以做!
看到他激動的模樣,王小川和劉慶峰對視一眼後,同時撇了撇嘴。
別看天涯現在如日中天,但他們難道不想分一杯羹嗎?
搜狗連百度都敢硬剛,區區一個天涯又能怎樣。
而且天涯能拿的錢比他們還多嗎?
相對國內眾廠商的浮躁,微軟,AMD和蘋果這些廠商的代表就要淡定的多。
像大衛和馬克這樣的老熟人,已經和吳辰建立了深度的合作。
而且更重要的是他們有錢。
國內廠商掏多少,他們可以掏雙倍的價格!
不過在他們看來,吳辰這次展現出來的技術雖然驚艷,但卻還沒到初看word2Vec和openGL架構時的激動。
一是因為國外的網際網路環境更開放一些。
二是因為不管輸入法還是中文社區的情感分析,對他們這些全球化巨頭來說,只是錦上添花的本地化業務,並非核心命脈。
他們更關心這項技術在通用領域的潛力。
不過當吳辰切換到下一頁PPT時,所有人都不由的坐直了身體,然後發出了低低的驚呼聲。
第二天。
周日。
小和山工業大學。
圖文信息中心第一學術報告廳。
籌備許久的聯合實驗室項目終於開始了。
參會的除了京大來的學者外,還有搜狗的王小川,天涯社區的邢明,科大訊飛的劉慶峰等人。
除了這些本土企業外,微軟、AMD和蘋果也都如期前來捧場。
而小和山工業大學這邊也給夠了面子。
不僅喊來了市科技局的主管領導,甚至還有省教育廳專門負責高校科研的處長。
所以原本一個簡單的聯合實驗室成立儀式,竟然有種向著行業峰值發展的趨勢。
在各位領導講話完畢後,終於輪到吳辰上場了。
今天他沒有穿著短袖和牛仔褲,甚至不是姜楠之前給他的那件休閒西裝。
而是昨晚逛街時,姜楠和陳蓓桃兩人挑了很多遍的一套正式西裝。
不過在吳辰看來,好像和賣保險的哥也沒區別。
說完開場的客套話後,吳辰直接講起了這次會議的主題。
「————今天我們不談遙遠的概念,只展示一項已經初步落地,並且立刻能為各位的業務注入活力的技術。」
「首先是關於語義理解和糾錯。」
「我們都知道,國內用戶當前主要使用拼音輸入法。」
「雖然相對智能ABC,搜狗和訊飛智能輸入法已經做到了更進一步的智能,但離真正的智能,還有一些差距。」
「例如用戶輸入:wo iang qu i zao。」
「傳統的輸入法,會輸出:我想去洗棗。」
「而使用語音輸入,這個問題更加明顯,例如下面的例子。」
」【jin tian tian qi bu cuo。】」
「目前的輸入法,識別出的結果是:【驚天天氣不錯。】」
「雖然我們能理解意思,但用屍體驗卻明顯說不上好,所以在目前激烈的競爭中,很難做到一家獨大。」
「針對這個痛點,我做出了如下改進。」
「輸入法的輸出,不能是簡單的詞庫匹配,而是讓最終的輸出結果,通過用戶一句話完整的語義,來進行後糾錯!」
吳辰運行了提前準備好的程序。
瞬間,錯誤被自動修正了。
同樣輸入【woiangquizao】,輸出的結果先是【我想去洗棗】,然後又瞬間糾正為【我想去洗澡】。
同樣針對語言輸入的【jintiantianqibucuo】,也在不到半秒的時間後,輸出為【今天天氣不錯】。
甚至吳辰還用方言測試了一下,效果依然完美。
台下,搜狗的王小川和科大訊飛的劉慶峰兩人面面相覷,眼神中都透露著一股興奮————
和恐懼。
做為輸入法行業的大佬,他們明顯看出來,吳辰和他們的技術完全不一樣。
這種錯誤糾正本身不難,他們也能做到。
但問題在於實時性和上下文的理解深度。
現在的輸入法技術是基於統計模型的(N—gram)。
也就是根據上一個詞猜下一個詞,說白了就是近視眼。
而吳辰展示的技術,仿佛有一雙能看透過去現在未來的眼睛。
它看完了整句話,理解了洗澡和洗棗的邏輯差異後,才做出的修改。
這不是傳統的概率猜測。
這是理解!
本來今天他們過來,本來是準備投資一項技術的。
但現在讓他們沒想到的是,吳辰已經完成了這項技術!
如果他直接下場做輸入法的話,那他們將面臨著一個前所未有的對手!
天涯的負責人刑明正好坐在他們旁邊。
看著兩人的表情,刑明不禁偷笑出了聲。
這幫搞技術的平時總覺得自己高人一等,看不起他們做社區的。
結果在絕對的降維打擊面前,他們那引以為傲的核心技術,跟小學生差不多。
不過留給王小川和劉慶峰震驚的時間並不多。
留給刑明快樂吃瓜的時間也不多。
因為吳辰很快就翻到了下一頁PPT,似乎這只是一項輕描淡寫的技術。
「接下來,則是我們要思考的另一個問題。」
「既然我們已經能知道用戶的輸入,那麼能否知道他們到底在說什麼?」
「大家都知道,當今世界網絡飛速發展,我們可以和世界各地的人們在網際網路上暢通無阻的交流。」
「但除了正常交流外,總有些人想破壞這個和諧的環境。」
「因此內容的審查,就成了一項極其高昂的成本開支。」
「比如這樣一段話:」
「【這屆專家真是太有良心了,建議我們現在不要買房,真是為了我們好,等房價漲到天上去我們再買,那時候才顯身份嘛】。
「它看似是在讚揚專家,用的都是肯定詞彙。」
「但實際上卻是極度的反諷,表達了對專家言論的憤怒和對高房價的無奈。」
「當前的解決手段,主要還是利用關鍵詞審核和屏蔽。」
「但群眾的智慧是無限的,這種方法很容易通過諧音梗或者是分字來表達。」
「例如【好】字,就可以分解為【女子】。」
「這就對網絡社區的環境審查造成了極其嚴重的挑戰。」
「那麼解決方案呢,目前雖然能有簡單的語文情感傾向判斷,但卻沒有任何實用價值。」
「而我則針對這一痛點,提供了一種情感分析和長文本理解的技術。」
「簡單來說,就是它不僅能識別表面的關鍵詞,還能探究用戶的真正意圖。
「」
「最終的效果,就是針對上面的那句話,可以得到如下結果。」
「情感傾向:負面(諷刺/憤怒)」
「違規風險:高。」
「核心摘要:對房價表達了不滿,並攻擊專家言論,存在煽動情緒風險。」
吳辰的這一頁PPT還沒講完,刑明就已經坐不住了。
身為天涯社區的負責人,他太知道天涯現在面臨的監管壓力有多大了。
奧運年之後,審核標準空前嚴格,天涯有數百人的審核團隊,每天三班倒盯著屏幕看。
如果這項技術能夠投入實用的話,他一年能省下多少人工審核的錢啊!
而且最關鍵的是,還能精準投送GG!
刑明瞬間激動的就想跳起來衝上去哪,然後問吳辰要不要股份,要不要女人,要不要大House。
只要他能將這項技術賣給自己,他什麼都可以做!
看到他激動的模樣,王小川和劉慶峰對視一眼後,同時撇了撇嘴。
別看天涯現在如日中天,但他們難道不想分一杯羹嗎?
搜狗連百度都敢硬剛,區區一個天涯又能怎樣。
而且天涯能拿的錢比他們還多嗎?
相對國內眾廠商的浮躁,微軟,AMD和蘋果這些廠商的代表就要淡定的多。
像大衛和馬克這樣的老熟人,已經和吳辰建立了深度的合作。
而且更重要的是他們有錢。
國內廠商掏多少,他們可以掏雙倍的價格!
不過在他們看來,吳辰這次展現出來的技術雖然驚艷,但卻還沒到初看word2Vec和openGL架構時的激動。
一是因為國外的網際網路環境更開放一些。
二是因為不管輸入法還是中文社區的情感分析,對他們這些全球化巨頭來說,只是錦上添花的本地化業務,並非核心命脈。
他們更關心這項技術在通用領域的潛力。
不過當吳辰切換到下一頁PPT時,所有人都不由的坐直了身體,然後發出了低低的驚呼聲。