第116章 沉默的溫柔
第116章 沉默的溫柔
榛果Seek回答問題時有時聰明,有時智障,其實有一個重要原因。
那就是:過擬合。
它的參數量不夠大,泛化能力沒有湧現,所以它的回答無限接近於閔欣柔整理好的語料。
而且為了讓回答有意義,吳辰不得不降低模型的發散性,它在面對未知領域時顯得更加呆板。
不過過擬合也有好處。
在2008年這個蠻荒時代,過擬合恰恰是一個巨大的護城河。
在大家還不知道大模型存在時,他們絕不會想到屏幕上那些引經據典、語氣滄桑的文字,竟然不是真人敲出來的。
AI最擅長的,就是用確定的語氣,回答已知的存量知識。
那麼針對它的這個特點,目前最好的一個產品:
就是:問答社區!
2008年是一個非常特殊的時間點。
此時國外的Quora還要一年才成立,國內的知乎還要兩年才成立。
所以這個世界上,還沒有一個高質量的問答社區。
大洋彼岸的Quora要等到明年才成立,國內的知乎更是兩年後的產物。
此時的中文網際網路,是一片知識荒漠。
大家找答案,要麼在搜尋引擎的GG里大海撈針,要麼去百度知道看那些樓主好人、同求甚至是複製粘貼的垃圾信息。
那高質量的回答有沒有呢?
自然是有的。
但它們散落在天涯的深水區、貓撲的置頂帖、貼吧的精品區里,像珍珠一樣被泥沙掩埋。
吳辰要做的,就是把這些珍珠串起來,做一個聚合全球智慧(其實是AI馬甲)的高端社區!
而且要牆內牆外兩開花!
聽到他的計劃,閔欣柔的眼中也亮起了光。
做為一個程式設計師,最難受的不是開發軟體時的困難。
最難受的是開發出來的軟體沒有人用!
吳辰上輩子的導師就曾說過,一款軟體做的太好但是沒人用的話。
那就是垃圾!
所以聽到自己寫的算法和清洗的數據,將成為全球數億用戶獲取知識的源頭,閔欣柔也很是激動。
這種成就,真的很難用錢來衡量!
「老師,我想幫您!」
閔欣柔期盼的說。
吳辰點了點頭。
「我和你說這些,自然就是想讓你也參與其中————不過我有個要求。」
他敲了敲桌子,嚴肅道:「我所有的想法,你都不能輕易透露給別人,明白嗎?」
「明白!」
閔欣柔使勁點頭,恨不得賭咒發誓自己會絕對忠誠。
當然吳辰也不需要她這樣。
分詞算法雖然重要。
但最核心的Transformer架構和模型權重,已經被他封裝在只有他能解開的黑盒裡了。
時光匆匆。
吳辰白天在學校教書,晚上回來就優化當前的榛果Seek1.0,周末還要和姜楠去深圳的電子廠視察。
但付出總是有回報的。
在以京大計算機學院副院長李祈正為首的合作方過來時,吳辰已經調試好了第一版可用的SDK。
「吳教授,我還以為你把我們都忘了呢!」
在機場接到李祈正時,他樂呵呵的對吳辰開玩笑。
「這我哪裡敢,李院長您可是冤枉我了。」
吳辰連忙道歉。
實際上兩人在線上也交流過幾次,但更多的時候吳辰是和陳蓓桃交流。
不過陳蓓桃主要負責的是圖像處理方面的工作,目前還沒有突破性的進展。
聽到他的話,陳蓓桃從姜楠懷中探出頭來。
「院長,吳大佬還真沒亂說,每周都和姜姜在深圳雙飛呢————哎呀!」
她話還沒說完,就被姜楠敲了一下腦袋。
李祈正也知道陳蓓桃的話總是很奇怪,所以並沒有在意。
他只是看向姜楠道:「這位就是姜老師是吧,久聞大名了。」
「李院長您好。」
姜楠鬆開好久沒見的閨蜜,上去和李祈正握手。
不過她有些奇怪為什麼對方怎麼會知道自己。
李祈正笑道:「姜老師最近可是把國外攪的天翻地覆啊。」
姜楠這才明白是怎麼回事,笑了笑後淡淡道:「都是吳辰的功勞。」
李祈正呵呵笑了幾聲,目光掠過她的臉,又看了看旁邊陳蓓桃,暗自嘆了口氣。
倒是吳辰十分迷惑。
怎麼還有自己的事?
朝停車場走去的時候,他悄悄問姜楠:「姜總又搞了什麼大新聞?」
姜楠還沒說話,陳蓓桃就叉腰叫了起來。
「大佬,你也太不關心我家姜姜了,為了你,她都得罪了不少人,你知道打假Aβ*56這件事有多危險麼?」
Aβ*56?
之前吳辰幫江東藥廠把這個坑躲過後,就沒有再花精力關注了。
沒想到竟然還有後續。
通過陳蓓桃嘰里呱啦的一陣講述,他才明白是怎麼回事。
原來姜楠在確定Aβ*56造假後,並沒有選擇沉默。
她利用吳辰提供的圖像算法,檢測出《自然》上的多篇關於阿爾茨海默症的核心論文,都存在嚴重的圖像拼接與偽造痕跡。
然後姜楠不僅實名向學術委員會提交了完整的證據鏈,而且還接受了海外媒體的採訪,直接揭開了這塊遮羞布,導致多家跟進該方向的跨國藥企股價大跌。
可以說,她把所有的功勞都給了吳辰,卻把最苦最危險的那部分工作留給了自己。
更嚴重的是江東藥廠估計已經上了某些組織的黑名單。
畢竟不是所有人都有理想抱負的。
用它來騙經費不好嗎?
非要把事情捅破?
而且多少博士的畢業論文都寫好了?
現在告訴他們一切都是假的,那他們估計想殺了姜楠的心都有。
聽完後,吳辰摸了摸手腕上的佛珠。
這些事情,他都沒有聽姜楠提起過。
於是他道:「這件事後邊你就別管了,我會處理。」
沒想到姜楠搖了搖頭。
「不用,你忙你的就好,這是醫藥行業的事,不值得你浪費精力。」
吳辰笑了笑:「研究的事我只是略懂,但輿論方面我還是能幫幫忙的。
姜楠本來還想說什麼,但突然想起來前幾天梁嘉誠和自己父親聊天時的話。
他說吳辰當時也說是略懂,結果最後狠狠打了自己的臉,還一天賺走了100萬O
於是她就沉默了下來。
到了學校,負責接待的是校長許建平。
雖然李祈正只是計算機學院的副院長。
但人家可是京大的副院長!
當然這些接待方面的事情,就不需要吳辰操心了。
晚上吃完飯後,他甚至還有空陪著姜楠和陳蓓桃夜遊了一次西湖。
然後他發誓再也不想陪女人逛街了。
榛果Seek回答問題時有時聰明,有時智障,其實有一個重要原因。
那就是:過擬合。
它的參數量不夠大,泛化能力沒有湧現,所以它的回答無限接近於閔欣柔整理好的語料。
而且為了讓回答有意義,吳辰不得不降低模型的發散性,它在面對未知領域時顯得更加呆板。
不過過擬合也有好處。
在2008年這個蠻荒時代,過擬合恰恰是一個巨大的護城河。
在大家還不知道大模型存在時,他們絕不會想到屏幕上那些引經據典、語氣滄桑的文字,竟然不是真人敲出來的。
AI最擅長的,就是用確定的語氣,回答已知的存量知識。
那麼針對它的這個特點,目前最好的一個產品:
就是:問答社區!
2008年是一個非常特殊的時間點。
此時國外的Quora還要一年才成立,國內的知乎還要兩年才成立。
所以這個世界上,還沒有一個高質量的問答社區。
大洋彼岸的Quora要等到明年才成立,國內的知乎更是兩年後的產物。
此時的中文網際網路,是一片知識荒漠。
大家找答案,要麼在搜尋引擎的GG里大海撈針,要麼去百度知道看那些樓主好人、同求甚至是複製粘貼的垃圾信息。
那高質量的回答有沒有呢?
自然是有的。
但它們散落在天涯的深水區、貓撲的置頂帖、貼吧的精品區里,像珍珠一樣被泥沙掩埋。
吳辰要做的,就是把這些珍珠串起來,做一個聚合全球智慧(其實是AI馬甲)的高端社區!
而且要牆內牆外兩開花!
聽到他的計劃,閔欣柔的眼中也亮起了光。
做為一個程式設計師,最難受的不是開發軟體時的困難。
最難受的是開發出來的軟體沒有人用!
吳辰上輩子的導師就曾說過,一款軟體做的太好但是沒人用的話。
那就是垃圾!
所以聽到自己寫的算法和清洗的數據,將成為全球數億用戶獲取知識的源頭,閔欣柔也很是激動。
這種成就,真的很難用錢來衡量!
「老師,我想幫您!」
閔欣柔期盼的說。
吳辰點了點頭。
「我和你說這些,自然就是想讓你也參與其中————不過我有個要求。」
他敲了敲桌子,嚴肅道:「我所有的想法,你都不能輕易透露給別人,明白嗎?」
「明白!」
閔欣柔使勁點頭,恨不得賭咒發誓自己會絕對忠誠。
當然吳辰也不需要她這樣。
分詞算法雖然重要。
但最核心的Transformer架構和模型權重,已經被他封裝在只有他能解開的黑盒裡了。
時光匆匆。
吳辰白天在學校教書,晚上回來就優化當前的榛果Seek1.0,周末還要和姜楠去深圳的電子廠視察。
但付出總是有回報的。
在以京大計算機學院副院長李祈正為首的合作方過來時,吳辰已經調試好了第一版可用的SDK。
「吳教授,我還以為你把我們都忘了呢!」
在機場接到李祈正時,他樂呵呵的對吳辰開玩笑。
「這我哪裡敢,李院長您可是冤枉我了。」
吳辰連忙道歉。
實際上兩人在線上也交流過幾次,但更多的時候吳辰是和陳蓓桃交流。
不過陳蓓桃主要負責的是圖像處理方面的工作,目前還沒有突破性的進展。
聽到他的話,陳蓓桃從姜楠懷中探出頭來。
「院長,吳大佬還真沒亂說,每周都和姜姜在深圳雙飛呢————哎呀!」
她話還沒說完,就被姜楠敲了一下腦袋。
李祈正也知道陳蓓桃的話總是很奇怪,所以並沒有在意。
他只是看向姜楠道:「這位就是姜老師是吧,久聞大名了。」
「李院長您好。」
姜楠鬆開好久沒見的閨蜜,上去和李祈正握手。
不過她有些奇怪為什麼對方怎麼會知道自己。
李祈正笑道:「姜老師最近可是把國外攪的天翻地覆啊。」
姜楠這才明白是怎麼回事,笑了笑後淡淡道:「都是吳辰的功勞。」
李祈正呵呵笑了幾聲,目光掠過她的臉,又看了看旁邊陳蓓桃,暗自嘆了口氣。
倒是吳辰十分迷惑。
怎麼還有自己的事?
朝停車場走去的時候,他悄悄問姜楠:「姜總又搞了什麼大新聞?」
姜楠還沒說話,陳蓓桃就叉腰叫了起來。
「大佬,你也太不關心我家姜姜了,為了你,她都得罪了不少人,你知道打假Aβ*56這件事有多危險麼?」
Aβ*56?
之前吳辰幫江東藥廠把這個坑躲過後,就沒有再花精力關注了。
沒想到竟然還有後續。
通過陳蓓桃嘰里呱啦的一陣講述,他才明白是怎麼回事。
原來姜楠在確定Aβ*56造假後,並沒有選擇沉默。
她利用吳辰提供的圖像算法,檢測出《自然》上的多篇關於阿爾茨海默症的核心論文,都存在嚴重的圖像拼接與偽造痕跡。
然後姜楠不僅實名向學術委員會提交了完整的證據鏈,而且還接受了海外媒體的採訪,直接揭開了這塊遮羞布,導致多家跟進該方向的跨國藥企股價大跌。
可以說,她把所有的功勞都給了吳辰,卻把最苦最危險的那部分工作留給了自己。
更嚴重的是江東藥廠估計已經上了某些組織的黑名單。
畢竟不是所有人都有理想抱負的。
用它來騙經費不好嗎?
非要把事情捅破?
而且多少博士的畢業論文都寫好了?
現在告訴他們一切都是假的,那他們估計想殺了姜楠的心都有。
聽完後,吳辰摸了摸手腕上的佛珠。
這些事情,他都沒有聽姜楠提起過。
於是他道:「這件事後邊你就別管了,我會處理。」
沒想到姜楠搖了搖頭。
「不用,你忙你的就好,這是醫藥行業的事,不值得你浪費精力。」
吳辰笑了笑:「研究的事我只是略懂,但輿論方面我還是能幫幫忙的。
姜楠本來還想說什麼,但突然想起來前幾天梁嘉誠和自己父親聊天時的話。
他說吳辰當時也說是略懂,結果最後狠狠打了自己的臉,還一天賺走了100萬O
於是她就沉默了下來。
到了學校,負責接待的是校長許建平。
雖然李祈正只是計算機學院的副院長。
但人家可是京大的副院長!
當然這些接待方面的事情,就不需要吳辰操心了。
晚上吃完飯後,他甚至還有空陪著姜楠和陳蓓桃夜遊了一次西湖。
然後他發誓再也不想陪女人逛街了。