第54章 清華講台與輿論暗戰

投票推薦 加入書籤 小說報錯

  六月二十日,周三,清華園。

  下午三點,主樓報告廳門口排起了長隊。兩百個座位早已坐滿,過道里站滿了人,窗外還有人踮腳往裡看。橫幅掛在講台後方:「中文信息處理的黃金時代——金牧公開課第一講」。

  林牧站在幕後,透過縫隙看著台下。黑壓壓的人頭,年輕的面孔,眼睛裡閃著光。最前排坐著幾位老教授,王選院士坐在正中間,正和旁邊的系主任低聲交談。

  雷軍走過來,壓低聲音:「林總,都準備好了。演示電腦檢查了三遍,投影儀調試好了,備用方案也Ready了。」

  「微軟那邊有什麼動靜?」林牧問。

  「來了三個人,坐在後排。」雷軍說,「戴維·王沒來,來的是中國區的技術總監和兩個助理。還有……」他頓了頓,「《計算機世界》和《中國青年報》的記者都到了,坐在媒體席。」

  「好。」林牧整理了一下西裝——葉溪溪特意給他買的,深灰色,合身,「按計劃進行。」

  三點十分,主持人上台:「各位老師,各位同學,今天我們非常榮幸地邀請到BJ金牧軟體公司創始人、『青年科技先鋒』獲得者林牧先生,為我們帶來題為《當漢字遇見代碼》的公開課。掌聲歡迎!」

  掌聲雷動。

  林牧走上講台,站定,目光掃過全場。

  「各位老師,各位同學,下午好。」他開口,聲音通過麥克風傳遍報告廳,「站在清華的講台上,我很惶恐。因為台下坐著的,可能是中國未來最好的程式設計師、最好的工程師、最好的科學家。」

  台下安靜下來。

  「但我今天想講的,不是技術,不是代碼,而是一個問題。」林牧切換PPT,幕布上出現一張照片——敦煌莫高窟的藏經洞,成堆的經卷。

  「1900年,王道士發現了這個藏經洞。裡面封存著從魏晉到宋元的五萬多卷文獻。但隨後幾十年,這些文獻流散到世界各地,大英博物館、法國國家圖書館、日本京都大學……中國人要研究自己的文獻,得去外國。」

  他切換下一張照片:發黃的古籍,蟲蛀的頁面。

  「這是我們師大圖書館的宋版《史記》。每次翻動,都有紙屑掉落。管理員說,最多還能翻五十次,這本書就碎了。」

  再下一張:計算機屏幕,上面是密密麻麻的代碼。

  「這是我們正在做的古籍數位化引擎。」林牧說,「用計算機視覺識別字形,用自然語言處理斷句標點,用排版引擎還原版式。目標是把五千年的文字,完完整整地搬進計算機,讓它們永遠不腐,永遠不碎。」

  台下響起竊竊私語。

  「我知道有人會問:這有什麼用?」林牧頓了頓,「是啊,有什麼用?不能吃,不能穿,不能賺錢。微軟的Office能幫學生寫作業,能幫會計做報表,能幫秘書打文件。我們的古籍引擎,能幹什麼?」

  他看向台下:「我只能說,有些事,不是因為它有用才做,而是因為做了,它才有用。」

  「一百年前,有人問:保存這些破經書有什麼用?今天我們知道,那是中華文明的根。一百年後,可能有人問:把古籍數位化有什麼用?我希望到那時,我們的後代可以說:因為數位化了,所以我們還能讀到李白杜甫,還能看到《清明上河圖》的題跋,還能知道我們的祖先在想什麼、寫什麼、夢什麼。」

  掌聲響起。

  林牧等掌聲稍歇,進入正題:「好,情懷講完了,現在講技術。」

  他回到電腦前,打開古籍引擎的演示程序。

  「這是我們團隊過去三個月的工作成果。」屏幕上出現一個簡潔的界面,「左邊是掃描的古籍圖像,右邊是識別結果。目前支持楷書、行書、草書三種字體,識別準確率在95%以上。」

  他拖入一張《蘭亭序》的掃描件。

  點擊「識別」。

  進度條快速走動。五秒後,右邊出現工整的繁體字文本。

  「這是基礎識別。」林牧說,「接下來是智能斷句。」

  點擊「斷句」。

  文本自動添加了標點——不是簡單的句號逗號,而是根據文言文語法規則添加的。「之乎者也」處理得恰到好處。

  「然後是排版還原。」點擊第三個按鈕。

  文本自動排列成豎排,從右到左,字體調整成仿宋體,加了淺朱絲欄線——完全復原了古籍的版式。


  台下響起驚嘆聲。

  「最後,」林牧說,「是翻譯適配。」

  他選擇「現代漢語適配」,點擊。

  豎排繁體文言文,瞬間變成橫排簡體白話文,但保留了原文的韻律和意境。

  「這……」一位老教授站起來,「這是怎麼做到的?」

  「用了一個我們自研的模型。」林牧調出技術架構圖,「核心是基於注意力機制的序列到序列模型,訓練數據是五千多份古籍和對應的現代漢語譯本。模型學會了文言文到白話文的映射規則,不是逐字翻譯,而是整體理解後的轉譯。」

  他頓了頓:「這個模型,我們今天開源。」

  全場譁然。

  「所有代碼、所有數據、所有模型參數,全部公開。」林牧調出金碼社區的連結,「任何高校、任何研究機構、任何個人,都可以免費使用、修改、再發布。只有一個要求:如果你基於這個模型做出了新成果,請也開源。」

  後排微軟的人臉色變了。

  「我知道有人會擔心:開源了,別人抄襲怎麼辦?」林牧看向後排,「但我想說:如果中國的古籍數位化,因為害怕抄襲而裹足不前,那才是最大的悲哀。」

  他提高聲音:「我們不怕抄襲,只怕沒人做。如果全中國的研究者都用我們的引擎,都來改進它,那三年後,中國將是世界古籍數位化的中心。這個中心,不在微軟,不在谷歌,在清華,在北師大,在每一個熱愛中國文化的人手裡。」

  掌聲如雷。

  王選院士站起來鼓掌,旁邊的系主任也跟著站起來。很快,全場起立。

  後排微軟的三個人,在掌聲中悄悄離場。

  公開課持續了兩個小時。林牧講了技術細節,講了開源理念,講了金牧的「種子計劃」。提問環節,學生們的問題一個接一個:

  「林總,我是中文系的,不懂編程,能參與嗎?」

  「能。我們需要文言文專家,需要校勘專家,需要版本學專家。技術只是工具,核心是文化。」

  「開源項目怎麼盈利?」

  「短期不盈利。但當我們成為標準,當我們建立了生態,盈利會自然到來。就像Linux,就像Apache。」

  「微軟會繼續打壓你們嗎?」

  「會。但打壓越狠,說明我們越對。」

  最後一個問題來自一個戴眼鏡的男生:「林總,我是計算機系大三的。我想畢業後去金牧工作,你們還要人嗎?」

  林牧笑了:「要。但我們沒錢,工資不高,加班很多,還可能隨時倒閉。要來嗎?」

  「來!」男生大聲說,「錢不重要,重要的是做的事!」

  全場大笑。

  公開課在五點半結束。林牧被學生們團團圍住,要簽名,要合影,要聯繫方式。

  等脫身時,天已經黑了。

  王選院士在門口等他。

  「小王,」院士拍拍他肩膀,「今天講得很好。但我要提醒你,微軟的反撲,會比你想的更狠。」

  「我明白。」林牧說。

  「古籍數位化是個好招牌,但也容易被人攻擊。」王選說,「我已經聽到風聲,有人準備寫文章,說你們『浪費國家資源做無用功』,說『古籍就該保持原樣,數位化是對文物的褻瀆』。」

  林牧皺眉:「這……也太牽強了。」

  「但能煽動情緒。」王選說,「輿論戰,從來不講道理,只講情緒。你得有準備。」

  「謝謝院士提醒。」

  回到公司,已經是晚上八點。

  林牧一進辦公室,陳靜就拿著一沓報紙衝進來。

  「林總,你看!」

  《科技日報》,第二版,標題醒目:《古籍數位化:一場昂貴的數字遊戲?》

  副標題:專家質疑金牧軟體「燒錢」項目,稱應優先發展實用軟體。

  文章引用了幾位「不願具名的專家」的話:

  「古籍數位化聽起來很美,但實際意義有限。中國還有那麼多企業用不起正版軟體,應該先解決實際問題。」

  「金牧作為國家項目承擔單位,拿著納稅人的錢做這種小眾研究,是否合適?」


  「與其花幾百萬數位化古籍,不如多開發幾個像WPS這樣的實用軟體。」

  文章最後一段:「記者嘗試聯繫金牧軟體,截至發稿未獲回應。」

  「這是第一篇。」陳靜說,「我托朋友打聽了,後面還有。《計算機世界》下周有個專題,《中國電子報》也在準備稿件。都是同一個調子——質疑古籍數位化的必要性,質疑金牧的動機。」

  林牧放下報紙:「誰組織的?」

  「表面上是幾家媒體自發,但背後……」陳靜壓低聲音,「我同學在《科技日報》,他說文章是微軟中國公關部提供的素材,專家也是他們推薦的。」

  「意料之中。」林牧說,「輿論戰開始了。」

  他想了想:「我們有幾件事要做。第一,寫反駁文章,但要找第三方寫——找高校教授,找圖書館專家,找文化學者。我們不能自己下場吵,那會顯得小氣。」

  「第二,加快演示版的完善。下個月工信部的立項會,我們要拿出讓所有人閉嘴的成果。」

  「第三,」他頓了頓,「啟動『古籍守護者』計劃。」

  「什麼計劃?」

  「面向全國徵集古籍掃描件。」林牧說,「任何人,只要有古籍,拍照上傳,我們就免費數位化,把成果回饋給提供者。同時,招募志願者,文科生可以幫忙校勘,理科生可以幫忙開發工具。我們要把這件事,變成一場全民運動。」

  陳靜眼睛亮了:「這樣輿論就不好攻擊了——我們是在發動群眾保護文物,不是燒錢做研究。」

  「對。」林牧說,「而且,一旦有成千上萬人參與,微軟再想抹黑,就是跟全國人民作對。」

  「我這就去準備!」

  陳靜離開後,林牧打開電腦,登錄金碼社區。

  古籍引擎的開原始碼,下載量已經突破八千。留言板有五百多條留言,大部分是支持和感謝。

  他翻到最新的一條,ID是「國圖小李」:

  「我是國家圖書館古籍部的工作人員。今天聽了清華的公開課,很受震撼。我們館有二十萬冊古籍,很多已經脆得不敢翻。如果你們的引擎真能用,我想申請合作。」

  林牧立刻回覆:「請留下聯繫方式,我們派人接洽。」

  剛發出去,又一條新留言,ID是「鐵馬冰河」:

  「後門事件的後續分析我寫完了,發在你郵箱。另外,微軟的技術清道夫最近在盯你們的社區,他們註冊了十幾個馬甲,準備發負面評論。我已經設置了過濾規則,但你們也要注意。」

  林牧回覆:「收到。運行時環境的架構圖我畫了個初稿,發給你看看。」

  處理完社區事務,已經是深夜十一點。

  林牧正要下班,手機響了。

  是葉溪溪。

  「哥,你看電視了嗎?」她聲音興奮。

  「沒有,怎麼了?」

  「新聞聯播!最後三分鐘,講了古籍數位化!用了你公開課的鏡頭,還採訪了王選院士!」葉溪溪說,「院士說,這是『用現代科技守護千年文脈』,說你和你團隊是『文化傳承的工程師』!」

  林牧愣住了。

  新聞聯播……那是最高級別的肯定。

  「還有呢,」葉溪溪繼續說,「我們系主任看了新聞,當場決定成立『古籍數位化興趣小組』,讓我當組長!他說,文科生也要懂技術,不能落後時代!」

  林牧笑了:「恭喜葉組長。」

  「少來!」葉溪溪嗔道,「對了,爸讓我告訴你,他看了新聞,很高興。說……說你這小子,總算幹了件像樣的事。」

  林牧心裡一暖。

  掛了電話,他打開電視,調到回放。

  新聞聯播的最後三分鐘,果然有他的鏡頭——站在清華講台上,背後是《蘭亭序》的數字復原畫面。王選院士的採訪片段,話語鏗鏘:「這不是簡單的技術項目,這是文化搶救。五千年的文明,不能斷在我們這一代人手裡。」

  畫面最後定格在一行字:科技賦能文化,創新傳承文脈。

  林牧關掉電視,靠在椅子上。

  窗外的北京城,萬家燈火。

  他知道,新聞聯播的報導,是一把雙刃劍。一方面,給了金牧最高的背書;另一方面,也把金牧推到了聚光燈下,成了靶子。


  但無論如何,這條路,走對了。

  他打開郵箱,鐵馬冰河發來的運行時環境架構圖,已經躺在那裡。

  點開,是一張極其複雜的技術圖——從底層驅動到應用框架,從文件系統到圖形界面,層層疊疊,但結構清晰。

  郵件正文只有一句話:「給我半年,給你一個能跑的世界。」

  林牧回覆:「好。需要什麼?」

  「人,錢,信任。」

  「都有。明天開始,你就是『長風』計劃的技術負責人。雷軍會配合你。」

  回復完,林牧站起來,走到窗邊。

  夜色中,中關村的霓虹依然閃爍。

  遠處,微軟中國的辦公樓,還有幾層亮著燈。

  近處,金牧的窗戶,也亮著。

  像兩軍對壘的營火。

  但林牧知道,他點燃的這堆火,連著五千年的薪火。

  這火,傳了五千年,不會滅在今天。

  手機又震動,是雷軍發來的簡訊:

  「林總,剛接到通知,工信部的古籍數位化立項會,提前到下周。微軟也報名了,他們推出了『Microsoft Digital Library』方案,號稱全球領先。」

  林牧回覆:「知道了。通知所有人,明早八點開會。我們得提前亮劍。」

  放下手機,他看著窗外的燈火。

  下周,又是一場硬仗。

  但今夜,至少可以睡個好覺。

  因為今天,他們站在了光里。

  這光,是從五千年前照過來的。

  他們要做的,就是把它傳下去。

章節目錄