第269章 出手

投票推薦 加入書籤 小說報錯

  第269章 出手

  林遠在試過DS-LLM的性能後對DS這家小公司來了興趣。

  他遍歷全網,發現這家公司竟然才剛成立不久,而且特麼成立的初衷竟然不是為了搞通用AI。其成立初衷竟然是為了研究如何將AI技術應用到金融交易市場。

  這特麼,,,讓林遠說啥呢。

  一個廚子為了炒出好菜,於是自己動手打制了一口鐵鍋,結果這口鐵鍋的性能不輸於專業鐵匠的匠心手作。

  廚子打制鐵鍋的時候沒想過以後要從事打鐵行業,他只是單純的想弄口好鍋做菜而已。

  如果事情到此為止,那還僅僅止步於略帶奇譚色彩而已。真正讓林遠吃驚的是,DS-LLM需要的算力這勾巴少。

  雖然林遠此前為了跑訓練特地去弄了兩塊部署在雲端的H100,甚至還為此提交報告給上頭審批,可是如果和chatGPT那些個大塊頭比起來,這特麼根本不是事。

  想在本地部署chatGPT?先不說openai如今已經是closeai,你根本就拿不到最新滿血版本的chatGPT。即便openai真的開源了chatGPT,就chatGPT4最新版本那恐怖的算力開銷。你就算買得起GPU,你也負擔不起電費呀。

  所以,這整件事情的輪廓就變成了:一個廚子為了燒好菜特地打制了一口鐵鍋,結果這口鐵鍋不但和專業鐵匠打制的性能差不多,還只需要更少的鐵料和工時。

  這,,,就特麼過分了呀。

  林遠於是接著試了下DS-V2版本,整體測試下來,DS的V2滿血版本已經和chatGPT4早期版本性能接近,可是相比於去年初發行的chatGPT4-o系列還是有不小差距。

  但這已然足夠讓林遠驚喜,因為這樣一個一百多人的小團隊竟然做出了如此驚艷的AI大語言模型。

  作為對比,看看那些個大公司,尤其是度度家,整天就想著靠AI來提升搜索體驗。明明也是一個企圖造口好鍋來燒出好菜的廚子,可偏偏兩者的差距卻是如此巨大。

  這種差距的巨大不是體現在兩家的大語言模型上的,而是體現在投入產出比上。

  度度家大概從十年前就號稱要搞AI,甚至還一度喊出了「all in AI」的口號。一段時期內也確實匯聚不少AI領域的大佬。結果,一不小心就成了其它公司的孵化池,成了半所AI領域的「黃埔軍校」。

  眼前的實例刷新了林遠的認知--原來無心插柳真的能柳成蔭。目標可以變,但是實現的決心必須堅決。

  最難能可貴的是,DS這家公司還把自家的AI語言大模型給開源了,這可比closeai有格局多了。

  鑑於此,林遠決定和這家小公司合作。

  因為這家小公司完全符合林遠的選擇標準——有足夠的技術實力,又有足夠的毅力,且和外資沒什麼關聯,最主要是還不為人所熟知。

  DS這家公司正好處於「大」和「小」的完美平衡點。

  太大的公司合作起來麻煩不說,且大公司有一堆的規章制度,林遠難免會深陷其中。光是算法智慧財產權就足夠煩人了。還有那沒完沒了的各種會議各種章程,林遠想想就頭大。

  畢竟大公司針對風險都是有一套完善的風控機制,也因此大公司規模上去後,創新能力反而會下降。為了應對這種情況,大公司才會搞出一些類似獨立工作室性質的項目攻堅小組。

  但是這類項目攻堅小組在大公司裡頭藏的太深,林遠沒機會直接和這些特種部隊一樣內部機構合作。

  而如果是小公司呢,太小的公司往往會面臨研發實力欠缺的問題。還有個更頭疼的,則是抱負問題。小公司的第一要務首先是活下去,按照常理是不會樂意投入資源到通用類技術領域的。

  所以,DS的這個規模正正好。

  這或許就是緣分吧。

  林遠很快就通過DS在github上的開源項目,給對方的帳號發了封站內信過去。雖然作為開源項目,林遠是可以直接提交項目貢獻請求的。

  可是呢,林遠還是想低調一點。

  一旦公開提交請求,那以後所有人都能看到某個帳號給DS的大語言模型提交了關鍵代碼更新,萬一有一天有人扒出來這個提交更新的帳號就是林遠的。

  之後要是好巧不巧,林遠做空NVIDIA的操作又被人發現了,然後兩廂關聯,林遠不就成了處心積慮做空NVIDIA了嘛。


  雖然林遠是想通過做空NVIDIA來反擊Musk出口惡氣,可事情做歸做,留不留痕跡卻是另外一回事。一旦留下了明顯的痕跡,那麻煩事可就一堆。

  成功的做空和操縱股價之間的界限鬼知道是如何區分的。

  因此林遠只是發了個私信,而且還是用臨時申請的帳號發的。

  私信中林遠給對方提供了一個關鍵思路,一個基於推理演進的關鍵思路。

  根據算力系統對眼下各大AI大語言模型的深度掃描,系統給出的評語是:訓練過程中過於強調算力的重要性,從而忽略了推理的價值。

  用人話說就是:不過腦子就知道蠻幹。

  最⊥新⊥小⊥說⊥在⊥六⊥9⊥⊥書⊥⊥吧⊥⊥首⊥發!

  林遠對此的理解是,就好比做數學題,你知道加減乘除的規律之後,就可以在此基礎上做任意多位數的加減乘除運算,這就是推理的過程。

  而與之相對的,就是硬湊答案。

  當然,算力系統實際所指出的眼下市面上的AI大語言模型的缺陷自然不會是如此淺薄的拙劣。可是道理大差不差。

  於是,林遠就將算力系統的見解經過加工之後給對方發了過去。

  他當然不至於僅僅發一段不著邊際的有關強調推理過程的話,而是針對DS-V2版本代碼中的某一組神經網絡進行了針對性優化。

  林遠將這一組神經網絡作為參照物,以此為根基修改代碼,用實例詮釋了算力系統有關強調推理的論點。

  經過修改之後,這組神經網絡就附帶了動態自動可調節屬性。以便在回答實際問題的時候,會從邏輯鏈入手,向用戶展示模型自身的推理過程。

  這一點是至關重要的,因為如果AI反饋的推理過程都是錯的,那你直接就可以中斷AI的回答,而不需要等AI回答完畢之後通過閱讀答案再去判斷。

  這種推理過程猶如是答案的綱領,讓人類能感知到AI的推理細節,從而實現雙向奔赴。

  因為AI所希望你問問題的方式,經常並非是人類實際的提問方式。再者人類的語言體系中本就存在一個隨著談話深入不停深化主題的概念,也就是說,人與人之間的談話是需要聯繫上下文的。

  這在日常對話中就很好理解,兩個陌生人對話的前期總是免不了建立共同語境的過程。既然如此,那人與AI的對話也是如此。

  強調推理,就是強調讓AI抓緊這種推理邏輯鏈。

  (本章完)

章節目錄