第82章 黑色星期一

投票推薦 加入書籤 小說報錯

  沒再多看論文,反而是打開了證券交易軟體,在卡里有幾百萬的時候他就開通了美股帳戶,就是為了在這個時間點狠狠地撈一筆。

  他把卡里的全部都存到了帳戶里,一共270萬,留下十萬塊應急。

  DS論文的發布在相關研究領域引起了巨大的地震,現在可能還看不出來,但是等過幾天之後,反應最為劇烈的就是美股科技板塊,

  如果他沒記錯的話大概是27號那一天,納斯達克指數就跌了3%,而僅僅是英偉達的股價暴跌17%。

  這沒啥好說的,周昀直接選擇直接買入看跌期權,而且是一把梭哈,因為期權的高槓桿性,他能收穫好幾倍於本金的收益。

  他也不貪心,記憶中當日暴跌時17%,他打算看跌14%就好,如果這麼算下來,千萬級別的收益是輕輕鬆鬆的。

  也許還有其他更加賺錢的辦法,但是他對金融領域並不算太熟悉,這個已經是他能想到的最好辦法,也是最快的。

  而且有了這筆本金,他就可以參與到之後一波更加瘋狂的資本市場。

  買完之後周昀就沒再管它,只需要等到27號交易結束等著數錢就完了。

  在等著收錢的時間裡,又一個好消息傳來,他投稿ICLR的那篇時間序列研究的文章收到了評分的通知,看分數AC應該是穩了,

  不過這次周昀並不打算再去參會,這種經歷有一次就夠了,如果是為了見什麼大佬好像也沒什麼意義,

  畢竟又不可能光憑一面之緣對方就怎麼怎麼樣,而且說是去開會,大部分時間其實都在玩,

  他本來就不是一個喜歡旅遊的人,偶爾出去一次還行,要是太頻繁他寧願窩在家裡看電影或者睡覺。

  再說現在網絡這麼發達,就算不去參會基本也能掌握基本情況。

  組裡的群聊,鄧永華也再次告知了大家這個消息,雖然周昀馬上就要博士了,但他還是掛名在鄧永華底下的博士生,所以就沒有退群。

  對此,大家除了恭喜也說不出別的什麼了,倒是當時跟著周昀做這個工作的幾個同組的人都很高興,畢竟混了個二作三作,雖然對他們畢業沒啥用,但這畢竟是頂會不是?

  至此,周昀的履歷下面又要多一篇頂會文章了。

  而在DeepSeek論文和模型發布之後,在學術界也引起了一場地震。

  有人驚訝於其技術帶來的極致性價比,不過也有人會發出疑問——代價是什麼?

  但這都無法阻擋DeepSeek的強勢。

  也許R1在之後的表現會越來越不如其它的大模型,也會發現有非常非常多的缺點,但在現在這個時間段,它無疑是非常強大的。

  米國,斯坦福某實驗室,凌晨兩點。

  正在查論文的博士生Leo看到DS的那篇論文,出於職業素養,他照例點開看了眼摘要。

  不過這一看,他瞬間坐直了身體,睡意全無,幾乎是脫口而:「Holy *&#$?!」

  雖然是凌晨兩點,但是因為他們最近在趕論文,所以實驗室里還有不少人,這聲驚呼引得旁邊還在跑實驗的同學投來疑惑的目光。

  「Leo,怎麼了?代碼又出bug了?」

  「我倒是希望代碼出bug了,看看這篇文章吧。」他將屏幕轉動了一下,讓其他人能看得清上面的論文題目。

  「R1: Redefining Cost-Performance Tradeoffs in Large-Scale Language Models?」

  旁邊的同學Sarah搜了一下,果然找到了這篇剛剛發布不久的文章。

  「這是哪個公司的成果嗎?」因為作者的名單上長長一串一般只有公司的文章才會這樣。

  「就是DeepSeek,之前他們不是發過一個V3版本的論文嗎?當時老闆還讓我們看過,你不記得了?」

  「哦~好像有點印象,怎麼,這篇R1有很大的提升嗎?」他一邊說著一邊看向下面的摘要部分。

  「Reinforcement learning(強化學習)?這不是和我們現在做的方向一樣嗎?」不過當他看到第一張圖片的時候不由得歪了歪腦袋,發出了同樣的驚呼:「Holy*&#$?真的假的?」

  圖片上面顯示了,其效果幾乎和GPT-o1持平,而且文中寫到了其推理成本的二十分之一還不到。

  Leo苦笑著搖頭「不知道,我希望是假的,但我感覺應該是真的。」

  搞科研最為悲傷的事情之一——你有了一個很好的idea,並且已經做了一段時間,就在快要有成果的時候,卻發現人家已經做出來了,而且比自己做的更好。

  好消息:LLM有了新的突破,壞消息:你論文白寫了。

  「哎~沒辦法,我再看看吧,如果是真的,估計老闆肯定會要求我們復現的。」

  「說的也是。」

  和他們一樣反應還有很多人,公司的工程師們,高校的學生老師,對搞科研的人來說熬夜是常態,所以哪怕論文是在夜裡發的也有很多人看到了這篇文章。

  僅僅是論文發布後的第二天,各個視頻網站或者學術論壇上就湧現出了不少針對R1的解讀。

  之後幾天,隨著不斷有人成功復現出DeepSeek,谷歌、Meta等大廠的AI部門負責人連夜召集緊急會議。

  因為DeepSeek的低成本將有可能會直接威脅到所有依賴高收費模式的雲服務和AI公司的盈利預期。

  很快,市場上謠言四起,比如什麼多家雲服務提供商正在緊急重新談判未來的GPU採購合同,規模可能大幅縮減。

  這一類的傳言難辨真假,這就導致了在極度敏感和恐慌的市場情緒下,成為了壓垮駱駝的最後一根稻草。

  DeepSeek的成功讓資本市場看到了開發成本較低的強大AI模型的可能性。

  27號,正好是周一,美股開盤。

  周昀提前候在電腦面前,兩塊屏幕,一塊屏幕放著電影,另一塊屏幕顯示著英偉達的股價。

  桌上還擺著一盤小零食,他盤著腿靠在椅子上,巴適的很。

  和記憶中新聞報導的一樣,剛一開盤Nvidia就以無可匹敵之勢一路下探,除此之外,其他晶片股也集體大跌。

  周昀吃著零食笑呵呵地看著下跌的股價,心裡冒出一個念頭,也不知道老黃現在是個什麼表情。

  反正他的嘴角是真的難壓。

章節目錄