第57章 策略

投票推薦 加入書籤 小說報錯

  藍策是第一個開始閱讀手冊的,卻是最後一個放下的。

  「怎麼樣有頭緒了嗎?」

  「差不多了,先聽你說吧,畢竟你經驗多一些。」

  藍策和衛臨風並沒有因為決策人的位置爭吵起來,反而藍策願意主動給衛臨風打下手。

  有時候擺正自己的位置才能讓事情推動得順利一些。

  「那我就先說說我的理解。」

  衛臨風一邊對照著賽事手冊,一邊講解著自己的比賽策略。

  作答區雖然只有一台計算機,並且最後提交算法也是以此為結果,但是每個參賽隊伍的選手都可以向賽事組申請領取一台開發用的筆記本。

  筆記本經過賽事組的全面安檢,無線、藍牙模塊全部被物理拆除,外部的接口只能接入封閉區域網的網線,以此來杜絕作弊的可能性。

  賽事手冊里雖然白紙黑字的寫著禁止外部數據與設備導入,但卻可以通過賽事組筆記本調用賽場封閉機房內的機架式伺服器陣列,也就是離線算力集群,以完成數據的處理。

  所以衛臨風的思路十分簡單清晰。

  先是根據題目設計出算法的結構和數據處理的策略。

  然後由他先一步去到作答區搭建模型架構,畢竟這一步是無論如何也節省不了時間的。

  而藍策則是用筆記本先完成數據處理的算法,然後再到作答區接入賽事組給定的離線數據集進行數據處理同時幫助衛臨風一同完善架構和進行訓練。

  至於王東和蘇瑜然則是需要在賽事組提供的資料下完成算法的可解釋性設計、臨床合規校驗、倫理說明。

  由於是基於大夏的臨床合規性,所以賽事組特定在酒店的某個會議室里臨時搭建了一座小型圖書館。

  裡面存放了有關大夏臨床要求等一系列資料,從中找到自己需要的東西也是一項消耗巨大的工作。

  當然,這也是比賽的一部分。

  聽完衛臨風的策略講述,其他幾人都沒有異議,不愧是比賽經驗豐富的前輩,雖然是新型賽制,卻在極短的時間裡就想到了目前能想到的最佳方案。

  接下來幾人重點討論了題目算法。

  這次比賽重點聚焦的是早期胰腺導管腺癌(PDAC)的精準篩查AI算法,目的是根據患者的臨床數據排除其他隱患。

  賽事組準備了中日韓7家頂級醫院近十年的回顧性隊列數據集,共包含12萬例受試者,涵蓋三大模態全量數據:影像、檢驗和文本病例。

  評審要求有三點:

  1.在獨立測試集陽性樣本占比1.8%、FPR(假陽性率)小於5%的前提下,篩查靈敏度要大於90%。

  2.單例全流程推理在單張消費級顯卡上耗時小於10秒。

  3.可解釋性模塊必須符合《大夏胰腺癌早篩早診指南》最新版循證醫學規範,禁止黑箱模型輸出。

  對此藍策提出了自己的看法。

  「1.8%的陽性率,如果堆千億參數的多模態大模型暴力擬合,很容易因為過擬合崩潰,而且十分浪費時間。」

  「我覺得算法設計要以臨床先驗為核心約束,先鎖死指南明確的胰腺癌高維特徵空間,再談模型訓練。」

  衛臨風點點頭表示同意。

  「那就不能只是簡單的特徵拼接,必須做跨膜態生物標誌物對齊,把影像的病灶強化特徵、血檢的時序變化特徵、病例的高危因素特徵錨定到同一個臨床發病邏輯上,避免模態間出現噪聲干擾。」

  「可解釋性、合規性和模型訓練同步進行,用最高效率完成題目。」

  四人很快明確了各自的分工,並立即開始按計劃推進。

  衛臨風則是先一步進入作答區開始模型框架的搭建,他沒有選擇和全場其他隊伍一樣使用通用多模態大模型,而是依據自己之前比賽的記憶,搭建一套針對早篩場景定製的時序融合網絡。

  藍策向賽事組申請了經過檢查的特定筆記本,儘管被賽事組拆除了很多模塊,裡面的存儲內容也幾乎寥寥無幾。

  但好在筆記本提前配置好了代碼環境和深度學習框架,賽事組也算是做了人事,藍策可以直接上手搭建基於臨床先驗的多模態數據自動化處理鏈路。

  在藍策拿到筆記本的一瞬間,隔壁的隊伍都懵了。


  臥槽,真的假的?還有這種東西?

  不是每個隊伍只能共用一台電腦?

  要知道在座的各位雖然都是代碼高手,但是每台電腦卻只有一張鍵盤,同時只有一個人能操作。

  而多台電腦的出現,即便只是筆記本,也能讓整個團隊的效率上升好幾個層級。

  還好並不是每個人都是傻子,很快就有隊伍想到了參賽手冊,並成功領取到了自己的電腦。

  「我操,我說怎麼一台電腦給了這麼多條網線呢,合著還能使用筆記本啊?」

  原本混亂的賽場一時間變得更加混亂,此刻大部分隊伍才意識到仔細閱讀參賽手冊的重要性。

  不過好像已經有些晚了。

  另一邊,王東和蘇瑜然搶先來到了存放臨床資料的小圖書館。

  「咱們好像是第一個誒。」

  蘇瑜然對著空空如也的小圖書館發出了感慨。

  王東則是仔細地打量了一番環境,除了成排的書架,在小圖書館的門口還放著一台電腦。

  一根長長的網線從電腦後面延伸出來不知道通向哪裡。

  「這應該是用來資料查詢的電腦,還好我們來的早,不然僅有一台電子查詢估計要排隊好久。」

  而且資料似乎都是獨一份的,先拿走的隊伍顯然更有優勢,像是一些重要資料,後來者只能硬等著前面的隊伍用完。

  沒有再浪費時間,兩人很快就開始資料的查找。

  接下來是一場近乎時間與身體的較量。

  隨著時間一點一點流逝,各路負責代碼的選手都出現了體力不支的情況。

  模型的構建可不是一個簡單的東西,即便是一個最簡單的算法,花費上幾個小時都是常有的事情。

  甚至一天一宿的坐在屏幕前面也不是沒有可能。

  直到此時,大部分隊伍才發現自己掉入了陷阱之中。

章節目錄