第1861章 技術深水區

投票推薦 加入書籤 小說報錯

  周一的技術戰略會上,賈瀞雯在白板上寫下四個字:圖像搜索。

  會議室里安靜了幾秒。

  然後響起一陣低低的議論聲。

  「圖像搜索?」李明重複了一遍,「用戶上傳圖片,然後我們找相似的圖片?」

  「對。」賈瀞雯點頭,「技術上叫基於內容的圖像檢索。

  國外有實驗室在研究,但還沒有成熟的產品。」

  張濤推了推眼鏡:「賈總,這個……太超前了吧?我們現在連文字搜索都還沒做到完美。

  圖像搜索的複雜度要高几個數量級。」

  「我知道難。」賈瀞雯說,「但搜索的未來不只是文字。

  圖片、聲音、視頻,這些都是信息。

  如果我們現在不開始研究,等別人做出來了,我們就落後了。」

  王磊舉手:「技術上具體要做什麼?」

  「分幾個部分。」賈瀞雯在白板上畫圖,「第一,特徵提取。

  從圖片裡提取顏色、紋理、形狀等特徵。

  第二,特徵索引。

  把這些特徵建成可搜索的資料庫。

  第三,相似度匹配。

  用戶上傳圖片後,計算和庫中圖片的相似度,返回最接近的結果。」

  她畫完,看向團隊。

  大多數人都皺著眉頭。

  「這需要計算機視覺的專業知識。」新來的一個算法工程師說,「我們團隊沒人懂這個領域。」

  「需要大量的計算資源。」另一個工程師補充,「圖片特徵提取很耗CPU,匹配算法也很複雜。

  現在的伺服器可能扛不住。」

  「還有數據問題。」李明說,「我們需要海量的圖片數據來訓練和測試。

  去哪找這麼多圖片?」

  質疑聲一個接一個。

  賈瀞雯安靜地聽著,等大家都說完了,她才開口。

  「所有的困難我都知道。」她說,「但陳總說了,有些事現在不做,以後就晚了。

  圖像搜索是未來,我們必須現在開始布局。」

  她頓了頓:「當然,不是要馬上做出產品。

  我們先做預研,探索技術可行性。

  周期定六個月,投入資源控制在可接受範圍內。

  這樣可以嗎?」

  團隊互相看了看,最終都點了頭。

  但賈瀞雯能看出來,大部分人心裡還是沒底。

  會後,她給陳浩打電話匯報情況。

  「團隊反應怎麼樣?」陳浩問。

  「有疑慮。」賈瀞雯實話實說,「覺得太超前,技術難度太大。」

  「正常。」陳浩說,「新技術的探索總是這樣。

  我等會兒發你一些資料,是國外論文和研究報告。

  你讓團隊先學習,有個概念。」

  半小時後,郵箱裡多了十幾封郵件。

  附件全是PDF,英文的,有些還有複雜的數學公式。

  賈瀞雯列印出來,厚厚一摞。

  她抱著這摞資料回到會議室,團隊還在討論。

  「這是陳總發的資料。」她把資料放在桌上,「大家先看看,了解下這個領域的前沿進展。」

  李明拿起一份,翻了翻,眼睛漸漸亮起來。

  「這篇論文……講的是基於顏色直方圖的圖像匹配。

  思路挺巧妙的。」

  張濤也拿起一份:「這個是紋理特徵提取的方法,用到了小波變換。」

  新來的算法工程師看著一篇論文,喃喃自語:「這個相似度度量公式……有點意思。」

  資料起了作用。

  團隊開始認真研究,會議室里響起了討論聲。

  但一周後,問題又來了。

  「賈總,我們試了幾個經典算法。」李明匯報,「效果……不太好。


  簡單的圖片能匹配,稍微複雜點就亂了。」

  「具體什麼問題?」

  「特徵不夠魯棒。」張濤解釋,「同一輛汽車,不同角度拍,提取的特徵差異很大。

  算法認不出來是同一個東西。」

  賈瀞雯思考著。

  這時,陳浩的電話來了。

  「進展如何?」他問。

  賈瀞雯把問題說了。

  陳浩聽完,沒直接給答案,而是問:「你們現在怎麼做的?」

  「按論文裡的方法,先做整體特徵提取,再做全局匹配。」

  「換個思路。」陳浩說,「分階段實現。

  第一階段,不做通用圖像搜索,先做特定類別的識別。

  比如先做汽車識別,因為汽車有比較固定的特徵。

  第二階段,擴展到建築、動物等常見類別。

  第三階段,再做通用搜索。」

  賈瀞雯記下來:「這是技術路徑上的建議?」

  「對。」陳浩說,「另外,方法上也可以調整。

  不要追求完美算法,先用簡單方法驗證可行性。

  小步快跑,快速試錯。」

  掛了電話,賈瀞雯立刻召集團隊。

  「調整策略。」她說,「我們不分階段:第一階段,選定十個常見物品類別——汽車、建築、動物、植物、家具、電器、服裝、食品、書籍、藝術品。

  第二階段,每個類別做專門的識別模型。

  第三階段,整合成原型系統。」

  她看向李明:「方法上,先用最簡單的特徵——顏色和紋理。

  效果不好再升級。

  目標不是完美,是驗證可行性。」

  團隊重新分工。

  十個人,每人負責一個類別。

  賈瀞雯要求每周匯報進展,遇到問題隨時討論。

  第一周,進展緩慢。

  負責汽車識別的工程師發現,不同顏色的汽車在顏色特徵上差異太大。

  負責動物識別的發現,貓和狗在某些角度下很難區分。

  第二周,有人想出了新辦法。

  負責建築的工程師提議,用邊緣檢測提取輪廓特徵,因為建築有清晰的幾何形狀。

  這個思路在其他類別也適用。

  第三周,團隊開始分享經驗。

  汽車組借鑑了建築組的輪廓方法,動物組結合了顏色和紋理特徵。

  小步快跑的策略見效了。

  雖然每個類別只能做到百分之六七十的準確率,但至少能跑了。

  第四周,賈瀞雯組織了一次內部演示。

  每個小組展示自己的成果。

  汽車組:能識別轎車、SUV、卡車等大類,但細分車型還有困難。

  建築組:能區分現代建築和古典建築,但具體風格識別不准。

  動物組:能區分貓、狗、鳥等大類,但具體品種分不清。

  演示完,賈瀞雯總結:「雖然不完美,但證明了這條路能走通。

  下個月的目標:提高每個類別的準確率,同時開始做系統整合。」

  【跪求禮物,免費的為愛發電也行!】

章節目錄