第1861章 技術深水區
周一的技術戰略會上,賈瀞雯在白板上寫下四個字:圖像搜索。
會議室里安靜了幾秒。
然後響起一陣低低的議論聲。
「圖像搜索?」李明重複了一遍,「用戶上傳圖片,然後我們找相似的圖片?」
「對。」賈瀞雯點頭,「技術上叫基於內容的圖像檢索。
國外有實驗室在研究,但還沒有成熟的產品。」
張濤推了推眼鏡:「賈總,這個……太超前了吧?我們現在連文字搜索都還沒做到完美。
圖像搜索的複雜度要高几個數量級。」
「我知道難。」賈瀞雯說,「但搜索的未來不只是文字。
圖片、聲音、視頻,這些都是信息。
如果我們現在不開始研究,等別人做出來了,我們就落後了。」
王磊舉手:「技術上具體要做什麼?」
「分幾個部分。」賈瀞雯在白板上畫圖,「第一,特徵提取。
從圖片裡提取顏色、紋理、形狀等特徵。
第二,特徵索引。
把這些特徵建成可搜索的資料庫。
第三,相似度匹配。
用戶上傳圖片後,計算和庫中圖片的相似度,返回最接近的結果。」
她畫完,看向團隊。
大多數人都皺著眉頭。
「這需要計算機視覺的專業知識。」新來的一個算法工程師說,「我們團隊沒人懂這個領域。」
「需要大量的計算資源。」另一個工程師補充,「圖片特徵提取很耗CPU,匹配算法也很複雜。
現在的伺服器可能扛不住。」
「還有數據問題。」李明說,「我們需要海量的圖片數據來訓練和測試。
去哪找這麼多圖片?」
質疑聲一個接一個。
賈瀞雯安靜地聽著,等大家都說完了,她才開口。
「所有的困難我都知道。」她說,「但陳總說了,有些事現在不做,以後就晚了。
圖像搜索是未來,我們必須現在開始布局。」
她頓了頓:「當然,不是要馬上做出產品。
我們先做預研,探索技術可行性。
周期定六個月,投入資源控制在可接受範圍內。
這樣可以嗎?」
團隊互相看了看,最終都點了頭。
但賈瀞雯能看出來,大部分人心裡還是沒底。
會後,她給陳浩打電話匯報情況。
「團隊反應怎麼樣?」陳浩問。
「有疑慮。」賈瀞雯實話實說,「覺得太超前,技術難度太大。」
「正常。」陳浩說,「新技術的探索總是這樣。
我等會兒發你一些資料,是國外論文和研究報告。
你讓團隊先學習,有個概念。」
半小時後,郵箱裡多了十幾封郵件。
附件全是PDF,英文的,有些還有複雜的數學公式。
賈瀞雯列印出來,厚厚一摞。
她抱著這摞資料回到會議室,團隊還在討論。
「這是陳總發的資料。」她把資料放在桌上,「大家先看看,了解下這個領域的前沿進展。」
李明拿起一份,翻了翻,眼睛漸漸亮起來。
「這篇論文……講的是基於顏色直方圖的圖像匹配。
思路挺巧妙的。」
張濤也拿起一份:「這個是紋理特徵提取的方法,用到了小波變換。」
新來的算法工程師看著一篇論文,喃喃自語:「這個相似度度量公式……有點意思。」
資料起了作用。
團隊開始認真研究,會議室里響起了討論聲。
但一周後,問題又來了。
「賈總,我們試了幾個經典算法。」李明匯報,「效果……不太好。
簡單的圖片能匹配,稍微複雜點就亂了。」
「具體什麼問題?」
「特徵不夠魯棒。」張濤解釋,「同一輛汽車,不同角度拍,提取的特徵差異很大。
算法認不出來是同一個東西。」
賈瀞雯思考著。
這時,陳浩的電話來了。
「進展如何?」他問。
賈瀞雯把問題說了。
陳浩聽完,沒直接給答案,而是問:「你們現在怎麼做的?」
「按論文裡的方法,先做整體特徵提取,再做全局匹配。」
「換個思路。」陳浩說,「分階段實現。
第一階段,不做通用圖像搜索,先做特定類別的識別。
比如先做汽車識別,因為汽車有比較固定的特徵。
第二階段,擴展到建築、動物等常見類別。
第三階段,再做通用搜索。」
賈瀞雯記下來:「這是技術路徑上的建議?」
「對。」陳浩說,「另外,方法上也可以調整。
不要追求完美算法,先用簡單方法驗證可行性。
小步快跑,快速試錯。」
掛了電話,賈瀞雯立刻召集團隊。
「調整策略。」她說,「我們不分階段:第一階段,選定十個常見物品類別——汽車、建築、動物、植物、家具、電器、服裝、食品、書籍、藝術品。
第二階段,每個類別做專門的識別模型。
第三階段,整合成原型系統。」
她看向李明:「方法上,先用最簡單的特徵——顏色和紋理。
效果不好再升級。
目標不是完美,是驗證可行性。」
團隊重新分工。
十個人,每人負責一個類別。
賈瀞雯要求每周匯報進展,遇到問題隨時討論。
第一周,進展緩慢。
負責汽車識別的工程師發現,不同顏色的汽車在顏色特徵上差異太大。
負責動物識別的發現,貓和狗在某些角度下很難區分。
第二周,有人想出了新辦法。
負責建築的工程師提議,用邊緣檢測提取輪廓特徵,因為建築有清晰的幾何形狀。
這個思路在其他類別也適用。
第三周,團隊開始分享經驗。
汽車組借鑑了建築組的輪廓方法,動物組結合了顏色和紋理特徵。
小步快跑的策略見效了。
雖然每個類別只能做到百分之六七十的準確率,但至少能跑了。
第四周,賈瀞雯組織了一次內部演示。
每個小組展示自己的成果。
汽車組:能識別轎車、SUV、卡車等大類,但細分車型還有困難。
建築組:能區分現代建築和古典建築,但具體風格識別不准。
動物組:能區分貓、狗、鳥等大類,但具體品種分不清。
演示完,賈瀞雯總結:「雖然不完美,但證明了這條路能走通。
下個月的目標:提高每個類別的準確率,同時開始做系統整合。」
【跪求禮物,免費的為愛發電也行!】
會議室里安靜了幾秒。
然後響起一陣低低的議論聲。
「圖像搜索?」李明重複了一遍,「用戶上傳圖片,然後我們找相似的圖片?」
「對。」賈瀞雯點頭,「技術上叫基於內容的圖像檢索。
國外有實驗室在研究,但還沒有成熟的產品。」
張濤推了推眼鏡:「賈總,這個……太超前了吧?我們現在連文字搜索都還沒做到完美。
圖像搜索的複雜度要高几個數量級。」
「我知道難。」賈瀞雯說,「但搜索的未來不只是文字。
圖片、聲音、視頻,這些都是信息。
如果我們現在不開始研究,等別人做出來了,我們就落後了。」
王磊舉手:「技術上具體要做什麼?」
「分幾個部分。」賈瀞雯在白板上畫圖,「第一,特徵提取。
從圖片裡提取顏色、紋理、形狀等特徵。
第二,特徵索引。
把這些特徵建成可搜索的資料庫。
第三,相似度匹配。
用戶上傳圖片後,計算和庫中圖片的相似度,返回最接近的結果。」
她畫完,看向團隊。
大多數人都皺著眉頭。
「這需要計算機視覺的專業知識。」新來的一個算法工程師說,「我們團隊沒人懂這個領域。」
「需要大量的計算資源。」另一個工程師補充,「圖片特徵提取很耗CPU,匹配算法也很複雜。
現在的伺服器可能扛不住。」
「還有數據問題。」李明說,「我們需要海量的圖片數據來訓練和測試。
去哪找這麼多圖片?」
質疑聲一個接一個。
賈瀞雯安靜地聽著,等大家都說完了,她才開口。
「所有的困難我都知道。」她說,「但陳總說了,有些事現在不做,以後就晚了。
圖像搜索是未來,我們必須現在開始布局。」
她頓了頓:「當然,不是要馬上做出產品。
我們先做預研,探索技術可行性。
周期定六個月,投入資源控制在可接受範圍內。
這樣可以嗎?」
團隊互相看了看,最終都點了頭。
但賈瀞雯能看出來,大部分人心裡還是沒底。
會後,她給陳浩打電話匯報情況。
「團隊反應怎麼樣?」陳浩問。
「有疑慮。」賈瀞雯實話實說,「覺得太超前,技術難度太大。」
「正常。」陳浩說,「新技術的探索總是這樣。
我等會兒發你一些資料,是國外論文和研究報告。
你讓團隊先學習,有個概念。」
半小時後,郵箱裡多了十幾封郵件。
附件全是PDF,英文的,有些還有複雜的數學公式。
賈瀞雯列印出來,厚厚一摞。
她抱著這摞資料回到會議室,團隊還在討論。
「這是陳總發的資料。」她把資料放在桌上,「大家先看看,了解下這個領域的前沿進展。」
李明拿起一份,翻了翻,眼睛漸漸亮起來。
「這篇論文……講的是基於顏色直方圖的圖像匹配。
思路挺巧妙的。」
張濤也拿起一份:「這個是紋理特徵提取的方法,用到了小波變換。」
新來的算法工程師看著一篇論文,喃喃自語:「這個相似度度量公式……有點意思。」
資料起了作用。
團隊開始認真研究,會議室里響起了討論聲。
但一周後,問題又來了。
「賈總,我們試了幾個經典算法。」李明匯報,「效果……不太好。
簡單的圖片能匹配,稍微複雜點就亂了。」
「具體什麼問題?」
「特徵不夠魯棒。」張濤解釋,「同一輛汽車,不同角度拍,提取的特徵差異很大。
算法認不出來是同一個東西。」
賈瀞雯思考著。
這時,陳浩的電話來了。
「進展如何?」他問。
賈瀞雯把問題說了。
陳浩聽完,沒直接給答案,而是問:「你們現在怎麼做的?」
「按論文裡的方法,先做整體特徵提取,再做全局匹配。」
「換個思路。」陳浩說,「分階段實現。
第一階段,不做通用圖像搜索,先做特定類別的識別。
比如先做汽車識別,因為汽車有比較固定的特徵。
第二階段,擴展到建築、動物等常見類別。
第三階段,再做通用搜索。」
賈瀞雯記下來:「這是技術路徑上的建議?」
「對。」陳浩說,「另外,方法上也可以調整。
不要追求完美算法,先用簡單方法驗證可行性。
小步快跑,快速試錯。」
掛了電話,賈瀞雯立刻召集團隊。
「調整策略。」她說,「我們不分階段:第一階段,選定十個常見物品類別——汽車、建築、動物、植物、家具、電器、服裝、食品、書籍、藝術品。
第二階段,每個類別做專門的識別模型。
第三階段,整合成原型系統。」
她看向李明:「方法上,先用最簡單的特徵——顏色和紋理。
效果不好再升級。
目標不是完美,是驗證可行性。」
團隊重新分工。
十個人,每人負責一個類別。
賈瀞雯要求每周匯報進展,遇到問題隨時討論。
第一周,進展緩慢。
負責汽車識別的工程師發現,不同顏色的汽車在顏色特徵上差異太大。
負責動物識別的發現,貓和狗在某些角度下很難區分。
第二周,有人想出了新辦法。
負責建築的工程師提議,用邊緣檢測提取輪廓特徵,因為建築有清晰的幾何形狀。
這個思路在其他類別也適用。
第三周,團隊開始分享經驗。
汽車組借鑑了建築組的輪廓方法,動物組結合了顏色和紋理特徵。
小步快跑的策略見效了。
雖然每個類別只能做到百分之六七十的準確率,但至少能跑了。
第四周,賈瀞雯組織了一次內部演示。
每個小組展示自己的成果。
汽車組:能識別轎車、SUV、卡車等大類,但細分車型還有困難。
建築組:能區分現代建築和古典建築,但具體風格識別不准。
動物組:能區分貓、狗、鳥等大類,但具體品種分不清。
演示完,賈瀞雯總結:「雖然不完美,但證明了這條路能走通。
下個月的目標:提高每個類別的準確率,同時開始做系統整合。」
【跪求禮物,免費的為愛發電也行!】