第1881章 我們做,但要有底線

投票推薦 加入書籤 小說報錯

  李明衝進賈瀞雯辦公室時,手裡攥著一沓列印紙,手指都在發抖。

  「成了!賈總,成了!」

  賈瀞雯抬起頭:「什麼成了?」

  「分布式索引!」李明把列印紙鋪在她桌上,「你看,測試數據!搜索響應時間平均縮短了百分之五十!最快的時候能達到零點八秒!」

  賈瀞雯拿起數據報告。

  表格密密麻麻,但結論很清楚:新技術讓百度搜索的速度提升了一半。

  「怎麼做到的?」她問。

  「我們把索引徹底打散了。」李明在白板上畫圖,「以前是集中式索引,所有數據在一個大庫里,查詢要遍歷整個庫。

  現在是分布式,數據按關鍵詞首字母分片,存在不同的伺服器上。

  查詢時,系統自動定位到對應的伺服器,只搜那一片數據。」

  他頓了頓:「就像圖書館以前把所有書堆在一起,現在分門別類放不同房間。

  找小說去A房間,找歷史去B房間,不用把所有房間都翻一遍。」

  賈瀞雯看著數據,心裡一陣激動。

  這意味著,百度的搜索速度將達到一個新高度,甚至可能超過那家美國公司。

  「穩定性呢?」她問。

  「測了一周,沒問題。」李明說,「而且分布式架構更健壯。

  一台伺服器宕機,只影響一部分數據,其他還能正常服務。

  不像以前,主庫一掛,全癱。」

  「太好了。」賈瀞雯站起來,「馬上部署,儘快上線。」

  「等等。」李明說,「還有件事。

  陳總昨天打電話,提了個新構想。

  他說……光快還不夠,要更聰明。」

  「什麼意思?」

  「個性化排序。」李明翻開筆記本,「陳總說,現在的搜索結果是基於全網數據,對所有用戶都一樣。

  但不同用戶的需求不同。

  比如搜『蘋果』,程式設計師可能想找編程資料,果農可能想找種植技術,普通用戶可能想買水果。

  如果能根據用戶的歷史行為,給每個人個性化的排序,體驗會更好。」

  賈瀞雯思考著這個構想。

  聽起來很先進,但……

  「這涉及用戶隱私吧?」她問。

  「對,所以陳總讓我們先做倫理研討。」李明說,「技術上是可行的。

  我們可以記錄用戶的搜索歷史、點擊行為,建立偏好模型。

  但這個數據怎麼用,邊界在哪裡,得想清楚。」

  當天下午,賈瀞雯組織了倫理研討會。

  參會的有技術核心、產品經理、法務顧問,還有新成立的用戶體驗團隊。

  會議室里爭論得很激烈。

  技術負責人張濤說:「從技術角度看,個性化是未來。

  網際網路信息太多,用戶需要過濾。

  我們幫他們過濾,這是服務。」

  產品經理王磊搖頭:「但你怎麼知道用戶想要什麼?靠歷史行為推測,可能推測錯。

  而且用戶會擔心:我的搜索記錄被保存,會不會泄露隱私?」

  法務顧問李律師推了推眼鏡:「法律上目前沒有明確規定。

  但用戶隱私是敏感問題。

  如果我們要做,必須有嚴格的數據保護措施,還要給用戶選擇權——要不要開啟個性化。」

  用戶體驗團隊的劉明說:「我做過用戶調研。

  大部分用戶希望搜索結果更相關,但確實擔心隱私。

  如果能有折中方案就好了。」

  賈瀞雯聽著大家的討論,在白板上寫下關鍵點:技術可行性、隱私邊界、用戶選擇權、數據安全。

  「這樣吧。」她最後說,「我們做,但要有底線。

  第一,數據必須匿名化處理,不關聯具體用戶身份。

  第二,用戶可以選擇是否開啟個性化功能,默認關閉。

  第三,數據加密存儲,定期清理。

  第四,明確告知用戶我們收集什麼數據,怎麼用。」

  「如果用戶選擇關閉,還收集數據嗎?」王磊問。

  「不收集。」賈瀞雯說,「只有開啟的用戶,我們才記錄行為。

  而且用戶隨時可以關閉,關閉後數據立即刪除。」

  【跪求禮物,免費的為愛發電也行!】

章節目錄