第1881章 我們做,但要有底線
李明衝進賈瀞雯辦公室時,手裡攥著一沓列印紙,手指都在發抖。
「成了!賈總,成了!」
賈瀞雯抬起頭:「什麼成了?」
「分布式索引!」李明把列印紙鋪在她桌上,「你看,測試數據!搜索響應時間平均縮短了百分之五十!最快的時候能達到零點八秒!」
賈瀞雯拿起數據報告。
表格密密麻麻,但結論很清楚:新技術讓百度搜索的速度提升了一半。
「怎麼做到的?」她問。
「我們把索引徹底打散了。」李明在白板上畫圖,「以前是集中式索引,所有數據在一個大庫里,查詢要遍歷整個庫。
現在是分布式,數據按關鍵詞首字母分片,存在不同的伺服器上。
查詢時,系統自動定位到對應的伺服器,只搜那一片數據。」
他頓了頓:「就像圖書館以前把所有書堆在一起,現在分門別類放不同房間。
找小說去A房間,找歷史去B房間,不用把所有房間都翻一遍。」
賈瀞雯看著數據,心裡一陣激動。
這意味著,百度的搜索速度將達到一個新高度,甚至可能超過那家美國公司。
「穩定性呢?」她問。
「測了一周,沒問題。」李明說,「而且分布式架構更健壯。
一台伺服器宕機,只影響一部分數據,其他還能正常服務。
不像以前,主庫一掛,全癱。」
「太好了。」賈瀞雯站起來,「馬上部署,儘快上線。」
「等等。」李明說,「還有件事。
陳總昨天打電話,提了個新構想。
他說……光快還不夠,要更聰明。」
「什麼意思?」
「個性化排序。」李明翻開筆記本,「陳總說,現在的搜索結果是基於全網數據,對所有用戶都一樣。
但不同用戶的需求不同。
比如搜『蘋果』,程式設計師可能想找編程資料,果農可能想找種植技術,普通用戶可能想買水果。
如果能根據用戶的歷史行為,給每個人個性化的排序,體驗會更好。」
賈瀞雯思考著這個構想。
聽起來很先進,但……
「這涉及用戶隱私吧?」她問。
「對,所以陳總讓我們先做倫理研討。」李明說,「技術上是可行的。
我們可以記錄用戶的搜索歷史、點擊行為,建立偏好模型。
但這個數據怎麼用,邊界在哪裡,得想清楚。」
當天下午,賈瀞雯組織了倫理研討會。
參會的有技術核心、產品經理、法務顧問,還有新成立的用戶體驗團隊。
會議室里爭論得很激烈。
技術負責人張濤說:「從技術角度看,個性化是未來。
網際網路信息太多,用戶需要過濾。
我們幫他們過濾,這是服務。」
產品經理王磊搖頭:「但你怎麼知道用戶想要什麼?靠歷史行為推測,可能推測錯。
而且用戶會擔心:我的搜索記錄被保存,會不會泄露隱私?」
法務顧問李律師推了推眼鏡:「法律上目前沒有明確規定。
但用戶隱私是敏感問題。
如果我們要做,必須有嚴格的數據保護措施,還要給用戶選擇權——要不要開啟個性化。」
用戶體驗團隊的劉明說:「我做過用戶調研。
大部分用戶希望搜索結果更相關,但確實擔心隱私。
如果能有折中方案就好了。」
賈瀞雯聽著大家的討論,在白板上寫下關鍵點:技術可行性、隱私邊界、用戶選擇權、數據安全。
「這樣吧。」她最後說,「我們做,但要有底線。
第一,數據必須匿名化處理,不關聯具體用戶身份。
第二,用戶可以選擇是否開啟個性化功能,默認關閉。
第三,數據加密存儲,定期清理。
第四,明確告知用戶我們收集什麼數據,怎麼用。」
「如果用戶選擇關閉,還收集數據嗎?」王磊問。
「不收集。」賈瀞雯說,「只有開啟的用戶,我們才記錄行為。
而且用戶隨時可以關閉,關閉後數據立即刪除。」
【跪求禮物,免費的為愛發電也行!】
「成了!賈總,成了!」
賈瀞雯抬起頭:「什麼成了?」
「分布式索引!」李明把列印紙鋪在她桌上,「你看,測試數據!搜索響應時間平均縮短了百分之五十!最快的時候能達到零點八秒!」
賈瀞雯拿起數據報告。
表格密密麻麻,但結論很清楚:新技術讓百度搜索的速度提升了一半。
「怎麼做到的?」她問。
「我們把索引徹底打散了。」李明在白板上畫圖,「以前是集中式索引,所有數據在一個大庫里,查詢要遍歷整個庫。
現在是分布式,數據按關鍵詞首字母分片,存在不同的伺服器上。
查詢時,系統自動定位到對應的伺服器,只搜那一片數據。」
他頓了頓:「就像圖書館以前把所有書堆在一起,現在分門別類放不同房間。
找小說去A房間,找歷史去B房間,不用把所有房間都翻一遍。」
賈瀞雯看著數據,心裡一陣激動。
這意味著,百度的搜索速度將達到一個新高度,甚至可能超過那家美國公司。
「穩定性呢?」她問。
「測了一周,沒問題。」李明說,「而且分布式架構更健壯。
一台伺服器宕機,只影響一部分數據,其他還能正常服務。
不像以前,主庫一掛,全癱。」
「太好了。」賈瀞雯站起來,「馬上部署,儘快上線。」
「等等。」李明說,「還有件事。
陳總昨天打電話,提了個新構想。
他說……光快還不夠,要更聰明。」
「什麼意思?」
「個性化排序。」李明翻開筆記本,「陳總說,現在的搜索結果是基於全網數據,對所有用戶都一樣。
但不同用戶的需求不同。
比如搜『蘋果』,程式設計師可能想找編程資料,果農可能想找種植技術,普通用戶可能想買水果。
如果能根據用戶的歷史行為,給每個人個性化的排序,體驗會更好。」
賈瀞雯思考著這個構想。
聽起來很先進,但……
「這涉及用戶隱私吧?」她問。
「對,所以陳總讓我們先做倫理研討。」李明說,「技術上是可行的。
我們可以記錄用戶的搜索歷史、點擊行為,建立偏好模型。
但這個數據怎麼用,邊界在哪裡,得想清楚。」
當天下午,賈瀞雯組織了倫理研討會。
參會的有技術核心、產品經理、法務顧問,還有新成立的用戶體驗團隊。
會議室里爭論得很激烈。
技術負責人張濤說:「從技術角度看,個性化是未來。
網際網路信息太多,用戶需要過濾。
我們幫他們過濾,這是服務。」
產品經理王磊搖頭:「但你怎麼知道用戶想要什麼?靠歷史行為推測,可能推測錯。
而且用戶會擔心:我的搜索記錄被保存,會不會泄露隱私?」
法務顧問李律師推了推眼鏡:「法律上目前沒有明確規定。
但用戶隱私是敏感問題。
如果我們要做,必須有嚴格的數據保護措施,還要給用戶選擇權——要不要開啟個性化。」
用戶體驗團隊的劉明說:「我做過用戶調研。
大部分用戶希望搜索結果更相關,但確實擔心隱私。
如果能有折中方案就好了。」
賈瀞雯聽著大家的討論,在白板上寫下關鍵點:技術可行性、隱私邊界、用戶選擇權、數據安全。
「這樣吧。」她最後說,「我們做,但要有底線。
第一,數據必須匿名化處理,不關聯具體用戶身份。
第二,用戶可以選擇是否開啟個性化功能,默認關閉。
第三,數據加密存儲,定期清理。
第四,明確告知用戶我們收集什麼數據,怎麼用。」
「如果用戶選擇關閉,還收集數據嗎?」王磊問。
「不收集。」賈瀞雯說,「只有開啟的用戶,我們才記錄行為。
而且用戶隨時可以關閉,關閉後數據立即刪除。」
【跪求禮物,免費的為愛發電也行!】