搜索也泄密?我們該怎樣規(guī)范搜索信息_第1頁
搜索也泄密?我們該怎樣規(guī)范搜索信息_第2頁
搜索也泄密?我們該怎樣規(guī)范搜索信息_第3頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

搜索也泄密?我們該怎樣規(guī)范搜索信息

周濤(電子科技大學教授,電子科技大學互聯(lián)網(wǎng)科學中心主任)劉奕群(清華大學計算機科學與技術系講師)對話背景韓媒報道稱,韓國政府8月11日表示將分階段廢除網(wǎng)絡實名制,完善同意搜集個人信息制度等對策來保護個人信息安全。韓國互聯(lián)網(wǎng)在2007年7月實施實名制后,網(wǎng)民個人信息在網(wǎng)絡上被大批量偷竊或泄露。同時,嚴格管理用戶在自己使用過的電腦上留下的個人記錄,確保不被商業(yè)組織過多利用。網(wǎng)絡技術的進步使得個人隱私成了問題。但同時,我們又面臨著海量信息,想找到自己的那款好像大海撈針,搜索出來的無數(shù)條結果猶如廢品。一邊是泄密,一邊是廢品,互聯(lián)網(wǎng)搜索到底是怎么了?為什么在搜索中我們不容易得到自己需要的信息?在上網(wǎng)或搜索過程中會不會造成信息泄露?如何保護個人信息?就此,記者采訪了有關專家。用戶使用習慣和算法直接關系到搜索質量主持人:為什么在搜索中我們不容易得到自己需要的信息?周濤:首先,我認為在大部分情況下,借助搜索引擎,用戶能夠比較容易找到自己需要的信息。當然,有時候也會遇到困難,我認為原因有以下幾點:最本質的原因是信息爆炸性的增長;其次是一些技術的問題,譬如怎么樣判斷用戶輸入的搜索詞和網(wǎng)頁內容的相關程度等,也是麻煩的問題;再次,搜索引擎里面加入了很多商業(yè)因素,包括推廣鏈接,關鍵詞競價排名等等,這些都會在一定程度上影響搜索的質量。當然,用戶自身關鍵詞選擇沒有經(jīng)驗,也會影響搜索結果的獲得。主持人:這種搜索的盲目是否是搜索引擎故意設置?與技術有沒有關系?周濤:搜索的質量和搜索算法有直接的關系。當然,一方面算法在不停改進,另一方面,搜索的范圍在不斷擴大,用戶對信息準確程度的要求越來越高,所以用戶對搜索質量的評價不一定會提高。任何一個搜索引擎都希望用戶能夠盡快獲得所需要的信息,不會故意設置障礙!劉奕群:從我的角度來說,我很難設想搜索引擎會故意在用戶使用的過程中設置障礙。搜索引擎行業(yè)的競爭是非常激烈的,所有的搜索引擎公司都希望能夠最快地、最好地滿足用戶的需求。當然搜索引擎也和其他網(wǎng)站一樣,希望能夠盡量長時間地讓用戶留在這個頁面上,因為長時間的停留有可能會帶給它更多的利益,任何網(wǎng)站都是這樣。因此,搜索引擎肯定是想留住用戶,但是我很難想象搜索引擎會用設置障礙的方式將用戶留在上面更長時間,這也是不太現(xiàn)實的?,F(xiàn)在有一個比較明顯的誤區(qū),就是大家都認為只要把廣告放在搜索頁面上,就可以賺錢。這是完全不對的。因為所有的搜索引擎都不是通過“展現(xiàn)給用戶”的模式來計費的,搜索引擎都是采用點擊收費的模式。所以,如果在某次查詢時,搜索引擎給了用戶一個明顯不相關的廣告,這對搜索引擎來說也是一件很不劃算的事情。因為當用戶發(fā)現(xiàn)這是一個明顯的無關的欺詐行為的話,用戶可以選擇不點擊它,搜索引擎一樣賺不到錢。所以從這個意義上說,搜索引擎和用戶之間是共贏的:搜索引擎希望用戶找到自己最想要的東西,從而保持自己的競爭力;而另一方面,用戶也想通過搜索引擎找到最想要的。搜索引擎很難對所有信息都公平主持人:搜索引擎是不是應該對所有網(wǎng)站和信息都公平?周濤:世界上沒有絕對的公平,互聯(lián)網(wǎng)也一樣,但至少互聯(lián)網(wǎng)要比現(xiàn)實社會更公平。任何一個搜索算法本身肯定是具有傾向性的,譬如會傾向于有很多鏈接鏈入的網(wǎng)頁,會傾向呈現(xiàn)新近出現(xiàn)或新近活躍的網(wǎng)頁等等。但是這個算法給定之后,對于所有的網(wǎng)頁,它們的排序是嚴格按照算法來的,從這個意義上講,這是公平的。當然,百度開創(chuàng)性地把經(jīng)濟作為一個維度放入到搜索算法中,允許網(wǎng)頁的所有人通過付費的形式,提高網(wǎng)頁排名。從算法的角度來看,這應該是一種不公平的行為。不過,用戶不應該對此有太多的批評,我們首先要感謝這些搜索引擎對數(shù)千億網(wǎng)頁進行抓取分析。我們肯定也經(jīng)常通過這些搜索引擎獲得有價值的信息,因此允許它們引入一些“不公平”因素而很好活下去,對用戶自己也是有好處的。譬如,在沒有百度和必須繞過百度6個推廣鏈接之間,我覺得用戶肯定會選擇后者。從另一個角度講,如果百度賺到足夠多的錢并且開拓了很多新的商業(yè)模式后,能夠逐步減輕甚至放棄競價排名機制,用戶肯定是樂于看到的。劉奕群:搜索引擎很難做到對所有的信息是公平的。比如說,我是一個個人網(wǎng)站主,并開設了一個自己的網(wǎng)站,并不能說搜索引擎對我的網(wǎng)站的內容和對門戶網(wǎng)站的內容就是公平的。因為我的投入也不夠,盡管我的內容可能在某一個方面是非常漂亮的,但是很難為人所知,所以搜索引擎也很難抓取到。因此,完全的公平是很難做到的。從另一個角度講,搜索引擎并不是一個公益行業(yè),要完全地公平地呈現(xiàn)信息也是不太可能的?,F(xiàn)在搜索引擎會通過一些自己支持的項目使互聯(lián)網(wǎng)上的信息獲取盡量平等些。通過分析歷史和喜好呈現(xiàn)用戶自己的搜索結果主持人:有哪些技術或方法能讓用戶更快捷地找到對自己有用的信息?周濤:除了搜索中用到的切詞技術、語義分析、排序算法等等,我覺得在經(jīng)典搜索算法之外,最有可能改變搜索體驗的技術,就是所謂的個性化技術。簡而言之,是通過用戶以前搜索的結果和點擊的歷史,分析用戶的喜好,從而為每一個用戶呈現(xiàn)個性化的搜索結果。事實上,百度已經(jīng)推出了個性化搜索的服務,國內也有專門做個性化技術的公司,例如百分點科技。個性化搜索及其他互聯(lián)網(wǎng)的個性化服務會很快走入大多數(shù)互聯(lián)網(wǎng)用戶的生活。注意,個性化技術意味著用戶要損失一定的個人隱私。劉奕群:基于我們現(xiàn)有的搜索引擎應用環(huán)境,我有兩個建議。第一個建議是,如果用戶要進行一些商業(yè)意圖比較明顯的搜索的話,并不一定要通過一般搜索引擎來進行。當然這個對用戶的要求就比較高了,用戶應當可以了解一些我們稱之為“垂直搜索引擎”的資源。這個搜索引擎可能是面向某一個特殊的領域搜索。另一個建議是,因為搜索引擎面對的是一個非常復雜的信息環(huán)境,這個信息環(huán)境中可能有很多的噪音,很多的垃圾,這個是很難避免的。所以用戶在使用搜索引擎的時候一定要意識到搜索不是萬能的,是可能產(chǎn)生錯誤的。因此用戶在使用搜索引擎時,應當懷著一個“七分信任、三分懷疑”的心態(tài)去看網(wǎng)上的資源。個性化意味著要損失一定的個人隱私主持人:用戶有沒有什么方法能夠找到適合自己的信息?周濤:如果用戶希望主動獲取,我個人覺得最好的途徑還是搜索引擎。其次,用戶可以把自己常用的網(wǎng)頁收藏起來,譬如用Delicious提供的工具,并且用合適的標簽進行管理。以后,通過瀏覽興趣相投的其他用戶的收藏,或者同一組標簽下的其他收藏,很容易找到感興趣的內容。如果用戶希望被動獲取,那么推薦引擎是一個很好的選擇。主持人:推薦搜索引擎會不會引起個人信息泄露呢?周濤:這是一個平衡的問題,要想獲得更好的體驗,就需要犧牲一部分個人隱私。當然,這部分隱私應該只能被用于提高搜索的質量,而不能被企業(yè)公開或販賣或謀求其他利益。如果用戶擔心自己的隱私被泄露,但又想獲得更好的個性化的搜索體驗。我建議用戶在平時工作或者娛樂的時候,可以登陸使用個性化搜索。在特定的一些隱私活動,譬如搜索自己的一些病癥,搜索可能的訴訟問題,搜索色情網(wǎng)站等等的時候,就退出登錄。趣談《天龍八部》與推薦搜索找到你的那一款數(shù)千億計的網(wǎng)頁,淘寶的上億件商品,Delicious的數(shù)億網(wǎng)頁收藏,Amazon的百萬圖書,Netflix的數(shù)萬部電影……對于我們而言,僅僅是將這些瀏覽一遍也要窮盡若干人生,更不用提仔細思量比較,選擇最適合自己的產(chǎn)品。簡而言之,一般互聯(lián)網(wǎng)用戶對于絕大多數(shù)名義上可以獲取的信息都是一無所知的。搜索引擎的出現(xiàn),是解決信息過載問題的一個里程碑式的事件。搜索引擎的本質是幫助用戶找到“他想要的東西”。用戶在使用搜索引擎的時候,需要輸入若干關鍵詞進行查詢,這就意味著用戶使用之前,對于查詢結果的內容和形式存在著預設的期望。典型如查找某機構地址和聯(lián)系方式,某網(wǎng)站主頁,某八卦新聞詳情等。推薦引擎的本質是幫助用戶找到“他喜歡的東西”。推薦引擎在沒有把用戶喜歡的東西呈現(xiàn)給用戶之前,用戶對這些東西很可能是一無所知的:既不知道其存在性,更談不上預先知道是否喜歡了。推薦引擎是通過用戶以前的訪問記錄,猜到用戶喜歡什么,然后把用戶喜歡的東西找出來,推送到用戶面前。以《天龍八部》為例,段譽在無量山山洞中見到神仙姐姐的時候,就植下了一生的情種。之后在燕子塢見到王夫人的時候,覺得有三四分相似;見到王語嫣的時候,覺得有七八分相似。從此,段譽對王語嫣的愛慕?jīng)]有變化過。對于這種需求,搜索引擎最合適不過了,想象段譽可以把神仙姐姐的特征轉化成關鍵詞輸入進去,我們的任務就是在千千萬萬的候選人中找出最象神仙姐姐的那位!段正淳則不一樣,愛過的女人很多,刀白鳳、秦紅棉、甘寶寶、阮星竹、王夫人、馬夫人……可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論