



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于天網(wǎng)搜索引擎的高校用戶娛樂搜索行為研究基于天網(wǎng)搜索引擎的高校用戶娛樂搜索行為研究【摘要】本文基于天網(wǎng)中文搜索引擎的日志對教育網(wǎng)用戶的娛樂搜索行為進(jìn)展研究。發(fā)現(xiàn)教育網(wǎng)用戶檢索藝人的頻次分布符合冪律分布特征,說明藝人的被檢率存在馬太效應(yīng)。用戶進(jìn)展娛樂搜索的時間特征和普通檢索根本相似,但在全天某些時段呈現(xiàn)頂峰期。不同類型高校用戶進(jìn)展娛樂搜索時的性別偏好存在明顯差異?!娟P(guān)鍵詞】搜索引擎用戶日志eb挖掘娛樂搜索行為AResearhftheERNetUsersEntertainentSearhingBehavirs【Abstrat】Inthispaper,theuserlgfTianang,ahine
2、sesearhenginesyste,isinvestigatedtbserveusersentertainentsearhingbehavir.Theresultshsthatthefrequenydistributinfhinesepp-starbEingsearhedisper-ladistributin,hihipliesthereisaattheEffethere.ThetiedistributinfusersentertainentsearhingbehavirbearssesiilaritytthatfthEIrgeneralsearhingbehavir,althughther
3、eareseveralrushhurshenusersretrieveentertainentinfratinrefrequentlyduringaday.Usersfrdifferenttypesfuniversitiespreferdifferentgendershentheyretrieveentertainentinfratin.【Keyrds】SearhEngineUsersLgebiningEntertainentSearhingBehavir1引言搜索引擎作為互聯(lián)網(wǎng)應(yīng)用的一個重要部分,其海量日志中蘊(yùn)含著很多潛在信息值得挖掘,其中的一個重要方面就是對于搜索引擎用戶行為的研究。目前學(xué)
4、界對于基于大規(guī)模搜索引擎日志的用戶行為研究集中在對用戶的普通使用行為的研究上。如文獻(xiàn)1對英文搜索引擎AltaVista、文獻(xiàn)2對搜狗搜索引擎、文獻(xiàn)3,4對北大天網(wǎng)等的日志進(jìn)展分析,得出搜索引擎用戶的根本行為特征,如使用頻次分布、查詢詞長度、會話時間、點(diǎn)擊習(xí)慣、訪問時間的分布、檢索詞的部分相似性等;在此根底上,進(jìn)而研究用戶查詢的多任務(wù)性57、用戶查詢的演化趨勢7,8以及用戶檢索目的分析3等深層問題。本文試圖研究特定用戶的特定信息檢索行為的特征,為此,本文以天網(wǎng)搜索引擎9日志為研究對象,對中國教育網(wǎng)中不同類型高校用戶的娛樂搜索行為特征進(jìn)展了分析比照,并對分析結(jié)果的傳播學(xué)意義進(jìn)展一些初步的討論。本文
5、所闡述的娛樂搜索行為特指用戶使用搜索引擎檢索娛樂圈中比較活潑的藝人姓名,以獲取相關(guān)娛樂信息的行為。選擇娛樂搜索作為我們進(jìn)展用戶行為研究的對象,一方面是因為娛樂人物的列表比較容易獲取和分類,并且檢索娛樂信息是天網(wǎng)用戶使用的一個重要功能,對天網(wǎng)用戶的娛樂搜索行為進(jìn)展研究,具備一定的代表性。更重要的原因在于,不同類型用戶的娛樂搜索行為會具有比較明顯的差異,比方女性用戶和男性用戶檢索時偏好的藝人就具有明顯不同,這使得對本文的研究結(jié)果進(jìn)展討論具備了實際意義。之所以選擇天網(wǎng)搜索引擎作為研究對象,是因為天網(wǎng)是目前國內(nèi)最大的非商業(yè)性搜索引擎,其用戶群體比較固定,主要為教育網(wǎng)用戶。教育網(wǎng)用戶主要來自國內(nèi)的各高校
6、,通過查詢高校的IP網(wǎng)段可以有效識別用戶的來源高校,這樣通過比照不同類型的高校用戶,比方文史類高校和理工類高校用戶之間檢索行為的差異,就可以推斷出不同類型的用戶檢索行為的差異。本文的詳細(xì)安排如下:第一部分,討論天網(wǎng)用戶娛樂搜索行為的根本特征,如用戶來源、藝人被檢率分布、檢索時間分布等,并討論其與一般檢索行為的差異。第二部分,討論不同類型高校用戶檢索藝人的偏好現(xiàn)象,引入偏好值的概念描繪藝人被不同類型用戶檢索所偏好的程度,并基于該數(shù)值進(jìn)展聚類分析。第三部分,總結(jié)。2天網(wǎng)用戶娛樂搜索行為的根本特征本文研究的數(shù)據(jù)來自天網(wǎng)搜索引擎2002年12月份的用戶查詢?nèi)罩荆舶?577081條檢索記錄。在統(tǒng)計之
7、前,先進(jìn)展了一些必要的數(shù)據(jù)預(yù)處理工作,例如對同一IP一天內(nèi)重復(fù)檢索超過50次以上的重復(fù)記錄予以刪除、剔除無意義的檢索記錄和亂碼等等。2.1用戶來源地的判斷與用戶類型的劃分。對天網(wǎng)日志中的檢索記錄,我們通過用戶來源的IP地址判斷用戶的來源地。通過統(tǒng)計,我們發(fā)現(xiàn),天網(wǎng)搜索引擎作為一個主要面向教育網(wǎng)用戶的通用搜索引擎,其用戶群中高校用戶占很大比重。圖1顯示了2002年天網(wǎng)搜索引擎用戶的來源地分布情況:如前所述,這為我們判斷天網(wǎng)用戶的使用類型提供了一個較為可靠的途徑。因為天網(wǎng)的主要用戶來自各個院校,而不同類型高校的用戶群體特征是不同的,例如一般而言,理工類院校的男女用戶比例要比文史類院校高。這樣,借助
8、對檢索數(shù)據(jù)的統(tǒng)計,我們可以通過對來源地高校的識別,對搜索引擎的目的用戶進(jìn)展社會學(xué)意義上的分類。這是普通搜索引擎日志所難以實現(xiàn)的。2.2藝人主題詞表的建立與藝人被檢頻次統(tǒng)計。我們手工挑選出華人娛樂圈中比較活潑的1645名藝人作為本文的研究對象,并對樣本中的天網(wǎng)用戶查詢數(shù)據(jù)進(jìn)展統(tǒng)計,分別計算這些藝人的姓名被檢的次數(shù)。圖2顯示藝人被檢頻度的分布符合冪律分布特性,這說明藝人受網(wǎng)絡(luò)用戶關(guān)注的程度亦呈現(xiàn)出馬太效應(yīng)現(xiàn)象。2.3娛樂搜索行為的時間分布特征。我們統(tǒng)計了用戶娛樂搜索行為的時間頻度分布和普通檢索的時間頻度分布,發(fā)現(xiàn)娛樂搜索和普通檢索行為根本一致,但在特定時間段存在一些差異,如圖3所示。圖4顯示兩種檢
9、索的頻次比隨時間的分布,可以看出,在早上8點(diǎn)左右和晚上10點(diǎn)左右,用戶的娛樂搜索行為相對而言到達(dá)頂峰。3天網(wǎng)用戶的娛樂搜索偏好由于不同高校的用戶存在性別分布、專業(yè)背景等方面的差異,在進(jìn)展娛樂搜索時關(guān)注的藝人性別側(cè)重點(diǎn)可能存在不同。為了考察這一假設(shè)是否成立,我們將使用天網(wǎng)頻次最高的前100所高校分為三類:文史類如中國人民大學(xué)、綜合類如北京大學(xué)和理工類如清華大學(xué);同時對作為研究對象的藝人的性別進(jìn)展手工標(biāo)引。分別統(tǒng)計以上三類高校用戶對男女藝人檢索數(shù)的比值是否有所差異。我們發(fā)現(xiàn),不同類型高校用戶進(jìn)展娛樂人物檢索時關(guān)注的藝人男女比例確實存在不同,關(guān)注男女藝人的比例從低到高依次為理工類、綜合類、文史類。圖
10、5顯示了三類高校檢索女藝人和男藝人的比例。由于搜索引擎在用戶覆蓋范圍和客觀性方面具有一般市場調(diào)查所不可比較的優(yōu)勢,這種基于搜索日志統(tǒng)計得出的結(jié)論要比一般的市場調(diào)查的結(jié)果客觀性更強(qiáng)一些。因此我們認(rèn)為這種基于海量數(shù)據(jù)分析得出的調(diào)查結(jié)果對于藝人的市場定位和制訂相應(yīng)網(wǎng)絡(luò)營銷策略具有一定的借鑒意義。參考文獻(xiàn)1raigSilverstein,etal.Analysisfaverylargeebsearhenginequerylg.InSIGIRFru,fall1998,Vlun33Nuber1,6122余慧佳等.基于大規(guī)模日志分析的網(wǎng)絡(luò)搜索引擎用戶行為研究.第三屆學(xué)生計算語言學(xué)研討會(SL2022)3AndreiBrder,Ataxnyfebsearh.InSIGIRFru,fall2002,Vlue36Nuber240(25):9115SpinkA,zutluH,zutluS.ultitaskinginfratinseekingandsearhingpresses.JurnalftheAerianSietyfrInfratinSienesandTehnlgy,2002;53(8):6396526zutluS,SpinkA,zutluH.Aday
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年生物可降解塑料項目建議書
- 二零二五年度借調(diào)人員職業(yè)發(fā)展與離職交接協(xié)議
- 信息技術(shù)助力農(nóng)村發(fā)展合作合同書
- 某業(yè)務(wù)模塊操作指南
- 三農(nóng)科技示范推廣項目實施方案
- 小鴨子游泳故事解讀
- 2025年磷酸氧鈦鉀晶體(KTP)合作協(xié)議書
- 中學(xué)生課外閱讀經(jīng)驗交流征文
- 小公主童話故事解讀征文
- 文化藝術(shù)品保護(hù)及版權(quán)授權(quán)合同
- 2025年買賣雙方合同模板
- 最專業(yè)的企業(yè)介紹模板課件
- 2025國家電投集團(tuán)資本控股限公司本部招聘11人高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 2025年湖南中醫(yī)藥高等??茖W(xué)校高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2025新人教版英語七年級下單詞英譯漢默寫表(小學(xué)部分)
- 《聯(lián)合國教科文:學(xué)生人工智能能力框架》-中文版
- 2023年部編人教版六年級道德與法治下冊全冊課件【完整版】
- 第1課 古代亞非(教學(xué)課件)-【中職專用】《世界歷史》同步課堂(同課異構(gòu))(高教版2023?基礎(chǔ)模塊)
- 煙草栽培(二級)鑒定理論考試復(fù)習(xí)題庫-下(多選、判斷題匯總)
- 2008 年全國高校俄語專業(yè)四級水平測試試卷
- 需求供給與均衡價格PPT課件
評論
0/150
提交評論