下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、網(wǎng)絡(luò)博客中話題選擇的性別差異王宇波(武漢大學(xué) 文學(xué)院,湖北 武漢,430072)wangyubo摘要:本文以國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心網(wǎng)絡(luò)媒體語(yǔ)言分中心的男女各50萬(wàn)篇博客文本為研究基礎(chǔ),首先探討了男女在話題選擇上的不同傾向,進(jìn)而通過(guò)正態(tài)驗(yàn)證、T檢驗(yàn)和卡方驗(yàn)證等手段,從統(tǒng)計(jì)學(xué)角度證明了:博客文本中男女話題選擇的差異非常大,具有顯著性。關(guān)鍵詞:網(wǎng)絡(luò)媒體監(jiān)測(cè)語(yǔ)料庫(kù);話題;性別差異;實(shí)證研究 The Gender Differences of Topic Selection Based on Web BlogsWang Yubo(Wuhan University, College of Chines
2、e Language and Literature, Hubei Wuhan, 430079)wangyuboAbstract: Based on 500,000 pieces web blogs of each gender from Network Media Language Branch of NationalLanguage Monitoring and ResearchCenter, the study firstly investigated male and females different tendencies on the selection of b
3、log topics. Then, by means of normal distribution tests, T-tests, chi square tests, and so on, the paper proved a fact from the angle of statistics that, in blog texts, the gender differences of topic selection were significant.Keywords: Network Media-Monitoring Corpora; Topics; Gender Differences;
4、Empirical Study 1引言關(guān)于男女話語(yǔ)選擇差異的研究,歐美學(xué)界的研究關(guān)注比較早,Klein(1971)、Aries(1976,1982)、Myerhoff(1980)、Wardhaugh(1986)等研究認(rèn)為男性談話的焦點(diǎn)總是圍繞政治、經(jīng)濟(jì)、競(jìng)爭(zhēng)、體育、商業(yè)及逗樂(lè),女性話題傾向于討論自身、感情、家庭、孩子以及夫妻關(guān)系等。中國(guó)關(guān)于男女話語(yǔ)選擇的差異研究起步較晚,多是國(guó)外研究成果的總結(jié),很少做有針對(duì)性的大范圍調(diào)查研究,確少專門(mén)針對(duì)國(guó)內(nèi)男女話題選擇的實(shí)際調(diào)查。并且,由于中外文化的差異,不同文化背景下的男女在話題選擇上表現(xiàn)出的差異必定不同。因此,國(guó)外的研究結(jié)論不能充分反映中國(guó)男女話語(yǔ)選擇的
5、差異。因此,本文通過(guò)對(duì)大規(guī)模具有性別屬性的博客語(yǔ)料進(jìn)行調(diào)查,比較男女性話題選擇上的差異是十分必要的。2、話題分類及話題選擇傾向根據(jù)網(wǎng)絡(luò)博客文本特點(diǎn),把博客主題大致分為27類,對(duì)男女各50萬(wàn)篇的博客文本進(jìn)行文本分類處理進(jìn)行文本分類的博客文本一共是1008755篇,其中男性博客500889篇,女性博客507866篇。,實(shí)現(xiàn)步驟如下:第一步:對(duì)所有文章進(jìn)行繁簡(jiǎn)轉(zhuǎn)化。第二步:用自動(dòng)化所的分詞軟件對(duì)所有文章進(jìn)行分詞。第三步:用正則表達(dá)式和停用詞表過(guò)濾已分好詞的博客。第四步:對(duì)27個(gè)類的訓(xùn)練語(yǔ)料進(jìn)行機(jī)器學(xué)習(xí),統(tǒng)計(jì)出27個(gè)類的詞頻表。第五步:對(duì)27個(gè)類的詞頻表進(jìn)行人工后干預(yù),利用專家的領(lǐng)域知識(shí)加強(qiáng)出現(xiàn)頻率不
6、高但區(qū)別度很高的專有名詞權(quán)重。第六步:按照樸素貝葉斯算法判斷每篇博客屬于各個(gè)類別的后驗(yàn)概率,取后驗(yàn)概率最大的類別作為分類結(jié)果。得到各個(gè)話題的文本數(shù)。見(jiàn)表1。表1 男女各話題的文本數(shù)男性女性D值差I(lǐng)T數(shù)碼383531748220871兩性生理12510115體育運(yùn)動(dòng)28710471623994健康醫(yī)療27466160-3414軍事國(guó)防16841391545歷史文化56598394820哲學(xué)人生407216312441娛樂(lè)追星807118017-9946宗教信仰23612732088家庭生活126634208957-82323工作求職1935972963情感婚姻7065979207-8548政治體
7、育培訓(xùn)597314094-8121文學(xué)藝術(shù)649830723426旅游度假728910506-3217時(shí)尚消費(fèi)1571337-1180星座占卜16372035-398雜談15151111592535586汽車房產(chǎn)1204457747法律制度30982672831游戲網(wǎng)游73516996652電視影視15622105325090科學(xué)技術(shù)19532791674經(jīng)濟(jì)財(cái)經(jīng)34916332858美容護(hù)膚1972118-1921美食佳肴25627315-47532.1男性話題選擇傾向以男性各話題的文本數(shù)為標(biāo)準(zhǔn),由高到底進(jìn)行降序排列可以看出,對(duì)男性而言,雜談是27個(gè)話題中文本數(shù)最多
8、的主題類別,占男性文本總數(shù)的30.25%,雜談?lì)愂俏覀冊(cè)谶M(jìn)行文本分類時(shí),無(wú)法把其歸為其他26個(gè)話題類別范圍之內(nèi)的文本,其內(nèi)容通常沒(méi)有固定的主題,多為隨感而發(fā)記錄作者心情或發(fā)表對(duì)相關(guān)事件人物的簡(jiǎn)短的看法,文本通常比較簡(jiǎn)短,話語(yǔ)量小。其次是家庭生活,占男性文本總數(shù)的25.28%,感情婚姻占14.11%、IT數(shù)碼占7.66%,談?wù)撟钌俚脑掝}是兩性生理,僅占文本總數(shù)的0.025%。Klein(1971)、Aries(1976,1982)、Myerhoff(1980)、Wardhaugh(1986)、Wardhaugh(1998)、趙蓉暉(2003)等都認(rèn)為,在日常閑聊時(shí),男性傾向于討論政治、法律、體育
9、、經(jīng)濟(jì)相關(guān)的話題,但是從上面的研究數(shù)據(jù)可以發(fā)現(xiàn),男性在網(wǎng)絡(luò)博客中最常討論的話題和日常閑聊討論的話題是有明顯差異的?!半s談、家庭生活、感情婚姻、IT數(shù)碼、體育運(yùn)動(dòng)”是男性在博客中討論最多的五個(gè)話題,約占男性被考察文本總數(shù)的83%,而其他22個(gè)話題僅占文本總數(shù)的17%,其中經(jīng)濟(jì)財(cái)經(jīng)占0.7%、政治體制占0.27%、法律制度占0.62%??梢?jiàn),話題的選擇與場(chǎng)景有密切的聯(lián)系,不同的場(chǎng)合,男性對(duì)話題的選擇傾向有很大的變化。2.2女性話題選擇傾向以女性各話題的文本數(shù)為標(biāo)準(zhǔn),由高到底進(jìn)行降序排列可以看出,27個(gè)話題中,家庭生活是女性談?wù)撟疃嗟闹黝},占女性文本總數(shù)的41.14%,其次是雜談?wù)?2.83%,感情
10、婚姻占15.6%、娛樂(lè)追星占3.55%,談?wù)撟钌俚氖莾尚陨?,僅10篇,約占全部文本數(shù)的0.002%。女性在網(wǎng)絡(luò)博客中最常討論的話題和日常閑聊討論的話題沒(méi)有明顯差異的。對(duì)女性各話題文本數(shù)所占百分比分析后可以看出,男女博客話題選擇的差異與國(guó)內(nèi)外對(duì)日常閑聊情境下男女話題選擇差異的研究成果不盡相同。主要表現(xiàn)在:以往研究認(rèn)為,在閑聊時(shí),女性才會(huì)傾向于選擇與家庭生活,感情婚姻相關(guān)的話題,男性不會(huì)。但通過(guò)以上研究發(fā)現(xiàn)表明,在博客文本中,男性談?wù)摷彝ド詈透星榛橐鱿嚓P(guān)的內(nèi)容是最主要的幾個(gè)話題之一,僅這兩個(gè)主題的文本數(shù)就占文本總數(shù)的39%。男女最常探討的前3個(gè)話題相同,即家庭生活、雜談、感情婚姻,僅是順序不同
11、,男性以沒(méi)有主題內(nèi)容的雜談居首,女性以家庭生活為主題內(nèi)容的話題居首。這也說(shuō)明,在日常閑聊和網(wǎng)絡(luò)博客兩種不同的交際狀態(tài)下,女男性對(duì)話題的選擇是有區(qū)別。3、差異顯著性檢驗(yàn)-X2(卡方)檢驗(yàn)以往研究都表明,在日常閑聊時(shí),男女在話題選擇上存在差異。本節(jié)將通過(guò)統(tǒng)計(jì)學(xué)的方法檢驗(yàn)博客語(yǔ)料中男女話題選擇的差異是否具有顯著性,即話題選擇的性別差異是否具有統(tǒng)計(jì)學(xué)上的意義。3.1差異顯著性檢驗(yàn)T檢驗(yàn)是最常用的檢驗(yàn)數(shù)據(jù)是否具有顯著性差異的假設(shè)檢驗(yàn),其前提是數(shù)據(jù)必須符合正態(tài)分布。因此,在進(jìn)行T檢驗(yàn)之前要進(jìn)行數(shù)據(jù)的正態(tài)驗(yàn)證。3.2正態(tài)驗(yàn)證由于兩組話題選擇數(shù)據(jù)是由27對(duì)配對(duì)數(shù)據(jù)組成,因此要對(duì)其進(jìn)行正態(tài)驗(yàn)證,只需驗(yàn)證他們的差
12、值d是否符合正態(tài)分布關(guān)于成對(duì)T檢驗(yàn)的前提詳見(jiàn)第十二章第三節(jié)。本節(jié)將利用SPSS(17.0)軟件來(lái)輔助驗(yàn)證男女話題選擇兩組數(shù)據(jù)的差值d是否符合正態(tài)分布。3.2.1 Kolmogorov-Smirnov 檢驗(yàn)為了檢驗(yàn)?zāi)信掝}選擇差值d是否符合態(tài)分布,我們應(yīng)用非參數(shù)Kolmogorov-Smirnov 正態(tài)性檢驗(yàn)方法,借助統(tǒng)計(jì)軟件SPSS17.0,得到結(jié)果見(jiàn)表2所示。表2 單樣本 Kolmogorov-Smirnov 檢驗(yàn)One-Sample Kolmogorov-Smirnov Test差值dN27Normal Parametersa,bMean-259.2593Std. Deviation190
13、95.19102Most Extreme DifferencesAbsolute.269Positive.248Negative-.269Kolmogorov-Smirnov Z1.397Asymp. Sig. (2-tailed).040a. Test distribution is Normal.b. Calculated from data.從上表可知,“近似P值(雙尾)”(Asymp. Sig.(2-tailed)為0.04,小于臨界值0.05,故可認(rèn)為差值d不服從正態(tài)分布。3.2.2散點(diǎn)圖驗(yàn)證也可以通過(guò)繪制Q-Q圖和P-P圖來(lái)直觀的判斷差值d是否符合正態(tài)分布。由于P-P圖是根據(jù)變量的
14、累積概率對(duì)應(yīng)于所指定的理論分布累積概率繪制的散點(diǎn)圖,用于直觀地檢測(cè)樣本數(shù)據(jù)是否符合某一概率分布。如果被檢驗(yàn)的數(shù)據(jù)符合正態(tài)分布,則代表樣本數(shù)據(jù)的點(diǎn)應(yīng)當(dāng)基本在代表理論分布的對(duì)角線上。Q-Q圖的結(jié)果與P-P圖非常相似,只是P-P圖是用分布的累計(jì)比,而Q-Q圖用的是分布的分位數(shù)來(lái)做檢驗(yàn)。和P-P圖一樣,如果數(shù)據(jù)為正態(tài)分布,則在Q-Q正態(tài)分布圖中,數(shù)據(jù)點(diǎn)應(yīng)基本在圖中對(duì)角線上。從下面的兩圖我們發(fā)現(xiàn),散點(diǎn)并不在對(duì)角線上,也說(shuō)明差值d不符合正態(tài)分布。因此,我們不能對(duì)男女話題選擇的兩組數(shù)據(jù)進(jìn)行T檢驗(yàn)和其他類型的參數(shù)檢驗(yàn)。3.3非參數(shù)檢驗(yàn)-卡方驗(yàn)證由于差值d不符合正態(tài)性分布,不滿足參數(shù)檢驗(yàn)的前提,因此我們采用非參
15、數(shù)檢驗(yàn)來(lái)驗(yàn)證男女話題選擇是否具有顯著性差異。非參數(shù)檢驗(yàn)是不依賴總體分布的統(tǒng)計(jì)分析方法,是指在總體不服從正態(tài)分布且分布情況不明時(shí),用來(lái)檢驗(yàn)數(shù)據(jù)資料是否來(lái)自同一個(gè)總體假設(shè)的一類檢驗(yàn)方法。當(dāng)參數(shù)檢驗(yàn)的應(yīng)用條件不能滿足,或有些分組數(shù)據(jù)一端或兩端為不確定數(shù)值時(shí),均要用非參數(shù)檢驗(yàn)。卡方驗(yàn)證是一種非參數(shù)性驗(yàn)證,馬廣惠(2003:105)指出“當(dāng)需要檢驗(yàn)分類數(shù)據(jù)或分組數(shù)據(jù)的分布和這些理論上期望的分布是否一致時(shí),X2是最有效的檢驗(yàn)方法?!薄笆钦Z(yǔ)言研究中最常用的一種非參數(shù)驗(yàn)證之一?!毕旅嫖覀儾捎每ǚ津?yàn)證中的獨(dú)立性驗(yàn)證來(lái)檢驗(yàn)博客文本中話題選擇的性別差異是否具有顯著性。借助統(tǒng)計(jì)軟件SPSS17.0,得到卡方驗(yàn)證的結(jié)果
16、,見(jiàn)表3所示。表3 Chi-Square TestsValuedfAsymp. Sig. (2-sided)Pearson Chi-Square86702.647a26.000Likelihood Ratio92547.88726.000Linear-by-Linear Association138.7161.000N of Valid Cases1008772a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 67.03.卡方檢驗(yàn)的結(jié)果通過(guò)表3“Chi-Square Tests”中的“
17、Pearson Chi-Square”一欄對(duì)應(yīng)的Value值和Asymp.Sig值可以查到,Value值86702.647即是x2值,Asymp.Sig值.000即是計(jì)算出的P值。當(dāng)P值小于0.05,說(shuō)明兩者之間存在顯著性差異。假若P值大于0.05,說(shuō)明兩者之間沒(méi)有顯著性差異。由于獨(dú)立性驗(yàn)證中的自由度df=(r-1)*(K-1),即行的數(shù)目減1乘以列的數(shù)目減1,df=(27-1)*(3-1)=52。查卡方分布表,對(duì)應(yīng)的自由度df=52,a=0.05的X2的臨界值為67.50,由于檢驗(yàn)統(tǒng)計(jì)值X2為86702.647,遠(yuǎn)遠(yuǎn)大于臨界值,同時(shí)P值為0.000<0.05。因此通過(guò)檢驗(yàn)統(tǒng)計(jì)值X2和P
18、值兩者可以判定:博客文本中男女話題選擇的差異非常大,具有顯著性。4、結(jié)論通過(guò)上面的調(diào)查可以發(fā)現(xiàn):博客文本中,男女對(duì)話題選擇的差異具有顯著性;在網(wǎng)絡(luò)博客和日常閑聊兩種不同的語(yǔ)境下,男性對(duì)話題的選擇會(huì)有明顯變化,日常閑聊中最常出現(xiàn)的“政治、兩性、經(jīng)濟(jì)、體育”等話題,并不是博客文本中男性最常討論的主題,相反,一直被學(xué)界認(rèn)為在閑聊時(shí)男性極少談?wù)摷彝?、情感等話題,卻成了男性在博客中最常見(jiàn)的幾個(gè)話題之一。我們認(rèn)為,這是由于博客具有的個(gè)人性、即時(shí)性、開(kāi)放性、交換性等多重特征,使得博客明顯不同于日常閑聊時(shí)的語(yǔ)境,因此,在日常閑聊和網(wǎng)絡(luò)博客兩種語(yǔ)境下,男性對(duì)話題的選擇出現(xiàn)了明顯的變化。當(dāng)然,話題選擇上的性別差異
19、不只限于成年人,在少年兒童中也同樣存在,Brooks-Gunn & W·Matthews(1979)、Gookwin(1990)等分別考察過(guò)白人和黑人子女的日常話語(yǔ)狀況,他們發(fā)現(xiàn),白人男孩較多地談?wù)擉w育運(yùn)動(dòng)、交流各種信息,白人女孩卻較多地談?wù)搶W(xué)校的事情、坦露內(nèi)心思想;黑人男孩比較喜歡宣揚(yáng)自己的“成就”,黑人女孩則更多地議論各自的外貌、打扮和相互之間的關(guān)系。參考文獻(xiàn):(1)賈玉新. 跨文化交際學(xué)M.上海:上海外語(yǔ)教育出版社,1997.(2)趙蓉暉. 語(yǔ)言與性別口語(yǔ)的社會(huì)語(yǔ)言學(xué)研究M.上海:上海外語(yǔ)教育出版社, 2003.(3)馬廣惠. 外國(guó)語(yǔ)言學(xué)及應(yīng)用語(yǔ)言學(xué)統(tǒng)計(jì)方法
20、M.西安: 西北農(nóng)林科技大學(xué)出版社 ,2003.(4)Aries, E. 1976. Interaction patterns and themes of male, female, and mixed groups. Small Group Behaviour, 7, pp. 7-18.(5)Aries, E. 1982. Verbal and nonverbal behavior in single-sex and mix-sex groups. Psychologica
21、l Reports 51, 127-34.(6)Klein, J. 1971. The family in“traditional”working-class England. In M. Anderson(ed.) Sociology of the Family, Baltimore, Penguin.(7)Myerhoff, B. 1980. Number Our Day. New York, Simon & Schuster.(8)Brooks-Gunn, J. & Matthews, W. 1979. He and She: How Children Develop T
22、heir Sex-role Identity. Englewood Cliffs, NJ:Prentice-Hall.(9)Goodwin, M. H. 1990. He-Said-She-Said: Talk as Social Organization among Black Children. Bloomington, Indiana University Press.(10)Fasold, R.The Socialinguistics of LanguageM.北京:外語(yǔ)教學(xué)與研究出版社, 2000. (11)Wardhaugh, R.Introduction to Socialing
23、uisticsM. 北京:外語(yǔ)教學(xué)與研究出版社, 1998.References:(1)Jia yuxin.1997. Intercultural Communication studiesM. Shanghai: Shanghai Foreign Language Education Press.(2)Zhao ronghui. 2003. Language and GenderSociolinguistic Studies on Spoken LanguageM. Shanghai: Shanghai Foreign Language Education Press.(3)Ma guanghui. 2003. Statistical Methods of Foreign Linguistics and Applied LinguisticsM. Xian: Northwest A&F University Press.(4)Aries, E. 1976. Interaction patterns and themes of male, female, and mixed groups. Small Group Behaviour, 7, pp. 7-18.(5)Arie
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度環(huán)保工程財(cái)產(chǎn)保全擔(dān)保協(xié)議3篇
- 甘肅2025年甘肅省中醫(yī)藥研究院招聘高層次人才3人筆試歷年參考題庫(kù)附帶答案詳解
- 2025版智慧醫(yī)療健康項(xiàng)目承包服務(wù)合同2篇
- 昆明2025年云南昆明市五華區(qū)云銅中學(xué)合同制教師招聘筆試歷年參考題庫(kù)附帶答案詳解
- 新疆2025年新疆昌吉州引進(jìn)人才65人筆試歷年參考題庫(kù)附帶答案詳解
- 2025年度個(gè)人住房公積金貸款合同(異地購(gòu)房)4篇
- 2024年滬科新版九年級(jí)歷史上冊(cè)月考試卷
- 2025年浙教版九年級(jí)地理下冊(cè)階段測(cè)試試卷
- 2025年粵教滬科版八年級(jí)歷史上冊(cè)月考試卷
- 2025年度個(gè)人二手房翻新裝修工程合同書(shū)
- 我的消防文員職業(yè)規(guī)劃
- 2024年世界職業(yè)院校技能大賽高職組“市政管線(道)數(shù)字化施工組”賽項(xiàng)考試題庫(kù)
- 介紹蝴蝶蘭課件
- CSC資助出國(guó)博士聯(lián)合培養(yǎng)研修計(jì)劃英文-research-plan
- 《環(huán)境管理學(xué)》教案
- 《阻燃材料與技術(shù)》課件 第5講 阻燃塑料材料
- 2025年蛇年年度營(yíng)銷日歷營(yíng)銷建議【2025營(yíng)銷日歷】
- (一模)寧波市2024學(xué)年第一學(xué)期高考模擬考試 數(shù)學(xué)試卷(含答案)
- 金蛇納瑞企業(yè)2025年會(huì)慶典
- 安保服務(wù)評(píng)分標(biāo)準(zhǔn)
- T-SDLPA 0001-2024 研究型病房建設(shè)和配置標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論