現(xiàn)代漢語詞量與分級公開課一等獎市優(yōu)質(zhì)課賽課獲獎?wù)n件_第1頁
現(xiàn)代漢語詞量與分級公開課一等獎市優(yōu)質(zhì)課賽課獲獎?wù)n件_第2頁
現(xiàn)代漢語詞量與分級公開課一等獎市優(yōu)質(zhì)課賽課獲獎?wù)n件_第3頁
現(xiàn)代漢語詞量與分級公開課一等獎市優(yōu)質(zhì)課賽課獲獎?wù)n件_第4頁
現(xiàn)代漢語詞量與分級公開課一等獎市優(yōu)質(zhì)課賽課獲獎?wù)n件_第5頁
已閱讀5頁,還剩35頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

現(xiàn)代漢語詞量與分級

思考一、現(xiàn)代漢語的詞量有多大?二、包括哪些詞語?三、分幾“級”合適?每級界限在哪?四、詞級劃分依據(jù)的標準和方法?當代最具影響力的兩個常用詞表:《現(xiàn)代漢語頻率詞典》,8548條《對外漢語教學詞匯大綱》,8822條“語法、語音是有系統(tǒng)的,詞匯是一盤散沙?!弊畛鯇嵺`,對《現(xiàn)代漢語詞典》的計量研究近幾年的實踐:《現(xiàn)代漢語常用詞表》,商務(wù)印書館,2008年11月“對外漢語1500常用詞”,見《中國語言生活狀況報告2006》,王鐵琨主編,商務(wù)印書館,2007年8月。(收入國家漢辦主編《國際漢語通用課程教學大綱》外語教學與研究出版社,2008年4月)“基礎(chǔ)教育3000基本詞”,見《中國語言生活狀況報告2007》,王鐵琨主編,商務(wù)印書館,2008年11月。一、現(xiàn)代漢語的詞匯量有多大?對詞典的考察對詞表的考察對大規(guī)模真實語料的考察從詞典來考察“詞匯量”1.《現(xiàn)代漢語詞典》的詞匯規(guī)范型詞典全面反映語言的詞匯體系,就要對詞語作全面收錄,不因某些詞語無需查檢而不收。規(guī)范型詞典對民族共同語詞匯的記錄是全面的,但不是窮盡的(在理論上和實踐上都是不可能的)?!冬F(xiàn)漢》是一部中型詞典,它在收詞上既是全面的,又有較強的選擇性。選詞的依據(jù),主要不是看查考的需要,而是看詞語在語言使用中出現(xiàn)的頻率。晁繼周、單耀海、韓敬體:《關(guān)于規(guī)范型詞典的收詞問題》,見《〈現(xiàn)代漢語詞典〉學術(shù)研討會論文集》,商務(wù)印書館,1996年版,第70、72頁?!冬F(xiàn)漢》詞條61000:-單字條10700(4000)-方言詞2600-科技術(shù)語60000*0.2=12000-書語詞3800=31900從嚴計算,32000-40000之間。在《現(xiàn)漢》的語文詞周圍存在一條寬闊的接壤詞匯帶:1.方言詞:《現(xiàn)代漢語方言大詞典》共41卷,收41個方言點的詞匯,平均每個點收詞8000條,其總數(shù)達30萬條以上。《漢語方言大詞典》20萬條2.術(shù)語詞、行業(yè)詞:數(shù)十個學科、行業(yè),以每個2000計,有數(shù)十萬條。3.新詞語:近30年間,30000余條,每年約1000條。4.文言詞:《辭源》10萬條,《漢語大詞典》非現(xiàn)代詞。《當代漢語詞典》中型語文詞典520002001《新華詞典》中型語文詞典500002005《現(xiàn)代漢語規(guī)范詞典》中型語文詞典800002005《辭海》大中型百科詞典1200001999《漢語大詞典》大型歷時詞典3700001994《中文大辭典》大型歷時詞典4300001962《漢和大辭典》大型歷時詞典4000001960《韓漢大辭典》大型歷時詞典4500002008方言詞與普通話詞語的區(qū)分:拇指–大拇指–大拇哥行業(yè)詞與普通話詞語的區(qū)分:招標、投標、競標、發(fā)標、中標、得標開標、唱標、流標、跑標、串標、圍標接聽主叫、被叫新詞語與普通話詞語的區(qū)分裸露、裸照、裸奔、裸泳、裸尸裸戲、裸曬、裸聊、裸背、裸肩/裸機、裸眼/裸捐、裸退、裸官書語詞與古語詞的區(qū)分:古語詞書語詞中性詞口語詞膺選登第、登科、及第當選、中選、入選考取、考中勖勵、勖勉激發(fā)、激勵、激揚、嘉勉、砥礪、慰勉勸勉、勉勵、鼓勵、勸導(dǎo)勸說、相勸、開解劬勞操勞奔波、勞累奔忙表名研制者詞語數(shù)時代現(xiàn)代漢語常用詞頻率詞典85481986對外漢語教學詞匯大綱國家漢辦88221992現(xiàn)代漢語詞表劉源710001984張氏詞庫張衛(wèi)國1090001999知網(wǎng)董振東810002005中文詞庫張潮生800002005中文信息處理用詞表孫茂松1200002007現(xiàn)代漢語常用詞表課題組560082008現(xiàn)代漢語語義分類詞典蘇新春830002008一般的分詞軟件所帶的詞庫容量:“10-15萬”從詞表來考察“詞匯量”從大規(guī)模真實語料來考察“詞匯量”來源/規(guī)模詞語數(shù)詞種數(shù)研制者時間通用語料庫(4500萬)25萬120000國家語委20002005年度(9億)165萬110000語言資源中心20062006年度(9.7億)260萬107000語言資源中心2007結(jié)論:從對詞典的考察來看,屬普通話詞匯的語文詞詞量約6萬左右。從對詞表和大規(guī)模真實語料來看,大概在8-10萬左右。確定詞量的關(guān)鍵在普通話詞匯與接壤詞匯之間如何劃界。二、現(xiàn)代漢語詞匯包括哪些詞種那么在6-8萬的普通話詞匯范圍中,包括了哪些詞語?試以下面三種為例:《現(xiàn)代漢語詞典》(63000/58000)《現(xiàn)代漢語語義分類詞典》(83000條/77000)《現(xiàn)代漢語常用詞表》(56008/55600)《現(xiàn)代漢語詞典》63000/580004573038329《現(xiàn)代漢語語義分類詞典》83000條/7700050567《現(xiàn)代漢語常用詞表》56008/55600交集比較:《現(xiàn)代漢語詞典》63000/58000457303832931032現(xiàn)代漢語語義分類詞典》83000/7700050567《現(xiàn)代漢語常用詞表》56008/5560005\06\07年度報告430000交集比較:結(jié)論:沒有一種詞匯集具有完全的“認同度”;沒有完整地包含它集或被它集所包含。不同規(guī)模、不同性質(zhì)、不同用途的詞匯集都有著自己“獨收子”。參與比較的詞匯集愈多,交集愈小,交集的“普遍性”愈突出。三、劃多少“級”合適?擬建構(gòu)“基本詞集”:第一級:3000條第二級:8000條第三級:30000條第四級:60000-80000條另有若干附屬的專集詞級劃分的參考因素:分布-分布率:使用-頻率-覆蓋率:基礎(chǔ)、重要的語義成分:服務(wù)對象、使用范圍:作用與功能結(jié)論:廣分布的詞,并不等于高頻詞;高頻率使用詞,不等于廣分布的詞母語學習者與第二語言學習者的不同;基礎(chǔ)教育學習者與社會使用者的不同;四者的共有詞05年總詞表(詞頻序號)50006522100001533615000265692000041252250006611530000171904310321650049普遍存在的詞不等于使用中的高頻詞基礎(chǔ)教育3000基本詞05年總詞表(詞頻序號)1000174220005577300024542普遍存在的詞不等于使用中的高頻詞四、詞級劃分依據(jù)的標準和方法頻次法分布法頻級法使用率使用度語義分布分布法與頻率法的對比教材分詞單位總數(shù)詞總數(shù)詞種數(shù)共用部分共用獨用詞種數(shù)比例%詞種數(shù)比例%詞種數(shù)比例%人教版342911287096248521046042.09927637.32511620.59蘇教版261997219337231801046045.12824635.57447419.3北師大版316522264280268951046038.89884032.87759528.24語文版368696306879284001046036.831012935.67781127.5四套教材詞語狀況:分布法頻次法序號詞文本數(shù)頻次數(shù)序號詞文本數(shù)頻次數(shù)3068平原27282372麥秸1503074逢27282373水上漂1503073噢27282374楊志1503076迷人27282420切斯特1493075靠近27282421信客1493079往日27282635帕霍姆1453078炎熱27282901賈蕓1413080向往27282902瑞恩1413082臉頰27272903王利發(fā)1413082不免27272974皮諾曹140分布法頻次法詞文本_頻次序頻次_文本序使用度序詞頻次序文本_頻次序使用度序平原306838763066麥秸23722747910195逢307439853079水上漂23732747810187噢307339863073楊志23742747710186迷人307639873078切斯特24202748010523靠近307539883080信客24212748110576往日307939893077帕霍姆26352748210907炎熱307839913075賈蕓29012748311211向往308039923074瑞恩29022748411212臉頰308241103082王利發(fā)29032748511213不免308241123081皮諾曹29742748611264分布法與頻次分的對比分析思考一:頻次統(tǒng)計法有相當?shù)恼`導(dǎo)性。頻統(tǒng)計法只有在具有大致相當?shù)姆植记闆r下才具有較好的參考性。思考二:使用度統(tǒng)計法能在一定程度上沖淡頻次信息的片面性,但它只適用于頻次與分布差別不大的現(xiàn)象適用。對頻次高分布窄的詞語不能起到足夠的校正作用,因為頻次畸高的因素仍會嚴重影響到綜合數(shù)值。思考三:詞語的分布信息比頻次信息有更好的參考價值。分布統(tǒng)計法能更準確地顯示詞語的通用性、基礎(chǔ)性、大眾性。頻級法的使用頻級:在調(diào)查對象中相同頻次的為一個頻級。頻級統(tǒng)計法:根據(jù)頻級調(diào)查詞語常用度的一種調(diào)查方法。適用于大規(guī)模語料調(diào)查。特別是對于立足于特性不一、容量差異明顯的多個語料庫之間比較的大規(guī)模詞匯統(tǒng)計。通常有升序,降序等?!冬F(xiàn)代漢語常用詞表》的

詞頻序號使用的是頻級法由于詞語的來源面比較寬,各種語料都有自己的覆蓋面與構(gòu)成特點,詞表中的詞語不能在每種語料中都得到全部顯現(xiàn)。同一個詞語在不同語料庫中的頻次也可能相差較大,因而不同語料庫中的具體頻次之間缺乏嚴格的可比性。用頻級統(tǒng)計則能較客觀地顯示每個詞語的使用情況。頻級就是同一語料庫中的所有詞語按頻次數(shù)量的多少排列時體現(xiàn)出來的排位順序。相同頻次的為一個頻級。

頻級統(tǒng)計分兩步施行。第一步形成不同類型語料的頻級:檢測語料有“通用語料庫”、“人民日報”、“文學

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論