版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、.1美國當代英語語料庫(COCA)使用說明.2/coca.3一、COCA語料庫簡介 COCA簡介 COCA:美國當代英語語料庫(Corpus of Contemporary American English)是由美國楊伯翰大學(xué)(Brigham Young University)的Mark Davies 教授開發(fā)的美國最新當代英語語料庫,是當今世界上最大的英語平衡語料庫。.4COCA語料庫簡介 COCA美國當代英語語料庫涵蓋美國這一時期的口語(spoken)、小說(fiction)、流行雜志(pop magzine)、報紙(newspaper)和學(xué)術(shù)期刊(
2、academic)五大類型的語料庫,并且在這五個類型方面基本呈均勻平衡分布。 網(wǎng)址:/cocalCOCA簡介.5選擇學(xué)習(xí)COCA的原因 1. COCA免費且在線方便。 2. 規(guī)模大(4.5億,1990-2012)、速度快(一般幾秒)、詞性標注易于理解。 3.時效性強每年至少更新兩次,并且每年新增2000萬詞匯。.6COCA界面簡介主要包括三大功能區(qū): 顯示及查詢條件界定區(qū),包括:顯示方式區(qū),字串查詢區(qū),語料庫分類區(qū),查詢結(jié)果排列方式區(qū)。 查詢結(jié)果數(shù)據(jù)顯示區(qū) 例句顯示區(qū).7 COCA界面簡介.8 COCA界面簡介 顯示方式區(qū): 1.LIST列表顯示 2.C
3、HART圖表顯示,可以顯示在各語料庫類型中的使用頻率和各時間段內(nèi)的使用情況。 3.KWICKey word in context,上下文關(guān)鍵詞顯示 4.COMPARE單詞比較顯示,比較兩個不同詞或短語的搭配情況。.9 COCA界面簡介.10 COCA界面簡介 字串查詢區(qū): 、WORDS:輸入字符串。 、COLLOCATES:上下文限定。 、POS LIST:詞性列表.11 COCA界面簡介.12COCA界面簡介 語料庫分類區(qū)(五大類型語料庫共包括42個子語料庫)。 功能:此區(qū)可以對查詢的字符串限定語料類型(Genre)和時段(Year) ,并且可以明確到查詢某一個子語料庫,時段也可以查詢?nèi)魏我?/p>
4、年的某個字詞的使用情況。.13COCA界面簡介 語料庫分類區(qū)(五大類型語料庫共包括42個子語料庫)。.14COCA界面簡介 語料庫分類區(qū)(五大類型語料庫共包括42個子語料庫)。.15二、COCA主要搜索功能 2.1 搜索搜索words、phrases、lemmas(單(單詞的所有形式)、詞的所有形式)、wildcards(通配符)和(通配符)和其他更加復(fù)雜的字詞。其他更加復(fù)雜的字詞。 例1. 輸入單詞“mysterious” (圖2.1.1-1):得到相關(guān)結(jié)果(圖2.1.1-2):在各子庫中的頻率,每百萬詞使用的頻率。 若對圖2中的相應(yīng)條塊進行點擊,那么就可以看到KWIC,如圖2.1.1-3
5、(以點Fiction的條塊為例):.16圖2.1.1-1.17圖2.1.1-2使用CHART顯示.18圖2.1.1-3 例句顯示區(qū)例句顯示區(qū)使用的是KWIC顯示.19KWIC顯示方式.20 藍色名詞 紫色動詞 綠色形容詞 棕色副詞 灰色代詞 黃色介詞KWIC顯示方式.21COCA主要搜索功能 例2. 輸入詞組輸入詞組“white+名詞名詞” (圖2.1.2-1),得到的結(jié)果都是white后面跟的名詞短語 (圖2.1.2-2),檢索表達式為:white n*。圖2.1.2-1.22圖2.1.2-2 White+名詞的短語規(guī)則:輸入名詞的話用正表達式規(guī)則:輸入名詞的話用正表達式: nn*;動詞;動
6、詞: v*; 形容詞形容詞: j*; 副詞副詞: r*;代詞代詞:p*;連詞連詞:c*.23POS LIST 詞性列表.24p noun.ALL=名詞p noun.SG=單數(shù)名詞p noun.PL=復(fù)數(shù)名詞p noun.CMN=普通名詞p noun.+PROP=專有名詞p noun.-PROP=非專有名詞POS LIST .25POS LIST p verb base=動詞原形p verb.INF=動詞不定式p verb MODAL=情態(tài)動詞p verb 3SG=動詞第三人稱單數(shù)p verb ED=過去式p verb EN=過去分詞p verb ING=現(xiàn)在分詞p verb.LEX=lexic
7、al verb實意動詞p verb.BE=系動詞p verb.DO=dop verb.HAVE=have.26p pron.INDF 不定代詞p pron.PERS 人稱代詞p pron.WH 疑問代詞p pron.REFL 反身代詞p adj.CMP 形容詞比較級 (comparative)p adj.SPRL 形容詞最高級 (superlative)p adv.particle 副詞小品詞p adv.WH 疑問副詞POS LIST.27p det.GEN 類指限定詞p det.POS 物主限定詞p num.CARD 基數(shù)詞p num.ORD 序數(shù)詞p conj.CRD 并列連詞p conj
8、.SUB 從屬連詞p Interj. 嘆詞p PUNC 標點POS LIST.28詞性列表的使用 1)查詢多義詞特定的詞性 2)某個詞前或者后面特定詞性的若干搭配詞,如confidence前的形容詞 3)詞性附碼放置的位置WORDS或 COLLOCATES處.29 例3.輸入通配符輸入通配符(wildcards),如分別輸入un*ly和r?n*,結(jié)果如圖。COCA主要功能(一)? 代替一個字母* 代替任意數(shù)量字母.30EXAMPLE 3.31EXAMPLE 3.32 例4.輸入輸入lemmaslemmas(即一個單詞的單復(fù)數(shù)單復(fù)數(shù)、時態(tài)時態(tài)等所有形式),若要得到sing這個單詞的所有形式,可以
9、如下圖所示。 COCA主要搜索功能.33規(guī)則:若要得到某個單詞的所有單復(fù)數(shù)和時態(tài)形式,那么就要在輸入時,在這個單詞外加 。EXAMPLE 4.34形容詞early的原形,比較級和最高級三種形式一次性檢索出來檢索EXAMPLE 4.35 例5.輸入某種詞性且部分帶有某些字母的命令輸入某種詞性且部分帶有某些字母的命令,如要得到以un-開頭、-ed結(jié)尾的所有形容詞的所有形式(見圖2.1.5-1)和得到動詞+任何詞+ground的所有詞組(見圖2.1.5-2):規(guī)則:若要得到某種詞性且詞中帶有部分帶有某些字母的形式時,如要得到以un-開頭、-ed結(jié)尾的所有形容詞的所有形式,那么輸入: un*ed.j*
10、;若要得到動詞+任何詞+ground的所有詞組,那么輸入: v*ground即可。前者用來研究詞匯,后者用來查詢特定詞性的搭配。COCA主要功能(一).36圖2.1.5-1 .37圖2.1.5-2 動詞+任何詞+ground的所有詞組.38 2.2 搜索搭配詞和出現(xiàn)的頻率搜索搭配詞和出現(xiàn)的頻率 如“thick后跟的名詞” (圖2.2-1)COCA主要搜索功能(二).39圖2.2-1 規(guī)則規(guī)則:在collocates里輸入n* 后選擇4,表示在thick4后面(4跨距范圍內(nèi))出現(xiàn)的任何名詞.40 如:跟在 “smile前面的形容詞” (圖2.2-2)規(guī)則:在words里輸入: smile.n*,
11、表示作為名詞的smile; 在collocates里輸入: aj*表示其前后出現(xiàn)形容詞的語境。COCA主要功能(二).41Confidence前使用的形容詞 圖2.2-3.42 2.3 搜索在子語料庫內(nèi)搜索在子語料庫內(nèi)(或之間或之間)出現(xiàn)的頻率出現(xiàn)的頻率(或比較或比較)(不同語域中的用法不同語域中的用法) 如在Fiction和Newspaper子語料庫中passionate后面可以跟任何名詞的詞及頻率,分別如兩圖(2.3-1和2.3-2)。COCA主要功能(三).43圖2.3-1 圖2.3-2 .44 但是也可以之間對兩者子語料庫中它們出現(xiàn)頻率的對比,操作:分別選擇section 1&
12、2,如下圖(圖2.3-3): COCA主要功能(三).45 2.4 進行語義傾向比較進行語義傾向比較 2.4.1 比較近義詞 如:近義形容詞hot和warm后面所跟名詞的區(qū)別(如圖2.4.1):COCA主要功能(四).46圖2.4.1 規(guī)則:在words的方格里分別輸入hot和warm,再在collocates方框里輸入nn*,表示后面所跟任何名詞。當然也可以比較在某個子語料庫中出現(xiàn)的頻率比較。 .47.48.49 2.4.2 比較反義詞 如:woman和man前面所跟的形容詞的區(qū)別(如圖2.4.2)圖2.4.2 規(guī)則:在words的方格里分別輸入woman和man,再在collocates方
13、框里輸入j*,選在左3,表示前面3個跨距內(nèi)所有的形容詞。當然也可以比較在某個子語料庫中出現(xiàn)的頻率比較。.50 2.4.3 搜索近義詞搜索近義詞 如:搜索beautiful的所有近義詞(如圖2.4.3-1)規(guī)則:在words的方格里輸入=beautiful,表示和beautiful語義相近的所有形容詞。.51 再如:搜索動詞clean的所有近義詞,如下圖:圖2.4.3-2 .52Question Application和increase能否作主謂搭配?.53查詢結(jié)果.54篩選出篩選出“應(yīng)用應(yīng)用”和和“增加增加”作主謂搭配的例句作主謂搭配的例句 The annual application of fertilizers has increased by 5.48% on average since 1980, and that of pesticide In ten Member States, average application of nitrogen increased almost 400%
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 招生政策調(diào)整與優(yōu)化
- 2025年股權(quán)交易合同修訂范本及條款3篇
- 二零二五年度苗木種植基地土壤修復(fù)合同范本4篇
- 2025年玻璃幕墻玻璃深加工與定制合同范本3篇
- 2025年度個人汽車租賃與智能駕駛輔助系統(tǒng)合同3篇
- 2024年03月湖南瀏陽農(nóng)村商業(yè)銀行股份有限公司招考35名員工筆試歷年參考題庫附帶答案詳解
- 2024西安市碑林區(qū)居間服務(wù)合同
- 2025年度家庭育兒嫂服務(wù)合同標準模板4篇
- 20202021數(shù)學(xué)北師大版選修1-1第一章-全稱量詞與全稱命題存在量詞與特稱命題課件
- 二零二五年度旅游景區(qū)門衛(wèi)服務(wù)合同4篇
- 春節(jié)行車安全常識普及
- 電機維護保養(yǎng)專題培訓(xùn)課件
- 汽車租賃行業(yè)利潤分析
- 春節(jié)拜年的由來習(xí)俗來歷故事
- 2021火災(zāi)高危單位消防安全評估導(dǎo)則
- 佛山市服務(wù)業(yè)發(fā)展五年規(guī)劃(2021-2025年)
- 房屋拆除工程監(jiān)理規(guī)劃
- 醫(yī)院保安服務(wù)方案(技術(shù)方案)
- 高效能人士的七個習(xí)慣:實踐應(yīng)用課程:高級版
- 小數(shù)加減法計算題100道
- 通信電子線路(哈爾濱工程大學(xué))智慧樹知到課后章節(jié)答案2023年下哈爾濱工程大學(xué)
評論
0/150
提交評論