漢字規(guī)范與規(guī)范漢字表的研制_第1頁
漢字規(guī)范與規(guī)范漢字表的研制_第2頁
漢字規(guī)范與規(guī)范漢字表的研制_第3頁
漢字規(guī)范與規(guī)范漢字表的研制_第4頁
漢字規(guī)范與規(guī)范漢字表的研制_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2008.11.8規(guī)范漢字表是國家當代書寫現(xiàn)代漢語通用語文本、處理現(xiàn)代社會與民眾直接相關的大規(guī)模信息所通用的漢字集合,體現(xiàn)國家當代通用漢字在字量、字形等方面的規(guī)范。字表共分三級:一級字表為基本通用字,是書寫現(xiàn)代漢語文本使用效度最高、規(guī)范作用最大的漢字的集合,是九年制義務教育基本用字,即常用字字集。二級字為次通用字,是使用頻度僅次于常用字、在常用字基礎上有所擴展的社會通用字,是知識階層和現(xiàn)代漢語專業(yè)出版物所需的擴展用字;三級字表是從人名用字、地名用字、科技用字和基礎教育文言文用字中選擇的準通用字,即一二級字表未能收入而在上述四個領域中使用頻度仍然較高的字。 新的規(guī)范漢字表研制完畢后,與規(guī)范漢字表

2、配套的規(guī)范漢字字典正在統(tǒng)稿階段。與規(guī)范漢字表配套的指南也在積極編寫中。指南說明了字表研制的理念,新舊規(guī)范的承襲和差異,應用的范圍、方法、原則,并提供了新的異體字整理表和簡繁字對照表。規(guī)范漢字表將在各個領域應用,關于新規(guī)范的理念與應用原則,將靠第一線的工作者們廣泛宣傳和細致指導。信息時代是漢字規(guī)范的必要性更加突顯的時代 我國現(xiàn)代漢字規(guī)范工作醞釀于20世紀初期。新中國成立后,由于一些領導人的提倡,這項事業(yè)由學術層面轉為國家行為,20世紀50年代以來的漢字規(guī)范政策,重要的是由國務院直接發(fā)布的,一般的或補充性質的,也是在國務院批轉的情況下,由文化、教育、出版或語言文字主管部門單獨或聯(lián)合發(fā)布的。 這些文

3、件的發(fā)布和半個世紀的貫徹實踐,為我國人民的語言文字生活注入了新的內容,形成了全國人民尤其是語言文字工作者牢不可破的規(guī)范意識和遵循規(guī)范的用字習慣,減少了各個領域使用漢字的難度,對文化、教育、出版和科技的發(fā)展,起到了無形地重要推動作用。試想一下,在幅員遼闊、人口眾多的中國,政治經濟如此統(tǒng)一的情況下,如果沒有通用層面的漢字規(guī)范,僅僅是國家政令和基礎教育這兩項,書寫不一的漢字將要帶給人們多少麻煩,就可以知道“規(guī)范”二字具有多大的分量了!中國正在實施的創(chuàng)新型國家的偉大戰(zhàn)略中,信息化成為實現(xiàn)這一目標的重要支撐。有人說:“現(xiàn)在的文字已經很少手寫,計算機的貯存空間又這樣大,規(guī)范的必要性已經逐漸減退了?!笔聦嵣?/p>

4、,在信息時代,發(fā)展政治、經濟、文化的重要條件,是及時和準確地獲得和傳播必要的信息。計算機成為傳播信息的工具,實現(xiàn)了信息傳播的高速度遠距離和高度的社會化。有了漢字這種傳播載體的標準化,才能實現(xiàn)信息傳播的速度和信度。在這種情況下,漢字規(guī)范的作用就更加突顯出來。漢字規(guī)范的科學性 漢字是記錄漢語的符號,一般情況下,它的產生、發(fā)展都是自然進行的。在漢字自然發(fā)展的過程中,內在的矛盾不斷產生。漢字在為全民所應用的長期過程中,受到各種內在關系和外在力量的相互制約而產生自組織現(xiàn)象,調節(jié)著簡與繁、多與省、亂與整的諸多矛盾,適應著社會的需要。 盡管有客觀規(guī)律操縱著漢字的存在與發(fā)展,處在某一具體階段的漢字,從總體看,

5、矛盾的存在是絕對的,平衡則是相對的,自發(fā)調節(jié)這些矛盾達到平衡的狀態(tài)需要經過相當長的時間。因此,在一定時期,為了需要必須進行人為的規(guī)范時,目的是使?jié)h字內部矛盾的調節(jié)在短期內奏效。 所以,它必須符合漢字發(fā)展的客觀的規(guī)律,一旦違背了漢字發(fā)展和使用的規(guī)律,那就必然使文字符號更難使用,更不切合社會的需要,與規(guī)范的初衷背道而馳。漢字規(guī)范的科學性就是在人為調節(jié)諸多矛盾時,必須遵循或不能違背漢字自身的發(fā)展規(guī)律。漢字的字量既要夠用又需要控制漢字有多少就夠用了?要看我們用字的目的是什么? 基礎教學用字是最起碼的;各學科學術著作用字相對多了一些專業(yè)術語用字;特殊領域用字還要多一些;古籍整理用字恐怕要算最多的了。最多

6、能多到多少字種?漢字實際的需要量比已經積累的字書、字庫的用量要少得多。多出來的字有三個來源:第一種是不同歷史層面不同字體的積淀;第二種是辭書儲存漢字時增加的無用例的錯別字;第三種是重復造的字。這些字就共時的使用而言都是冗余的字樣。儲備求全,使用求純。二者之間,存在著一個整理的問題,規(guī)范漢字表要提供合理的字量,還要選出真正有用的字。漢字的字數多多益善是一種認識上的誤區(qū) 漢字經歷數千年的發(fā)展,各種字體的構形首先積淀到說文小篆層面。說文小篆通過系統(tǒng)的字理分析,優(yōu)選了少量的字樣,用“六書”的前四書進行窮盡分析,構建了一個漢字的構形系統(tǒng)。這個構形系統(tǒng)是理想化的,它影響了今文字的構形,但它沒能控制漢字在楷

7、書層面上字數的增多,字書和字符集收字現(xiàn)在已經達到8-9萬字,有些字庫正在向13萬飆升,還在通過多方面的搜集無限增多。冗余字無限增多是一種災難識字難(學習吃力,浪費記憶)信息處理難(浪費貯存空間,接受與發(fā)出信息浪費人力與時間)辨認尋找難(規(guī)律被破壞,索引不好設,“暗里尋他千百度”)付出這樣困難的代價,收獲又是什么呢?對專業(yè)人士來說,可能擴大了0.1%的古書閱讀量;對普及層面來說,僅僅能夠滿足“識字多”的虛榮心,其他都是負作用。不要利用計算機的存儲量來做無意義甚至有害的事,縱容垃圾字泛濫。普及性古籍用字的字量和字頻與現(xiàn)代漢語用字的比較 前100字共字64字前300字共字127字共字76 76%23

8、20“四 書” 前100字共字47字前300字共字190字共字7427%14622708“三百千”與現(xiàn)代漢語高頻字字種差異與現(xiàn)代漢語3500常用字比較字種數總字數普及性古 籍56764近世楷書的字量舉例從斷代的需要出發(fā),由宋人手寫后雕刻的宋版書中抽樣選取文本總字數200471字,共整理出4856字種從18401首宋詩的1060696字中整理出的不重復單字4520個二者合并去重共5100多字累計魏至清代楷書的實際用字可以得出:楷書書寫和印刷的古籍字種12760字,其中用字量超過3個的字種7540字,可以稱為通用字的5540字,與宋代幾乎取齊覆蓋率與使用價值高增長臨界點缺字與三級字表的通用性8第一

9、,通用要考慮閱讀的頻度。例如,前面說到的西醫(yī)藥名、飲食營養(yǎng)學中的化學元素用字,文本的使用率并不高;但閱讀的幾率卻可以達到千家萬戶。又如,基礎教育語文教材的文言用字,也有少部分不屬于社會通用字,但是每年的教材印刷必須使用,歷屆老師、學生、家長必須面對,也是需要統(tǒng)一字形而進入規(guī)范的。8第二,通用要考慮儲備領域。以漢字為載體的信息,一部分是在流通領域通行的,還有一部分是儲備領域必須的。例如姓名,除了知名人士,一般的姓名在社會通用層面上使用度不會太高;地名,除了大城市、著名景點,一般的地名在社會通用層面上使用度也比較有限,根據字頻和使用度不能將它們收集出來。但是,無所不往的郵政、金融、交通等事業(yè),無人

10、不用的身份證、戶籍卡、學歷證書、病歷卡等證件,必須儲備可能用到的漢字。如果在信息處理上不去對這些字進行規(guī)范,也會引起社會信息儲備和使用的混亂。異體字問題8異體字屬于強迫一部分漢字“退役”,異體字的定義必須嚴格,不該“退役”的“退役”就會影響表達。8一異表存在正字義項不能包含非正字的現(xiàn)象。例如:熔(镕):在“溶化;溶解”義項上兩者都可使用,但在“1、熔鑄金屬的模具。2、規(guī)范,模式”義項上只能作“鎔”。又如:修(脩):在“干肉;舊時送給老師的酬金”等義項上只能用“脩”,其他義項相同。8一異表 存在完全不通用字。即:現(xiàn)代漢語中,正字與非正字不具有相同的記詞職能。其中包括無關的同音字、不同音的近義詞以

11、及非本國用字等。如上文所舉的“諂(謟)”“咱(倃)”,在音義上均不相關。8異體字要科學處理。在字表中恢復的異體字舉例1.誤做異體字取消,群眾已經自動恢復:皙(xi1) 2.群眾喜歡用做人名的字或有影響的人名用字:堃(坤 kun1)、喆(哲 zhe2)、昇(升sheng1)、淼(渺 miao3)等3.姓氏用字:仝(tong2)4.地名用字:砦(zhai4)、邨(村cun1) 漢字規(guī)范的社會應用性 漢字規(guī)范在某些社會應用領域具有強制性,特別是基礎教育、出版印刷、信息處理這三個領域,雖然屬于專業(yè)領域,但同時也涉及國內和海外學習漢語漢字的所有人群,如何使這些受眾使用方便,這不能不是一個出發(fā)點。 中國歷

12、史上的漢字規(guī)范有兩種情況:一種是權威的學術規(guī)范,它是由一些影響較大的學者通過他們的著作來實現(xiàn)的,例如許慎的說文解字 。另一種是權力的強制規(guī)范,它是通過政治力量來對漢字的應用規(guī)則作出硬性規(guī)定的,如唐代的干祿字書。這種規(guī)范一旦實行,就會成為社會用字的現(xiàn)實,使用者從不習慣到慢慢習慣,即使其中人為的規(guī)定從理論上看有不盡然合理之處,習慣成自然,也就具有了社會性。 我國50年代以來發(fā)布的規(guī)范,是屬于專家和權力相結合的規(guī)范,在方法上是最理想的。 協(xié)調好科學性與社會性的關系重視科學性,依照漢字的內在規(guī)律進行規(guī)范,是符合漢字發(fā)展長遠利益的;但是,漢字是一種社會運用的符號,它的人文性決定了完全符合數理邏輯的理想漢

13、字實際上并不存在。在廣大的使用領域,在計算機高超的貯存技術面前,理論有時顯得非常“低能”這“低能”有些是因為理論缺乏實踐的考驗,還不夠完善;還有一些是因為應用領域瞬息萬變的形勢,是滯后的理論研究無法反映的。大眾和專業(yè)領域的需求是不同的,分開層次解決問題更能切合需要。科學性與社會性一致的地方,應當大膽處理;科學性與社會性產生矛盾的地方,要認真協(xié)調,理論有時要做必要的讓步。一簡對多繁的問題兩岸的交流日益頻繁,信息的溝通要求速度和信度。兩岸共同的追求是利用計算機技術求得簡繁漢字準確的、快速的自動轉換,但是在轉換中出現(xiàn)了較大的誤差。漢字簡化系統(tǒng)第一種字用合并漢字的繁難不只是筆畫的繁多,更因為表意文字字

14、數的繁多。因為注意到減少字數,簡化漢字采用了較多的同音替代進行簡化,或合并了一些已經分化了的字形。例如:干干(干犯)、干(枝榦)、干(幹練、幹事)、亁(亁燥、亁脆)舍舍(房舍)、舍(捨棄)漢字簡化系統(tǒng)第二種字用合并8也是為了減少字數,簡化漢字取消了一批異體字,而這批異體字有一部分不是嚴格的異體字,無法用正字取代。例如:8分化字:背揹,布佈,欲慾8同源通用字:玩翫,游逰,志誌8部分通用字:雕鵰,哄閧,斤觔8同音借用字:,修脩 齣-出 “齣”是不組詞的自由語素,專用做量詞。前面有數詞和指代詞,但“出來”的“出”前面也有有量詞“一”和極個別其他量詞的時候: 一出去就不回來 太陽一出來天就亮了 六出祁

15、山面-麵 他一面點錢,一面罵罵咧咧 這是從前面茶棚里留聲機上放出來的。 發(fā)-發(fā)、髮 由此生發(fā)出各種新問題 生髮油用來生發(fā)板-闆 管他新板子老板子,作成家具涂上漆都一樣語言文字研究與技術的結合統(tǒng)計簡繁對應的多種情況,根據多種情況制訂簡繁對應的詞語表建立簡繁平行詞語庫,將其引進高精度簡繁智能轉換系統(tǒng)增加詞庫中語詞的單位,包括與轉換環(huán)境相關的詞組、多字段解決不等距離的單向區(qū)別字對轉換字的干預問題尋求便利用戶的個別轉換的技術處理方法控制類推的問題 簡化漢字第二表規(guī)定了“可作簡化偏旁用的簡化字和簡化偏旁”,共收132個簡化字和14個不成字的偏旁。這就是類推。在通用字范圍內,類推的原則已經貫徹,有些辭書無

16、限類推,超出了規(guī)定的范圍。類推的優(yōu)勢與弊病保持漢字的系統(tǒng),易于識別??傮w減少筆畫,書寫方便。改變字的結構,使字理模糊。有些字破壞了漢字的美觀性。出現(xiàn)了一些同形字。形成了一個新的“系統(tǒng)”,使古今距離與兩岸距離越來越遠。規(guī)范漢字表實行“有限類推簡化” 按簡化字總表第二表規(guī)定的132字與14個偏旁的范圍類推,不擴大范圍。簡化字總表第一表的繁體字作構字部件時,無論是整體或使局部一律不類推簡化。如“讏”,不能簡化為“(上)衛(wèi)(下)言”,也不能把上面部件居中的“韋”簡化為“韋”。 采用“部分代替全體”原則簡化的字(如“親”、“產”、“從”、“豐”、“廣”、“鄉(xiāng)”、“殺”、“與”、“云”等),以及結構產生變

17、化的字(如“備”、“薦”、“雙”、“義”等),原則上只在第一層次構字時類推,以保持原字的結構不受影響。 采用以上原則產生難以識別的怪異字或產生同形字,可以靈活處理。 字表以外的字不再類推怎樣使用規(guī)范漢字表規(guī)范漢字表根據普遍社會應用層面規(guī)定了字級、字量和字形,必須嚴格執(zhí)行,個人習慣在社會用字上要服從社會,服從法律。人名、地名、科技用字要服從規(guī)范,受到一定的限制。文言、手寫是力求規(guī)范,另行處理。在教育、教學領域制定應用字表,既要遵循規(guī)范漢字表的規(guī)定,又不能簡單截用其中的一段使用。教學要遵循循序漸進的原則,由易到難,而社會普遍應用層面的字頻,與漢字的難易度和構形相互依存的系統(tǒng)是不一致的。 三種語料庫

18、部分漢字頻次比較漢字中國發(fā)年成種分 體 物國家語委平衡語料庫頻次132129334350527380科普與教育綜合語料庫頻次92631392437363818適合第一學段兒童文學語料庫頻次132132156156103103223223119119251251299299541541264264分清“不規(guī)范字”與“未規(guī)范字” “規(guī)范漢字”對應著的兩個不同的概念:一個是“不規(guī)范的字”。已經有了規(guī)范漢字,在通用層面上書寫現(xiàn)代漢語文本時,仍然去用其他字形,就屬于不規(guī)范字。例如:我們認定“淚”為規(guī)范字,“淚”是它的嚴格異體字,不應當出現(xiàn)在現(xiàn)代漢語文本中。我們規(guī)定“險”“檢”“劍”“儉”為規(guī)范字,一般不要在簡化漢字文本里再出現(xiàn)“險” “檢”“劍”“儉”這樣的繁體字。錯別字就更是不規(guī)范的字了。另一個是“未規(guī)范字”,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論