




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1第十章
中文測試與評價2
測試與教學大綱、教材編寫及課堂教學并稱語言教學四大要素。語言測試可以用來對受試的語言能力作出判斷,同時也可以用來檢驗和評估語言教學的效果。3第一節(jié)
測試與評價的設計一、測試與評價的基本概念與理論(一)基本概念教學中經常會遇到“測試”“考試”“測驗”“測量”“評價”“評估”等術語,這些術語之間既相互關聯(lián)又存在不同程度的差異。測試指的是在教育過程中,測量學生某一個領域的能力或知識的系統(tǒng)程序或方法。考試與測試是同義詞,但更多時候是指與教學大綱相聯(lián)系的評價。
4測試和測驗也是同義詞。測驗的種類主要分為四大類:智力測驗、教育測驗、心理測驗、職業(yè)測驗。在心理學領域的測量專指心理測量。斯克瑞文:評價的核心是價值判斷。根據(jù)教學評價的不同目的,評價分為形成性評價和總結性評價。形成性評價是在教學活動過程中進行的評價,對提高教育活動質量有重要作用;總結性評價是在教學活動結束后對其結果進行的評價,主要目的是問責。5布魯姆:將形成性評價定義為在教學過程中為了獲得有關教學的反饋信息,改進教學,使學生對所學知識達到其所需掌握的程度而進行的系統(tǒng)性評價,是教學控制的關鍵一環(huán)。
安置性評價:發(fā)生在教學開始前,是教師根據(jù)教學大綱,對學生已學知識和技能的掌握程度進行的評價,不僅包括對舊知識與技能的掌握程度,也包括對即將開展的新的教學知識的掌握程度。診斷性評價:在學生學習的形成性階段就對學生的學習進行必要的檢測,診斷學習中存在的問題,通過必要的矯正來實現(xiàn)掌握。6(二)理論基礎
語言測試從語言學、語言教學法和學習論取得科學內容,從心理與教育測量學獲得科學手段,成了一門跨學科的綜合性科學。
語言測試經歷了三個發(fā)展階段:傳統(tǒng)或科學前階段,現(xiàn)代或心理測量結構主義階段,以及后現(xiàn)代或心理語言學社會語言學階段。7二、語言測試的整體設計(一)確定測試的目的/功能;(2)確定測試目標;(3)確定測試形式與題型。8二、語言測試的整體設計(一)確定測試的目的/功能;1.安置性測試、診斷性測試和選拔性測試安置性測試(PlacementTest)。用于評估學生的語言能力水平,以便將學生安排到合適的課程或班級中。診斷性測試(DiagnosticTest)的目的在于確定學生在特定方面是否需要更多的幫助。選拔性測試(SelectiveTest)的目的在于通過測試,按一定的條件進行選拔。92.形成性測試和總結性測試。依據(jù)測試實施階段的不同,可將測試分為形成性測試、總結性測試。形成性測試(FormativeTest)是在正在開展的語言課程的不同階段設置的考試,用來測試學生們學到了什么,通過及時揭示問題,及時反饋以促進教學。總結性測試(SummativeTest)更傾向于在課程結束的時候設置,是對學生一定時期的較全面的學習狀況所進行的價值判斷,旨在對教育活動作出總結性的結論,甄別優(yōu)劣,鑒定分等,為各級決策人員提供參考依據(jù)。103.成績測試、能力測試和表現(xiàn)性測試。
成績測試(AchievementTest)的目的,是在不同的學習階段,檢查學生對所學內容的掌握程度,看是否達到了教學大綱預定的目標。
能力測試(ProficiencyTest)與成績測試不同,并不考慮考生的具體學習內容,是為了測試不同教育背景下學生的能力而設計的。
表現(xiàn)性測試(PerformanceTest)既有別于能力測試,也有別于成績測試。表現(xiàn)性測試同樣不考慮考生的具體學習內容,在這一點上與能力測試是相同的。11(二)確定測試目標
語言測試整體設計的第二個步驟,是要依據(jù)課程目標或教學目標確定測試目標。
評價的目的是檢驗課程目標或教學目標的實現(xiàn)程度,因此應根據(jù)教學目標的性質選擇適當?shù)脑u價方法。12(三)確定測試形式與題型
在確定測試目標之后,需要確定測試形式,如是檔案袋測試還是面試,是直接測試還是間接測試,是客觀測試還是主觀測試,等等。從題型的角度可將測試分為客觀性測試和主觀性測試??陀^性測試題指考生得分客觀、評分不受評卷人主觀因素(如英語水平、情感、疲勞等)影響的試題。常見的題型有多項選擇題、完形填空題、正誤判斷題、配對題等。主觀性測試題的評分需要評分員的主觀參與,要依據(jù)評分標準給出分數(shù),考生得分會受評卷人主觀因素影響或控制,如寫作題。13考試大綱至少需要包括以下方面:(1)考查目標,亦稱考查能力層次。它反映了該門課程對學生知識和能力的要求。(2)考查內容,反映了課程的基本綱要或內容體系。如果測試內容的覆蓋面過窄或過寬,測試結果就難以真正反映學生的學習發(fā)展水平;而測試內容的覆蓋面具有代表性,是保證測試效度以及對測試結果進行解釋的重要前提條件。(3)考查目標與考查內容的比例,亦稱權重。它反映了考查目標和考查內容各項目之間的相對重要性。可以結合學生完成測試所需時間、題目難度等因素綜合考慮,確定測試內容和試題分布。14三、測試試題的設計與編寫
為了編好試題,可以這樣做:(1)把握試題編寫原則及編寫時需要考慮的各個細節(jié),避免出現(xiàn)編寫時的一些常見問題。(2)了解考試對象,如考生使用的課本和所學習的內容、考生考試心理、答題行為等。(3)積累命題素材。一方面是積累考試時使用的語言材料,為題目設計做準備;另一方面則是累積考生之前的語言錯誤及相關研究等,為選項設計做準備。(4)完成試題編寫后,應認真進行審查修改。15(一)題干的編寫第一,題干簡單、準確、明了地陳述問題。編寫題目時,措辭需反復推敲。第二,題干一般只使用特指問句,不用是非疑問句、正反問句和選擇疑問句。第三,題干設計關注與語言材料有關的核心問題。題目要有效地,反映計劃考查的目標。第四,盡量不使用反向提問,尤其不要使用雙重否定。第五,題目與題目之間應有相對的獨立性,避免相互依賴、相互包含或相互暗示。16(二)選項的編寫1.選項的編寫原則如果是設計單項選擇題,首先要保證在多個選項中只有一個正確答案或最佳答案。其次,選項中應避免使用諸如“以上皆對”“以上皆錯”之類的詞以減少猜測概率。再次,正確答案與其他選項應大致相同。最后,選項應盡量避免使用與語言材料一樣的措辭。2.干擾項的編寫首先,教師根據(jù)自己的教學經驗判斷學生可能會犯的錯誤。其次,所有的干擾項都應顯得合情合理,具有吸引力。再次,每個干擾項都應該似是而非,具有一定的迷惑性。最后,為了使干擾項發(fā)揮作用,保證難度,應最大限度地避免題目內部的相互暗示。17編寫選項要注意避開以下暗示:(1)語法暗示。如果題干是不完整的,那么每一選項填入題干都應語法正確(考查語法的題目除外)。(2)選項間的不一致。各選項的難度、詞性、語體、感情色彩等如果截然不同,或其中一個與其他的不同,便會給考生造成暗示,使得測試效度降低。(3)答案位置。如果正確答案總是出現(xiàn)在某個位置,考生找到規(guī)律后也可能對不把握的題目進行猜測,固定選某個選項,從而降低了測試的效度。18第二節(jié)
測試與評價的質量分析
測試與評價的質量分析無論測試還是評價,都是對一組行為進行衡量,這組行為是表征目標能力的全部行為的一個抽樣。測試或評價的目的是提供一種客觀、準確、科學的測試工具,搜集有關教學的信息,為提高教學質量服務。一、測試與評價的質量分析
測試與評價的質量分析是借助數(shù)據(jù)統(tǒng)計方法,運用定量分析指標,如成績分數(shù)分布、平均分、信度、效度、難度以及區(qū)分度等指標,來判斷考試作為測量工具的檢測質量如何。質量分析也離不開價值判斷。19(一)基本分析
1.集中程度分析(1)平均數(shù)。所有數(shù)據(jù)xi的總和除以總個(次)數(shù)所得之商,簡稱平均數(shù)(Mean)或均數(shù)。(2)中數(shù)。將一組數(shù)據(jù)按大小順序排列后,處在數(shù)列中點位置的數(shù)值,即為中數(shù)(Median)。(3)眾數(shù)。眾數(shù)(Mode)是在一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值。202.分散程度分析(1)全距。全距(Range)又稱兩極差,用符號R表示。它是說明數(shù)據(jù)離散程度的最簡單統(tǒng)計量。
(2)方差和標準差。方差也稱變異數(shù)、均方,它是每個數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差乘方后的均值。方差也是表示數(shù)據(jù)離散程度的特征數(shù)。21(二)信度與效度分析大規(guī)模測試一般會報告本次測試的信度(Reliability)和效度(Validity)。信度又稱可靠性,指的是測量結果的一致性和穩(wěn)定性程度。效度是指測量結果的有效性程度,也就是所測得的結果與測量目標的符合程度。經典測量理論的幾個相關概念1.真分數(shù)經典測量理論的基礎是真分數(shù)理論,經典的信度理論是由真分數(shù)理論導出的。2.兩類誤差誤差是指在測量過程中由那些與測量目的無關的因素所產生的一種不準確的測量效應。223.CTT的三個假設假設一,真分數(shù)不變??忌哂泻愣ǖ男睦硖刭|,取值是常數(shù)。假設二,誤差完全隨機。這里包含兩層意思:一是重復測量無限多次,誤差的期望值為0;二是誤差與真分數(shù)之間、誤差與誤差之間、誤差與其他變量之間相互獨立。假設三,觀察分數(shù)等于真分數(shù)與誤差分數(shù)之和。X=T+E公式9以這一公式為基礎,可以做出一個意義重大而用途廣泛的推論,即觀察分數(shù)的方差等于真分數(shù)方差與誤差分數(shù)方差的和。4.平行測驗平行測驗是指能以相同的程度測量同一種心理特質的兩個或多個測驗。235.信度的不同定義在平行測驗中,所有誤差分數(shù)的方差相等,所有考生的誤差分數(shù)的方差相等。6.信度指數(shù)和信度系數(shù)信度指數(shù),指觀察分數(shù)與真分數(shù)的相關,其值等于真分數(shù)標準差與觀察分數(shù)標準差的比值。信度系數(shù),指兩個平行測驗間觀察分數(shù)的相關,其值等于真分數(shù)方差與觀察分數(shù)方差的比值。7.測量的標準誤248.常用的相關關系有積差相關、等級相關、質與量相關。(1)積差相關。積差相關也稱皮爾遜相關,是求直線相關的基本方法,適用于兩列數(shù)據(jù)都是測量的數(shù)據(jù),而且兩列變量各自總體的分布都是正態(tài)的情況,即正態(tài)雙變量。25(2)等級相關。①斯皮爾曼等級相關。斯皮爾曼等級相關適用于只有兩列變量,而且是屬于等級變量性質,具有線性關系的數(shù)據(jù)。②肯德爾等級相關。肯德爾等級相關中多計算肯德爾W系數(shù),又稱和諧系數(shù)(theKendallCoefficientofConcordance),是表示多列等級變量相關程度的一種數(shù)據(jù)。26
(3)質與量相關。若一列變量是等比或等距的測量數(shù)據(jù),另一列變量是按性質劃分的類別,那么這樣兩列變量的直線相關,稱為質與量相關,包括①點二列相關②二列相關③多系列相關27(三)試題質量分析對試題的定量分析,主要是測量每一道題的難度和區(qū)分度,隨后計算題目平均難度和平均區(qū)分度作為試卷的難度與區(qū)分度質量評價的參考。28二、測試分數(shù)的報告
在大規(guī)模標準化測試中,依據(jù)分數(shù)解釋的不同,可將測試分為標準參照測試和常模參照測試。標準參照測試是在一定的行為領域中按照具體的行為標準水平對被試的測試結果做出直接解釋的測試。測試結束后,一般以書面測試報告的形式向學生、家長及測試使用者告知測試結果。描述性報告是一種典型的質性反饋形式,是指對學生在評價中的表現(xiàn)以書面報告形式進行描述,一般由教師完成。描述性報告有時也顯得有些過分注意細節(jié),難以形成一個整體的反饋。29第三節(jié)
中文水平考試與
“教”“學”“考”一體化
考試、教學和考試結果的使用,三者構成一個系統(tǒng),要發(fā)揮系統(tǒng)的作用,三者必須協(xié)調。考試、教學和考試結果的使用又是完全不同的過程,應當區(qū)分開來,各司其職、各盡其責。一、中文水平考試
中文水平考試是為測試母語非漢語者的漢語水平而設立的國家級標準化考試。30HSK總體能力描述如下:通過HSK(一級)的考生能理解并使用一些非常簡單的中文詞語和句子,具備進一步學習中文的能力。通過HSK(二級)的考生能用中文就生活中一些常見的話題進行簡單而直接的交流。通過HSK(三級)的考生能用中文完成生活、學習、工作等方面的基本交際任務。通過HSK(四級)的考生能用中文就比較復雜的話題進行交流,表達較為規(guī)范、得體。通過HSK(五級)的考生能用中文就比較抽象或專業(yè)的話題進行討論、評價和發(fā)表看法,能較輕松地應對各種交際任務。通過HSK(六級)的考生能用中文自如地進行各種社會交際活動,中文應用水平接近中文為母語者。31HSKK總體能力描述如下:通過HSKK(初級)的考生可以聽懂并用中文口頭表達較為熟悉的日常話題,滿足基本交際需求。通過HSKK(中級)的考生可以聽懂并用中文較為流利地與中文為母語者進行交流。通過HSKK(高級)的考生可以聽懂并用中文流利地表達自己的見解。32HSK七至九級能力描述如下:HSK七至九級全面考查《標準》規(guī)定的中文言語交際能力、話題任務內容,衡量聽、說、讀、寫、譯五種語言技能。通過HSK(七級)的考生具備良好的聽、說、讀、寫能力和初步的專業(yè)翻譯能力。能夠就較為廣泛和較高層次的話題進行基本規(guī)范、流利、得體的社會交際。通過HSK(八級)的考生具備良好的聽、說、讀、寫能力和基本的專業(yè)翻譯能力。能夠就各類高層次或專業(yè)話題進行較為規(guī)范、流利、得體的社會交際。通過HSK(九級)的考生具備良好的聽、說、讀、寫能力和專業(yè)翻譯能力。能夠綜合運用各種技能,在各種情境下,就各類話題進行規(guī)范、流利、得體的社會交際。33二、中文水平考試的反撥效應
與小規(guī)模的校內測試不同,大規(guī)模測試往往是高風險測試、高利害測試。反撥效應是考試后效的一種。語言測試對語言學習、語言教學的影響被稱為語言測試的反撥效應。從影響對象看,包括考試的使用、考試對考生與教育者的影響、決策者對考試結果的解釋、任何可能產生的考試誤用和濫用以及預期以外的影響。34HSK面向成人中文學習者,其成績可以滿足多元需求,除了可以為中文學習者了解、提高自己的中文應用能力提供參考依據(jù)以外,還可以發(fā)揮以下作用:(1)為院校招生、分班授課、課程免修、學分授予提供參考依據(jù)。(2)為用人機構錄用、培訓、晉升工作人員提供參考依據(jù)。(3)為相關中文教學單位、培訓機構評價教學或培訓成效提供參考依據(jù)。35正面反撥效應主要體現(xiàn)在三個方面:第一,HSK基本能反映學生的中文水平,有助于學生發(fā)現(xiàn)自己目前的不足,從而調整學習方法和策略。第二,HSK能夠幫助學生提高中文交際水平。第三,HSK增加了學生學習中文的熱情,為后續(xù)的中文學習提供持續(xù)的動力。36負面反撥效應表現(xiàn)為阻礙學生的學習,不利于持續(xù)性、發(fā)展性學習。主要表現(xiàn)在兩個方面:第一,對于高級別的HSK考試,如HSK(五級)(六級),學生往往需要花費過多的精力備考,同時由于一般的課程教學與備考無關,因而準備HSK考試會在一定程度上影響課堂學習效率,學生會由此產生焦慮和壓力。第二,學生過分注重應試技巧,違背了語言學習的規(guī)律。從長遠角度看,學生的應試技巧學習行為會阻礙中文學習的進展,尤其是當課程學習與HSK考試無關時。37三、“教”“學”“考”一體化
要想實現(xiàn)中文水平考試與“教”“學”“考”一體化,教師、學生以及測試設計者應共同努力。
就教師來說,首先應全方位了解各等級的考試大綱及其相對應的能力要求,明確測試目標。其次,適當拓展教學內容,采取多樣的教學方法。最后,在組織測試反饋的過程中,教師要把握好知識特點,堅持“新知識及時測試,舊知識定期測試,易錯知識反復測試”的原則,尊重記憶和遺忘規(guī)律,促使學生及時掌握知識。
38
就學習者來說,首先應對HSK有正確的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 港口客運與城市規(guī)劃考核試卷
- 果蔬汁飲料的食品安全法規(guī)更新與合規(guī)考核試卷
- 初等教育的社會實踐任務考核試卷
- 海水養(yǎng)殖的市場需求與產品創(chuàng)新實踐考核試卷
- 熔爐工藝流程仿真與實踐考核試卷
- 產品釆購合同標準文本
- 代理技校招生合同標準文本
- 前期物業(yè)轉讓合同標準文本
- 供應貨品合同標準文本
- 漁業(yè)機械制造企業(yè)的人力資源管理考核試卷
- DB11∕T 2077-2023 城市副中心 新型電力系統(tǒng)10kV及以下配電網設施配置技術規(guī)范
- 石油鉆井平臺受限空間作業(yè)規(guī)范
- 屋頂分布式光伏電站專項施工方案
- 2024年中考語文考點專題復習標點符號含解析
- Python編程基礎(項目式微課版)教案1 1.1 Python概述
- 2024年外研版小學英語新教材教材介紹教材解讀-專題講座
- 內科護理學心肌病病人的護理
- 2024年共青團入團發(fā)展對象、積極分子考試測試題庫(附答案)
- 2024年北京市東城區(qū)中考二模道德與法治試題分析 教學設計
- 四川省住宅設計標準
- 全員品質管理制度
評論
0/150
提交評論