版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
教育研究方法網(wǎng)上輔導(dǎo)六次(第七章實(shí)驗(yàn)法)第一個(gè)問題實(shí)驗(yàn)法概述實(shí)驗(yàn)研究方法初始于自然科學(xué)的研究。我國古代的《墨經(jīng)》中記載的“針孔成像”、古希臘阿基米德計(jì)量“王冠”含金量,都是公認(rèn)的古代科學(xué)實(shí)驗(yàn)的典型。近代以來,實(shí)驗(yàn)法逐漸用于社會(huì)科學(xué)的研究。在教育領(lǐng)域,自從1768年裴斯泰洛齊創(chuàng)辦“新莊”實(shí)驗(yàn)學(xué)校,許多教育家相繼創(chuàng)辦各種實(shí)驗(yàn)學(xué)校,特別是拉伊和梅伊曼把實(shí)驗(yàn)科學(xué)的實(shí)驗(yàn)?zāi)J揭氲浇逃芯恐衼?,推?dòng)了在教育教學(xué)各個(gè)方面進(jìn)行實(shí)驗(yàn)研究的開展。時(shí)至今日,實(shí)驗(yàn)研究方法成為教育科學(xué)研究的重要方法之一。實(shí)驗(yàn)及其基本要素介紹定義、三個(gè)要素、和實(shí)驗(yàn)的基本邏輯。1.實(shí)驗(yàn)即實(shí)驗(yàn)法的定義實(shí)驗(yàn)和實(shí)驗(yàn)法可以從不同的方面和角度給予說明。一些有特點(diǎn)的定義如下:由研究者對(duì)一個(gè)變量的操縱和對(duì)結(jié)果的有控制的觀察和測量所構(gòu)成的任何研究。1一種在有控制的條件下可重復(fù)的觀察;其中一個(gè)或更多的獨(dú)立變量受到控制,以使建立起來的假設(shè)或者假說所確定的因果關(guān)系有可能在不同情景中受到檢驗(yàn)。2實(shí)驗(yàn)研究是一種研究情境,在此情境中至少涉及一個(gè)自變量,即實(shí)驗(yàn)變量,他受到研究者的精心處理或控制。3教育實(shí)驗(yàn)研究方法是為了解決教育中的問題,根據(jù)一定的教育理論或假設(shè)組織有計(jì)劃的教育實(shí)踐,經(jīng)過一定的時(shí)間,就實(shí)驗(yàn)效果進(jìn)行比較分析,從而得出有關(guān)實(shí)驗(yàn)因素的科學(xué)結(jié)論。4教育研究方法是研究者按照研究目的,合理地控制或創(chuàng)造一定的條件,人為地變革研究對(duì)象,從而驗(yàn)證假設(shè)探討教育現(xiàn)象因果關(guān)系的一種研究方法。教育實(shí)驗(yàn),或許是變化某個(gè)條件而使其余條件保持恒定,或許是讓多個(gè)條件同時(shí)變化,分析這些條件的影響以及它們之間可能的相互作用。5實(shí)驗(yàn)的一般定義:一種經(jīng)過精心的設(shè)計(jì),并在高度控制的條件下,通過操縱某些因素,來研究變量之間因果關(guān)系的方法。實(shí)驗(yàn)的基本目標(biāo)是決定兩個(gè)變量之間是否具有因果關(guān)系。一般來說,在實(shí)驗(yàn)過程中,研究者通過引入(或操縱)一個(gè)變量(即自變量),以觀察和分析它對(duì)另一個(gè)變量(即因變量)所產(chǎn)生的效果。從方法論上看,實(shí)驗(yàn)是定量研究的一種特定類型,它比其他幾種教育科學(xué)研究方法更直接地基于實(shí)證主義的背景和原理。尤其是在檢驗(yàn)變量之間的因果關(guān)系方面,實(shí)驗(yàn)研究具有最突出的效用。因?yàn)?,判斷因果關(guān)系的三個(gè)條件在實(shí)驗(yàn)研究的方式中,可以得到最為充分的滿足。2.實(shí)驗(yàn)法的三個(gè)要素作為一種特定的研究方式,實(shí)驗(yàn)法有著三對(duì)基本要素。分別是:·實(shí)驗(yàn)組與控制組;·前測與后測;·自變量與因變量。任何一項(xiàng)實(shí)驗(yàn)研究,一般都會(huì)涉及到這些基本要素??梢哉f,實(shí)驗(yàn)研究的這三種基本要素,構(gòu)成了實(shí)驗(yàn)研究所具有的獨(dú)特的語言。(1)自變量與因變量自變量是引起其他變量變化的變量,故也稱作原因變量。而因變量則稱作結(jié)果變量。在實(shí)驗(yàn)研究中,自變量又稱作實(shí)驗(yàn)刺激(experimentalstimulus),而因變量則往往是研究所測量的變量。實(shí)驗(yàn)研究的中心目標(biāo)是探討變量之間的因果關(guān)系,其基本內(nèi)容是考察自變量對(duì)因變量的影響,即考察實(shí)驗(yàn)剌激對(duì)因變量的影響。與一般意義上的自變量有所不同的是,實(shí)驗(yàn)中的自變量通常都是二分變量,即它通常只有兩個(gè)取值:有和無,即給予實(shí)驗(yàn)刺激或不給予實(shí)驗(yàn)剌激。(2)前測與后測在一項(xiàng)實(shí)驗(yàn)設(shè)計(jì)中,通常需要對(duì)因變量(或結(jié)果變量)進(jìn)行前后兩次相同的測量。第一次在給予實(shí)驗(yàn)剌激之前,稱為前測(pretest)。第二次則在給予實(shí)驗(yàn)剌激之后,稱為后測(posttest)。研究者通過比較前測和后測的結(jié)果,來衡量因變量在給予實(shí)驗(yàn)刺激前后所發(fā)生的變化,反映實(shí)驗(yàn)刺激(自變量)對(duì)因變量所產(chǎn)生的影響。這種測量既可以是一次問卷調(diào)查,也可以是一項(xiàng)測驗(yàn)。(3)實(shí)驗(yàn)組與控制組實(shí)驗(yàn)組(experimentalgroup)是實(shí)驗(yàn)過程中接受實(shí)驗(yàn)剌激的那一組對(duì)象。即使是在最簡單的實(shí)驗(yàn)設(shè)計(jì)中,也至少會(huì)有一個(gè)實(shí)驗(yàn)組??刂平M(controlgroup)也稱為對(duì)照組,它是各方面與實(shí)驗(yàn)組都相同,但在實(shí)驗(yàn)過程中并不給予實(shí)驗(yàn)刺激的一組對(duì)象??刂平M的作用是向人們顯示,如果不接受實(shí)驗(yàn)刺激那樣的處理,那么將會(huì)怎樣,與實(shí)驗(yàn)組形成比較。在實(shí)驗(yàn)研究過程中,研究者不僅觀察接受刺激的實(shí)驗(yàn)組,同時(shí)他們也觀察沒有接受實(shí)驗(yàn)剌激的控制組。并通過比較對(duì)這兩組對(duì)象的觀察結(jié)果,來分析和說明實(shí)驗(yàn)刺激的作用和影響。3.實(shí)驗(yàn)的邏輯和實(shí)驗(yàn)的條件(1)實(shí)驗(yàn)的邏輯如果我們根據(jù)某種理論命題得到兩個(gè)變量之間存在因果聯(lián)系的假設(shè),或者我們根據(jù)經(jīng)驗(yàn)事實(shí)和主觀判斷,推測現(xiàn)象X是造成現(xiàn)象Y的原因,即:X→Y。為了證明這一假設(shè),我們首先觀察Y的變化情況。即先測量在沒有受到X的影響之前,Y的情況如何,然后,通過操縱某些條件,引入被看作自變量和原因的實(shí)驗(yàn)刺激,即引入X,接著再對(duì)引入X以后Y的情況進(jìn)行測量,并比較前后兩次測量的結(jié)果。如果前后兩次的情況發(fā)生變化,則可以初步認(rèn)為X是導(dǎo)致Y變化的原因,即檢驗(yàn)了X→Y。這可以說就是實(shí)驗(yàn)研究的最基本的分析邏輯。如下圖所示。當(dāng)然,這只是一種最簡化的情形,同時(shí),它也是一種最理想的情況。實(shí)際的教育科學(xué)實(shí)驗(yàn)的形式要復(fù)雜得多。一般情況下,任何兩種事物或現(xiàn)象之間的關(guān)系,都會(huì)同時(shí)受到若干其他事物或現(xiàn)象的影響。要說明這兩種事物或現(xiàn)象之間存在因果聯(lián)系,實(shí)際上就意味著,人們要排除其他相關(guān)事物或現(xiàn)象造成因變量發(fā)生變化的可能性,即要排除其他各種因素造成因變量Y在前后兩次測量中所得的結(jié)果不同的可能性??赡苄宰畲蟮囊粋€(gè)影響因素是前測的影響,即人們第一次對(duì)因變量Y進(jìn)行測量的行為本身對(duì)因變量就已經(jīng)產(chǎn)生了影響。它使得在人們引入實(shí)驗(yàn)刺激(即引入自變量X)和在對(duì)因變量進(jìn)行第二次測量(即后測)之前,因變量就已經(jīng)發(fā)生了變化,因而人們帶著前測情況的影響進(jìn)行后測,從而使后測結(jié)果產(chǎn)生變化(或有所不同)。正是為了排除這種因素造成結(jié)果變化的可能性,需要有一個(gè)控制組。對(duì)這個(gè)控制組來說,它也接受前后兩次對(duì)因變量Y的測量,但卻不對(duì)其實(shí)施實(shí)驗(yàn)刺激,即不引入自變量X。這樣,在“實(shí)驗(yàn)組和控制組這兩組對(duì)象是相同的”的前提下,人們就可以從實(shí)驗(yàn)組前后兩次測量之差中,減去控制組前后兩次測量之差,從而得到僅由自變量X所產(chǎn)生的影響。這就是為什么實(shí)驗(yàn)研究的分析邏輯中必須有“實(shí)驗(yàn)組”、“控制組”這一對(duì)基本要素的原因。注意上面所說的“在‘實(shí)驗(yàn)組和控制組這兩組對(duì)象是相同的’前提下”這句話的含義,自然就會(huì)提出另一個(gè)重要的問題:實(shí)驗(yàn)組和控制組的對(duì)象是否相同?以及如何使得或保證這兩個(gè)組的對(duì)象相同?如果實(shí)驗(yàn)組和控制組這兩組對(duì)象本身就不同,那么,對(duì)這兩組對(duì)象進(jìn)行前測和后測所得到的結(jié)果也會(huì)不一樣,他們之間的測量結(jié)果實(shí)際上是不可比的。換句話說,由兩組對(duì)象前后測之差相減所得到的,并不就是實(shí)驗(yàn)剌激X的影響,其中還夾雜著由兩組對(duì)象本身的差異所造成的影響。正是為了排除這種影響,實(shí)驗(yàn)研究又必須面對(duì)實(shí)驗(yàn)對(duì)象選擇的問題。通過一個(gè)假設(shè)的例子來具體說明實(shí)驗(yàn)研究的基本邏輯,以及實(shí)驗(yàn)的三組基本要素在實(shí)驗(yàn)中所扮演的角色。假設(shè),研究者對(duì)某種新的教學(xué)方法的效果感興趣,即他希望探討:“新的教學(xué)方式”(自變量)與“學(xué)生成績提高”(因變量)之間的是否存在因果關(guān)系?他選擇了兩個(gè)各方面情況都差不多的班級(jí),并在開學(xué)初對(duì)這兩個(gè)班級(jí)的學(xué)生進(jìn)行了相同科目、相同試卷的測驗(yàn)(前測)。然后,在其中一個(gè)班級(jí)(實(shí)驗(yàn)組)按一種新的教學(xué)方式進(jìn)行教學(xué)(給予實(shí)驗(yàn)剌激),而在另一個(gè)班級(jí)(控制組)中,仍按照原來的教學(xué)方式進(jìn)行教學(xué)。學(xué)期末,他再對(duì)這兩個(gè)班級(jí)的學(xué)生進(jìn)行第二次相同科目、相同試卷的測驗(yàn)(后測),并對(duì)測量結(jié)果進(jìn)行比較。如果兩班學(xué)生后來的學(xué)習(xí)成績相差無幾,則說明新的教學(xué)方式(實(shí)驗(yàn)刺激)并沒有起作用;如果只有實(shí)驗(yàn)組的成績提高了,而控制組的成績沒變化;或者雖然兩班學(xué)生的成績都提高了,但實(shí)驗(yàn)組學(xué)生的成績提高得更多,則可以看作是新的教學(xué)法所起的作用和產(chǎn)生的影響。(2)實(shí)驗(yàn)的條件進(jìn)行一項(xiàng)具體實(shí)驗(yàn)必須滿足這樣幾個(gè)基本條件:①必須建立變量之間因果關(guān)系的假設(shè)。實(shí)驗(yàn)研究的目標(biāo)就是檢驗(yàn)和證明因果關(guān)系。因此,變量之間因果關(guān)系的假設(shè)是實(shí)驗(yàn)研究的邏輯起點(diǎn)。在進(jìn)行一項(xiàng)具體實(shí)驗(yàn)時(shí),研究者必須事先建立起兩個(gè)變量之間因果關(guān)系的明確的假設(shè)。同時(shí),研究者應(yīng)了解他所要引人的自變量是什么,他要測量的因變量是什么,特別是要清楚如何引入作為自變量的實(shí)驗(yàn)刺激。②自變量必須能夠很好地被“孤立”。這即是說,所要引入和觀測其效果的變量必須能夠與其他變量隔離開,即實(shí)驗(yàn)環(huán)境能夠很好地“封閉”起來。在許多實(shí)際研究中,這一點(diǎn)往往是最難做到的。比如,如果研究者希望研究電視節(jié)目對(duì)兒童行為的影響,他就必須從兒童所受到的家庭影響、學(xué)校影響、同齡群體影響和其他大眾傳媒影響中,嚴(yán)格地“孤立”出“電視的影響”這一因素,顯然,這在實(shí)踐上常常是相當(dāng)困難的。③自變量(實(shí)驗(yàn)刺激)必須是可以改變的,同時(shí)也是容易操縱的。最簡單的改變是“有”和“無”,對(duì)應(yīng)的操縱則是“給予實(shí)驗(yàn)刺激”和“不給予實(shí)驗(yàn)刺激”;更為復(fù)雜的改變則是程度上的變化,比如刺激程度的“強(qiáng)”、“中”和“弱”以及刺激時(shí)間的長短等。④實(shí)驗(yàn)程序和操作必須能夠重復(fù)進(jìn)行。實(shí)驗(yàn)作為教育科學(xué)與自然科學(xué)在研究方法中最接近,而且程序和操作也最嚴(yán)格的一種研究方法,可重復(fù)性是必須具備的重要條件之一。從另一個(gè)角度說,實(shí)驗(yàn)的可重復(fù)性也是實(shí)驗(yàn)結(jié)果所具有的確定性(或信度)的重要基礎(chǔ)。⑤必須具有高度的控制條件和能力。對(duì)實(shí)驗(yàn)對(duì)象(包括實(shí)驗(yàn)組和控制組)的嚴(yán)格控制,以及對(duì)實(shí)驗(yàn)環(huán)境的高度把握,共同決定著實(shí)驗(yàn)研究的結(jié)論的準(zhǔn)確程度??梢哉f,控制是實(shí)驗(yàn)研究的本質(zhì)特征,沒有控制就沒有實(shí)驗(yàn)。因?yàn)楦鶕?jù)實(shí)驗(yàn)的基本邏輯,如果研究者在實(shí)驗(yàn)中缺乏適當(dāng)?shù)?、?zhǔn)確的控制,他就無法確定實(shí)驗(yàn)所得到的結(jié)果究竟是由于他所假設(shè)的因素(自變量)所導(dǎo)致,還是由于一些其他未能加以控制的因素所導(dǎo)致。二、實(shí)驗(yàn)的分類1.實(shí)驗(yàn)室實(shí)驗(yàn)與實(shí)地實(shí)驗(yàn)嚴(yán)格的實(shí)驗(yàn)研究通常在實(shí)驗(yàn)室內(nèi)進(jìn)行,當(dāng)然實(shí)驗(yàn)也可以在現(xiàn)實(shí)社會(huì)生活中進(jìn)行。前者稱為實(shí)驗(yàn)室實(shí)驗(yàn)(laboratoryexperiment),后者稱為實(shí)地實(shí)驗(yàn)(fieldexperiment)。在心理學(xué)中,實(shí)驗(yàn)室實(shí)驗(yàn)的例子更多。例如,研究者希望探討“群體的一致性規(guī)范”對(duì)人們的行為所形成的壓力和影響。實(shí)驗(yàn)在一個(gè)專門的實(shí)驗(yàn)室進(jìn)行。每次安排四名實(shí)驗(yàn)對(duì)象進(jìn)入實(shí)驗(yàn)室。研究者首先告訴實(shí)驗(yàn)對(duì)象他們正在參加一項(xiàng)有關(guān)觀察和判斷的實(shí)驗(yàn)(實(shí)驗(yàn)的表面目的)。黑板上共畫有四條直線。上面的三條豎線由短到長,差別明顯。下面的一條橫線與三條豎線中長短居中的那條相等。研究者逐個(gè)詢問實(shí)驗(yàn)對(duì)象,“三條豎線中哪一條與橫線相等?”第一個(gè)回答:“與最長的那條豎線相等。”第二個(gè)、第三個(gè)實(shí)驗(yàn)對(duì)象也做出了相同的回答。這時(shí),研究者又問第四個(gè)實(shí)驗(yàn)對(duì)象。這位實(shí)驗(yàn)對(duì)象從一開始就覺得橫線與中間那條豎線等長,可隨著前面一個(gè)個(gè)回答者的回答,他開始出現(xiàn)動(dòng)搖,并最終在輪到自己回答時(shí),也違心地做出了與前面三個(gè)實(shí)驗(yàn)對(duì)象一致的回答:“與最長的那條豎線相等。”實(shí)際上,前三個(gè)實(shí)驗(yàn)對(duì)象都是研究者的同謀,他們故意做出與事實(shí)不一致的回答。此實(shí)驗(yàn)研究的實(shí)際目的是,考察最后回答問題的那些實(shí)驗(yàn)對(duì)象是否會(huì)屈從于群體的規(guī)范。在實(shí)驗(yàn)室實(shí)驗(yàn)中,實(shí)驗(yàn)背景和變量都相對(duì)容易控制,實(shí)驗(yàn)環(huán)境可以較好地“封閉”,實(shí)驗(yàn)者能夠比較清楚確切地觀察到自變量對(duì)因變量的影響。這是實(shí)驗(yàn)室實(shí)驗(yàn)的主要優(yōu)點(diǎn)。但實(shí)驗(yàn)室實(shí)驗(yàn)在實(shí)驗(yàn)內(nèi)容上局限性比較大,即許多教育研究者感興趣的內(nèi)容常常無法在小小的實(shí)驗(yàn)室中人工地制造出來。與此相聯(lián)系的另一個(gè)缺點(diǎn)是,實(shí)驗(yàn)室實(shí)驗(yàn)的結(jié)果在推廣性、普遍性和概括性上往往較差。原因之一是較多的實(shí)驗(yàn)室實(shí)驗(yàn)都是以一定區(qū)域?qū)W生的有限取樣為實(shí)驗(yàn)對(duì)象,而他們與眾多的不同區(qū)域的學(xué)生之間存在著許多差別。其二是實(shí)驗(yàn)室的環(huán)境與現(xiàn)實(shí)的教育環(huán)境之間的差別也很大。而實(shí)地實(shí)驗(yàn)中,研究者可以在真實(shí)的教育環(huán)境背景中觀察到學(xué)生自然的反應(yīng)。但同時(shí)研究者卻又常常難以對(duì)眾多有可能影響因變量的實(shí)驗(yàn)背景、實(shí)驗(yàn)條件進(jìn)行控制,難以孤立出自變量的獨(dú)立影響。他所能作的工作僅僅是觀察發(fā)生了什么事情,即僅僅是對(duì)他無法控制的現(xiàn)象所產(chǎn)生的可能的影響進(jìn)行測量。2.標(biāo)準(zhǔn)實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)實(shí)驗(yàn)設(shè)計(jì)必須具有一些必備的條件,例如,隨機(jī)指派實(shí)驗(yàn)對(duì)象以形成兩個(gè)或多個(gè)相同的組,前測和后測,實(shí)驗(yàn)環(huán)境的封閉,實(shí)驗(yàn)刺激的控制和操縱等.這樣的實(shí)驗(yàn)通常稱為標(biāo)準(zhǔn)實(shí)驗(yàn).然而,對(duì)于教育研究來說,進(jìn)行類似于自然科學(xué)中、或者心理學(xué)中常見的諸如實(shí)驗(yàn)室實(shí)驗(yàn)?zāi)菢拥氖謬?yán)格、十分完備的標(biāo)準(zhǔn)實(shí)驗(yàn)的可能性不大。教育研究的對(duì)象和內(nèi)容常常在許多方面限制了這種嚴(yán)格的實(shí)驗(yàn)設(shè)計(jì)在現(xiàn)實(shí)中的應(yīng)用。例如,他們有時(shí)不能完全控制對(duì)自變量的操縱,有時(shí)他們僅僅只能進(jìn)行后測,有時(shí)他們又不能將被試隨機(jī)分配到不同的實(shí)驗(yàn)條件中??傊?,他們常常無法對(duì)實(shí)驗(yàn)環(huán)境進(jìn)行高度的控制。上述各種缺乏實(shí)驗(yàn)設(shè)計(jì)中一個(gè)或多個(gè)“條件”或“部分”的實(shí)驗(yàn),就被稱做“準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)”(quasi-experimentaldesigns)。這一概念是D.T.坎貝爾和J.C.斯坦利于1966年首創(chuàng)的?!皽?zhǔn)”是“類似于”、“接近于”、“幾乎是”或者“半”的意思(有的著作中將其直接譯為半實(shí)驗(yàn))。D.T.坎貝爾和J.C.斯坦利指出,通過仔細(xì)地選擇被試群體和測量方法,人們可以建立“在產(chǎn)生正確因果推論的能力上與真實(shí)實(shí)驗(yàn)相近的研究設(shè)計(jì)"。因此,準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)是在更好的實(shí)驗(yàn)設(shè)計(jì)無法實(shí)行的時(shí)候所使用的有實(shí)用價(jià)值的設(shè)計(jì)。從變量分析的角度來看,準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)可以說是處在以相關(guān)分析為特征的調(diào)查研究與以因果分析為特征的實(shí)驗(yàn)研究之間。準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)有以下幾種常見類型:(1)“具有不等同組的僅有后測的設(shè)計(jì)。”這種設(shè)計(jì)有一個(gè)具有實(shí)驗(yàn)刺激和僅有后測的實(shí)驗(yàn)組,一個(gè)僅有后測的實(shí)驗(yàn)組。實(shí)驗(yàn)組與控制組之間并不是具有相似性或相同性,即兩組不等同;二是對(duì)使實(shí)驗(yàn)刺激缺乏控制。(2)“有前測和后測的單組設(shè)計(jì)”。這種設(shè)計(jì)僅有一個(gè)實(shí)驗(yàn)組,有前測和后測,也有實(shí)驗(yàn)刺激,但是無控制組。(3)“僅有后測設(shè)計(jì)的單組設(shè)計(jì)”這種設(shè)計(jì)是最簡單的實(shí)驗(yàn)設(shè)計(jì),它比單組設(shè)計(jì)的組成部分更少,只有實(shí)驗(yàn)刺激和對(duì)實(shí)驗(yàn)組的后測。3.雙盲實(shí)驗(yàn)所謂雙盲實(shí)驗(yàn)(double-blindexperiments),指的是在一項(xiàng)實(shí)驗(yàn)中,實(shí)驗(yàn)剌激對(duì)于實(shí)驗(yàn)對(duì)象和參與實(shí)驗(yàn)的觀察人員來說都是未知的。即究竟是實(shí)驗(yàn)組還是控制組被給予了實(shí)驗(yàn)刺激,參與實(shí)驗(yàn)的雙方(指實(shí)驗(yàn)對(duì)象和實(shí)驗(yàn)人員)都不知道,實(shí)驗(yàn)剌激是由實(shí)驗(yàn)人員和實(shí)驗(yàn)對(duì)象以外的第三者任意分派和給定的。為什么要采用雙盲實(shí)驗(yàn)?zāi)?先讓我們來看看這樣一個(gè)例子。心理學(xué)家羅森塔爾為了研究教師的期待對(duì)學(xué)生表現(xiàn)的影響,在一所小學(xué)一至五年級(jí)的學(xué)生中進(jìn)行了一項(xiàng)實(shí)驗(yàn)。他先對(duì)全體學(xué)生進(jìn)行了語言能力和思維推理能力的測驗(yàn),以了解學(xué)生的基礎(chǔ)。然后,他隨機(jī)地從每個(gè)年級(jí)的學(xué)生中抽出20%的學(xué)生作為教師期待的對(duì)象。他告訴教師說,這20%的學(xué)生有可能比其他學(xué)生學(xué)得更好(即更有發(fā)展?jié)摿?。其實(shí),這20%的學(xué)生與其他80%的學(xué)生的能力和發(fā)展?jié)摿ο喈?dāng)。當(dāng)教師對(duì)全體學(xué)生進(jìn)行了八個(gè)月的教學(xué)之后,研究者又對(duì)全體學(xué)生進(jìn)行了一次測驗(yàn)。結(jié)果發(fā)現(xiàn),被教師期待的這20%的學(xué)生,其成績?nèi)硷@著地提高,教師對(duì)他們的評(píng)語也比其他學(xué)生好。這一實(shí)驗(yàn)表明了教師的期待對(duì)學(xué)生發(fā)展所具有的作用和效果。三、教育實(shí)驗(yàn)研究方法的優(yōu)點(diǎn)和不足1.教育實(shí)驗(yàn)研究方法的優(yōu)點(diǎn)(1)教育實(shí)驗(yàn)研究法是教育科學(xué)研究中建立因果關(guān)系的最好方法實(shí)驗(yàn)研究法在建立因果關(guān)系方面而論,是優(yōu)于其它方法的,因?yàn)?,文獻(xiàn)法、調(diào)查法、內(nèi)容分析法等研究方法,在多數(shù)情況下是橫向進(jìn)行的,而非在整個(gè)時(shí)期內(nèi)進(jìn)行的,但實(shí)驗(yàn)研究方法一般都是縱向的,盡管時(shí)間可能很短,但是自變量與因變量之間也有一個(gè)時(shí)間的先后問題,它為研究實(shí)驗(yàn)因子在整個(gè)時(shí)期的變化提供機(jī)會(huì)。此外,在嚴(yán)格控制無關(guān)因素對(duì)因變量影響方面,實(shí)驗(yàn)法是最好的。例如調(diào)查研究一般對(duì)環(huán)境中的干擾因素難以控制,觀察法研究雖然常常是縱觀地進(jìn)行的,但一般不能控制外部因素對(duì)因變量的影響,也不大可能準(zhǔn)確地測量因變量的變化;文獻(xiàn)研究有時(shí)是縱貫的,但一般不能控制外部因素對(duì)因變量的影響,也不能準(zhǔn)確地測量因變量的變化;文憲法研究有時(shí)也可能是縱貫的,但也大可能進(jìn)行控制。一個(gè)真正的實(shí)驗(yàn),在控制方面是較好的,控制對(duì)于資料分析和假設(shè)檢驗(yàn)都具有重要的效果。(2)獲得自然條件下遇不到或難以遇到的情況或情境它可以使研究者獲得自然條件下遇不到或難以遇到的情況或情境,可以擴(kuò)大研究的范圍和和排除或抑制某些對(duì)研究有不利影響的內(nèi)容。它使研究者可以在多種不同的情況下或情境中,研究教育問題。(3)可以重復(fù)驗(yàn)證在實(shí)驗(yàn)中,通過人為地改變條件,可多次獲得同一狀態(tài)下的某些現(xiàn)象,因此它比采用觀察法、調(diào)查法等能更加確切地研究這些現(xiàn)象。(4)提高研究的準(zhǔn)確性和精密度實(shí)驗(yàn)使研究者有可能準(zhǔn)確地、精細(xì)地、分別地研究事物的各方面或組成部分,比較容易觀察某些特定因素的效果。進(jìn)行實(shí)驗(yàn)室,可以有計(jì)劃地控制現(xiàn)象和環(huán)境,造成便于精確測量和運(yùn)用機(jī)械方法紀(jì)錄的條件,使研究更為精密。2.教育實(shí)驗(yàn)研究方法的缺點(diǎn):(1)它需要花較多的人力,有時(shí)往往受到實(shí)驗(yàn)設(shè)備,以及其他實(shí)驗(yàn)條件的限制。(2)同時(shí),對(duì)實(shí)驗(yàn)所需要的現(xiàn)象和環(huán)境的控制難度大。教育實(shí)驗(yàn)的對(duì)象是活生生的人,要像自然科學(xué)的實(shí)驗(yàn)室實(shí)驗(yàn)?zāi)菢訉?shí)行嚴(yán)格的控制是不可能的。(3)它對(duì)進(jìn)行實(shí)驗(yàn)的或參加實(shí)驗(yàn)的人員都有一定要求,有的實(shí)驗(yàn)要求試驗(yàn)者熟練地掌握實(shí)驗(yàn)法的有關(guān)技術(shù),并要求訓(xùn)練有素。有的實(shí)驗(yàn)還需要有關(guān)單位、學(xué)校的配合和協(xié)助方能進(jìn)行。正是由于這些原因和限制,在教育研究中,實(shí)驗(yàn)研究法的應(yīng)用不如其他研究方法廣泛。第二個(gè)問題影響實(shí)驗(yàn)的因素和實(shí)驗(yàn)的控制一、效度問題進(jìn)行實(shí)驗(yàn)設(shè)計(jì),首先必須要考慮實(shí)驗(yàn)效度。所謂效度,就是指實(shí)驗(yàn)設(shè)計(jì)能夠回答要研究的問題的程度。實(shí)驗(yàn)效度一般有兩種:內(nèi)在效度和外在效度。在實(shí)驗(yàn)過程中,這兩種效度可能受到許多因素的影響。1.內(nèi)在效度內(nèi)在效度(internalvalidity)指研究結(jié)果能被明確解釋的程度。實(shí)驗(yàn)者所操縱的實(shí)驗(yàn)變量對(duì)因變量所造成的影響的真正程度。實(shí)驗(yàn)內(nèi)在效度高低,取決于對(duì)無關(guān)變量控制的程度??刂频脑胶?,實(shí)驗(yàn)的效果越能解釋為由實(shí)驗(yàn)處理所造成.反之,控制的越差,實(shí)驗(yàn)結(jié)果越無法解釋。其結(jié)果究竟是由實(shí)驗(yàn)處理所產(chǎn)生,還是由其他無關(guān)因素所導(dǎo)致的,將難以確定。對(duì)于影響內(nèi)在效度的因素,美國學(xué)者坎貝爾和斯坦利(Cambell&Stanley,1963)認(rèn)為有八項(xiàng)因素是影響內(nèi)在效度的無關(guān)變量6。(1)歷史(history)(或同時(shí)事件)。假定研究者所用研究實(shí)驗(yàn)設(shè)計(jì)為:O1 XO2即在給予實(shí)驗(yàn)處理(X)之前進(jìn)行測驗(yàn)(O1),實(shí)驗(yàn)處理(X)之后再進(jìn)行測驗(yàn)(O2),自O(shè)1至O2這段期間內(nèi),影響因變量O2的因素,除了X之外,可能還有某些特殊事件。例如,研究者想試驗(yàn)一種新的閱讀教學(xué)方法的效果,先對(duì)一組受試實(shí)施閱讀測驗(yàn),經(jīng)過一個(gè)學(xué)期的新的閱讀方法教學(xué)后,再使用同樣的閱讀測驗(yàn)測量他們的閱讀能力。結(jié)果發(fā)現(xiàn)后一種測驗(yàn)的分?jǐn)?shù)顯著高于前一測驗(yàn)的分?jǐn)?shù),因此,研究者就下了這樣的結(jié)論:新的閱讀教學(xué)方法是較好的方法。這個(gè)結(jié)論可能不正確,因?yàn)樵趯?shí)驗(yàn)進(jìn)行期間,一些影響因變量的事件可能和實(shí)驗(yàn)處理同時(shí)發(fā)生作用,從而混淆了實(shí)驗(yàn)結(jié)果。例如,學(xué)校圖書館在實(shí)驗(yàn)期間購進(jìn)了大量趣味性強(qiáng)的讀物,引發(fā)學(xué)生的閱讀興趣;或?qū)W校正巧在該期間開展閱讀競賽活動(dòng),調(diào)動(dòng)起學(xué)生的閱讀熱情;甚至,學(xué)校平時(shí)的正規(guī)教學(xué)也可能介入影響。所以,閱讀能力的增加,不能認(rèn)定為單純由實(shí)驗(yàn)處理所導(dǎo)致。一般來說,實(shí)驗(yàn)時(shí)間越長,實(shí)驗(yàn)處理以外的其他事件的影響的可能性就越大。(2)成熟(maturation)受試者在實(shí)驗(yàn)期間,不論生理或心理的都會(huì)產(chǎn)生變化。例如,變得更成熟、健壯、疲勞、饑餓、分心或沒有興趣等,這些改變都會(huì)影響實(shí)驗(yàn)結(jié)果。前面提到的新閱讀教學(xué)方法實(shí)驗(yàn)的例子中,受試者也會(huì)因?yàn)槟挲g增長而在認(rèn)識(shí)能力方面的自然發(fā)展和成熟,或詞匯的自然增長,形成干擾實(shí)驗(yàn)處理的效果,使閱讀能力的提高,難以單純歸因于新的閱讀教學(xué)方法。(3)測驗(yàn)(testing)許多教育實(shí)驗(yàn)研究為了比較實(shí)驗(yàn)前后的情況,往往在實(shí)驗(yàn)處理之前進(jìn)行測驗(yàn),但前測的經(jīng)驗(yàn)常常有助于后測分?jǐn)?shù)的提高,尤其是前后測驗(yàn)的題目基本相同時(shí)。因?yàn)?,受試者在?jīng)過前測之后,會(huì)熟悉測驗(yàn)的技巧和內(nèi)容。所以,即使沒有實(shí)驗(yàn)處理的效果,也可能因前測的經(jīng)驗(yàn)的影響,導(dǎo)致后測分?jǐn)?shù)的提高。(4)工具(instrumentation)在測量過程中,測量工具(例如,試卷、儀器等)不同,評(píng)價(jià)者身心發(fā)生變化(例如,評(píng)卷者在評(píng)價(jià)后測時(shí),變得比前測時(shí)較為疲勞、粗心或嚴(yán)格),也可能改變實(shí)驗(yàn)的結(jié)果。還以上述新閱讀教學(xué)方法的實(shí)驗(yàn)為例(O1 XO2),如果前測的試題比后測的試題容易,則閱讀能力的變化有可能是測量工具不同引起的結(jié)果,而非實(shí)驗(yàn)處理的效果。同一主試者,對(duì)實(shí)驗(yàn)處理后的評(píng)價(jià),可能會(huì)引起對(duì)實(shí)驗(yàn)較為熟悉,或更為了解實(shí)驗(yàn)的目的,或因疲勞與厭煩,而改變?cè)u(píng)價(jià)的標(biāo)準(zhǔn),結(jié)果導(dǎo)致實(shí)驗(yàn)效果受到影響。(5)統(tǒng)計(jì)回歸(statisticalregression)統(tǒng)計(jì)回歸現(xiàn)象指受試者的測量分?jǐn)?shù)在第二次測量時(shí),有向團(tuán)體平均數(shù)回歸(趨近)的傾向。換言之,高分組的手勢者在第二次測量時(shí),其分?jǐn)?shù)由于向平均數(shù)回歸而有降低的趨勢,但是低分的受試者,其分?jǐn)?shù)卻有升高的趨勢。在有前后測的實(shí)踐中。若以極端分?jǐn)?shù)(高分和低分組)的學(xué)生為對(duì)象,容易出現(xiàn)統(tǒng)計(jì)回歸現(xiàn)象。(6)差異的選擇(differentialselection)由于為用隨即抽樣和隨即分派之故,所選擇的兩組或幾組受試者,在未用實(shí)驗(yàn)處理之前,本來各方面能力有所偏差或不相等,那么實(shí)驗(yàn)結(jié)果的兩組成績不同,就不能說這種差異是單純由于實(shí)驗(yàn)處理所造成的。所以,在采用兩組或多組的實(shí)驗(yàn)研究中,研究者必須可考慮不同組別受試者在各項(xiàng)特質(zhì)(實(shí)際素質(zhì))上的是否一致。如果組別之間受試者的特質(zhì)不同一致,實(shí)驗(yàn)結(jié)果中出現(xiàn)的差異就有可能是由原來研究組之間所存在的差異所造成的,而非實(shí)驗(yàn)處理的結(jié)果。(7)受試者的流失(experimentalmortality)研究樣本在實(shí)驗(yàn)期間的流失(例如,遷居、退學(xué)、死亡等),有可能使實(shí)驗(yàn)結(jié)果難以解釋。例如,研究者隨機(jī)分派兩組小學(xué)一年級(jí)新生進(jìn)行某一新課程的新方法教學(xué)研究,假定實(shí)驗(yàn)一年期間,不少智力低的學(xué)生從實(shí)驗(yàn)組退出,而控制組卻無此現(xiàn)象,研究結(jié)果如發(fā)現(xiàn)實(shí)驗(yàn)組成績優(yōu)于控制組,此結(jié)果很可能不是因?qū)嶒?yàn)處理所造成的,而是因?qū)嶒?yàn)組多數(shù)低能力的受試中途退出實(shí)驗(yàn)的結(jié)果。當(dāng)實(shí)驗(yàn)組和控制組有不同比率的受試退出實(shí)驗(yàn)室時(shí),就會(huì)導(dǎo)致實(shí)驗(yàn)結(jié)果的偏差。雖然,兩組都是經(jīng)過隨機(jī)抽樣和分排而得到的,而由于不同比率的受試者退出實(shí)驗(yàn)中,所剩下的樣本可能有異于原來的無偏差的樣本。(8)選擇與成熟的交互作用(selection-maturationinteraction,etc.)前面所述七項(xiàng)因素,因彼此交互作用,將是構(gòu)成影響內(nèi)在效度的另一個(gè)因素。選擇與成熟的交互作用便是常見的例子。例如,研究者要檢驗(yàn)?zāi)承睦碇委煼椒ǖ男Ч謩e選擇一些有心理異常狀態(tài)的學(xué)生為實(shí)驗(yàn)組,選擇一些心理正常的學(xué)生為控制組,在實(shí)驗(yàn)處理前,兩組均作心理測驗(yàn),測驗(yàn)表明,異常組的異常傾向分?jǐn)?shù)比正常組的該項(xiàng)分?jǐn)?shù)高的多。在異常組實(shí)施異常心理治療后,再對(duì)兩組進(jìn)行心理測量,發(fā)現(xiàn)異常組的異常傾向分?jǐn)?shù)大為降低,或接近正常組的該項(xiàng)成績分?jǐn)?shù)。對(duì)這種現(xiàn)象的分析認(rèn)為,有可能不是心理治療所發(fā)生的實(shí)驗(yàn)處理效果,而是因?yàn)檫x擇了一組有自然恢復(fù)現(xiàn)象的異常組與一組無自然恢復(fù)現(xiàn)象的正常組所造成的。異常組與正常組本來就不同,這是“差異的選擇”的因素;實(shí)驗(yàn)處理后,異常組發(fā)生了自然恢復(fù),正常組則無,這是“成熟因素”;這兩種因素造成了不平行的發(fā)展曲線,即選擇與成熟的交互作用因素的影響。72.外在效度外在效度(externalvalidity)指實(shí)驗(yàn)結(jié)果的概括性和代表性。換言之,就是指實(shí)驗(yàn)結(jié)果是否可以推論到實(shí)驗(yàn)對(duì)象以外的其他受試者,或?qū)嶒?yàn)情境以外的其他情境。一個(gè)實(shí)驗(yàn)越能實(shí)現(xiàn)這個(gè)目標(biāo),就表示該實(shí)驗(yàn)越有良好的外部效度。如果用于男生實(shí)驗(yàn)的結(jié)果,只適用于中學(xué)生男生,而不能推論到女生,用于中學(xué)生的實(shí)驗(yàn)的結(jié)果,只適用于中學(xué)生,而不能推論到小學(xué)生,那么,這個(gè)實(shí)驗(yàn)設(shè)計(jì)的外部效度(群體效度)就比較低。如果在試驗(yàn)室里實(shí)驗(yàn)的結(jié)果,只是用于實(shí)驗(yàn)室環(huán)境,而不能推論到日常生活情境,在城市實(shí)驗(yàn)的結(jié)果,只適用于城市,而不能推論到農(nóng)村,這個(gè)實(shí)驗(yàn)設(shè)計(jì)的外部效度(生態(tài)效度)也不高。美國學(xué)者坎貝爾和斯坦利(Cambell&Stanley,1963)認(rèn)為有四個(gè)因素是影響外在效度的無關(guān)變量。8(1)測驗(yàn)的反作用或交互作用效果(reactionorinteractioneffectoftesting)測驗(yàn)的反作用指前測對(duì)后測的作用;測驗(yàn)的交互作用,指前測與后測的交互作用。有前測經(jīng)驗(yàn)容易造成后測成績好。在有前測和后測的實(shí)驗(yàn)設(shè)計(jì)中,前測的經(jīng)驗(yàn)往往會(huì)限制研究結(jié)果的推論性,因?yàn)?,由于受?shí)驗(yàn)處理具有敏感性,平常情境下未曾注意到的問題或現(xiàn)象,這時(shí)變得更加敏捷和警覺,以至實(shí)驗(yàn)效果可能部分來自前測的經(jīng)驗(yàn)所產(chǎn)生的敏感性。平常情境下未曾注意到的問題或現(xiàn)象,這時(shí)變得更加敏感和警覺,以至實(shí)驗(yàn)效果可能來自于前測經(jīng)驗(yàn)所產(chǎn)生的敏感性。例如,研究者欲了解一周的政治理論學(xué)習(xí)對(duì)學(xué)生政治理論學(xué)習(xí)的態(tài)度改變的效果,學(xué)習(xí)之前,如先測量學(xué)生對(duì)政治學(xué)習(xí)的態(tài)度,則由于這一測驗(yàn)的影響,學(xué)生在一周的學(xué)習(xí)期間,特別集中注意學(xué)習(xí)和前測經(jīng)驗(yàn)的影響有關(guān)的問題和內(nèi)容,結(jié)果導(dǎo)致測驗(yàn)成績有很大的改變。這種改變可能是前測所產(chǎn)生的敏感性和政治理論學(xué)習(xí)的交互作用結(jié)果(因?yàn)榍皽y使學(xué)生對(duì)政治理論的學(xué)習(xí)更容易引起警覺和重視)。但在沒有前測的實(shí)驗(yàn)情境下的一周的政治學(xué)習(xí),可能就不會(huì)有這樣好的測驗(yàn)成績。因此,有前測的實(shí)驗(yàn)結(jié)果,只能推論有前測經(jīng)驗(yàn)的情況,而不能推論到其他沒有前測經(jīng)驗(yàn)的團(tuán)體中去。(2)選擇偏差與實(shí)驗(yàn)變量的交互作用效果(interactioneffectsofselectionbiasesandexperimentalvariable)當(dāng)研究者選擇一些具有獨(dú)特心理的特質(zhì)的受試者作實(shí)驗(yàn)時(shí),選擇偏差與實(shí)驗(yàn)變量的交互作用效果就容易產(chǎn)生。因?yàn)檫@些獨(dú)特的心理特質(zhì),有利于對(duì)實(shí)驗(yàn)處理造成較佳的反應(yīng)。例如,如果選擇一些具有高智力的學(xué)生,進(jìn)行發(fā)現(xiàn)式的教學(xué)與傳統(tǒng)式教學(xué)比較,實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)前一種教學(xué)法優(yōu)于后一種教學(xué)法。但是這一結(jié)果不能推論到實(shí)驗(yàn)以外的其他一般的學(xué)生中去。因?yàn)閰⒓訉?shí)驗(yàn)的對(duì)象,具有高智力的獨(dú)特心理特質(zhì)者的學(xué)生(選擇偏差),他們也許比這種特質(zhì)低的學(xué)生(例如,低智能的學(xué)生),更能從發(fā)現(xiàn)教學(xué)法(實(shí)驗(yàn)變量)獲益。如果將這種結(jié)果隨意推廣到智力一般或較低的學(xué)生,顯然會(huì)造成推論的錯(cuò)誤。(3)實(shí)驗(yàn)安排的反作用效果(reactiveeffectsofexperimentalarrangements)由于實(shí)驗(yàn)情節(jié)的安排,受試者知道自己正在被觀察或正在參加實(shí)驗(yàn),他(她)所表現(xiàn)出來的行為,通常與他(她)不知道在正在被觀察或不是參加實(shí)驗(yàn)時(shí),有很大的不同。這時(shí),他們往往可能為投實(shí)驗(yàn)者所好,而改變正常的行為方式,努力表現(xiàn)試驗(yàn)者所期望的行為,以獲得實(shí)驗(yàn)者的歡悅。但受試者在非實(shí)驗(yàn)情境的表現(xiàn),可能遇此完全不同。例如,學(xué)生知道自己被選擇在參加一項(xiàng)新的教學(xué)方法的實(shí)驗(yàn),因而在實(shí)驗(yàn)期間表現(xiàn)出比平時(shí)更高的興趣和動(dòng)機(jī),更大的學(xué)習(xí)主動(dòng)性和積極性,結(jié)果使實(shí)驗(yàn)效果產(chǎn)生很大的改變。由此可見,在實(shí)驗(yàn)情況下所得的結(jié)果,可能和自然情境下的結(jié)果大不相同,這就是為什么實(shí)驗(yàn)結(jié)果常不能適用于日常生活情境的原因。(4)多重實(shí)驗(yàn)處理的干擾(multiple-treatmentinterference)當(dāng)同樣的受試者重復(fù)接受兩種以上或多種實(shí)驗(yàn)處理時(shí),由于前面的處理通常不易完全消失,以至幾項(xiàng)實(shí)驗(yàn)處理之間會(huì)產(chǎn)生干擾的作用。因此,這種實(shí)驗(yàn)的結(jié)果,只能推論到類似這種重復(fù)實(shí)驗(yàn)處理的受試者,而無法應(yīng)用于只有一種實(shí)驗(yàn)處理的情況。例如,實(shí)驗(yàn)集中學(xué)習(xí)法、分散學(xué)習(xí)法、整體學(xué)習(xí)法和部分學(xué)習(xí)法的效率時(shí),讓每位受試者重復(fù)采用四種方法,如果發(fā)現(xiàn)其中的整體學(xué)習(xí)法的效果最好時(shí),研究者并不能將這種結(jié)果推論到僅僅接受一種整體學(xué)習(xí)法的處理情境,因?yàn)檎w學(xué)習(xí)法之所以取得良好的效果,可能是和其他的三種方法共同交互作用的結(jié)果。綜合上述,實(shí)驗(yàn)的內(nèi)在效度逾高,其結(jié)果愈能確認(rèn)是由實(shí)驗(yàn)處理所造成的;而實(shí)驗(yàn)的外在效度逾高,其結(jié)果的推論范圍就愈大。因此,實(shí)驗(yàn)的設(shè)計(jì)必須重視這兩種效度。但是在實(shí)驗(yàn)情境中,要同時(shí)十全十美兼顧這兩種效度是很難做到的。一般,基本研究比較重視內(nèi)在效度,而應(yīng)用研究則比較重視外在效度(在不太影響內(nèi)在效度的情況下)二、實(shí)驗(yàn)控制的兩個(gè)重要內(nèi)容1.尋找兩組相同的對(duì)象根據(jù)實(shí)驗(yàn)研究的分析邏輯的要求,必須有兩組各方面都一樣的對(duì)象。在實(shí)際研究中,研究者為了創(chuàng)造出兩組相同的對(duì)象,往往采用兩種方法:一是匹配二是隨機(jī)指派。(1)匹配匹配(matching)指的是依據(jù)各種標(biāo)準(zhǔn)或特征,找出兩個(gè)完全相同或幾乎完全相同的實(shí)驗(yàn)對(duì)象進(jìn)行配對(duì),并將其中一個(gè)對(duì)象分到實(shí)驗(yàn)組,而將另一個(gè)對(duì)象分到控制組的方法。在心理學(xué)的實(shí)驗(yàn)中,這種方法比較常見。例如,要進(jìn)行一項(xiàng)有關(guān)小學(xué)教育的實(shí)驗(yàn)研究,需要選擇兩組“相同的”學(xué)生作為實(shí)驗(yàn)的對(duì)象??梢韵葘?duì)某一個(gè)年級(jí)的全體學(xué)生進(jìn)行一次智商測驗(yàn)。從學(xué)生的智商測驗(yàn)得分表中,發(fā)現(xiàn)有兩個(gè)(或者多個(gè))學(xué)生的智商分?jǐn)?shù)為108,就將這兩個(gè)學(xué)生作為一對(duì),并將其中的一個(gè)分到實(shí)驗(yàn)組,而將另一個(gè)分到控制組。同樣,又發(fā)現(xiàn)有兩個(gè)(或以上)的學(xué)生智商分?jǐn)?shù)為112,也照樣一個(gè)組分一個(gè);繼續(xù)找出這樣具有相同智商分?jǐn)?shù)的學(xué)生對(duì)子,同樣將他們分別分到實(shí)驗(yàn)組和控制組,直到找滿實(shí)驗(yàn)樣本所需要的數(shù)目為止。用實(shí)驗(yàn)的語言來說,這樣做就是“在智商這一變量上對(duì)兩組學(xué)生進(jìn)行了匹配”。應(yīng)該指出的是,按照上面所介紹的方法進(jìn)行匹配的兩組學(xué)生,雖然在“智商”這一變量上完全相同,但他們可能在其他一些變量上又很不相同。比如,可能其中一組的女生比例較高,而另一組中則是男生的比例較高,即兩個(gè)組在“性別”這一變量上的分布有所不同。同時(shí),由于男生和女生對(duì)待學(xué)習(xí)的態(tài)度不同,學(xué)習(xí)的方法不同,學(xué)習(xí)成績也有所不同。因而對(duì)于所研究的問題來說,“按照智商分?jǐn)?shù)相等”的標(biāo)準(zhǔn)選擇出來的這兩個(gè)組,仍然沒有達(dá)到在“性別”上“完全相同”的要求。還必須進(jìn)一步根據(jù)性別進(jìn)行匹配。推而廣之,這兩個(gè)組的學(xué)生除了在性別上有差別外,還會(huì)在類似的許多變量上都有所不同。比如學(xué)習(xí)成績的好壞、家庭人口的多少、家庭收入的高低、父親的職業(yè)類型等等。因此,要保證兩個(gè)組的對(duì)象“完全相同”,必須在第三個(gè)、第四個(gè)、……、第n個(gè)相關(guān)的變量上繼續(xù)進(jìn)行匹配。這是一項(xiàng)什么樣的工作呢?十分顯然地是,要找出兩個(gè)在一個(gè)、兩個(gè)或者三個(gè)變量上相同的對(duì)象是容易的,但要找出兩個(gè)在所有變量上都相同的對(duì)象,則是完全不可能的。這也即是說,在某種意義上匹配的方法是基本無用的—因?yàn)槟繕?biāo)是要使兩組對(duì)象在所有方面都相同,然而,在實(shí)際生活中無法做到這一點(diǎn)。困難來自三個(gè)方面:一是現(xiàn)實(shí)中往往會(huì)沒有足夠的對(duì)象供選擇。因?yàn)殡S著需要相同的變量數(shù)目的逐漸增加,現(xiàn)實(shí)中符合條件的對(duì)象數(shù)目將急劇減少。從實(shí)踐的角度來看,研究者將在這方面遇到難以克服的困難。二是研究者只能在那些他們已經(jīng)意識(shí)到對(duì)因變量可能有影響的變量上進(jìn)行匹配。而實(shí)際生活中還有更多沒有被研究者意識(shí)到的因素可能對(duì)因變量有影響,這些沒有被研究者意識(shí)到的變量,顯然不會(huì)被研究者用來對(duì)對(duì)象進(jìn)行匹配。三是人們的有些特征在實(shí)踐上是很難測量的,或者說是很難操作化為具體的、可觀測的指標(biāo)的。比如人們的“動(dòng)機(jī)”、“性格”等。如果不能很好地測量“動(dòng)機(jī)”,就無法在“動(dòng)機(jī)”這一變量上與對(duì)象進(jìn)行匹配。當(dāng)然,匹配的方法在實(shí)際研究中仍具有一定的作用,研究者還是可以在有限的條件下,針對(duì)那些與研究所關(guān)注的主要問題密切相關(guān)的變量來進(jìn)行匹配,而暫時(shí)忽略和放棄其他一些與所研究的問題聯(lián)系相對(duì)不太緊密的變量。只是在這樣做的時(shí)候有一點(diǎn)應(yīng)注意,研究的結(jié)論應(yīng)限于一定的范圍,下結(jié)論時(shí)應(yīng)留有充分的余地。還可以從一種相反的途徑來對(duì)實(shí)驗(yàn)對(duì)象進(jìn)行匹配,即直接將實(shí)驗(yàn)組和控制組的總體結(jié)構(gòu)配成完全一樣。這種方式與非隨機(jī)抽樣中的“定額抽樣”方法有點(diǎn)相似。例如,假如實(shí)驗(yàn)對(duì)象共60名學(xué)生,其中有40名男生,20名女生,那么,安排20名男生、10名女生到實(shí)驗(yàn)組,而另外20名男生和10名女生則分到控制組。這樣,實(shí)驗(yàn)組和控制組在“組內(nèi)的性別比例”方面就是相同的;或者說,對(duì)這兩個(gè)組的對(duì)象在“性別”變量上進(jìn)行了匹配。另外,假如這些對(duì)象中共有20名學(xué)生來自城市,其余40名學(xué)生來自農(nóng)村,那么,在按性別分組的同時(shí)考慮到城鄉(xiāng)變量的分配,即在分到實(shí)驗(yàn)組和控制組的30名學(xué)生中,都要保證有10名是城市學(xué)生,20名是農(nóng)村學(xué)生。這樣就在“性別”和“城鄉(xiāng)”兩個(gè)變量上對(duì)實(shí)驗(yàn)組和控制組進(jìn)行了匹配。同樣困難的是,要想同時(shí)考慮實(shí)驗(yàn)組和控制組在所有變量上的比例和結(jié)構(gòu),事實(shí)上也是不可能的。人們所能做的往往只是在非常有限的幾個(gè)重要變量上兩組結(jié)構(gòu)相等。(2)隨機(jī)指派隨機(jī)指派(randomization)的方法是研究者用來解決實(shí)驗(yàn)中兩組對(duì)象相同性問題的另一種辦法。隨機(jī)指派的邏輯和程序十分簡單,即完全按照隨機(jī)抽樣的原理和方法來將實(shí)驗(yàn)對(duì)象隨機(jī)地分配到實(shí)驗(yàn)組和控制組中。具體的操作方法可以有如下三種:(1)用拋硬幣的方式來決定每一個(gè)具體的對(duì)象是去實(shí)驗(yàn)組還是去控制組。比如,假定要將60名大學(xué)生分到實(shí)驗(yàn)組和控制組(每組30人)。那么,從第一個(gè)對(duì)象開始,根據(jù)拋硬幣的結(jié)果來決定其去的組別。若硬幣正面朝上,則該對(duì)象去實(shí)驗(yàn)組;若硬幣反面朝上,則該對(duì)象就去控制組。根據(jù)概率原則可知,拋硬幣時(shí)出現(xiàn)正面朝上與反面朝上的概率各為50%。因而,被分到兩個(gè)組去的實(shí)驗(yàn)對(duì)象也基本相等。(2)按單、雙號(hào)來簡單地決定每一個(gè)對(duì)象是去實(shí)驗(yàn)組還是去控制組。同樣是60名學(xué)生,將他們隨意地按順序排列。然后,將號(hào)碼為單數(shù)的,即1,3,5,7,……,59號(hào)的學(xué)生分配到實(shí)驗(yàn)組,而將雙號(hào)的,即2,4,6,8,……,60這30名學(xué)生分配到控制組。這實(shí)際上類似于概率抽樣方法中的系統(tǒng)抽樣法。(3)按照排列的順序或?qū)嶋H抽取實(shí)驗(yàn)對(duì)象時(shí)的先后順序來決定。比如,將名單中排在前面的30名學(xué)生分到實(shí)驗(yàn)組,而排在后面的30名學(xué)生分到控制組?;蛘邔⑾瘸榈降那?0名學(xué)生分配到實(shí)驗(yàn)組,而將后抽到的30名學(xué)生分配到控制組。按照上述三種方法分配的結(jié)果,兩個(gè)組在各個(gè)方面都會(huì)比較相似。例如,如果這60名學(xué)生中有40名男生,20名女生。那么,在所形成的兩個(gè)組中,其男女生所占的比例也會(huì)接近2:1。這也即是說,兩個(gè)組中的性別比與總體中的性別比基本相同。完全一樣的道理,這兩組學(xué)生在其他變量(特征)上的比例也都會(huì)與總體中的比例相接近。這樣,得到了兩個(gè)在所有變量上都幾乎完全一樣的小組。或者說,這兩個(gè)小組的學(xué)生在所有變量(包括那些尚未認(rèn)識(shí)到的和無法測量的變量)上的分布幾乎都是相同的。這是隨機(jī)指派最為重要的作用。可以說,隨機(jī)指派為人們創(chuàng)造了幾乎完全相同的兩組對(duì)象。之所以說“幾乎完全相同”,是因?yàn)殡S機(jī)指派仍然存在誤差,特別是當(dāng)對(duì)象的數(shù)量比較小時(shí),這種誤差可能還會(huì)很大。所以,在可能的情況下,實(shí)驗(yàn)對(duì)象應(yīng)達(dá)到一定的數(shù)量。(3)配對(duì)方法與隨機(jī)指派方法的比較配對(duì)方法的實(shí)質(zhì)是盡可能使實(shí)驗(yàn)組和控制組中的成員相互之間在許多重要的背景因素、個(gè)人特征因素上完全一樣。而隨機(jī)化方法的實(shí)質(zhì)則是依據(jù)與隨機(jī)抽樣完全一樣的原理,用概率論來控制各種干擾變量的出現(xiàn)。不難理解,當(dāng)人們根據(jù)隨機(jī)化的方法,從一個(gè)總體中選出兩個(gè)群體時(shí),各種干擾變量會(huì)以同樣的方式對(duì)兩個(gè)群體影響。因?yàn)楦鶕?jù)概率論,此時(shí)所選出的兩個(gè)群體基本上是兩個(gè)完全相同的群體。所以,使用后者所進(jìn)行的實(shí)驗(yàn)在準(zhǔn)確性和精確性上將超過前者。因?yàn)橥ㄟ^概率論可使那些偶然因素像熟知因素一樣被把握,所以在匹配法中的那些由于不熟悉而不能控制的因素,也成為可以把握的了。2.對(duì)自變量的操縱當(dāng)研究者能夠決定他的實(shí)驗(yàn)對(duì)象將經(jīng)歷什么,或?qū)⒔邮苁裁刺幚砗桶才艜r(shí),就說他能夠操縱自變量。例如,如果研究者能夠決定實(shí)驗(yàn)組的學(xué)生在新的學(xué)期中將接受新的教學(xué)法的教學(xué),就說這個(gè)研究者能夠操縱自變量—“新的教學(xué)法"。實(shí)驗(yàn)中對(duì)自變量的操縱常常體現(xiàn)在如何恰當(dāng)?shù)亍爸圃斐觥边@個(gè)自變量上。例如,如果人們的假設(shè)是“在緊張情景中,吸煙者會(huì)吸更多的煙”,那么,“緊張”和“香煙的消耗”是兩個(gè)主要的變量,其中“緊張”是自變量,它一般可以定義為人們?cè)谛睦砩?、精神上的一種壓力或負(fù)擔(dān)。要用實(shí)驗(yàn)來檢驗(yàn)這一假設(shè)時(shí),前提之一就是要在實(shí)驗(yàn)中制造出“緊張”來。人們可以用“必須在規(guī)定時(shí)間內(nèi)完成一份數(shù)量大、難度大、并且占學(xué)期總成績80%的數(shù)學(xué)考試”來對(duì)一組學(xué)生“制造”緊張。然而,許多對(duì)教育研究者來說十分感興趣的變量通常都不能夠被操縱。比如,教育研究者通常要探討學(xué)生的性別、年齡、家庭背景或個(gè)性特征等等,是否會(huì)影響他們的學(xué)習(xí)傾向。而學(xué)生的這些特征卻是研究者無法操縱的,即研究者無法使某個(gè)學(xué)生的這些特征發(fā)生改變。因此,人們往往無法用實(shí)驗(yàn)來研究這種關(guān)系。與實(shí)驗(yàn)相反,調(diào)查正好適合這種研究。除此以外,教育研究者還會(huì)由于政治的、倫理的原因或限制,而不能操縱另一些變量。比如,人們不能為了研究人的社會(huì)化過程,而把一部分兒童同社會(huì)隔離開來,即制造出“缺乏社會(huì)接觸”這一自變量,以比較這些兒童的成長與那些正常生活在社會(huì)中的兒童的成長之間的差別。我們也不能去人為地讓一對(duì)夫婦離婚,以觀察離婚事件對(duì)其子女成長的影響。因此,許多對(duì)教育研究者來說十分感興趣的變量通常不能被操縱,正是造成教育學(xué)者較少采用實(shí)驗(yàn)室實(shí)驗(yàn)研究方式的一個(gè)重要原因。三、實(shí)驗(yàn)控制要正確地解釋實(shí)驗(yàn)結(jié)果,除了具體分析影響實(shí)驗(yàn)效度的各種因素外,還必須設(shè)法控制一些影響實(shí)驗(yàn)效果的無關(guān)變量。1.實(shí)驗(yàn)控制的原則實(shí)驗(yàn)控制有一個(gè)基本原則,這就是最大最小控制原則。意思是使自變量產(chǎn)生最大變化,使其他干擾的變量與誤差產(chǎn)生最小的影響。這個(gè)原則在英文上稱為maximinconprinciple,前一字是由maximize,minimize,control三個(gè)字縮寫組合而成。這個(gè)原則包括三層意思:(1)控制實(shí)驗(yàn)變量要使實(shí)驗(yàn)變量有系統(tǒng)而且盡量的(maximized)使前后的變化顯出差異。例如,要研究時(shí)間(自變量)與遺忘(因變量)的關(guān)系時(shí),時(shí)間的選擇應(yīng)采用1、3、5、7、9、11等不同日期的變化順序,而不宜采用1、2、3、4、5、6、7、8等不同小時(shí)的變化順序。因?yàn)楹笳咦兓g差異太小,所產(chǎn)生結(jié)果影響不易辨別。(2)控制無關(guān)變量要控制自變量之外一切可能影響結(jié)果的其他變量,使其保持不變或達(dá)到最小變化甚至排除在實(shí)驗(yàn)情境之外,務(wù)必不致影響自變量與因變量之間的因果關(guān)系。(3)控制測量工具控制測量工具的選擇與使用,務(wù)必使誤差減低到最低限度。2.實(shí)驗(yàn)控制的方法根據(jù)上述原則,研究者要采取一些對(duì)可能影響實(shí)驗(yàn)結(jié)果的無關(guān)變量進(jìn)行控制的方法。(1)隨機(jī)控制法隨機(jī)控制是將參與實(shí)驗(yàn)的受試者以隨機(jī)分派的方式,分為實(shí)驗(yàn)組與控制組或各個(gè)不同的實(shí)驗(yàn)組。從理論上說,隨機(jī)法是控制無關(guān)變量的最佳方法。因?yàn)樵诟怕实脑瓌t下,各組受試者所具備的各種條件機(jī)會(huì)均等。在實(shí)際使用時(shí),隨機(jī)分派法可分為兩個(gè)步驟:第一步是用隨機(jī)的方法將參加實(shí)驗(yàn)的所有人員進(jìn)行分組;第二步是再以隨機(jī)的方法決定哪一組為實(shí)驗(yàn)組,哪一組為控制組。隨機(jī)控制的方法,雖然在事實(shí)上未必各方面都完全相等,但理論上他們相等的機(jī)會(huì)是比較多的。(2)物理控制法物理控制就是注意實(shí)驗(yàn)情境的物理?xiàng)l件是否保持恒定,刺激的呈現(xiàn)是否標(biāo)準(zhǔn),以及反應(yīng)的記錄是否客觀一致等物理性因素的控制。例如,為了使實(shí)驗(yàn)情境保持恒定,以免干擾實(shí)驗(yàn)變量對(duì)因變量的效果,要設(shè)法控制聲音、燈光、氣氛、周圍環(huán)境等物理因素。(3)排除控制法排除法是在設(shè)計(jì)實(shí)驗(yàn)時(shí)將可能影響結(jié)果的變量,預(yù)先排除于實(shí)驗(yàn)條件之外,使自變量簡化,免受其他變量的影響。例如,在試驗(yàn)發(fā)現(xiàn)式教學(xué)法和演講式教學(xué)法的優(yōu)劣時(shí),如果認(rèn)為智力因素會(huì)影響結(jié)果,則只選高智力生為受試者(或只選中等智力生或只選低智力生為受試者),這樣智力因素對(duì)實(shí)驗(yàn)結(jié)果的影響被排除掉了。同樣,如果認(rèn)為性別因素對(duì)實(shí)驗(yàn)有影響,則可采用單一性別(如只用男生或只用女生為受試者),這樣,性別因素對(duì)實(shí)驗(yàn)結(jié)果的影響可排除掉。排除法能很有效地控制無關(guān)變量,但所得的研究結(jié)果缺乏普遍的推論性。例如,只用男生為研究對(duì)象,將來結(jié)果就不適用于女生。因此,在實(shí)驗(yàn)設(shè)計(jì)時(shí),排除法并不常用。(4)納入控制法納入法是彌補(bǔ)排除法缺點(diǎn)的一種方法。這種方法是把影響將來實(shí)驗(yàn)結(jié)果的某種(或某些)因素也當(dāng)作自變量來處理,將其納入實(shí)驗(yàn)設(shè)計(jì)中,成為多因子實(shí)驗(yàn)設(shè)計(jì)。這樣,不但可以收到控制之效,而且還可以進(jìn)一步了解變量間的交互作用結(jié)果。例如,上例中,可將智力因素分為高、中、低三個(gè)層次納入設(shè)計(jì)中,這時(shí),原設(shè)計(jì)就變成為2(教學(xué)法)×3(智力)的二因子實(shí)驗(yàn)設(shè)計(jì)。在這一設(shè)計(jì)中,一方面可了解不同智力間的差別,另一方面又可了解智力和教學(xué)法之間的交互作用,亦即教學(xué)法的效果是否因不同智力層次而有所差異。假如同時(shí)考慮智力和性別兩個(gè)因素,就成為:2(教學(xué)法)×3(智力)×2(性別)的三因子實(shí)驗(yàn)設(shè)計(jì)。(5)配對(duì)控制法配對(duì)法是企圖使實(shí)驗(yàn)變量之外其他變量發(fā)生相等影響的一種方法。具體做法是:首先認(rèn)定與因變量有明顯關(guān)系的變量,然后決定所要控制的變量,并據(jù)此選擇同等分?jǐn)?shù)或相同特質(zhì)的受試者配對(duì)。配對(duì)后,再以隨機(jī)分派的方式,將其中一個(gè)分派到實(shí)驗(yàn)組,另一個(gè)分派到控制組。例如,為了使兩組學(xué)生的智力相等,研究者可從智力測驗(yàn)分?jǐn)?shù)中,選擇分?jǐn)?shù)相同的受試者配成對(duì),然后隨機(jī)分派到實(shí)驗(yàn)組和控制組。常用以配對(duì)的變量有性別、年齡、社會(huì)經(jīng)濟(jì)地位、智力、學(xué)業(yè)成績、個(gè)性特征和前測分?jǐn)?shù)等。必須注意的是,配對(duì)變量的決定,一定要以和因變量有高度相關(guān)者為根據(jù)。在理論上,配對(duì)后,實(shí)驗(yàn)組和控制組的受試者,在所據(jù)以配對(duì)的特質(zhì)方面,可達(dá)到相等的程度。但在實(shí)驗(yàn)上是很難使用的。因?yàn)椋菏紫?,配?duì)的變量若超過兩個(gè)以上時(shí),要找到這幾個(gè)變量同時(shí)相等的受試者是十分困難的;其次,配對(duì)的變量雖然可保證會(huì)相等,但其他因素卻未必會(huì)相等。再次,對(duì)于中介變量,如動(dòng)機(jī)、態(tài)度等內(nèi)在的因素,根本無法找到可靠的根據(jù)去進(jìn)行配對(duì)。只有隨機(jī)控制法才能克服配對(duì)法顧此失彼的缺點(diǎn),而且對(duì)難以觀察測量的中介變量如動(dòng)機(jī)、性向、態(tài)度、疲勞、注意等因素,也同樣發(fā)生控制作用,這也許是在實(shí)際中人們多用隨機(jī)法而少用配對(duì)法的重要原因。(6)測量選擇控制法測量選擇法是把參加實(shí)驗(yàn)的對(duì)象全部測量一下,然后根據(jù)測量的結(jié)果,予以合理的選擇與分配。為了使各組均等而編制或采用的測驗(yàn),必須合乎實(shí)驗(yàn)處理的要求。例如,如果打算采用兩個(gè)組做實(shí)驗(yàn),以比較兩種數(shù)學(xué)教學(xué)方法的效果,那么所要測量的就是學(xué)生原有的數(shù)學(xué)水平。測量的結(jié)果出來后,就按分?jǐn)?shù)多少的順序排列好,然后再按排列順序上的位置,把他們均等地分派在各組里面。為了使各組均等,在實(shí)行分組時(shí)可采取“弓”字排列式。如下A、B兩式,若按順序連結(jié),則是兩條“弓”字形的曲線。根據(jù)上述分組法,組數(shù)再多時(shí)仍可依此類推。為了使各組的均等更接近于理想水平,可在依上述方法分組后,再求得各組的平均分?jǐn)?shù)而加以比較,若仍發(fā)現(xiàn)有彼此懸殊的情況,則可把這一組中分?jǐn)?shù)較高的人和那一組中分?jǐn)?shù)較低的人加以調(diào)換。此外,僅僅在平均分?jǐn)?shù)上相等還不算相等,還必須在差異量數(shù)〈如平均差,標(biāo)準(zhǔn)差等〉上也力求相等。只有這樣,才能使兩組在原有水平上更接近于真正均等??刂茻o關(guān)變量是實(shí)驗(yàn)研究中一項(xiàng)非常重要的工作。但這里所說的“控制",只是相對(duì)的,而非絕對(duì)的,只有程度之分。要想對(duì)人類行為和對(duì)復(fù)雜多變的教育現(xiàn)象,像物理化學(xué)實(shí)驗(yàn)?zāi)菢舆_(dá)到絕對(duì)控制而又肯定變量問因果關(guān)系的程度,事實(shí)上是不可能的。因此,在教育實(shí)驗(yàn)研究中要正確理解“控制"一詞,才能正確解釋所得的實(shí)驗(yàn)結(jié)果。第三問題實(shí)驗(yàn)設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì)是實(shí)驗(yàn)研究的藍(lán)圖。它的意義在于給研究者提供如何控制變量,如何分析資料,可以獲得怎樣的結(jié)論的一種構(gòu)想、計(jì)劃和策略。為了簡明地表示各種研究設(shè)計(jì)的特征,下面的研究設(shè)計(jì)將用符號(hào)來表示?,F(xiàn)先介紹實(shí)驗(yàn)設(shè)計(jì)的符號(hào)及其涵義:3X:表示研究者所操縱的實(shí)驗(yàn)變量;O:表示觀察分?jǐn)?shù)或測量分?jǐn)?shù);R:表示受試者是隨機(jī)選擇和隨機(jī)分派到各組;…:表示由虛線所隔開的各組研究對(duì)象之間不相等;—:表示由實(shí)驗(yàn)所隔開的各組研究對(duì)象之間不相等;由左至右:表示時(shí)間次序或先后;同一橫行的X或0:表示這些X或0是對(duì)同一組受試者的實(shí)驗(yàn)處理。一、單組實(shí)驗(yàn)設(shè)計(jì)單組實(shí)驗(yàn)設(shè)計(jì)是用單一實(shí)驗(yàn)組為研究對(duì)象,施加某一種或數(shù)種實(shí)驗(yàn)處理的實(shí)驗(yàn)設(shè)計(jì)。1.設(shè)計(jì)1:單組后測設(shè)計(jì)這種設(shè)計(jì)的模式如下:XO這種設(shè)計(jì)的要求是,首先選擇一些受試者作為研究對(duì)象,并給予一種實(shí)驗(yàn)處理,然后測量實(shí)驗(yàn)處理的效果。例如,為試驗(yàn)一種新的教學(xué)方法對(duì)學(xué)習(xí)成績的影響,于是采用一班學(xué)生實(shí)施這種教學(xué)方法,一個(gè)學(xué)期后,測驗(yàn)學(xué)生的學(xué)習(xí)成績,并憑研究者主觀的判斷下結(jié)論說:這種教學(xué)方法有助于學(xué)習(xí)成績的提高。這個(gè)結(jié)論可能是不正確的,因?yàn)?,這種設(shè)計(jì)的內(nèi)在效度甚差,如“歷史”、“成熟”、“差異的選擇”和“受試的流失”等因素可能干擾實(shí)驗(yàn)結(jié)果??傊?,這種設(shè)計(jì)雖然簡單易行,但因缺乏控制組和可比較的量數(shù),許多因素會(huì)混淆實(shí)驗(yàn)結(jié)果,在一般的教育研究中,這種設(shè)計(jì)已甚少采用,不過,能認(rèn)識(shí)其優(yōu)缺點(diǎn),對(duì)于從事更適當(dāng)?shù)膶?shí)驗(yàn)設(shè)計(jì)是必要的。2.設(shè)計(jì)2:單組前后測設(shè)計(jì)這種設(shè)計(jì)的模式如下:O1XO2這種設(shè)汁的要求是,對(duì)受試者進(jìn)行實(shí)驗(yàn)處理前的測驗(yàn)(O1),然后給予受試者實(shí)驗(yàn)處理(X),再給予受試者一次測驗(yàn)(O2)。最后比較前測和后測的分?jǐn)?shù),通常采用兩個(gè)相關(guān)樣本平均數(shù)差異的顯著性的檢驗(yàn)(N>30用Z檢驗(yàn),N<30則用t檢驗(yàn)),以檢驗(yàn)前后兩次測驗(yàn)平均數(shù)的差異顯著性(統(tǒng)計(jì)檢驗(yàn)的具體方法可參閱有關(guān)章節(jié))。這種研究設(shè)計(jì)的優(yōu)點(diǎn)是:相同的受試者都接受前測和后測,“差異的選擇”和“受試的流失”兩因素即可被控制。缺點(diǎn)則是:實(shí)驗(yàn)效果可能受到“歷史”、“成熟”、“工具”、“選擇與成熟的交互作用”的干擾,可見其內(nèi)在效度也很差,少用為宜。3.設(shè)計(jì)3:單組相等時(shí)間樣本設(shè)計(jì)這種設(shè)計(jì)的基本模式是:X1O1X0O2X1O3X0O4這種設(shè)計(jì)是對(duì)一組受試者抽取兩個(gè)相等的時(shí)間樣本,在其中一個(gè)時(shí)間樣本出現(xiàn)實(shí)驗(yàn)處理(X),另一個(gè)時(shí)間樣本不出現(xiàn)實(shí)驗(yàn)處理(X0),然后,比較這兩段時(shí)間測驗(yàn)的分?jǐn)?shù)。例如,新的教學(xué)方法與傳統(tǒng)的教學(xué)方法對(duì)同一班學(xué)生相間出現(xiàn),看兩段時(shí)間的學(xué)習(xí)成績有無不同。統(tǒng)計(jì)檢驗(yàn)可采用變異數(shù)分析法。也可采用相關(guān)樣本平均數(shù)差異的顯著性檢驗(yàn)(N)30用Z檢驗(yàn),N<30用t檢驗(yàn))。這種設(shè)計(jì)能完全控制影響內(nèi)在效度的八個(gè)因素。缺點(diǎn)主要在外在效度方面,實(shí)驗(yàn)結(jié)果可能會(huì)受到“實(shí)驗(yàn)安排的反作用效果”、“選擇的偏差與實(shí)驗(yàn)變量的交互作用”、“重復(fù)實(shí)驗(yàn)處理的干擾”等因素的影響。這一設(shè)計(jì)也可用于只有一個(gè)受試者的情形。4.設(shè)計(jì)4:單組縱貫時(shí)間系列設(shè)計(jì)這種設(shè)計(jì)的基本模式是:O1O2O3O4XO5O6O7O8使用這種設(shè)計(jì)時(shí),要對(duì)實(shí)驗(yàn)組做周期性的一系列測量,并在測量的這一時(shí)間系列中間呈現(xiàn)實(shí)驗(yàn)變量(X),然后比較實(shí)驗(yàn)變量前后的一系列測量記錄是否有顯著差異。例如,研究者欲探索提高工人的教育水平是否會(huì)提高工廠的產(chǎn)量,于是從1月到6月,在每月末,都把準(zhǔn)備參加教育培訓(xùn)的工人的生產(chǎn)量記錄起來,然后,從7月至12月,對(duì)工人進(jìn)行某一項(xiàng)專門技術(shù)的教育培訓(xùn),接著,繼續(xù)記錄從第二年的1月至6月的生產(chǎn)量,看看經(jīng)培訓(xùn)后的1~6月產(chǎn)量比培訓(xùn)之前1~6月產(chǎn)量是否有顯著增加。這種設(shè)計(jì)的統(tǒng)計(jì)分析除了可用相關(guān)樣本平均數(shù)差異的顯著性檢驗(yàn)(N>30用Z檢驗(yàn),N〈30用t檢驗(yàn)〉外,比較理想的統(tǒng)計(jì)檢驗(yàn)方法是采用趨向分析。在內(nèi)在效度方面,這一設(shè)計(jì)的缺點(diǎn)是:“歷史”的因素可能對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生干擾。要補(bǔ)救這一缺點(diǎn),最好多增加一個(gè)控制組,成為“多重縱貫時(shí)間系列設(shè)計(jì)”。除了“歷史”因素外,影響內(nèi)在效度的其他因素均可被控制。在外在效度方面,“測驗(yàn)的反作用或交互作用效果”未能控制,因此,其實(shí)驗(yàn)結(jié)果只能推論到重復(fù)測驗(yàn)的群體。好在利用學(xué)校里的學(xué)生做實(shí)驗(yàn)時(shí),學(xué)生便是常常接受重復(fù)測驗(yàn)的團(tuán)體,而研究者所要推論的對(duì)象也正好是學(xué)生。因此,這一缺點(diǎn),對(duì)于在校學(xué)生而言,并非真正的缺點(diǎn)。5.設(shè)計(jì)5:單組多因子實(shí)驗(yàn)設(shè)計(jì)這種設(shè)計(jì)的基本模式是:(O1X1O2)(O3X2O4)這一設(shè)計(jì)的要求是,以單組作為實(shí)驗(yàn)對(duì)象,施加兩種或兩種以上的實(shí)驗(yàn)處理。每一種實(shí)驗(yàn)處理均進(jìn)行前測和后測。然后比較各種實(shí)驗(yàn)處理的效果。例如,要對(duì)一個(gè)班級(jí)進(jìn)行兩種教學(xué)方法的對(duì)比實(shí)驗(yàn)。具體做法是,在實(shí)施甲種方法前進(jìn)行一次測驗(yàn)(O1),在實(shí)施甲種方法(X1)后,再進(jìn)行一次測驗(yàn)(O2),對(duì)兩次測驗(yàn)成績比較,可求出甲種方法所產(chǎn)生的效果。同樣,用乙種方法(X2)實(shí)驗(yàn)一次,得出乙種方法所產(chǎn)生的效果。最后,對(duì)這兩種教學(xué)方法所產(chǎn)生的效果進(jìn)行比較,明確哪一種方法的效果比較好。這種設(shè)計(jì)的統(tǒng)計(jì)分析,可采用相關(guān)樣本平均數(shù)差異的顯著性檢驗(yàn)(N)30用Z檢驗(yàn),N<30用t檢驗(yàn))。內(nèi)在效度方面,這種設(shè)計(jì)的缺點(diǎn)是:實(shí)驗(yàn)結(jié)果可能受到“歷史”、“測量的工具”等因素的影響。在外在效度方面,這種設(shè)計(jì)的缺點(diǎn)是“多重實(shí)驗(yàn)處理的干擾”即后一實(shí)驗(yàn)處理在實(shí)驗(yàn)對(duì)象中所產(chǎn)生的變化,可能受到前一實(shí)驗(yàn)處理的影響。二、組別比較實(shí)驗(yàn)設(shè)計(jì)組別比較實(shí)驗(yàn)設(shè)計(jì)是以兩個(gè)或兩個(gè)以上的組作為實(shí)驗(yàn)組和控制組,然后比較各個(gè)組所發(fā)生的變化。1.設(shè)計(jì)6:靜態(tài)組比較設(shè)計(jì)這種設(shè)計(jì)的基本模式是:這種設(shè)計(jì)要求選擇一班學(xué)生作為實(shí)驗(yàn)組,另一班學(xué)生為控制組,給予實(shí)驗(yàn)組實(shí)驗(yàn)處理后,測驗(yàn)兩班學(xué)生的成績。統(tǒng)計(jì)分析可采用獨(dú)立樣本平均數(shù)差異的顯著性檢驗(yàn)(N)30用Z檢驗(yàn),N〈30用t檢驗(yàn)〉。這種設(shè)計(jì)由于使用控制組比較,“歷史”因素可被控制,如果兩組年齡相同,也可能控制“成熟”因素。因在設(shè)計(jì)中沒有前測處理,“測驗(yàn)”和“工具”兩個(gè)因素也容易控制。但由于兩組實(shí)驗(yàn)對(duì)象條件不相等,“差異的選擇”、“選擇與成熟”的因素可能會(huì)影響結(jié)果。因?yàn)橛袃蓚€(gè)組,“受試者的流失”也可能干擾實(shí)驗(yàn)效果。2.設(shè)計(jì)7:等組前后測設(shè)計(jì)這種設(shè)計(jì)的基本模式是:這個(gè)設(shè)計(jì)的主要步驟:①用隨機(jī)方法選擇受試者,并將其隨機(jī)分派到實(shí)驗(yàn)組和控制組(R);②實(shí)驗(yàn)處理前,兩組都接受前測(O1O3);③實(shí)驗(yàn)組接受實(shí)驗(yàn)處理(X),而控制組則否;④實(shí)驗(yàn)處理后,兩組都接受后測(O3O4);⑤比較兩組實(shí)驗(yàn)結(jié)果[(O2-O1)-(O4-O3)]。在實(shí)際研究中,有時(shí)可能有好幾種不同的實(shí)驗(yàn)處理,這時(shí),可根據(jù)比較的需要采用兩組或超過兩組以上的實(shí)驗(yàn)設(shè)計(jì)。兩種實(shí)驗(yàn)處理的等組前、后測設(shè)計(jì)模式實(shí)驗(yàn)結(jié)果=(O2-O1)-(O4-O3)三種實(shí)驗(yàn)處理的等組前、后測設(shè)計(jì)模式實(shí)驗(yàn)結(jié)果是把三種實(shí)驗(yàn)處理所產(chǎn)生的變化互相比較。如果實(shí)驗(yàn)因子加多,設(shè)計(jì)的組數(shù)也要相應(yīng)增加。這種設(shè)計(jì)的統(tǒng)計(jì)分析是對(duì)兩組調(diào)節(jié)后的平均數(shù)(實(shí)驗(yàn)的后測值減去前測值的平均數(shù),即各增益數(shù)之平均數(shù))作獨(dú)立樣本平均數(shù)差異的顯著性檢驗(yàn)(N>30用Z檢驗(yàn),N<30用t檢驗(yàn))。但這種設(shè)計(jì)最適當(dāng)?shù)慕y(tǒng)計(jì)分析法,是共變量分析法(analysisofcovariance),即以兩組的前測分?jǐn)?shù)作為共變量,進(jìn)行共變量分析。9這種實(shí)驗(yàn)設(shè)計(jì)的內(nèi)在效度是很高的,由于采用相等的控制組,而且兩組都有前、后測,故在前測到后測期間影響內(nèi)在效度的“歷史”、“成熟”、“測驗(yàn)”、“工具”、“統(tǒng)計(jì)回歸”等因素,兩組完全一樣。再者,由于采用隨機(jī)方法,兩組在各方面的特質(zhì)相等,故可控制“差異的選擇”、“受試的流失”和“選擇與成熟等因素交互作用”等三個(gè)因素的干擾??梢姡且环N嚴(yán)謹(jǐn)控制的實(shí)驗(yàn)設(shè)計(jì),在教育實(shí)驗(yàn)研究中常被采用。但在外在效度方面,由于采用前測,實(shí)驗(yàn)結(jié)果可能受到“測驗(yàn)的反作用或交互作用效果”因素的干擾,“實(shí)驗(yàn)安排的反作用效果”因素的干擾有時(shí)也可能產(chǎn)生。3.設(shè)計(jì)8:等組后測設(shè)計(jì)這種設(shè)計(jì)的模式是:這種設(shè)計(jì)與前述等組前后測設(shè)計(jì)比較,不同之處是兩組在實(shí)驗(yàn)處理前都沒有測驗(yàn)?,F(xiàn)以一例子來說明這種設(shè)計(jì)的使用方法。假定要探討教師和學(xué)校領(lǐng)導(dǎo)交換意見的機(jī)會(huì)是否有助于提高教帥的工作態(tài)度。于是從學(xué)校中隨機(jī)抽取一些教師參加實(shí)驗(yàn),其中一部分教師隨機(jī)分派為實(shí)驗(yàn)組,另一部分為控制組。實(shí)驗(yàn)開始時(shí),實(shí)驗(yàn)組的教師每日均有兩次機(jī)會(huì)和校長交換意見,商談校務(wù)和教學(xué)事宜,控制組則無此機(jī)會(huì)。經(jīng)過一年后,實(shí)驗(yàn)組和控制組的教師,都接受一項(xiàng)測量“教師工作態(tài)度”的問卷。然后比較兩組教師的工作態(tài)度是否有顯著差異。統(tǒng)計(jì)分析可使用獨(dú)立樣本平均數(shù)差異的顯著性檢驗(yàn)(N>30用Z檢驗(yàn),N<30用t檢驗(yàn))。這是一種十分理想的實(shí)驗(yàn)設(shè)計(jì),因?yàn)樗鼘?duì)影響內(nèi)在效度的八個(gè)因素均可有效控制,而且,尚可避免因前測所產(chǎn)生的“測驗(yàn)的反作用效果”。這種設(shè)計(jì)的局限性在于,它無法確定實(shí)驗(yàn)處理是否對(duì)不同層次的受試者有不同的效果。如果有前測時(shí),則可據(jù)之以形成不同組別,從事進(jìn)一步的分析。例如,假定要比較采用歸納法和演繹法教數(shù)學(xué)的效果,如實(shí)驗(yàn)前,兩組都沒有進(jìn)行數(shù)學(xué)成績的測驗(yàn)(前測),僅在實(shí)驗(yàn)后測量數(shù)學(xué)成績,如經(jīng)比較結(jié)果,發(fā)現(xiàn)兩組沒有顯著差異,據(jù)此而確定實(shí)驗(yàn)處理沒有效果。但是,如果有數(shù)學(xué)成績的前測,人們就可根據(jù)數(shù)學(xué)成績將學(xué)生分成高、中、低三個(gè)層次,進(jìn)行2(教學(xué)法)×3(數(shù)學(xué)成績)的實(shí)驗(yàn)設(shè)計(jì),實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn)兩種教學(xué)方法的效果因?qū)W生數(shù)學(xué)前測成績不同而異。4.設(shè)計(jì)9:所羅門四等組設(shè)計(jì)這一設(shè)計(jì)實(shí)際上是上述等組前后測設(shè)計(jì)和等組后測設(shè)計(jì)的綜合,是由所羅門(Solomon,1949)首創(chuàng),故稱為所羅門四組設(shè)計(jì)(Solomonfourgroupdesigns)。其設(shè)計(jì)模式是:這種設(shè)計(jì)包含有兩個(gè)實(shí)驗(yàn)組和兩個(gè)控制組,四組受試者均由隨機(jī)方法選擇而來。其中,有兩個(gè)組接受前測,兩個(gè)組則無。實(shí)驗(yàn)處理后,四組均接受后測。實(shí)驗(yàn)效果的測定,可用相關(guān)樣本或獨(dú)立樣本的Z檢驗(yàn)或t檢驗(yàn)(N>30用Z檢驗(yàn),N<30用t檢驗(yàn))的方法,檢驗(yàn)下列四種平均數(shù)的差異顯著性:①第一組前測和后測平均數(shù)的差異(O2-O1);②第一組和第二組后測平均數(shù)的差異(O2-O4);③第三組、第四組后測平均數(shù)的差異(O5-O6);④第一組、第二組前測平均數(shù)和第三組后測平均數(shù)的分別差異(O5-O1或O5-O3)。如果上述四個(gè)差異的檢驗(yàn)都獲得一致性的效果,研究者將更有信心確定是實(shí)驗(yàn)處理產(chǎn)生了效果。因?yàn)檫@等于重復(fù)做了四次實(shí)驗(yàn)(若以有前測和無前測比較,則等于重復(fù)做了二次實(shí)驗(yàn))。有關(guān)前測經(jīng)驗(yàn)的單獨(dú)效果之檢驗(yàn),可比較第二組和第四組后測平均數(shù)的差異(O4-O6)。這種設(shè)計(jì)對(duì)影響內(nèi)在效度的八個(gè)因素均可控制,而且,可以控制和測量前測的主要效果,可以控制和測量前測與實(shí)驗(yàn)處理間的交互作用效果(通過第一組和第三組的比較),可以測量“成熟”和“歷史”的綜合影響效果(根據(jù)第四組的后測平均數(shù)O6和第一、二組的個(gè)別前測平均數(shù)O1、O3的比較)??梢?,這種設(shè)計(jì)是最嚴(yán)謹(jǐn)控制的實(shí)驗(yàn)設(shè)計(jì)之一。但是,由于有四個(gè)組,需要大量的樣本,研究者須付出很大的代價(jià),缺乏實(shí)用性。因此,在一般的教育研究中,這種設(shè)計(jì)的應(yīng)用并不廣泛。5.設(shè)計(jì)10:不相等控制組設(shè)計(jì)這種設(shè)計(jì)的模式是:這種設(shè)計(jì)與靜態(tài)比較設(shè)計(jì)相比,唯一不同之處是:這種設(shè)計(jì)兩組都有前測。而與等組前后測設(shè)計(jì)相比,區(qū)別則在于:這種設(shè)計(jì)不是采取隨機(jī)方法分派受試者,所以實(shí)驗(yàn)組與控制組的各方面條件未必相等。運(yùn)用這種設(shè)計(jì)的一般步驟是:①以班級(jí)為單位,將班級(jí)隨機(jī)分派為實(shí)驗(yàn)組和控制組;②對(duì)兩組實(shí)施前測;③實(shí)驗(yàn)組接受實(shí)驗(yàn)處理,而控制組則否;④實(shí)驗(yàn)處理后,兩組進(jìn)行后測。例如,研究者欲試驗(yàn)新編的小學(xué)《數(shù)學(xué)》課教材是否優(yōu)于舊教材,可接洽一所小學(xué)做實(shí)驗(yàn),結(jié)果這所學(xué)校不允許采用隨機(jī)方法從各班級(jí)中抽取學(xué)生,并隨機(jī)分派到實(shí)驗(yàn)組和控制組,而只能提供六個(gè)原來班級(jí)學(xué)生作為實(shí)驗(yàn)對(duì)象。這時(shí),研究者只好將六個(gè)班級(jí)隨機(jī)分派三個(gè)班為實(shí)驗(yàn)組,另三個(gè)班為控制組(顯然,這種分派方式不能看作是隨機(jī)分派,因?yàn)槊恳晃粚W(xué)生并沒有同等機(jī)會(huì)被分派到實(shí)驗(yàn)組或控制組。不過,在不能完全隨機(jī)分派學(xué)生的情況下,以班級(jí)為單位隨機(jī)分派也是一種可取的措施。)。接著,對(duì)兩組受試者實(shí)施一項(xiàng)數(shù)學(xué)思維能力水平測驗(yàn),然后,實(shí)驗(yàn)組使用新教材教學(xué),而控制組仍使用舊教材教學(xué),一個(gè)學(xué)期后,兩組再接受思想品德水平測驗(yàn),則可比較新舊教材之優(yōu)劣。統(tǒng)計(jì)分析同第7種設(shè)計(jì)。這種實(shí)驗(yàn)設(shè)計(jì)在教育研究中使用很普遍。在內(nèi)在效度方面,這種設(shè)計(jì)可以控制“歷史”、“測驗(yàn)”、“成熟”、“測量的工具”、“受試的流失”等因素。由于有前測,“差異之選擇”因素也可控制(如,可用共變量分析法控制某些特質(zhì)方面的差異)。但是,由于沒有采用完全隨機(jī)方式分派受試者,故“選擇與成熟”、“選擇與同時(shí)事件”等的交互作用,會(huì)干擾實(shí)驗(yàn)效果。如果兩組受試的選擇不適當(dāng),“統(tǒng)計(jì)回歸”也有可能產(chǎn)生。在外在效度方面,不能控制“測驗(yàn)的反作用或交互作用效果”、“選擇偏差的交互作用效果”和“實(shí)驗(yàn)安的反作用效果”等因素。三、循環(huán)實(shí)驗(yàn)或輪組實(shí)驗(yàn)設(shè)計(jì)循環(huán)實(shí)驗(yàn)設(shè)計(jì)或輪組實(shí)驗(yàn)設(shè)計(jì)也叫對(duì)抗平衡設(shè)計(jì),它是把各種實(shí)驗(yàn)處理(不管是幾個(gè)),輪換施行于各組(各組不必均等)然后根據(jù)每種實(shí)驗(yàn)處理所發(fā)生變化的總和來決定實(shí)驗(yàn)的效果。1.設(shè)計(jì)11:循環(huán)實(shí)驗(yàn)設(shè)計(jì)這種設(shè)計(jì)的模式分為甲、乙兩種。甲模式:這種設(shè)計(jì)的實(shí)驗(yàn)步驟如下:①選取二班作為實(shí)驗(yàn)組(兩班不必均等);②兩組在第一個(gè)實(shí)驗(yàn)時(shí)間內(nèi)進(jìn)行前測并分別接受二種不同實(shí)驗(yàn)處理中的一種;③兩組在第一個(gè)實(shí)驗(yàn)時(shí)間內(nèi),進(jìn)行實(shí)驗(yàn)l處理以后的測驗(yàn);④在第二個(gè)實(shí)驗(yàn)時(shí)間內(nèi),將用輪換方式,將實(shí)驗(yàn)處理分別呈現(xiàn)給各組受試者,使每組都有機(jī)會(huì)接受每一種實(shí)驗(yàn)處理。在每次實(shí)驗(yàn)處理前后,各組均接受前測和后測。例如,研究者欲探索兩種不同的強(qiáng)化方式,對(duì)學(xué)習(xí)效果的影響。這兩種不同的強(qiáng)化方式是:A.固定時(shí)間強(qiáng)化(X1):不管學(xué)生的學(xué)習(xí)成績?nèi)绾?,只有等待某一特定時(shí)間到來才“強(qiáng)化”。如:教師固定在每個(gè)學(xué)期的中段考時(shí),才對(duì)學(xué)生優(yōu)者表揚(yáng),差者批評(píng)。B.不定時(shí)強(qiáng)化(X):教師對(duì)學(xué)生的強(qiáng)化,沒有固定的時(shí)間,如教師經(jīng)常對(duì)學(xué)生優(yōu)者表揚(yáng),差者批評(píng)。根據(jù)上述設(shè)計(jì)模式,研究者選擇兩組學(xué)生(不必均等),在第一學(xué)期,A組接受固定時(shí)間的強(qiáng)化,而B組則接受不固定時(shí)間的強(qiáng)化;在第二學(xué)期,B組接受固定時(shí)間的強(qiáng)化,而A組則接受不固定時(shí)間的強(qiáng)化。在每個(gè)學(xué)期的實(shí)驗(yàn)前后,都分別對(duì)各組學(xué)生的學(xué)習(xí)成績進(jìn)行前測和后測。最后,把這兩種不同的強(qiáng)化方式各自在各學(xué)期內(nèi)所發(fā)生的變化的總和進(jìn)行比較,即可知兩種不同的強(qiáng)化方式對(duì)學(xué)習(xí)效果影響的優(yōu)劣。如果實(shí)驗(yàn)處理有三種,則實(shí)驗(yàn)組分別也應(yīng)增至三個(gè),每組仍對(duì)所有實(shí)驗(yàn)處理輪流實(shí)驗(yàn)一遍,各種實(shí)驗(yàn)處理的次序應(yīng)像下面的方法排列:這樣的排列方法使每一種實(shí)驗(yàn)處理不但在各組中循環(huán)了一遍,而且在實(shí)驗(yàn)次序的每一個(gè)地位上也都循環(huán)了一遍。上述設(shè)計(jì)若不要前測,則變?yōu)橐夷J剑哼@種設(shè)計(jì)的統(tǒng)計(jì)分析,可采用拉丁方格實(shí)驗(yàn)的重復(fù)量數(shù)變異數(shù)分析法,其分析的模式依上面設(shè)計(jì)模式安排如下:組別實(shí)驗(yàn)處理X1X2At1t2Bt2t2t表示實(shí)驗(yàn)處理時(shí)間順序。從縱行的總和可檢驗(yàn)“實(shí)驗(yàn)處理”之間的差異顯著性;利用橫行的總和可檢驗(yàn)組別之間的差異顯著性。在內(nèi)在效度方面,這種設(shè)計(jì)除了可能產(chǎn)生“選擇與成熟的交互作用效果”之外,其他七個(gè)影響內(nèi)在效度的因素均可被控制。在外在效度方面,“多重實(shí)驗(yàn)處理的干擾”的因素可能影響外在效度。在每種實(shí)驗(yàn)處理都有前測的這類設(shè)計(jì),“測驗(yàn)的反作用效果”因素也能影響外在效度。在實(shí)際應(yīng)用上,這種設(shè)計(jì)不必要求各組均等,因而省卻了均等組別的麻煩。但各種實(shí)驗(yàn)處理被實(shí)驗(yàn)的次數(shù)增加,這就自然又增加了很多麻煩。上述十一種實(shí)驗(yàn)設(shè)計(jì)各有利弊。在選擇運(yùn)用時(shí),每種設(shè)計(jì)還可以根據(jù)實(shí)驗(yàn)情況而加以改進(jìn)。在這些設(shè)計(jì)中,第三種單組相等時(shí)間樣本設(shè)計(jì)、第四種單組縱貫時(shí)間系列設(shè)計(jì)、第十種不相等控制組設(shè)計(jì)、第十一種循環(huán)實(shí)驗(yàn)設(shè)計(jì)這四種又被叫做“準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)”(quasi-experimentaldesign)。準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)和真正實(shí)驗(yàn)設(shè)計(jì)的主要區(qū)別,在于真正實(shí)驗(yàn)設(shè)計(jì)可以使用隨機(jī)分派的方法將受試者分派到不同的實(shí)驗(yàn)處理或情境,而準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)則無法如此分派受試者。準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)在教育研究中廣泛應(yīng)用,原因是在學(xué)校抽樣很難做到隨機(jī)化,因?yàn)樵趯?shí)際中,人們不能也不愿打破現(xiàn)存的編班。而準(zhǔn)實(shí)驗(yàn)設(shè)計(jì),以原班級(jí)作為實(shí)驗(yàn)對(duì)象,并在可能的條件下盡可能進(jìn)行控制,所以教育研究者常常愿意采用。第四問題實(shí)驗(yàn)結(jié)果的驗(yàn)證教育是復(fù)雜的社會(huì)現(xiàn)象,影響某一教育現(xiàn)象發(fā)生的因素是很多的,教育實(shí)驗(yàn)所得的結(jié)果不可能達(dá)到像自然科學(xué)實(shí)驗(yàn)研究結(jié)果那樣準(zhǔn)確的程度。為了有效地檢驗(yàn)教育實(shí)驗(yàn)結(jié)果的準(zhǔn)確程度,下面介紹幾種常用的檢驗(yàn)實(shí)驗(yàn)結(jié)果的方法。一、從實(shí)驗(yàn)程序上檢驗(yàn)任何實(shí)驗(yàn)研究的進(jìn)行都有一定的程序(包括設(shè)計(jì)、抽樣、分組、控制等工作),實(shí)驗(yàn)程序的科學(xué)性和先進(jìn)性將影響實(shí)驗(yàn)結(jié)果i的準(zhǔn)確性。因此,要驗(yàn)證實(shí)驗(yàn)結(jié)果,首先必須全面地考察整個(gè)實(shí)驗(yàn)的全過程,檢查實(shí)驗(yàn)過程的各個(gè)環(huán)節(jié)是否抓好,實(shí)驗(yàn)設(shè)計(jì)效度;如何,無關(guān)因素控制得怎樣。只有這樣,才有可能對(duì)實(shí)驗(yàn)結(jié)果的l準(zhǔn)確性有比較全面的認(rèn)識(shí)和評(píng)價(jià)。二、用實(shí)驗(yàn)系數(shù)進(jìn)行檢驗(yàn)實(shí)驗(yàn)處理所產(chǎn)生的效果如何,主要是從前后測驗(yàn)所得數(shù)據(jù)的比較,及對(duì)不同實(shí)驗(yàn)處理效果測驗(yàn)所得數(shù)據(jù)的比較中來看的。實(shí)驗(yàn)結(jié)果可靠程度的大小一般可用下列求實(shí)驗(yàn)系數(shù)的辦法來檢驗(yàn):優(yōu)勝點(diǎn)實(shí)驗(yàn)系數(shù)=2.78×優(yōu)勝點(diǎn)標(biāo)準(zhǔn)差優(yōu)勝點(diǎn)=實(shí)驗(yàn)因子1的平均進(jìn)步數(shù)一實(shí)驗(yàn)因子z的平均進(jìn)步數(shù)優(yōu)勝點(diǎn)標(biāo)準(zhǔn)差=J(平均標(biāo)準(zhǔn)差1)2+(平均標(biāo)準(zhǔn)差2)2一每個(gè)受測者的增益數(shù)之和平均進(jìn)步數(shù)一受測者數(shù)每一實(shí)驗(yàn)因子的平均進(jìn)步數(shù)求得后,可據(jù)以求得這個(gè)平均進(jìn)步數(shù)的平均標(biāo)準(zhǔn)差,進(jìn)而求得優(yōu)勝點(diǎn)的標(biāo)準(zhǔn)差。實(shí)驗(yàn)系數(shù)的大小可用來表示實(shí)驗(yàn)可靠程度的大小。實(shí)驗(yàn)系數(shù)越大,就表明實(shí)驗(yàn)結(jié)果越可靠。一般說來,實(shí)驗(yàn)系數(shù)為1或接近于1時(shí),就表明實(shí)驗(yàn)結(jié)果相當(dāng)可靠。如果在0.5以下,就不能認(rèn)為是可靠的。4三、與其他有關(guān)的已確立的定理定論對(duì)照進(jìn)行檢驗(yàn)任何理論都不是孤立的,人們可以把實(shí)驗(yàn)所得結(jié)果以及由此推出的理論,拿來和已經(jīng)確立的有關(guān)定理、定論對(duì)照,進(jìn)行驗(yàn)證。如果相一致,就證明實(shí)驗(yàn)結(jié)果及由此產(chǎn)生的理論是可靠的,否則就應(yīng)有疑問。不一致有兩種可能:一般情況下,可能是實(shí)驗(yàn)結(jié)果不可靠,但有時(shí)也可能是已成定論不可靠,應(yīng)予推翻,當(dāng)然,后一種情況是很少的。所以,當(dāng)實(shí)驗(yàn)結(jié)果與已成定論不一致J時(shí),問題就非常復(fù)雜了,這時(shí)往往需要把研究范圍再擴(kuò)大,即連同所謂已成定論的也要再拿來分析研究一番。那就不屬于這一實(shí)驗(yàn)的問題范圍了。四、用重復(fù)實(shí)驗(yàn)來檢驗(yàn)這種檢驗(yàn)辦法是另行抽樣,改變實(shí)驗(yàn)對(duì)象,進(jìn)行重復(fù)實(shí)驗(yàn)。重復(fù)實(shí)驗(yàn)的關(guān)鍵是:實(shí)驗(yàn)對(duì)象改變,實(shí)驗(yàn)處理不變,其他條件盡可能保持不變。重復(fù)實(shí)驗(yàn)的結(jié)果若與原實(shí)驗(yàn)結(jié)果相符或差別不大,就證明實(shí)驗(yàn)可靠,如果差別太大,還可重復(fù)實(shí)驗(yàn)多次,看究竟哪個(gè)實(shí)驗(yàn)結(jié)果比較可靠。真正的科學(xué)結(jié)論是應(yīng)該經(jīng)得起多次反復(fù)檢驗(yàn)的。不過,這種檢驗(yàn)辦法是比較麻煩的。前文就比較具體的問題所進(jìn)行的有控制的小型實(shí)驗(yàn)而言,而對(duì)于牽涉面比較廣的問題所進(jìn)行的自然實(shí)驗(yàn),就不能拿前面所講的那些要求去硬套,特別是對(duì)于牽涉面比較廣、規(guī)模比較大的實(shí)驗(yàn),要想對(duì)于各方面的情況嚴(yán)格加以控制是不可能的,而且控制過多了反而會(huì)失去實(shí)驗(yàn)的真實(shí)性。在這種情況下,自然實(shí)驗(yàn)就非常必要,它決不是控制實(shí)驗(yàn)所能代替的。當(dāng)然,自然實(shí)驗(yàn)也是一種科學(xué)實(shí)驗(yàn),也一樣須有假設(shè),須有實(shí)驗(yàn)因子,并須有各方面應(yīng)有的數(shù)據(jù)。它與控制實(shí)驗(yàn)的主要區(qū)別在于它是在自然狀態(tài)下,在日常正常生活工作學(xué)習(xí)條件下所進(jìn)行的實(shí)驗(yàn)。它需要進(jìn)行更深入的分析與檢驗(yàn),并不斷調(diào)整其實(shí)驗(yàn)措施。它要求實(shí)驗(yàn)者站在更高的角度,具有敏銳的觀察能力與更高的分析綜合能力。第六章自測題及參考答案一、填空1.觀察法具有目的性與計(jì)劃性、()、()、直接性等特點(diǎn)。2.根據(jù)觀察的范圍,可以把觀察分為()和()。3.觀察記錄的方式有頻率記錄、等級(jí)記錄、行為檢核記錄、()、()。4.根據(jù)研究者是否借助于觀察儀器,把觀察法分成直接觀察和()。5.根據(jù)觀察的時(shí)間,可以把觀察分成()和追蹤觀察。前者是非連續(xù)性的,比如對(duì)某個(gè)學(xué)生的行為觀察,規(guī)定每周一觀察一次。6.觀察策略有()之分,()的觀察策略是指在運(yùn)用觀察法的整個(gè)過程中(即從設(shè)計(jì)到分析)所使用的方法和要求,()的觀察策略是指在實(shí)施觀察的過程中所使用的方法和要求。7.觀察位置的選擇包括兩個(gè)因素:()。()是指觀察者如何面對(duì)被觀察者;()是指觀察者和被觀察者之間的遠(yuǎn)近。8.觀察計(jì)劃和方案的內(nèi)容包括:()、觀察對(duì)象、觀察的內(nèi)容、觀察類型、觀察的取樣和時(shí)間安排、觀察提綱和觀察記錄表、觀察手段和工具等。9.量化處理是對(duì)經(jīng)過編碼分類的資料,運(yùn)用()進(jìn)行加總、求平均、求百分比、進(jìn)行差異檢驗(yàn)等。10.測驗(yàn)是一種系統(tǒng)化了的()和一種測量的()。11.好的測驗(yàn)必須要有()的量表,才能使測驗(yàn)所獲得數(shù)量更有意義。12.()是教育與心理學(xué)研究中常用的一種研究方法,這種方法主要用于人的個(gè)性及其它個(gè)別心理差異的定量化研究。13.測量法具有評(píng)估、()與預(yù)測三種功能。14.()是編制測驗(yàn)的中心環(huán)節(jié),()是具體體現(xiàn)測驗(yàn)?zāi)康牡闹匾獌?nèi)容,也是決定測驗(yàn)好壞的重要方面。15.()是指每一題目對(duì)所測量的心理特性()的區(qū)分程度。16.測驗(yàn)的客觀性是關(guān)于測驗(yàn)系統(tǒng)化過程好壞程度的指標(biāo)。包括以下諸方面:()、()、推論的客觀性。17.成就測驗(yàn)是指經(jīng)過一定的()或測驗(yàn)編制程序()的各類教育測驗(yàn)。18.()是指測驗(yàn)分?jǐn)?shù)與效度標(biāo)準(zhǔn)之間的相關(guān)系數(shù)。19.()是指測驗(yàn)內(nèi)部所有項(xiàng)目分?jǐn)?shù)之間的一致性20.()是指測驗(yàn)?zāi)軌驒z驗(yàn)理論的概念或特質(zhì)的程度。二、名詞解釋1.觀察法,2.參與性觀察,3.非參與性觀察,4.有結(jié)構(gòu)性觀察,5.無結(jié)構(gòu)性觀察,6.時(shí)間取樣觀察,7.事件取樣觀察,8.測驗(yàn)法,9.量表,10.是非題,11.常模,12.再測信度,13.復(fù)本信度,14評(píng)分者信度,15.追蹤觀察三、選擇
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版物流合作合同文檔大全
- 洛陽科技職業(yè)學(xué)院《醫(yī)學(xué)遺傳學(xué)醫(yī)學(xué)細(xì)胞生物學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025地產(chǎn)公司土地合同管理辦法
- 商業(yè)零售設(shè)備電路改造合同
- 管道安裝腳手架施工合同范本
- 2025店鋪裝修合同常用版樣本
- 個(gè)人展會(huì)用車租賃協(xié)議
- 醫(yī)療衛(wèi)生服務(wù)采購招投標(biāo)樣本
- 地鐵安全乘車禮儀指南
- 環(huán)保工程項(xiàng)目管理準(zhǔn)則
- 鋼化玻璃的MSDS英文報(bào)告
- 大學(xué)生情緒管理1500字論文2篇
- 2023廣東省成人高考《英語》(高升專)考試卷及答案(單選題型)
- 《德米安 埃米爾 辛克萊年少時(shí)的故事》讀書筆記思維導(dǎo)圖PPT模板下載
- 年產(chǎn)萬噸天然飲用水生產(chǎn)項(xiàng)目可行性研究報(bào)告
- 臨床藥理學(xué)第十四章 腎功能不全臨床用藥
- YS/T 682-2008釕粉
- GB/T 5976-2006鋼絲繩夾
- 麗聲妙想英文繪本第一級(jí) My Dad課件
- 部編版五年級(jí)語文上-句子專項(xiàng)課件
- 初中語文人教九年級(jí)下冊(cè)《統(tǒng)一》PPT
評(píng)論
0/150
提交評(píng)論