企業(yè)研究方法9-第9章測量量表信度效度課件_第1頁
企業(yè)研究方法9-第9章測量量表信度效度課件_第2頁
企業(yè)研究方法9-第9章測量量表信度效度課件_第3頁
企業(yè)研究方法9-第9章測量量表信度效度課件_第4頁
企業(yè)研究方法9-第9章測量量表信度效度課件_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第9章測量:量表、信度、效度

本章學(xué)習(xí)目的:1.了解如何和何時使用不同形式的評定量表與等級量表。2.解釋測量的穩(wěn)定性與一致性,以及它們是被如何證實(shí)的。3.熟悉不同形式的效度。4.討論各種決定測量方法質(zhì)量的概念,以及為什么需要在研究中確定它們。本章學(xué)習(xí)重點(diǎn):測量的信度和效度

第9章測量:量表、信度、效度本章學(xué)習(xí)目的:本章學(xué)習(xí)重點(diǎn):測19.1評定量表

◆二分量表(dichotomousscale)◆類別量表(categoryscale)◆李克特量表(LikertScale)◆數(shù)值量表(numericalscale)◆語義差異量表(semanticdifferentialscale)◆列舉式評定量表(itemizedratingscale)◆固定或常數(shù)總和評定量表(fixedorconstantsumratingscale)◆Stapel量表(StapelScale)◆圖形評定量表(graphicratingscale)◆共識性量表(consensusscale)不常用的:塞斯通等距量表與多元尺度量表(MultidimensionalScale)9.1評定量表◆二分量表(dichotom29.1評定量表9.1.1二分量表二分量表通常以“是”或“否”來做回答,如以下示例(它采用定類尺度來標(biāo)記受試者的回答)。9.1.2類別量表

類別量表通常使用多重選項(xiàng)來標(biāo)記單一答案,同樣地,它一般也是采用定類尺度9.1評定量表9.1.1二分量表9.1.2類別量表

類別量表39.1評定量表9.1.3李克特量表李克特量表被設(shè)計為五點(diǎn)量表,如下所示,定位點(diǎn)(anchors)是用來代表受試者對敘述句的贊成或不贊成程度有多強(qiáng)烈。接著,可將每位受試者在題項(xiàng)上的答案加總,而這些題項(xiàng)通常用來測量某個概念或變量。該量表一般采用的是定距尺度,而且量表中任何二點(diǎn)之間的差距是相等的。9.1.4語義差異量表幾個具有兩極性的屬性,可通過所謂的語義空間(semanticspace)加以測量,將相對應(yīng)的屬性放在量表兩端當(dāng)作極端值,而受試者則被要求在語義空間中指出他們對某些特定的個人、目標(biāo)物或事件的態(tài)度。例如,常使用某些具有相對性的形容詞,如“好一壞”、“強(qiáng)一弱”、“熱一冷”等。語義差異量表不僅常被用來評估受試者對某個品牌、廣告、目標(biāo)物或個人的態(tài)度,還時??赏ㄟ^受試者的回答來獲得不錯的觀點(diǎn)。此外,該量表通常會被當(dāng)作定距尺度來處理。9.1評定量表9.1.3李克特量表9.1.4語義差異量表49.1評定量表9.1.5數(shù)值量表數(shù)值量表跟語義差異量表很類似,也經(jīng)常被當(dāng)成定距尺度來使用。不過其不同之處在于數(shù)值量表提供五點(diǎn)或七點(diǎn)量表,并且將極端的形容詞放在兩端。9.1.6列舉式評定量表列舉式評定量表根據(jù)研究需要為每一個題項(xiàng)提供五點(diǎn)或七點(diǎn)量表,由每位受試者在每個題項(xiàng)旁填寫合適的數(shù)字,或是圈選出他認(rèn)為適合的數(shù)字,然后將這些題項(xiàng)的答案加總。該量表也被當(dāng)成定距尺度來使用。如果需要的話,列舉式評定量表可以靈活地提供較多的定位點(diǎn)(四點(diǎn)、五點(diǎn)、七點(diǎn)、九點(diǎn)或任何數(shù)目),而且也能使用不同的定位方式(如從“非常不重要”到“非常重要”;從“極端低”到“極端高”)。當(dāng)有中立點(diǎn)時,量表為平衡式評定量表,當(dāng)沒有中立點(diǎn)時,量表為不平衡式評定量表。研究報告指出,五點(diǎn)量表就是一個很好的量尺,而且評定量表從五點(diǎn)增加到七點(diǎn)或增加到九點(diǎn)其實(shí)并不會增加評定信度。列舉式評定量表常被應(yīng)用到企業(yè)研究中,既然該量表本身可彈性地調(diào)整成想要采用的點(diǎn)數(shù),那么每一個定位點(diǎn)的命名就必須仔細(xì)推敲以符合研究者欲測量變量的特性。9.1評定量表9.1.5數(shù)值量表9.1.6列舉式評定量表59.1評定量表9.1.7固定或常數(shù)總和評定量表受試者必須在欲評定的變量之間分配分?jǐn)?shù)。p1449.1.8Stapel量表

Stapel量表可同時測量受試者對研究主題的態(tài)度的方向與強(qiáng)度,其特色在于它設(shè)置了中心點(diǎn)以及數(shù)值量表的范圍。例如,量表的兩端是從十3到一3。這提供了一個用來測量距離的方式,即表現(xiàn)受試者的答案與測量因素有多近或多遠(yuǎn)。但該量表并無絕對零點(diǎn),所以屬于定距尺度。1459.1評定量表9.1.7固定或常數(shù)總和評定量表9.1.8St69.1評定量表9.1評定量表79.1評定量表9.1.9圖形評定量表

利用圖形可幫助受試者在量表中指出其答案所在的位置。通過在坐標(biāo)上適當(dāng)?shù)狞c(diǎn)做記號,幫助受試者在量表上表達(dá)他們對特定問題的回答。該量表的優(yōu)點(diǎn)是容易作答,并可通過量表中標(biāo)示點(diǎn)旁的簡短敘述來導(dǎo)引評點(diǎn)的位置。9.1.10共識性量表

共識性量表是由座談小組依據(jù)與被測量概念的切題程度或相關(guān)程度來挑選特定的題項(xiàng),并經(jīng)信度與效度檢驗(yàn)之后發(fā)展而成。其中,塞斯通等距量表(ThurstoneEqualAppearingIntervalScale)就是一種共識性量表,在挑選出題項(xiàng)后使用大量敘述概念(命題)的卡片,讓座談小組評定該命題與被研究概念的接近程度。9.1評定量表9.1.9圖形評定量表9.1.10共識性量表89.1評定量表9.1.11其他量表

有些高級測量方法,如多維度量表可用視覺方式將目標(biāo)物、人或這二者加以量化,然后再進(jìn)行聯(lián)合分析(cojointanalysis)。該量表可提供構(gòu)念中各維度間關(guān)系的想像空間。在此需注意的是,許多有名的量表如李克特量表或其他數(shù)值量表是組織研究中最常用的測量態(tài)度與行為的工具。。9.1評定量表9.1.11其他量表99.2等級量表等級量表是用來測量個體對兩個或兩個以上目標(biāo)物或項(xiàng)目間(其本質(zhì)是定序尺度)的偏好。然而,這樣的排序也許不能為某些正(尋求答案的人提供決定性的線索。例如,假設(shè)目前經(jīng)理正在搜集四條生產(chǎn)線的相關(guān)信息,以決定要將重心放在哪一條生產(chǎn)線上。假定有35%的受試者選第一條生產(chǎn)線,25%的受試者選第二條生產(chǎn)線,20%的受試者認(rèn)為第三條與第四條對他們而言都一樣重要。然而,管理者還是無法決定,是否該選擇最多人偏好的第一條生產(chǎn)線,因?yàn)槠渲杏?5%的受試者并未選擇該條生產(chǎn)線。在等級量表中可使用的方法包括:配對比較、強(qiáng)迫選擇和比較量表9.2等級量表等級量表是用來測量個體對兩個或兩個以上目標(biāo)109.2等級量表9.2.1配對比較配對比較量表常用來評估數(shù)量較少的目標(biāo)物,由受試者在兩個目標(biāo)物間做出選擇以確定受試者的偏好。在先前的例子中,如果使用配對比較,則可計算受試者對某一產(chǎn)品的一致性偏好,例如喜歡第一條生產(chǎn)線多過喜歡第二條,也多過喜歡第三條或第四條。如此,管理者終于可確定須將重心放在哪一條生產(chǎn)線。然而隨著比較目標(biāo)物數(shù)量的增加,配對比較的次數(shù)也會隨之增加(假使目標(biāo)物有n個,則配對比較的次數(shù)為〔n(n一1)/2〕),這也使得受試者容易感到疲倦。因此若目標(biāo)物較少,配對比較是不錯的方法9.2.2強(qiáng)迫選擇強(qiáng)迫選擇是要求受試者將目標(biāo)物或群體做相對等級的排序。此方法對受試者而言比較容易,特別是對需要排序的選項(xiàng),且目標(biāo)物或群體數(shù)量有限的時候。9.2等級量表9.2.1配對比較9.2.2強(qiáng)迫選擇119.2等級量表9.2.3比較量表比較量表提供一個偏好的標(biāo)桿或評分用以評估對研究目標(biāo)物、事件或情況的態(tài)度。9.2等級量表9.2.3比較量表129.2等級量表總而言之,定類資料本身即適用于二分法或類別量表,具備順序特性的資料則適用于任何一個等級量表:配對比較、強(qiáng)迫選擇或比較量表。具備定距或等同于定距特性的資料則適用于評定量表,這些都可以在上述各種不同范例中看到。語義差異量表與數(shù)值量表嚴(yán)格說來并不是定距尺度,雖然它們時常在資料分析中被視為定距尺度來處理。評定量表通常被用來測量大部分的行為概念,而等級量表則是將原本以定類尺度做區(qū)別的變量進(jìn)一步進(jìn)行比較或加以排序。9.2等級量表總而言之,定類資料本身即適用于二分法或類別量表139.3測量的質(zhì)量通過一套評估方法來確保這些已開發(fā)量表的質(zhì)量。9.3測量的質(zhì)量通過一套評估方法來確保這些已開發(fā)量表的質(zhì)量149.3測量的質(zhì)量9.3.1題項(xiàng)分析題項(xiàng)分析(itemanalysis)是用來了解量表中的題項(xiàng)是否恰當(dāng)以及題項(xiàng)所具有的鑒別力。換言之,就是檢驗(yàn)每個題項(xiàng)是否具有將研究對象區(qū)別出高分群與低分群的能力。在題項(xiàng)分析中,可通過t值(t-values)來檢驗(yàn)高分群與低分群的平均數(shù)是否有顯著的差異(可參考本書最后對t檢驗(yàn)的解釋)。具有高t值的題項(xiàng)(該指標(biāo)可在量表中找出具有區(qū)別能力的題項(xiàng))將被留在量表內(nèi),然后再對測量工具進(jìn)行信度檢驗(yàn),最后確定測量工具的效度。所謂的信度是當(dāng)測量工具在測量任一概念時檢驗(yàn)其是否具有一致性。效度則是檢驗(yàn)開發(fā)出的測量工具是否能真正測量出想要測量的特定概念。換句話說,效度是關(guān)于我們是否真正測量到“對的”概念,而信度則是與測量的穩(wěn)定性與一致性有關(guān)。測量的效度與信度可以證明研究的科學(xué)嚴(yán)謹(jǐn)性。9.3測量的質(zhì)量9.3.1題項(xiàng)分析所謂的信度是當(dāng)測量工具在測159.4信度信度是指測量無偏差的程度。沒有偏差是指在不同時間點(diǎn)和以量表內(nèi)不同題項(xiàng)去測量的結(jié)果應(yīng)該是一致的。換言之,測量工具的信度是一項(xiàng)穩(wěn)定性指標(biāo),且量表所使用的題項(xiàng)必須跟想要測量的概念是一致的,如此才能確定測量的質(zhì)量。9.4信度信度是指測量無偏差的程度。沒有偏差是指在不同時間點(diǎn)169.4信度9.4.1測量的穩(wěn)定性

測量的穩(wěn)定性或低可變性是指在不同時間點(diǎn)的測量結(jié)果相同,即使在無法控制測量條件或受試者狀態(tài)的情況下,測量結(jié)果仍然穩(wěn)定不變。這種穩(wěn)定性確保了測量的質(zhì)量,因?yàn)椴徽摵螘r概念都可以穩(wěn)定地被測量。一般來說,有兩種穩(wěn)定性的檢驗(yàn)方式——再測信度與復(fù)本信度。9.4.2再測信度將第二次與第一次的測量做比較,這種經(jīng)重復(fù)測量所得到的信度系數(shù),我們稱之為再測信度(test-retestreliability)。也就是說,將一份測量某概念且包含數(shù)個題項(xiàng)的問卷對同一組受試者進(jìn)行測試,第一次與第二次測試可能間隔一段時間,例如,數(shù)星期到6個月之間。然后計算同一組受試者在兩個不同時點(diǎn)作答所得的分?jǐn)?shù),并求兩分?jǐn)?shù)間的相關(guān)系數(shù),這個相關(guān)系數(shù)被稱為再測系數(shù)(test-retestcoefficient)。系數(shù)愈高,表示再測信度愈高,也代表測量的穩(wěn)定性。9.4信度9.4.1測量的穩(wěn)定性9.4.2再測信度179.4信度9.4.3復(fù)本信度針對同一概念,有兩組同質(zhì)且相當(dāng)?shù)臏y量工具,這兩組工具測量出的結(jié)果高度相關(guān)時,即可認(rèn)為具有復(fù)本信度。一般而言,這兩種版本的量表會有相似的題項(xiàng)與填答格式,唯一不同的是敘述的語法與問題呈現(xiàn)的順序。在此我們將嘗試找出因?yàn)轭}項(xiàng)的語法與順序所造成的誤差。如果這兩組復(fù)本所得出的分?jǐn)?shù)之間高度相關(guān)(高于8以上),我們就可確定該份量表是相當(dāng)可靠的,而且由語法、排序或其他因素所造成的誤差是相當(dāng)小的。9.4.4量表的內(nèi)部一致性量表的內(nèi)部一致性是指在測量某一概念時題項(xiàng)間的一致性指標(biāo)。換句話說,這些題項(xiàng)應(yīng)該是“被當(dāng)成具有同樣性質(zhì)的組合”,而且都能夠獨(dú)立測量相同概念。也就是說受試者對這些題項(xiàng)都有一個整體的且同樣的看法。一致性可通過檢查量表中題項(xiàng)與題項(xiàng)之間,或子題項(xiàng)之間是否高度相關(guān)來確定。一般來說,一致性指標(biāo)包括項(xiàng)目間一致性信度與折半信度。9.4信度9.4.3復(fù)本信度9.4.4量表的內(nèi)部一致性189.4信度1.項(xiàng)目間一致性信度項(xiàng)目間一致性信度是用來檢驗(yàn)在同一個量表中受試者對所有題項(xiàng)答案的一致性。假使這些題項(xiàng)是對相同概念的獨(dú)立測量單位,那么題與題之間應(yīng)有一定的相關(guān)程度。而在項(xiàng)目間一致性信度指標(biāo)中,最普遍使用的檢驗(yàn)是Cronbach'sa系數(shù)(Cronbach,l946),它適用于多重評分量表的題項(xiàng)(multipoint-scaleditems)。另外,庫李法則適用于二分法的題項(xiàng)(dichotomousitems),上述系數(shù)愈高,測量工具愈好。2.折半信度折半信度(split-halfreliability)是指將單一量表拆成兩半之后彼此的相關(guān)性。不過,該系數(shù)的估計值會受到將量表內(nèi)的題項(xiàng)拆成兩半的方式的影響。此外,折半信度只有在一種情況下會比Cronbach’sα系數(shù)更適用,即只有當(dāng)量表的題項(xiàng)要測量一個維度以上的情況下,而且其他限定條件都剛好符合時(完整說明請參考Campbell,1976)才比較好。因此,大部分的案例中,Cronbach'sa系數(shù)可以被視為代表項(xiàng)目間一致性信度的合適指標(biāo)。9.4信度1.項(xiàng)目間一致性信度2.折半信度199.4信度在此應(yīng)注意的是,還有另一種信度,稱為評分者間信度(interraterreliability),它是指不同的評定者對同一個現(xiàn)象的看法或?qū)Ψ磻?yīng)的解釋(這不應(yīng)與測量工具的信度混淆)。如前所述,當(dāng)資料是通過觀察、投射測驗(yàn)或非結(jié)構(gòu)性訪談獲得時,因?yàn)檫@些資料很大程度上依賴主觀性的解釋來分析,所以評分者間信度顯得格外重要。另外,信度在量表質(zhì)量的檢驗(yàn)中是一個必要條件而非充分條件。例如,某個量表具有高度穩(wěn)定性與一致性,因此能可靠地測量某個概念,但是它衡量到的也許不是研究者想要測量的概念。而效度就是用來確保量表具有能夠測量到想要測量的概念的能力。以下我們將討論效度的概念。9.4信度在此應(yīng)注意的是,還有另一種信度,稱為評分者間信度(209.5效度在本書第7章關(guān)于實(shí)驗(yàn)設(shè)計的部分,曾經(jīng)討論過幾個看起來有點(diǎn)關(guān)聯(lián)的名詞——內(nèi)部效度與外部有效性。這些概念代表的意思是因果關(guān)系的正確性(內(nèi)部效度),以及該因果關(guān)系可類推到外部環(huán)境的共性(外部有效性)。而我們現(xiàn)在要探討的是測量工具本身的效度,即當(dāng)我們詢問受試者一組問題后(如開發(fā)出一個測量工具),其實(shí)是希望能通過問題測量某個概念。但是我們?nèi)绾尾拍芎侠淼拇_信確實(shí)測量出了想要測量的概念,而不是其他概念呢?這可以應(yīng)用某些效度檢驗(yàn)來決定。有幾種類型的效度都可用作檢驗(yàn)測量質(zhì)量的指標(biāo),而且人們常用不同的名稱來表示它們。為了清楚地說明,我們將效度歸類到三種寬泛的標(biāo)題下:內(nèi)容效度、效標(biāo)關(guān)聯(lián)效度和構(gòu)念效度。9.5效度在本書第7章關(guān)于實(shí)驗(yàn)設(shè)計的部分,曾經(jīng)討論219.5效度9.5.1內(nèi)容效度內(nèi)容效度的建立是要確保量表中包含了能夠測量該概念的適當(dāng)?shù)那矣写硇缘念}項(xiàng)。量表內(nèi)的項(xiàng)目愈能代表該概念的主要領(lǐng)域或范圍,則其內(nèi)容效度愈好。簡單來說,內(nèi)容效度代表了將概念拆解成維度與要素的過程是否完善的指標(biāo)。一般來說,可通過座談小組來證實(shí)量表的內(nèi)容效度。Kidder與Judd(1986)曾舉例說明為了確定某個用來測量“語言障礙”的量表是否具有內(nèi)容效度,可將其交給一群專家來評估(如專業(yè)的語言治療師)。表面效度一般被視為內(nèi)容效度的基本且最低的要求。表面效度是指當(dāng)某些題項(xiàng)被設(shè)計來測量某個概念時,至少要看起來像在測量此概念。但有些研究者并不認(rèn)為表面效度可作為內(nèi)容效度的有效構(gòu)成要素。9.5.2效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是指測量能夠像預(yù)期所希望的那樣按照某一標(biāo)準(zhǔn)區(qū)分個體。效標(biāo)關(guān)聯(lián)效度一般可用同期效度(concurrentvalidity)或預(yù)測效度(predictivevalidity)來代表。同期效度適用于量表可區(qū)別出某些已知有差異的個體,即這些個體在該量表上的得分應(yīng)該是有差異的。9.5效度9.5.1內(nèi)容效度9.5.2效標(biāo)關(guān)聯(lián)效度229.5效度預(yù)測效度是指測量工具能在某個未來的效標(biāo)上區(qū)分出個別差異的能力。例如,在招募員工時,同時也讓新進(jìn)員工填寫性向或能力測驗(yàn),并將此成績與其未來的工作績效做比較。基本上,性向測驗(yàn)得分較低的人應(yīng)該會有較差的工作績效表現(xiàn);反之,則有較好的工作績效表現(xiàn)。由此即可得知,該測驗(yàn)具有較高的預(yù)測效度。9.5、3構(gòu)念效度構(gòu)念效度是用來證明從量表所獲得的結(jié)果與設(shè)計該量表時所依據(jù)的理論之間的契合程度。一般來說,構(gòu)念效度可通過聚合效度(convergentvalidity)與辨別效度(discriminantvalidity)來評估,其意義如下:聚合效度是指當(dāng)采用兩種不同的測量工具來測量同一概念時,所獲得的分?jǐn)?shù)是高度相關(guān)的。而辨別效度是指如果根據(jù)理論預(yù)測兩個變量是不相關(guān)的,則兩個變量的實(shí)際測量分?jǐn)?shù)也應(yīng)該是不相關(guān)的。其實(shí),效度可以通過許多不同的方式來確立。在實(shí)踐中,那些用來測量概念且已經(jīng)發(fā)表的各種測量工具,通常會對測量工具所確立的各式效度指標(biāo)加以描述,這樣可讓使用者或讀者判斷該量表的質(zhì)量。9.5效度預(yù)測效度是指測量工具能在某個未來的效標(biāo)上區(qū)分出個別23內(nèi)容效度舉例工作投入度1.工作對我而言僅僅意味著掙錢;2.我生活中的滿足主要來自于工作;3.我對自己的工作很有興趣;4.即使不需要錢,我也可能繼續(xù)工作;5.我最重要的事都跟自己的工作有關(guān);6.即使沒有加班費(fèi),我仍會加班完成工作;7.對我而言,工作的前幾個小時感覺過得很快;8.您對工作中有規(guī)律的日?;顒佑卸嘞矚g;9.每天早上,您有多盼望即將來臨的工作。內(nèi)容效度舉例24效標(biāo)關(guān)聯(lián)效度—同期效度例如:工作倫理的量表:工作倫理價值觀高/低效標(biāo)關(guān)聯(lián)效度—預(yù)測效度例如:找工時候的性向測試/能力測試效標(biāo)關(guān)聯(lián)效度—同期效度259.5效度內(nèi)容效度表面效度效標(biāo)關(guān)聯(lián)效度同期效度預(yù)測效度構(gòu)念效度聚合效度辨別效度該量表充分測量出了想要測量的概念嗎?是否有“專家”證實(shí)該量表確實(shí)能測量出想要測量的?該量表是否具有預(yù)測某一效標(biāo)變量的能力?該量表是否具有預(yù)測某一現(xiàn)有效標(biāo)變量的能力?該量表是否具有預(yù)測某一未來效標(biāo)變量的能力?該量表是否能夠測量出理論上所說的概念?兩種測量工具測量同一概念時,其結(jié)果是否高度相關(guān)?該量表對理論上認(rèn)為不相關(guān)的變量的測量結(jié)果是否相關(guān)程度很低?9.5效度內(nèi)容效度該量表充分測量出了想要測量的概念嗎?26總結(jié)以上討論的各種效度可通過幾種方式來確定:(1)相關(guān)性分析,可應(yīng)用于同期效度、預(yù)測效度,或聚合效度和辨別效度;(2)因素分析,這是一種多變量分析技巧,用來確認(rèn)概念的維度并標(biāo)示出每個題項(xiàng)所適合歸屬的維度(建立構(gòu)念效度);(3)使用不同的測量工具與形式來建立多元特性、多元方法的相關(guān)矩陣,這樣可以進(jìn)一步提高測量質(zhì)量??偠灾?測量的質(zhì)量可通過不同形式的效度與信度來確立,如圖9.1所示。任何研究要獲得好的結(jié)果,都要求所測結(jié)果確實(shí)代表了欲測量的理論框架中的概念。我們要使用具有高效度與高信度的測量工具以確保研究是符合科學(xué)標(biāo)準(zhǔn)的。在組織研究中,一直有研究者在努力開發(fā)許多重要概念的測量工具,而且這些研發(fā)者同時也建立了這些工具的心理測量學(xué)特性(例如信度與效度)。因此,研究者通??梢岳靡延械?且有良好聲譽(yù)的量表工具來測量,這會比自己辛苦開發(fā)量表更劃算。然而,在使用這些量表時研究者應(yīng)清楚地注明其引用的資料來源(如作者及參考文獻(xiàn)),讓有需要的讀者可以尋找更多信息??偨Y(jié)以上討論的各種效度可通過幾種方式來確定:(1)相關(guān)性分析27企業(yè)研究方法9-第9章測量量表信度效度課件28企業(yè)研究方法9-第9章測量量表信度效度課件29企業(yè)研究方法9-第9章測量量表信度效度課件30企業(yè)研究方法9-第9章測量量表信度效度課件31謝謝!謝謝!32第9章測量:量表、信度、效度

本章學(xué)習(xí)目的:1.了解如何和何時使用不同形式的評定量表與等級量表。2.解釋測量的穩(wěn)定性與一致性,以及它們是被如何證實(shí)的。3.熟悉不同形式的效度。4.討論各種決定測量方法質(zhì)量的概念,以及為什么需要在研究中確定它們。本章學(xué)習(xí)重點(diǎn):測量的信度和效度

第9章測量:量表、信度、效度本章學(xué)習(xí)目的:本章學(xué)習(xí)重點(diǎn):測339.1評定量表

◆二分量表(dichotomousscale)◆類別量表(categoryscale)◆李克特量表(LikertScale)◆數(shù)值量表(numericalscale)◆語義差異量表(semanticdifferentialscale)◆列舉式評定量表(itemizedratingscale)◆固定或常數(shù)總和評定量表(fixedorconstantsumratingscale)◆Stapel量表(StapelScale)◆圖形評定量表(graphicratingscale)◆共識性量表(consensusscale)不常用的:塞斯通等距量表與多元尺度量表(MultidimensionalScale)9.1評定量表◆二分量表(dichotom349.1評定量表9.1.1二分量表二分量表通常以“是”或“否”來做回答,如以下示例(它采用定類尺度來標(biāo)記受試者的回答)。9.1.2類別量表

類別量表通常使用多重選項(xiàng)來標(biāo)記單一答案,同樣地,它一般也是采用定類尺度9.1評定量表9.1.1二分量表9.1.2類別量表

類別量表359.1評定量表9.1.3李克特量表李克特量表被設(shè)計為五點(diǎn)量表,如下所示,定位點(diǎn)(anchors)是用來代表受試者對敘述句的贊成或不贊成程度有多強(qiáng)烈。接著,可將每位受試者在題項(xiàng)上的答案加總,而這些題項(xiàng)通常用來測量某個概念或變量。該量表一般采用的是定距尺度,而且量表中任何二點(diǎn)之間的差距是相等的。9.1.4語義差異量表幾個具有兩極性的屬性,可通過所謂的語義空間(semanticspace)加以測量,將相對應(yīng)的屬性放在量表兩端當(dāng)作極端值,而受試者則被要求在語義空間中指出他們對某些特定的個人、目標(biāo)物或事件的態(tài)度。例如,常使用某些具有相對性的形容詞,如“好一壞”、“強(qiáng)一弱”、“熱一冷”等。語義差異量表不僅常被用來評估受試者對某個品牌、廣告、目標(biāo)物或個人的態(tài)度,還時常可通過受試者的回答來獲得不錯的觀點(diǎn)。此外,該量表通常會被當(dāng)作定距尺度來處理。9.1評定量表9.1.3李克特量表9.1.4語義差異量表369.1評定量表9.1.5數(shù)值量表數(shù)值量表跟語義差異量表很類似,也經(jīng)常被當(dāng)成定距尺度來使用。不過其不同之處在于數(shù)值量表提供五點(diǎn)或七點(diǎn)量表,并且將極端的形容詞放在兩端。9.1.6列舉式評定量表列舉式評定量表根據(jù)研究需要為每一個題項(xiàng)提供五點(diǎn)或七點(diǎn)量表,由每位受試者在每個題項(xiàng)旁填寫合適的數(shù)字,或是圈選出他認(rèn)為適合的數(shù)字,然后將這些題項(xiàng)的答案加總。該量表也被當(dāng)成定距尺度來使用。如果需要的話,列舉式評定量表可以靈活地提供較多的定位點(diǎn)(四點(diǎn)、五點(diǎn)、七點(diǎn)、九點(diǎn)或任何數(shù)目),而且也能使用不同的定位方式(如從“非常不重要”到“非常重要”;從“極端低”到“極端高”)。當(dāng)有中立點(diǎn)時,量表為平衡式評定量表,當(dāng)沒有中立點(diǎn)時,量表為不平衡式評定量表。研究報告指出,五點(diǎn)量表就是一個很好的量尺,而且評定量表從五點(diǎn)增加到七點(diǎn)或增加到九點(diǎn)其實(shí)并不會增加評定信度。列舉式評定量表常被應(yīng)用到企業(yè)研究中,既然該量表本身可彈性地調(diào)整成想要采用的點(diǎn)數(shù),那么每一個定位點(diǎn)的命名就必須仔細(xì)推敲以符合研究者欲測量變量的特性。9.1評定量表9.1.5數(shù)值量表9.1.6列舉式評定量表379.1評定量表9.1.7固定或常數(shù)總和評定量表受試者必須在欲評定的變量之間分配分?jǐn)?shù)。p1449.1.8Stapel量表

Stapel量表可同時測量受試者對研究主題的態(tài)度的方向與強(qiáng)度,其特色在于它設(shè)置了中心點(diǎn)以及數(shù)值量表的范圍。例如,量表的兩端是從十3到一3。這提供了一個用來測量距離的方式,即表現(xiàn)受試者的答案與測量因素有多近或多遠(yuǎn)。但該量表并無絕對零點(diǎn),所以屬于定距尺度。1459.1評定量表9.1.7固定或常數(shù)總和評定量表9.1.8St389.1評定量表9.1評定量表399.1評定量表9.1.9圖形評定量表

利用圖形可幫助受試者在量表中指出其答案所在的位置。通過在坐標(biāo)上適當(dāng)?shù)狞c(diǎn)做記號,幫助受試者在量表上表達(dá)他們對特定問題的回答。該量表的優(yōu)點(diǎn)是容易作答,并可通過量表中標(biāo)示點(diǎn)旁的簡短敘述來導(dǎo)引評點(diǎn)的位置。9.1.10共識性量表

共識性量表是由座談小組依據(jù)與被測量概念的切題程度或相關(guān)程度來挑選特定的題項(xiàng),并經(jīng)信度與效度檢驗(yàn)之后發(fā)展而成。其中,塞斯通等距量表(ThurstoneEqualAppearingIntervalScale)就是一種共識性量表,在挑選出題項(xiàng)后使用大量敘述概念(命題)的卡片,讓座談小組評定該命題與被研究概念的接近程度。9.1評定量表9.1.9圖形評定量表9.1.10共識性量表409.1評定量表9.1.11其他量表

有些高級測量方法,如多維度量表可用視覺方式將目標(biāo)物、人或這二者加以量化,然后再進(jìn)行聯(lián)合分析(cojointanalysis)。該量表可提供構(gòu)念中各維度間關(guān)系的想像空間。在此需注意的是,許多有名的量表如李克特量表或其他數(shù)值量表是組織研究中最常用的測量態(tài)度與行為的工具。。9.1評定量表9.1.11其他量表419.2等級量表等級量表是用來測量個體對兩個或兩個以上目標(biāo)物或項(xiàng)目間(其本質(zhì)是定序尺度)的偏好。然而,這樣的排序也許不能為某些正(尋求答案的人提供決定性的線索。例如,假設(shè)目前經(jīng)理正在搜集四條生產(chǎn)線的相關(guān)信息,以決定要將重心放在哪一條生產(chǎn)線上。假定有35%的受試者選第一條生產(chǎn)線,25%的受試者選第二條生產(chǎn)線,20%的受試者認(rèn)為第三條與第四條對他們而言都一樣重要。然而,管理者還是無法決定,是否該選擇最多人偏好的第一條生產(chǎn)線,因?yàn)槠渲杏?5%的受試者并未選擇該條生產(chǎn)線。在等級量表中可使用的方法包括:配對比較、強(qiáng)迫選擇和比較量表9.2等級量表等級量表是用來測量個體對兩個或兩個以上目標(biāo)429.2等級量表9.2.1配對比較配對比較量表常用來評估數(shù)量較少的目標(biāo)物,由受試者在兩個目標(biāo)物間做出選擇以確定受試者的偏好。在先前的例子中,如果使用配對比較,則可計算受試者對某一產(chǎn)品的一致性偏好,例如喜歡第一條生產(chǎn)線多過喜歡第二條,也多過喜歡第三條或第四條。如此,管理者終于可確定須將重心放在哪一條生產(chǎn)線。然而隨著比較目標(biāo)物數(shù)量的增加,配對比較的次數(shù)也會隨之增加(假使目標(biāo)物有n個,則配對比較的次數(shù)為〔n(n一1)/2〕),這也使得受試者容易感到疲倦。因此若目標(biāo)物較少,配對比較是不錯的方法9.2.2強(qiáng)迫選擇強(qiáng)迫選擇是要求受試者將目標(biāo)物或群體做相對等級的排序。此方法對受試者而言比較容易,特別是對需要排序的選項(xiàng),且目標(biāo)物或群體數(shù)量有限的時候。9.2等級量表9.2.1配對比較9.2.2強(qiáng)迫選擇439.2等級量表9.2.3比較量表比較量表提供一個偏好的標(biāo)桿或評分用以評估對研究目標(biāo)物、事件或情況的態(tài)度。9.2等級量表9.2.3比較量表449.2等級量表總而言之,定類資料本身即適用于二分法或類別量表,具備順序特性的資料則適用于任何一個等級量表:配對比較、強(qiáng)迫選擇或比較量表。具備定距或等同于定距特性的資料則適用于評定量表,這些都可以在上述各種不同范例中看到。語義差異量表與數(shù)值量表嚴(yán)格說來并不是定距尺度,雖然它們時常在資料分析中被視為定距尺度來處理。評定量表通常被用來測量大部分的行為概念,而等級量表則是將原本以定類尺度做區(qū)別的變量進(jìn)一步進(jìn)行比較或加以排序。9.2等級量表總而言之,定類資料本身即適用于二分法或類別量表459.3測量的質(zhì)量通過一套評估方法來確保這些已開發(fā)量表的質(zhì)量。9.3測量的質(zhì)量通過一套評估方法來確保這些已開發(fā)量表的質(zhì)量469.3測量的質(zhì)量9.3.1題項(xiàng)分析題項(xiàng)分析(itemanalysis)是用來了解量表中的題項(xiàng)是否恰當(dāng)以及題項(xiàng)所具有的鑒別力。換言之,就是檢驗(yàn)每個題項(xiàng)是否具有將研究對象區(qū)別出高分群與低分群的能力。在題項(xiàng)分析中,可通過t值(t-values)來檢驗(yàn)高分群與低分群的平均數(shù)是否有顯著的差異(可參考本書最后對t檢驗(yàn)的解釋)。具有高t值的題項(xiàng)(該指標(biāo)可在量表中找出具有區(qū)別能力的題項(xiàng))將被留在量表內(nèi),然后再對測量工具進(jìn)行信度檢驗(yàn),最后確定測量工具的效度。所謂的信度是當(dāng)測量工具在測量任一概念時檢驗(yàn)其是否具有一致性。效度則是檢驗(yàn)開發(fā)出的測量工具是否能真正測量出想要測量的特定概念。換句話說,效度是關(guān)于我們是否真正測量到“對的”概念,而信度則是與測量的穩(wěn)定性與一致性有關(guān)。測量的效度與信度可以證明研究的科學(xué)嚴(yán)謹(jǐn)性。9.3測量的質(zhì)量9.3.1題項(xiàng)分析所謂的信度是當(dāng)測量工具在測479.4信度信度是指測量無偏差的程度。沒有偏差是指在不同時間點(diǎn)和以量表內(nèi)不同題項(xiàng)去測量的結(jié)果應(yīng)該是一致的。換言之,測量工具的信度是一項(xiàng)穩(wěn)定性指標(biāo),且量表所使用的題項(xiàng)必須跟想要測量的概念是一致的,如此才能確定測量的質(zhì)量。9.4信度信度是指測量無偏差的程度。沒有偏差是指在不同時間點(diǎn)489.4信度9.4.1測量的穩(wěn)定性

測量的穩(wěn)定性或低可變性是指在不同時間點(diǎn)的測量結(jié)果相同,即使在無法控制測量條件或受試者狀態(tài)的情況下,測量結(jié)果仍然穩(wěn)定不變。這種穩(wěn)定性確保了測量的質(zhì)量,因?yàn)椴徽摵螘r概念都可以穩(wěn)定地被測量。一般來說,有兩種穩(wěn)定性的檢驗(yàn)方式——再測信度與復(fù)本信度。9.4.2再測信度將第二次與第一次的測量做比較,這種經(jīng)重復(fù)測量所得到的信度系數(shù),我們稱之為再測信度(test-retestreliability)。也就是說,將一份測量某概念且包含數(shù)個題項(xiàng)的問卷對同一組受試者進(jìn)行測試,第一次與第二次測試可能間隔一段時間,例如,數(shù)星期到6個月之間。然后計算同一組受試者在兩個不同時點(diǎn)作答所得的分?jǐn)?shù),并求兩分?jǐn)?shù)間的相關(guān)系數(shù),這個相關(guān)系數(shù)被稱為再測系數(shù)(test-retestcoefficient)。系數(shù)愈高,表示再測信度愈高,也代表測量的穩(wěn)定性。9.4信度9.4.1測量的穩(wěn)定性9.4.2再測信度499.4信度9.4.3復(fù)本信度針對同一概念,有兩組同質(zhì)且相當(dāng)?shù)臏y量工具,這兩組工具測量出的結(jié)果高度相關(guān)時,即可認(rèn)為具有復(fù)本信度。一般而言,這兩種版本的量表會有相似的題項(xiàng)與填答格式,唯一不同的是敘述的語法與問題呈現(xiàn)的順序。在此我們將嘗試找出因?yàn)轭}項(xiàng)的語法與順序所造成的誤差。如果這兩組復(fù)本所得出的分?jǐn)?shù)之間高度相關(guān)(高于8以上),我們就可確定該份量表是相當(dāng)可靠的,而且由語法、排序或其他因素所造成的誤差是相當(dāng)小的。9.4.4量表的內(nèi)部一致性量表的內(nèi)部一致性是指在測量某一概念時題項(xiàng)間的一致性指標(biāo)。換句話說,這些題項(xiàng)應(yīng)該是“被當(dāng)成具有同樣性質(zhì)的組合”,而且都能夠獨(dú)立測量相同概念。也就是說受試者對這些題項(xiàng)都有一個整體的且同樣的看法。一致性可通過檢查量表中題項(xiàng)與題項(xiàng)之間,或子題項(xiàng)之間是否高度相關(guān)來確定。一般來說,一致性指標(biāo)包括項(xiàng)目間一致性信度與折半信度。9.4信度9.4.3復(fù)本信度9.4.4量表的內(nèi)部一致性509.4信度1.項(xiàng)目間一致性信度項(xiàng)目間一致性信度是用來檢驗(yàn)在同一個量表中受試者對所有題項(xiàng)答案的一致性。假使這些題項(xiàng)是對相同概念的獨(dú)立測量單位,那么題與題之間應(yīng)有一定的相關(guān)程度。而在項(xiàng)目間一致性信度指標(biāo)中,最普遍使用的檢驗(yàn)是Cronbach'sa系數(shù)(Cronbach,l946),它適用于多重評分量表的題項(xiàng)(multipoint-scaleditems)。另外,庫李法則適用于二分法的題項(xiàng)(dichotomousitems),上述系數(shù)愈高,測量工具愈好。2.折半信度折半信度(split-halfreliability)是指將單一量表拆成兩半之后彼此的相關(guān)性。不過,該系數(shù)的估計值會受到將量表內(nèi)的題項(xiàng)拆成兩半的方式的影響。此外,折半信度只有在一種情況下會比Cronbach’sα系數(shù)更適用,即只有當(dāng)量表的題項(xiàng)要測量一個維度以上的情況下,而且其他限定條件都剛好符合時(完整說明請參考Campbell,1976)才比較好。因此,大部分的案例中,Cronbach'sa系數(shù)可以被視為代表項(xiàng)目間一致性信度的合適指標(biāo)。9.4信度1.項(xiàng)目間一致性信度2.折半信度519.4信度在此應(yīng)注意的是,還有另一種信度,稱為評分者間信度(interraterreliability),它是指不同的評定者對同一個現(xiàn)象的看法或?qū)Ψ磻?yīng)的解釋(這不應(yīng)與測量工具的信度混淆)。如前所述,當(dāng)資料是通過觀察、投射測驗(yàn)或非結(jié)構(gòu)性訪談獲得時,因?yàn)檫@些資料很大程度上依賴主觀性的解釋來分析,所以評分者間信度顯得格外重要。另外,信度在量表質(zhì)量的檢驗(yàn)中是一個必要條件而非充分條件。例如,某個量表具有高度穩(wěn)定性與一致性,因此能可靠地測量某個概念,但是它衡量到的也許不是研究者想要測量的概念。而效度就是用來確保量表具有能夠測量到想要測量的概念的能力。以下我們將討論效度的概念。9.4信度在此應(yīng)注意的是,還有另一種信度,稱為評分者間信度(529.5效度在本書第7章關(guān)于實(shí)驗(yàn)設(shè)計的部分,曾經(jīng)討論過幾個看起來有點(diǎn)關(guān)聯(lián)的名詞——內(nèi)部效度與外部有效性。這些概念代表的意思是因果關(guān)系的正確性(內(nèi)部效度),以及該因果關(guān)系可類推到外部環(huán)境的共性(外部有效性)。而我們現(xiàn)在要探討的是測量工具本身的效度,即當(dāng)我們詢問受試者一組問題后(如開發(fā)出一個測量工具),其實(shí)是希望能通過問題測量某個概念。但是我們?nèi)绾尾拍芎侠淼拇_信確實(shí)測量出了想要測量的概念,而不是其他概念呢?這可以應(yīng)用某些效度檢驗(yàn)來決定。有幾種類型的效度都可用作檢驗(yàn)測量質(zhì)量的指標(biāo),而且人們常用不同的名稱來表示它們。為了清楚地說明,我們將效度歸類到三種寬泛的標(biāo)題下:內(nèi)容效度、效標(biāo)關(guān)聯(lián)效度和構(gòu)念效度。9.5效度在本書第7章關(guān)于實(shí)驗(yàn)設(shè)計的部分,曾經(jīng)討論539.5效度9.5.1內(nèi)容效度內(nèi)容效度的建立是要確保量表中包含了能夠測量該概念的適當(dāng)?shù)那矣写硇缘念}項(xiàng)。量表內(nèi)的項(xiàng)目愈能代表該概念的主要領(lǐng)域或范圍,則其內(nèi)容效度愈好。簡單來說,內(nèi)容效度代表了將概念拆解成維度與要素的過程是否完善的指標(biāo)。一般來說,可通過座談小組來證實(shí)量表的內(nèi)容效度。Kidder與Judd(1986)曾舉例說明為了確定某個用來測量“語言障礙”的量表是否具有內(nèi)容效度,可將其交給一群專家來評估(如專業(yè)的語言治療師)。表面效度一般被視為內(nèi)容效度的基本且最低的要求。表面效度是指當(dāng)某些題項(xiàng)被設(shè)計來測量某個概念時,至少要看起來像在測量此概念。但有些研究者并不認(rèn)為表面效度可作為內(nèi)容效度的有效構(gòu)成要素。9.5.2效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是指測量能夠像預(yù)期所希望的那樣按照某一標(biāo)準(zhǔn)區(qū)分個體。效標(biāo)關(guān)聯(lián)效度一般可用同期效度(concurrentvalidity)或預(yù)測效度(predictivevalidity)來代表。同期效度適用于量表可區(qū)別出某些已知有差異的個體,即這些個體在該量表上的得分應(yīng)該是有差異的。9.5效度9.5.1內(nèi)容效度9.5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論