測量量表大學(xué)課件_第1頁
測量量表大學(xué)課件_第2頁
測量量表大學(xué)課件_第3頁
測量量表大學(xué)課件_第4頁
測量量表大學(xué)課件_第5頁
已閱讀5頁,還剩49頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第八章測量量表1學(xué)習(xí)目標(biāo)建構(gòu)衡量尺度的五種方式。如何建立量表衡量的信度和效度?學(xué)習(xí)了本章之后,應(yīng)該能夠達(dá)到如下目標(biāo):2如何及何時,使用不同方式的評點(diǎn)量表與等級量表?課程回顧3

上一章節(jié)中我們討論了如何將企業(yè)研究中的一般觀念轉(zhuǎn)化為有效的、可測量的概念。

本章主要討論測量量表的類型、建構(gòu)等相關(guān)議題。量表的基本概念一種測量工具,常被用來測量調(diào)查對象如何感覺或思考某事物,研究者借助它來測量某個建構(gòu)的強(qiáng)度、方向、層次。4定義以一個連續(xù)體的方式來排列回答值或觀察值,

方法然后對其結(jié)果加以分析

。量表的構(gòu)建旨在創(chuàng)造以順序、等距、比率形式測量變項的數(shù)字分?jǐn)?shù),而數(shù)字的指派有助于人們進(jìn)行量化思考。目的量表不僅有助于概念的概念化與操作化過程,而且量表產(chǎn)生量化測量,可以和其他變量一

起被用來檢驗假設(shè)。優(yōu)點(diǎn)第一節(jié)評點(diǎn)量表與等級量表

第二節(jié)測量量表制定第三節(jié)量表的信度與效度5第一節(jié)評點(diǎn)量表與等級量表6一、評點(diǎn)量表(rating

scales)二、等級量表(ranking

scales)scale)8、多等級清單量表(multiple

rating

list

scale)9

、Stapel量表(staple

scale)10、圖形評點(diǎn)量表(graphic

rating

scale)11、共識性量表(consensus

scale)12、其他量表7一、評點(diǎn)量表(rating

scales)inhere1、二分量表(dichotomous

scale)

2、類別量表(category

scale)3、李克特量表(likert

scale)4、語意差別量tex表t

(semantic

differentialscale)5、數(shù)值量表(ninumerical

scale)6、列舉式評點(diǎn)her量e

表(itemized

rating

scale)7、固定或常數(shù)總和評點(diǎn)量表(fixed

or

constant

sum

ratingtext1、二分量表(dichotomous

scale)8二分量表又稱為簡單分類量表(simplecategoryscale),提供兩個相互排斥的回答選項,通常以“是”或“否”來做回答,但是有時也可以時是“重要”和“不重要”,“同意”和“不同意”,或另外一套不連續(xù)的種類。如以下范例(其采用名目量尺來標(biāo)志受試者地回答)?!醴穹独?你有車子嗎?

□是2、類別量表(category

scale)多選項-單一

選擇量表(multiplechoice,

single-responsescale)多選項-單一選擇量表允許評價者選擇一個或幾個選項,在上表中,我們用一個問題測量7個指標(biāo),可能所有7個家裝設(shè)計的來源都在考慮之中,當(dāng)考慮了所有應(yīng)答者的選項時,這種選項的積累特點(diǎn)是有效的。類別量表多選項-多選擇量表(multiplechoice,multiple-

responsescale)99%10范例2你居住在加州北部的何處?□北80%灣

□南灣□東灣

□半島

□其他(

)55%范例3在你選擇pc電腦時,你主要考慮哪些方面?□品牌30%□價格

□售后服務(wù)

□保修期

□外形設(shè)計

□性能□其他(

)舉例如下3、李克特量表(likertscale)11李克特量表是評分加總量表(summated

ratingscale)的變種中最常用的一種量表,加總量表有一些陳述,應(yīng)答者利用數(shù)值表示對每一個陳述的

贊成或反對程度,這些數(shù)值可以加總來測量應(yīng)答

者的態(tài)度,一般一個可靠的李克特量表要求包括

20-25個適當(dāng)構(gòu)造的、有關(guān)態(tài)度對象的問題。在下面的例子中,對每一個陳述被設(shè)計為五點(diǎn)量表,如下所示之定位點(diǎn)(anchors)是用來檢查受試

者對敘述句的贊成或不贊成程度有多強(qiáng)烈。范例412非常不同意不同意不贊成也不同意同意非常同意12345接著,可將每位受試者在這些題項上的答案加總,而這些題項通常是用來衡量特定概念或變項(如范例4)。此種量表一般采用的是區(qū)間量尺,而在量表中任何兩點(diǎn)之間地差距是相等的。范例513(1)我的工作非常有趣12345(2)我并非整天都全神貫注在我的工作12345(3)生活中沒有工作將是乏味的12345使用前述的李克特量表,指出你贊成下列每一個敘述的程度:4、語意差別量表(semantic

differential

scale)14語意差別量表具有是建立在一個對象具有幾個方面的內(nèi)涵意義基礎(chǔ)之上的,這些意義分布在多維屬性空間里面,被稱作語意空間(semanticspace)。每一種內(nèi)涵意義具有相對兩極的屬性,將相對應(yīng)的屬性放在量表兩端當(dāng)作極端值,而受試者則被要求在語意空間中,指出他們對某些特定地個人、目標(biāo)物或事件的態(tài)度。例如,常使用某些具有相對應(yīng)兩端地形容詞,如“好-壞”、“強(qiáng)-弱”、“熱-冷”等。語意差別量表不僅常被用來評估受試者對特定品牌、廣告、目標(biāo)物或個人的態(tài)度外,還時??赏高^他們地選擇獲得不錯的點(diǎn)子。管理人員品牌形象、機(jī)構(gòu)形象、政治問題和個性對象的市場營銷研究以及組織研究中常常采用這種量表。此外,該量表通常會被當(dāng)作區(qū)間量尺來處理,舉例如下。范例6有反應(yīng)的――――――――――――――――――――沒有反應(yīng)的美麗的―――――――――――――――――――――丑陋的勇敢的―――――――――――――――――――――膽小的5、數(shù)值量表(numerical

scale)15非常愉快7654321非常不愉快數(shù)值量表中每個數(shù)值表度點(diǎn)之間的間距是相等的,共有的點(diǎn)作為極端點(diǎn)的標(biāo)志。應(yīng)答者量表中選擇一個數(shù)字寫在每個問題旁邊。如果例子中包含無數(shù)個有關(guān)員工業(yè)績的問題,這種方法可以既提供重要性的絕對度量,又提供被評價的不同問題的相對度量(排序)。數(shù)值量表跟語意差別量表很類似,也經(jīng)常被當(dāng)作區(qū)間量尺來使用,不過其不同之處在于數(shù)值量表提供五點(diǎn)或七點(diǎn)量表,并且將極端的形容詞放在兩端,如下所示。范例7你和你的房地產(chǎn)代理人之間的相處有多愉快?6、列舉式評點(diǎn)量表

(itemized

rating

scale)16非常不可能1不可能2中等3可能4非??赡?(1)我將在12個月內(nèi)換工作(2)我最近將負(fù)擔(dān)起新的任務(wù)(3)我將可能在12個月內(nèi)離開公司注:以上為有中立點(diǎn)(neutral

point)的平衡式評點(diǎn)量表(balanced

rating

scale)范例8(i)底下每一題皆使用下列量表作答,并于題項右邊的底線上標(biāo)示你的答案。請在下列題項上圈選出最接近你的感覺之?dāng)?shù)字17有一點(diǎn)有中等非常有完全沒興趣1興趣2程度的興趣3興趣4你會如何評定你對改變目前組織政策的興趣

13

42注:此為沒有中立點(diǎn)的不平衡式評點(diǎn)量表(unbalanced

rating

scale)范例8(ii)7、固定或常數(shù)總和評點(diǎn)量表(fixed

or

constant

sum

rating

scale)18受試者必須在欲評點(diǎn)的變項之間分配點(diǎn)數(shù),但是當(dāng)要均衡或加總許多方面時,應(yīng)答者的耐心和精確度都會受到影響。這種尺度的優(yōu)點(diǎn)是它與百分比的相容

性和可以對連續(xù)的數(shù)據(jù)進(jìn)行比較并做出選擇。如下所示(該量表較偏向具有

順序量尺的特性)。范例9總分為一百點(diǎn),請以分配的方式,指出你在選擇香皂時,對下列五個特性之重視程度香味顏色形狀大小泡沫的質(zhì)地總點(diǎn)數(shù)

1008、多等級清單量表(multiple

rating

list

scale)19多等級清單量表與數(shù)值量表類似,但在兩個方面有所不同:它允許評價者循環(huán)回答它的編排允許看到結(jié)果,其優(yōu)點(diǎn)是應(yīng)答者的評價清楚的展現(xiàn)在研究人員和面前,這種尺度產(chǎn)生與區(qū)間數(shù)據(jù)。9、Stapel量表(staple

scale)20+3+2+1+3+2+1+3+2+1采用現(xiàn)代化的技術(shù)產(chǎn)品創(chuàng)新人際關(guān)系的技巧—1—1—1—2—2—2—3—3—3范例10請根據(jù)以下所提之觀點(diǎn),評價你上司的能力如何,并圈選出適合數(shù)字。10、圖形評點(diǎn)量表

(graphic

rating

scale)21圖形評點(diǎn)量表是利用圖形的呈現(xiàn)可幫助受試者在量表中,指出其答案之所在位置,使研究人員能夠識別很小的差異。藉由在標(biāo)線上相稱的點(diǎn)做記號(如下所示),幫助受試者在量表上表達(dá)他們對特定問題的回答。雖然以下范例看起來好像是區(qū)間量尺,但該量表實(shí)為順序量尺。特點(diǎn):該量表的優(yōu)點(diǎn)是容易作答,并可透過量

表中標(biāo)識點(diǎn)旁的簡短敘述作為導(dǎo)引評點(diǎn)的位置,且此一作法較抽象的分類來得好。表情量表(face

scale)也是一種圖形評點(diǎn)量表,其是將表情的差距以圖案從微笑到悲傷加以呈現(xiàn),讓受

試者評定他們在一些事情上的感受,例如,對

工作的感覺。11、共識性量表(consensus

scale)22共識性量表是由評審小組依據(jù)與欲測量概念的切題程度或相關(guān)程度

來挑選特定的題項,并經(jīng)由信度與效度的檢驗之后發(fā)展而成。其中,塞斯通等距量表就是一種共識性量表,在挑選出題項后,使用大量

敘述概念的卡片,讓評審小組評定該敘述句距離欲研究概念有的接

近程度。然而,由于該量表需要長時間的發(fā)展,因此,很少用來衡

量組織的概念。12、其他量表有些進(jìn)階的測量方法,如多元尺度度量表可用視覺方式針對目標(biāo)物、人或此二者加以量表化,然后在進(jìn)行聯(lián)合分析(conjoint

analysis)。此量表可提供構(gòu)念中各面向間之關(guān)系的想象空間。在此需注意的是,許多有名的量表,如李克特量表或其它數(shù)值量表,是組織研究中最常用來衡量態(tài)度與行為的工具。返回23第一節(jié)評點(diǎn)量表與等級量表24二、等級量表(ranking

scales)1、配對比較量表(paired

comparison

scale)2、強(qiáng)迫選擇量表(forced

ranking

scale)3、比較量表(comparative

scale)配對比較量表“下面列出的每對雙座跑車中,如果你必須選擇出一個,請選擇出你比較喜歡的一個,并在旁邊做上記號。”_BMWZ3_Porsche

Boxster_Chevrolet

corvette_BMWZ3_Chevrolet

corvette_Dodge

Viper_Chevrolet

corvette_Porsche

Boxster_Porsche

Boxster_Dodge

Viper_Dodge

Viper_BMWZ3強(qiáng)迫選擇量表“根據(jù)你的偏好順序?qū)走_(dá)的探測特點(diǎn)進(jìn)行排序,在最喜歡的旁邊標(biāo)上1,在第二個喜歡的旁邊標(biāo)上2,等等”_使用人員程序設(shè)計_無線設(shè)施_體積?。唛L距離預(yù)警_最少的錯誤預(yù)警比較量表“與你以前的互助基金業(yè)相比,新的基金的業(yè)績:”_差_好_1_2大致相同_345返回25consensusscalingarbitrary

scaleitemanalysisscalingfactorscale主觀決斷量表共識量表項目分析量表因素量表通過收集適合給定主題的問題來設(shè)計主觀決斷量表共識量表要求問題由一組裁判選出,然后在三個方面進(jìn)行評價項目分析方法涉及計算每個量表問題在高分群體和低分群體中的平均得分第二節(jié)測量量表制定用于處理怎樣處理多維的內(nèi)容范圍;怎樣找出那些探索性研究沒有發(fā)現(xiàn)的基礎(chǔ)維度26你怎樣看待__公司的形象?1.作為一個工作的場所?差_

_

_

_ _好2.作為市政建設(shè)的主辦方?差_

_

_

_ _好3.對生態(tài)環(huán)境的關(guān)注?差_

_

_

_ _好4.作為少數(shù)民族人士的雇主?差_

_

_

_ _好優(yōu)點(diǎn):設(shè)計簡單、成本低廉,可以提供由于而充分的信息。缺點(diǎn);設(shè)計方法是主觀的,設(shè)計的問題無普遍性。返回27下表顯示了同義詞典研究的結(jié)果評價權(quán)力行動好-差硬-軟主動-被動積極-消極強(qiáng)-弱快-慢完全-不完全重-輕熱-冷及時的-不及時的陽性-陰性易激動的-冷靜的嚴(yán)厲的-仁慈的固執(zhí)的-屈從的評價的子類溫順的優(yōu)點(diǎn)動態(tài)的優(yōu)點(diǎn)可信賴的優(yōu)點(diǎn)快樂主義的優(yōu)點(diǎn)干凈-骯臟成功-不成功正確-錯誤快樂的-痛苦的仁慈-殘忍高-低有聲望的-無聲望的美麗的-丑陋的善交際的-不善交際有意義的-無意義的相信-懷疑善交際的-不善交際明亮的-黑暗的重要的-不重要的明智-愚蠢有意義-無意義利他的-利己的進(jìn)步的-退步的健康的-生病的感激的-不感激的干凈的-骯臟的美麗的-丑陋的和諧的-不和諧的28返回第三節(jié)量表的信度與效度29在建立了衡量的標(biāo)準(zhǔn)后,就要衡量量表的信度與效度指標(biāo)。簡單來說,所謂的信度是指當(dāng)檢驗衡量工具在衡量任一概念時,是否具有一致性。效度則是在檢驗發(fā)展完成的衡量工具,是否能真正衡量到想要衡量的特定概念。換句話說,效度是關(guān)于我們是否真正衡量到對的概念,而信度則是與衡量的穩(wěn)定性與一致性有關(guān)。衡量的效度與信度是將科學(xué)上所要求的嚴(yán)謹(jǐn),應(yīng)用到一般的調(diào)查研究中。以下將針對這二種標(biāo)準(zhǔn)做深入討論,并說明各種形式的信度與效度。第三節(jié)量表的信度與效度30一、衡量的信度二、衡量的效度一、衡量的信度312、影響因素3、評估方法1、定義:測量的一致性與穩(wěn)定性而言的,說的是在測量重復(fù)進(jìn)行的情況下,測量工具能否產(chǎn)生一致性結(jié)果,能夠穩(wěn)定的測量研究變量的程度影響信度的主要因素(1)在結(jié)構(gòu)式、標(biāo)準(zhǔn)化程度較高的測量中,信度主要受隨機(jī)誤差的影響。而隨機(jī)誤差源自:受訪者:是否認(rèn)真、耐心的配合調(diào)查,有無太大情緒波動調(diào)查時間:一般來說,調(diào)查時間越長、問題越多、難度越大、信度越低調(diào)研人員:是否認(rèn)真、規(guī)范的調(diào)查、記錄,是否有意或無意地對受訪者施加影響測量工具:量表設(shè)計是否合理,問題措辭是否清晰,題目間的關(guān)聯(lián)度的高低測量環(huán)境:有無他人“在場”,有無噪音和分心的事物

注意,要想提高測量的信度,我們需要注意兩個明確,一是問題要明確,二是遣詞造句要清晰,盡量使受訪者知道究竟該如何做答。32影響信度的主要因素(2)在非結(jié)構(gòu)式、非標(biāo)準(zhǔn)化的測量中,除偶然因素外,信度還受一些主觀因素的影響。調(diào)研人員:容易攙雜自己武斷的評估,特別在觀察和試驗法中受訪者:不同的受訪者會帶入不同的世界觀,使用不同的評分標(biāo)準(zhǔn)。對此情況,我們通常采用刪除極端的受訪者的評分,取均值的辦法來解決。返回33評估信度的方法方法34(1)復(fù)測信度(2)復(fù)本信度(3)折半信度(1)復(fù)測信度35定義:復(fù)測信度是指我們用同一份量表,對同

一群受訪者,在兩次不同的時間進(jìn)行調(diào)

查,根據(jù)兩次測量結(jié)果,計算相關(guān)系數(shù),以此來評估測量信度。使用技巧:1:選取少數(shù)重要的問題通過電話、郵件或再上門拜訪等方式進(jìn)行復(fù)測。

2:面對面訪談,在受訪者做答完完畢后,進(jìn)行補(bǔ)充式復(fù)測。3:長期跟蹤調(diào)查,采用完全重復(fù)測量,并輔以電話、電郵、電腦等建立大型的數(shù)據(jù)庫管理系統(tǒng),定期更新、修補(bǔ)數(shù)據(jù)。(2)復(fù)本信度36定義:指用兩個等價的量表形式(原本和復(fù)本),對同一群受訪者進(jìn)行兩次調(diào)查,然后根據(jù)測量結(jié)果,比較兩次答案的相似性,計算相關(guān)系數(shù),評估測量信度。缺點(diǎn):構(gòu)建一個完全等價的量表技術(shù)上非常困難復(fù)本的設(shè)計耗時、耗力、且成本昂貴設(shè)計技巧:同一主題,可將原本中的某些問題或陳述反向表達(dá)如原本中,讓受訪者對“A商店的服務(wù)員態(tài)度熱情”發(fā)表

意見,答案選項設(shè)“非常不贊同,不贊同,不確定,贊

同,非常贊同”五項,則在復(fù)本中,我們可以這樣提問,

“A商店的服務(wù)員給人高傲的感覺”,答案依然設(shè)“非常不贊同,不贊同,不確定,贊同,非常贊同”五項。(3)折半信度37定義:指信度的測量集中在構(gòu)成一份量表的項目體系的內(nèi)部一致性上。它是在我們無復(fù)本又不準(zhǔn)備復(fù)測的情況下,通常采用的最簡單的估計信度的方法。α系數(shù):分割量表項目的不同方法的所有可能的折半系數(shù)的平均數(shù)用于測量結(jié)果取決于量表或問卷項目是如何被拆分時。

隨量表項目數(shù)的增加而增大。一般介于0——1之間,0代表測量不可信,1代表測量完全可信,當(dāng)α系數(shù)小于或等于0.6時,表明內(nèi)部一致性很低。β系數(shù)常與α系數(shù)配合使用,以幫助確定在計算α系數(shù)時所用的拆分方法是否掩飾了任何不一致的項目。3、建立可靠的測量標(biāo)準(zhǔn)可靠的測量標(biāo)準(zhǔn)是指持有相同看法或感受

的受訪者在接受對同一研究變量的測量時,會產(chǎn)生相同或相近的答案。

而不可靠測量標(biāo)準(zhǔn)的產(chǎn)生原因一般為:如問題的提示語或解說詞不夠明確;調(diào)查

人員對不同受訪者所做的問題陳述方式不

一;受訪者對問題中的某些措辭有不同的

理解等。一般而言,在時間允許的情況下,調(diào)研人員有必要在展開市場調(diào)查時進(jìn)行可靠度評估,盡量選用可靠的測量標(biāo)準(zhǔn)。384、可靠度評估的步驟首先,形成一個合格的測量標(biāo)準(zhǔn)。我們應(yīng)在正式調(diào)查前,用心進(jìn)行前期測試,改進(jìn)或剔除那些含有不可靠測量標(biāo)準(zhǔn)的問題。其次,量表中項目及所設(shè)答案的添減或變化都是造成不可靠測量標(biāo)準(zhǔn)的原因。在調(diào)查進(jìn)行中,當(dāng)我們對測量標(biāo)準(zhǔn)產(chǎn)生疑問時,可以考慮“濃縮”量表,增加可信度。再次,在確保有一個比較準(zhǔn)確的測量標(biāo)準(zhǔn)前提下,我們可以使用復(fù)測信度、復(fù)本信度或折半信度來直接檢測受訪者的可信性,將那些不可靠的測量結(jié)果排除于最終的匯總、分析之外。但在將這些受訪者的答案排列之前,必須肯定你的度量標(biāo)準(zhǔn)對大多數(shù)受訪者來說是可信的。最后,通過計算α系數(shù)來表征可信度。通常,第一次測量的可靠度達(dá)到0.65或0.70就被認(rèn)為是可以接受的。返回39二、衡量的效度效度(Validity)是就測量的準(zhǔn)確性和真實(shí)性而言的,是指測量工具能夠準(zhǔn)確地測量調(diào)查對象特性的程度。調(diào)查測量結(jié)果的有效性衡量工具本身的效度表面效度準(zhǔn)則效度內(nèi)在效度內(nèi)容效度效標(biāo)關(guān)系效度建構(gòu)效度系統(tǒng)誤差和其他變量測量工具樣本的代表性內(nèi)在效度和外在效度40影響效度的因素評估方法(1)內(nèi)容效度內(nèi)容效度(content

validity)的建立是要確保量表中,包含了能夠衡量該概念的適當(dāng)且具代表性的題項。量表內(nèi)的項目愈能代表該概念的主要領(lǐng)域或共通性,則其內(nèi)容效度愈好。簡單來說,內(nèi)容效度也代表了將概念拆解成構(gòu)面與要素的過程是否完善的指標(biāo)。一般來說,量表的內(nèi)容效度通常會透過評審小組的認(rèn)可。

Kidder與Judd(1686)曾舉例說明,某個用來衡量“語言障礙”的量表是否具有內(nèi)容效度,可交由一群專家來評估(如專業(yè)的語言治療師)。表面效度(face

validity)一般被視為內(nèi)容效度的基本且最低的要求。表面效度系指當(dāng)某些題項被設(shè)計來衡量某個概念時,至少要看起來像在衡量此概念。但有些研究者并不認(rèn)為表面效度可當(dāng)作內(nèi)容效度有意義的構(gòu)成要素。返回41(2)效標(biāo)關(guān)系效度42效標(biāo)關(guān)系效度(criterion-relatedvalidity)系指建立另一個個體的期望效標(biāo),當(dāng)作衡量是否有效的標(biāo)準(zhǔn)。效標(biāo)關(guān)系度一般可用同時效度(concurrent

validity)或預(yù)測效度(predictive

validity)來代表。同時效度適用于量表可區(qū)別出某些已知有差異的個體時;亦即這些個體在此量表上的得分應(yīng)該是有差異的,如以下范例之說明。范例假設(shè)一個關(guān)于工作倫理的量表已被發(fā)展出來,并交由一群領(lǐng)取社會救

濟(jì)的人來填答,基本上,此量表應(yīng)能區(qū)別出,一群樂于接受工作且由

機(jī)會不依靠社會救濟(jì)的人,以及另一群即時提供工作也不想工作的人。因此,這二群人在該量表上應(yīng)由不同的得分。很明顯地,這些具有高

度工作倫理價值觀的人,不想依靠社會救濟(jì)且渴望靠自己獲取被雇傭

的機(jī)會。另一方面,那些工作倫理價值觀較低的人,將盡可能地爭取

繼續(xù)使用社會救濟(jì)地機(jī)會,且視工作為作苦工。故如果此二種類型地

人在工作倫理量表上地得分相同,則該份測驗就不是衡量到工作倫理,而是其他概念的衡量。預(yù)測效度系指測量工具能在某個未來的效標(biāo)上,區(qū)分出個別差異的能

力。例如,在招募員工時,同時也讓新近員工填寫性格或能力測驗,

并將此成績與其未來的工作績效做比較。基本上,性格測驗得分較低

的人應(yīng)該會由較差的工作績效表現(xiàn);反之,則由較好的工作績效表現(xiàn)。由此即可得知,此測驗具有較高的預(yù)測效度。返回43(3)建構(gòu)效度44建構(gòu)效度(construct

validity)是用來證明,從量表所獲得的結(jié)果與設(shè)計該量表時所依據(jù)的理論之間的契合程度。一般來說,建構(gòu)效度可透過聚合效度(convergent

validity)與區(qū)別效度(discriminant

validity)來評估,其意義如下。聚合效度系指,當(dāng)采用二種不同的衡量工具來衡量同一個概念時,所獲得的分?jǐn)?shù)之間是有高度相關(guān)的。而區(qū)別效度系指,如果根據(jù)理論的預(yù)測,二個變項之間時不相關(guān)的,則兩個變項的實(shí)際衡量分?jǐn)?shù)之間,應(yīng)該也時不相關(guān)的。其實(shí),效度可以透過許多不同的方式來建立。在實(shí)務(wù)上,那些用來衡量概念且已經(jīng)發(fā)表的各種衡量工具,通常會對衡量工具所建立的各式效度指標(biāo)加以描述,如此可讓使用者或讀者判斷該量表的適合度。下表8-2概要說明了本章討論過的各種效度。表8-2效度的類型效度敘述內(nèi)容效度該份量表有適切地衡量到想要衡量的概念嗎?表面效度有沒有專家認(rèn)證,該份量表確實(shí)能衡量到我們想要衡量的?效標(biāo)關(guān)系效 該份量表是否具有預(yù)測某一效標(biāo)變項的能力?度同時效度該份量表是否具有預(yù)測某一現(xiàn)存效標(biāo)變項的能力?預(yù)測效度該份量表是否具有預(yù)測某一未來效標(biāo)變項的能力?構(gòu)念效度該衡量工具能夠衡量到如理論所提的概念?聚合效度二種衡量工具衡量同一個概念時,其結(jié)果是否具有高度相關(guān)?區(qū)辨效度該份量表跟理論上無關(guān)的變項之間有低度相關(guān)?45效度的建立方式相關(guān)分析,可應(yīng)用于同時效度、預(yù)測效度,或是聚

合效度、區(qū)別效度上因素分析,多變量分析的技

巧,用來確認(rèn)概念的構(gòu)面,以及標(biāo)示出每個題項所適

合歸屬的構(gòu)面向度(建立構(gòu)念效度)使用不同的衡量

工具與形式來建立多元特質(zhì)、多元方法的相關(guān)矩陣,如此將可額外提高衡量的完備性46總而言之,衡量的合適度將可透過不同形式的效度與信度

來確立。任何研究要獲得好的結(jié)果,都必須要求確實(shí)有衡

量到理論架構(gòu)種的概念。我們需要使用具有高度效度與高

度信度的衡量工具,以確保我們的研究是符合科學(xué)標(biāo)準(zhǔn)的。幸運(yùn)的是,在組織的研究中,一直有研究者在努力研發(fā)許

多重要概念的衡量工具,而且這些研發(fā)者同時也建立了這

些工具在心理計量上的特性(psychometric

properties;

例如信度與效度)。因此,研究者通??梢岳眉扔械?,

且有良好聲譽(yù)的量表工具來衡量,這會比自己辛苦開發(fā)出

來的量表來得合適。然而,在使用這些量表時,研究者應(yīng)

清楚地注解其引用的資料來源(如作者及參考文獻(xiàn)),讓有需要的讀者可以尋找更多資訊。47本章小結(jié)48社會科學(xué)的許多概念具有復(fù)雜的、各式各樣的含義。為求涵蓋周全,研究者通常要針對具體概念進(jìn)行多重觀察,但是并不是所有的變量都可以這么直截了當(dāng)測量。因此,研究者需要借助一定的測量工具來實(shí)現(xiàn)準(zhǔn)確地測量變量,了解變量的涵義和結(jié)構(gòu)。本章所討論的是研究者變量測量中最常用的工具——量表。本章討論了量表的類型,如何及何時,使用不同方式的評點(diǎn)量表與等級量表。其次,討論了量表的制定,介紹了四種最常用的方法:主觀決斷法、項目分析法、因素法。在研究測量中,精確性和準(zhǔn)確性都十分重要,而且是必備的。社會科學(xué)研究者建構(gòu)和評估測量時,采用兩項技術(shù)性指標(biāo)——信度和效度——來衡量測量的可信程度。本章詳細(xì)分析了不同類型的信度和效度的涵義和檢驗。本章關(guān)鍵術(shù)語49評點(diǎn)量表(rating

scales)等級量表(ranking

scales)李克特量表(likert

scale)復(fù)測信度(test-retest

reliability)復(fù)本信度(equivalent-form

reliability)折半信度(split-half

reliability)內(nèi)容效度(content

validity)效標(biāo)關(guān)系效度(criterion-related

validity)建構(gòu)效度(construct

validity)聚合效度(convergent

validity)區(qū)別效度(discriminated

validity)一、復(fù)習(xí)思考題501.請簡短敘述態(tài)度評點(diǎn)量表與等級量表的不同,并指出二者在何時適合使用。2.為何建立衡量的適合度是很重要的?應(yīng)如何建立呢?3.請建立一個語意差別量表,來評估某一特定品牌的咖啡或茶的屬性。4.文中建議,「盡可能使用已經(jīng)發(fā)展好,且在已發(fā)表研究中被重復(fù)使用的衡量工具,而盡量不要為自己的研究去開發(fā)量表?!鼓鈫幔繛槭裁??5.一個有效度的衡量工具一定是有信度的,但一個有信度的衡量工具不一定是有效度的。試評論之。二、牛刀小試大家有想念牛老師的復(fù)習(xí)時間嗎?老牛有問題要問各位同學(xué)啦!看完各種研究類型,那就要請大家實(shí)際應(yīng)用一下啰!問題:你曾被要求對一家石油開發(fā)公司的一群經(jīng)理陳述開展一項研究工作地目的。你簡要介紹了打算使用的方法以及對問卷進(jìn)行預(yù)先測試的方法。隨后提問時,以為經(jīng)理懷疑預(yù)測是否次要,他認(rèn)為因為時間急迫,無

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論