不同等級數(shù)利克特量表的適用性研究報告_第1頁
不同等級數(shù)利克特量表的適用性研究報告_第2頁
不同等級數(shù)利克特量表的適用性研究報告_第3頁
不同等級數(shù)利克特量表的適用性研究報告_第4頁
不同等級數(shù)利克特量表的適用性研究報告_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、-. z.不同等級數(shù)利克特量表的適用性研究來自網(wǎng)絡, 佚名1. 引言量表是市場調(diào)查等領域常用的工具,常用的三種量表分別是瑟斯頓量表Thurston scale,利克特量表Likert scale和格特曼量表Guttman scale。相對于瑟斯頓量表的嚴格編制要求和格特曼量表在實際中難以滿足的條件,利克特量表易于編制而有同樣滿意的信度Kapes, Mastie & Whitfield, 1994。利克特量表以一系列述開場,每一個述表達一種或明確贊成或明確不贊成的態(tài)度,工程根據(jù)測驗過程中施測對象的答復而進展選擇,被試要求對每一個述進展等級答復。由于利克特量表容易設計、構(gòu)造簡單且易于操作,可以用來

2、測量其他一些量表所不能夠測量的*些多維度的復雜概念或態(tài)度。因此使得利克特量表成為應用最為廣泛的一種量表形式,在市場研究中也得到大量應用。如測量消費者對產(chǎn)品或效勞的重視程度與滿意程度;對測量個人生活狀態(tài)、消費心理;測量消費者對品牌、廣告等的心理感覺等。常見的利克特量表包括4點式、5點式、6點式和7點式,有時候也可以見到10點式。在量表實際的編制過程中,等級數(shù)確實定往往帶有較大的隨意性,對各種量表優(yōu)劣勢的認識也更多地停留在感性經(jīng)歷的根底之上。如果對上述的五種等級利克特量表進展劃分,按照其相似程度大體可以分為三種,即最為常見的5點和7點可以作為奇數(shù)等級的代表,4點和6點可作為偶數(shù)等級的代表,而10點

3、在*種程度上與前兩類都不一樣,可以作為多等級的代表。在定性思考的根底之上,研究者普遍認為這三類量表各自具有以下優(yōu)劣勢。作為奇數(shù)等級代表的5點和7點量表的應用最為廣泛,因而是被訪者較為熟悉的形式,在實際實施時不需進展過多的解釋即可進展,但其缺點也是比擬明顯的。由于中國傳統(tǒng)文化倡導中庸思想,被訪者在填答時可能會出現(xiàn)趨中反響,即傾向于選擇一般等中間選項,這一方面沒有真實反映被訪者的傾向性,另一方面可能還包含著不確定/不一定等意義,而這也是研究者不希望看到的結(jié)果。正是為了克制這種趨中反響,強迫被訪者在答復時產(chǎn)生一定的傾向性,局部研究者開場嘗試使用偶數(shù)等級的4點和6點量表,由于國外在評分時習慣采用四分制

4、差,一般,好,優(yōu)秀,因而使用4點恰好可以符合其文化,但由于其等級數(shù)較少,在反響態(tài)度傾向時并不細致,因而并不是特別適合在我國使用。6點量表在正向和負向態(tài)度上各分了三個等級,既防止了趨中反響,在態(tài)度的區(qū)分方面也較為細致,因而受到了局部研究者的青睞和偏愛,但其缺陷時被訪者對這類量表的接觸較少,在實施時需要更多的解釋。多等級的10點量表也較為常見,由于我國學校教育在評分時習慣采用百分制,因而當采用十分制時被訪者能夠較為容易地給出一個得分,但其缺點在于受到了我國的評分體制將60分列為及格線,被訪者較少給出5分及以下的評價,這就使得整體得分偏高,因而不能客觀地反響其態(tài)度。作為利克特量表的不同形式,以上各種

5、量表都具有便于編制和操作的優(yōu)點,但也都具有一定的缺陷,主要表現(xiàn)在被訪者較少進展極端的評價,進而在一定程度上降低了各種量表的效用。上述判斷大多是基于研究者的經(jīng)歷而總結(jié)出的,缺少在數(shù)據(jù)方面的支持。為此,也有局部來自不同領域的研究者采用定量的分析方法來探討利克特量表的理想等級數(shù)。在心理計量學領域,以量表部一致性為例,Symonds1924的研究說明當?shù)燃墧?shù)為7至9時,計算的結(jié)果最好。7點量表也同樣得到了Cicchetti1995, Nunnally1967, Finn1972等研究結(jié)果的支持;而Bending1953比擬了3/5/7/9/11點量表后則認為,應該使用9點量表。然而另外一些研究者則認為

6、部一致性與量表等級數(shù)無關Peabody, 1962; Boote, 1981; Widing & Coulter,1991; etc.。Christian Jensen & John Tndering2005則在語言學領域比擬了2點、4點和30點量表的結(jié)果,發(fā)現(xiàn)4點量表可以得到最好的結(jié)果,同時還發(fā)現(xiàn)量表等級數(shù)越多,被訪者在判斷時所花費的時間就越長,這一結(jié)果在前一領域也得到了證明Matell & Jacoby, 1972。因此,等級數(shù)確實定不光要考慮到其實際效果的問題,同時還需要與訪問效率進展權衡。以上的量表研究幾乎都是基于紙筆測驗或者計算機測驗的結(jié)果,此時消費者能夠?qū)π枰x擇的尺度同時有一個全

7、面的理解。在市場研究中,調(diào)查作為一種常用的訪問方式,被訪者僅能夠逐一聽到選項,而無法象紙筆測驗或者計算機測驗一樣看到選項,從而使被訪者無法形成對選擇所需要量表選項的全面的評估和全面的理解。此種不能夠看到選擇的訪問方式可能會產(chǎn)生如下兩個方面的影響,首先過于復雜的量表選項等級將影響選項的讀出與理解,嚴重影響訪問效率;其次被訪者會根據(jù)語言習慣來答復,而無法完全按照問卷設計的尺度進展評估。所以在進展訪問時,不同等級的克特量表可能與紙筆或者其他面訪有不同的影響。而目前心理學界和市場研究屆缺少這方面的研究成果。2. 問題提出與研究目的前人研究已為量表等級數(shù)的探討打下了很好的根底,但還存在以下幾個方面的問題

8、:首先,囿于研究方法以及所比擬的量表等級數(shù)不同,研究結(jié)果并沒有取得完全的一致;其次,以往研究大多是國外研究者的結(jié)晶,由于各國文化的不同,其結(jié)論能否直接套用到我國還值得商榷。第三,缺乏對不能夠看到選項的訪問時所用量表等級數(shù)的研究結(jié)果;最后,目前對不同等級優(yōu)劣勢的探討還停留在理論層面,沒有系統(tǒng)性的研究結(jié)論對市場研究領域以操作指導。為了解決上述問題,本研究以*產(chǎn)品手機滿意度研究為例,選擇在我國比擬常用的5點、6點、7點和10點量表進展測量。也同時考慮兩種不同的訪問方式:在線調(diào)查能夠看到選項與CATI計算機輔助訪問不能夠看到選項。為了比擬四種量表的測量結(jié)果,本研究擬從以下幾個方面來對此進展判斷,試圖探

9、討不同量表等級數(shù)對于研究結(jié)果的影響,分析不同等級量表的優(yōu)劣勢以及在不同訪問方式中的適用程度,并為量表的改良方向提供建議。1四種量表在測量消費者對產(chǎn)品滿意度上的一致性程度;2量表的信度、效度水平;3量表的鑒別度,量表顯著性區(qū)分不同屬性或產(chǎn)品滿意度的能力。4量表的選項分布特征。3. 研究方法3.1 調(diào)查量表及測量設計本研究以手機滿意度為研究容,比擬了四個量表的評價效果,整體問卷由三局部組成:表1問卷的構(gòu)造分布在第二局部的滿意度評價中,量表共分四個版本,分別為:五點量表,六點量表,七點量表,十點量表。除計分方式不同之外,四個版本間的題目完全一致。為了與常見的量表表現(xiàn)形式相匹配,將五點量表、六點量表和

10、七點量表以選擇題形式出現(xiàn),并有文字對應;十點量表以打分的形式出現(xiàn),無文字對應。具體形式如下:五點量表:1.非常不滿意2.比擬不滿意3.一般4.比擬滿意5.非常滿意六點量表:1.非常不滿意2.不滿意3.有些不滿意4.有些滿意5.滿意6.非常滿意七點量表:1.非常不滿意2.不滿意3.有些不滿意4.一般5.有些滿意6.滿意7.非常滿意十點量表:請用1到 10的任何一個數(shù)字來表達您的意見,10分為總分值,表示非常滿意。本研究采用單因素的被訪者間的隨機區(qū)組設計,調(diào)查過程中在四個版本的量表中隨機選擇*一被訪者所答復的量表形式,計算機輔助的隨機樣本分配較好地保證了四組間樣本的同質(zhì)性以及不同組別間被訪者數(shù)量的

11、一致性。3.2 調(diào)查方法與樣本調(diào)查數(shù)據(jù)在2006年1月1-20日收集。Online調(diào)查通過在線PanelQTICK. 題客調(diào)查網(wǎng)發(fā)布問卷獲得,數(shù)據(jù)通過標準篩選程序去掉答題明顯邏輯錯誤以及與Panel信息不符合的數(shù)據(jù),CATI調(diào)查通過訪問中心對全國18-55歲居民進展隨機訪問獲得。CATI和Online調(diào)查圍均覆蓋了一級、二級和三級城市。兩個調(diào)查的對象是擁有并正在使用手機的消費者,有效問卷共計2193份,其中Online調(diào)查共得到808份有效樣本,CATI共得到1385份有效樣本。所有樣本被隨機分為四組,各組樣本的根本背景資料見表2。表2樣本背景比擬通過對年齡和個人平均月收入進展方差檢驗發(fā)現(xiàn),四

12、組樣本無明顯差異,因而可以作為同質(zhì)樣本組,在量表的答復上可以相互比擬。Online和CATI相比,前者被訪者的年齡偏低,收入偏高,這可能是由于訪問的方式所決定的,但這種差異目前還不是本研究的重點。4. 結(jié)果分析與討論4.1四種量表測量各因素滿意度排序無顯著差異以各產(chǎn)品因素的滿意度進展比擬為例,來研究四種量表的測量結(jié)果,如下為CATI訪問結(jié)果。表3 各屬性的平均滿意度及排序CATI由于四組樣本的同質(zhì)性,不同樣本組的結(jié)果具有一定的可比性。表2展現(xiàn)了不同量表所得到的結(jié)果及其排序結(jié)果,因為利克特量表等級的不同,各產(chǎn)品因素的滿意度得分差異較大,等級數(shù)越高,平均滿意度得分越高,而且標準差越大。為方便比擬,

13、將結(jié)果根據(jù)各因素滿意度評分的平均值與標準差進展標準化,如圖1所示。各因素滿意度的評分在具體的排名上存在著差異,但是品牌、通話質(zhì)量、操作容易程度在任何一種量表中都是滿意度最高的三個。利用利用肯德爾和諧系數(shù)Kendall coefficient of concordance,又稱肯德爾W系數(shù)對排序結(jié)果的一致性進展了檢驗。W值為15.5= ,差異并不顯著。圖 1 標準化各因素滿意度CATI對在線數(shù)據(jù)進展分析,也有同樣的結(jié)果,各因素滿意度得分因為量表等級不同而差異較大,但是各因素滿意度得分的排序無顯著差異。即說明,雖然利克特量表的等級不同,但是它們測量到的消費者對產(chǎn)品的滿意度也保持相對的一致。4.2

14、量表的信度、效度分析信度表示一個量表對于所衡量測量特質(zhì)特征的穩(wěn)定性和可信度程度,是衡量量表質(zhì)量的重要指標之一。由表4可以看出,無論是CATI 還是在線調(diào)查,十點量表的部一致性信度均優(yōu)于其他量表,其次是五點量表,再次是七點量表,而六點量表的信度水平最低。表4 不同量表的部一致性系數(shù)比擬除量表的信度之外,效度是衡量量表質(zhì)量的另一個重要指標。通過比擬了其與推薦率以及再購置可能性這兩個題目之間的相關情況,得到績效關聯(lián)效度詳見表5。結(jié)果說明,在CATI訪問中,六點量表的績效關聯(lián)效度較低;在在線調(diào)查中,不同等級量表的績效關聯(lián)效度相差不大。表5 總體滿意程度的績效關聯(lián)效度4.2量表鑒別度比擬在市場研究中,一

15、直以來的一個重要目標就是盡量以較少的樣本量來獲得足夠可靠有效的數(shù)據(jù)。量表的鑒別度為在一定樣本量下使所調(diào)查的有差異的數(shù)據(jù)獲得檢驗上顯著性的能力。一個高鑒別度的方法應該是使用較少樣本就能夠獲得所需要的顯著性結(jié)果。而顯著性檢驗與所比擬數(shù)值的差值以及所比擬數(shù)值分布的標準差有關。假設需要對a因素與b因素的滿意度得分進展顯著性檢驗,在兩因素方差S2一致的情況下,可以進展Z檢驗:在同樣的顯著性程度下。在本研究中,因為四種量表所測量的各因素的滿意度值的差異較大,但排序根本一致,根據(jù)各因素滿意度平均分的分布轉(zhuǎn)化后標準得分根本一致。所以兩個一樣的因素,在不同的量表測量中應該有相似的標準化得分。k 為*一固定值,為

16、屬性滿意度平均分的標準差。為簡便起見,量表得分的標準差用所有因素的標準差的平均分代替。因此。所以,兩個因素比擬要獲得同樣的顯著性,不同量表的樣本量應該與的平方成正比。記為量表鑒別系數(shù)指標,量表鑒別系數(shù)越大,所需要的樣本量越大。如表6所示,要獲得同樣的鑒別力,在CATI訪問中,等級越多的量表所需要的樣本量越少。十點量表所需要的樣本量僅為五點量表的54%,七點量表所需樣本量為五點量表的74.5%,能夠節(jié)約大量的訪問本錢。而在在線調(diào)查中,六點量表、七點量表與十點量表均能夠節(jié)約17.5%-28.5%的樣本量。表6CATI和在線調(diào)查的不同等級量表的鑒別力比擬4.4 各量表選項分布特征分析將所有9種屬性的

17、滿意度分布平均起來,并且轉(zhuǎn)化為0-1的空間上標準化,如下列圖所示。無論是CATI還是在線調(diào)查,四種量表的分布都呈現(xiàn)右偏分布,即總體來看,選擇高分的被訪者比擬多。量表等級分布的偏態(tài)不利于數(shù)據(jù)的統(tǒng)計與分析,因為許多一元或多元統(tǒng)計方法的前提就是樣本的正態(tài)分布,如t檢驗、相關分析、回歸等。過高的峰度則表示數(shù)據(jù)過度集中,將影響根據(jù)被訪者反響進展細分的可能性,并且可能導致數(shù)據(jù)有效性不夠高。相對于峰度而言,偏度是對統(tǒng)計結(jié)果影響較大的因素。表7 量表等級偏度峰度系數(shù)CATI表8 等級偏度峰度系數(shù)在線調(diào)查在兩種訪問方式中,五點量表的偏度較小,峰度也較小,并沒有出現(xiàn)所謂的中庸,過度偏向中間選項的狀態(tài),反而是比擬集

18、中于比擬滿意這一選項,這也可能與滿意度研究本身的特征有關。僅僅從正態(tài)性來說是五點量表是在CATI以及在線調(diào)查中都比擬適宜的量表。六點量表在CATI訪問中偏度最大,在在線調(diào)查中,偏度也較大,僅次于十點量表。從正態(tài)性角度出發(fā),六點是不太適用的量表。七點量表的偏度較小,而且峰度也較小,尤其是在可以看到選項的在線調(diào)查中正態(tài)性非常好。但是七點量表非常不符合中國人的理解習慣,在CATI訪問中,從分布圖可以看出,七點量表出現(xiàn)了明顯的雙峰狀態(tài),在4和7的位置上僅有很少的頻數(shù),這可能是因為在無法看到選項時,人們難以用4位和7位的量級來答復下列問題。而在能夠看到選項的在線調(diào)查中,被訪者能夠根據(jù)量表等級作出比擬合理

19、的反響。十點量表的偏度很高,這可能是由于只有很少一局部被訪者選擇1-4而造成的。在CATI和在線訪問中,選擇1-4的比例不超過5%。4.5 十點量表的修正能夠有效提高數(shù)據(jù)分析由前面的分析可以看出,無論是在信度方面,還是效度方面,十點量表均具有比擬穩(wěn)定的優(yōu)越性,但在分布方面卻存在較大的偏態(tài)性,為此需要對其進展修正。應用Option-Keyed方法,將不符合正態(tài)分布的局部進展一些重新賦值。具體而言,十點量表在1-4分段偏態(tài)嚴重,根據(jù)模糊數(shù)學原理,把14分定義為模糊的不滿意分數(shù),全部賦值為4分,因此形成一個4-10分的新量表。修正后的量表結(jié)果見表9。表9 10點量表的修正結(jié)果比擬由上表可以看出,經(jīng)過

20、Option-Keyed修正后的十點量表的正態(tài)性有了大幅的提高,已經(jīng)接近5點量表的水平。與此同時,量表的均值、信度、效度、鑒別力都沒有大的變化。通過修正前與修正后的比照,9因素的滿意度的評分均值的絕對值改變?nèi)狈?%,相關系數(shù)到達99.8%以上。所以Option-keyed 修訂十點量表將在不改變結(jié)果的情況下,大大改善量表的正態(tài)性,有助于進展進一步的統(tǒng)計分析。5結(jié)論根據(jù)以上研究結(jié)果,可以得出以下結(jié)論:不同利克特量表的應用雖然不會給直接的統(tǒng)計結(jié)果帶來明顯差異,但是量表等級越多,鑒別力就越高,同樣樣本下可以得到更準確的結(jié)果或者反過來可以節(jié)約樣本量。一般來說,在能夠看到選項的訪問中,如在線調(diào)查或者紙筆

21、調(diào)查,適用10點量表或7點量表;在不能夠看到選項的訪問中,主要指CATI,適用10點量表或者5點量表。對10點量表采用Opion-keyed修正,將1-4點統(tǒng)一賦分為4將大大提高量表的正態(tài)性從而有助于其他統(tǒng)計分析。本次研究以滿意度研究為具體研究問題,研究結(jié)果在推論到其他問題類型時可能會稍有不同,需要研究者在考慮實際情況的根底上,合理的選擇利克特量表的等級數(shù)。參考文獻1.厚粲徐建平. 2003現(xiàn)代心理與教育統(tǒng)計學師大學2.日昌1999心理測量學. 人民教育3.程金剛. 1998評定量表中的評定等級數(shù)與測驗的因素構(gòu)造及信度的關系.碩士學位論文4.Christian Jensen, John Tnd

22、ering. 2005 Perceived prominence and scale types,Proceedings, FONETIK.5.Bending,A.W. 1954 Reliability and the number of rating scale categories. The Journal of Applied Psychology. 381, 38-40.6.Cicchetti,D.V, Showalter,D. & Tyrer, P.J. 1985 The effect of number of rating scale categories in levels of

23、 interater raliability. Applied Psychological Measurement. 9, 31-36.7.Matell, M.S. & Jacoby, J. 1972 Is there an optimal number of alternatives for Likert-scale iterms? Journal of Applied Psychology. 566, 506-509.8.Symonds, P.M. 1924 On the loss of reliability in ratings due to coarseness of the sca

24、le. Journal of E*perimental Psychology. 7, 456461.9.Nunnally, J. 1967 Psychometric theoryNew York: McGraw-Hill10.Finn, R.H. 1972Effects of Some Variations in Rating Scale Characteristics on the Means and Reliabilities of Ratings. Journal of Educational and Psychological Measurement, 32, 255-265.11.Peabody, D. 1962 Two ponents i

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論