




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第四編市場調(diào)查中的數(shù)據(jù)分析本編重點(diǎn)變量類型頻數(shù)(百分比)眾數(shù)、中位數(shù)均值、標(biāo)準(zhǔn)差卡方分析單因素方差分析簡單相關(guān)系數(shù)因子分析調(diào)查報(bào)告的結(jié)構(gòu)第十五章市場調(diào)查數(shù)據(jù)的錄入與整理第一節(jié)調(diào)查問卷的回收與編輯數(shù)據(jù)資料的處理過程是從回收第一份問卷開始的。按照事先調(diào)查方案的計(jì)劃,盡量確保每份問卷都是有效問卷(所謂“有效”問卷,指的是在調(diào)查過程中按照正確的方式執(zhí)行完成的問卷)。問卷回收以后,督導(dǎo)員必須按照調(diào)查的要求,仔細(xì)的檢查問卷。檢查問卷的目的在于將有錯(cuò)誤填寫,或者是挑出不完整或不規(guī)范的問卷,保證數(shù)據(jù)的準(zhǔn)確性。所謂錯(cuò)誤填寫即出現(xiàn)了那些不合邏輯或根本不可能的結(jié)果,通過對(duì)調(diào)查員的復(fù)核,可以檢查出哪些調(diào)查員沒有按照調(diào)
2、查的要求去訪問,那么,該調(diào)查員完成的問卷可能存在很多問題。還有可能出現(xiàn)漏答了某些必須回答的問題,比如被訪者的人口特征等基本情況,造成問卷回答不完整。鑒于這些情況,不管是由于調(diào)查員造成的還是被訪者的原因,通常有兩種方式進(jìn)行補(bǔ)救:對(duì)于出現(xiàn)漏答的問卷,通常要求調(diào)查員對(duì)受訪者進(jìn)行重訪,以補(bǔ)充未答的問題;如果不便于重訪或重訪后的問卷還有問題,數(shù)目不是很多,可以當(dāng)作缺失值計(jì)。如果數(shù)量非常大,這份問卷就只能當(dāng)作廢卷處理,并且按照被訪對(duì)象的抽樣條件,補(bǔ)作相關(guān)的樣本。問卷檢查問卷的檢查一般是指對(duì)回收問卷的完整性和訪問質(zhì)量的檢查,目的是要確定哪些問卷可以接受,哪些問卷要作廢。檢查的要點(diǎn)包括:(1)規(guī)定詳細(xì)的檢查規(guī)
3、則,一份問卷哪些問題是必須填寫完整的,哪些問題出現(xiàn)缺失時(shí)可以容忍等,使督導(dǎo)員明確檢查問卷的每一項(xiàng)流程。(2)對(duì)于每份調(diào)查員交回來的問卷必須徹底地檢查,以確認(rèn)調(diào)查員或者被訪者是否按照相關(guān)的要求完成了訪問,并且完整的記錄在問卷恰當(dāng)?shù)奈恢?。?)應(yīng)該將問卷分成三種類型,一種是完成的問卷,一種是作廢的問卷,第三種是有問題的問卷,但是通過追訪還可以利用的問卷。(4)如果抽樣中有配額的要求,那么應(yīng)將完成的問卷中的配額指標(biāo)進(jìn)行統(tǒng)計(jì)分析,確定問卷是否完成配額的要求,以便及時(shí)的補(bǔ)充不足的樣本。(5)通常有下面的情況的問卷是不能接受的:所回收的問卷明顯不完整,缺了一頁或者多頁;問卷中有很多內(nèi)容沒有填答;問卷的模式
4、說明調(diào)查員(被訪者)沒有理解或者遵循訪問指南回答等;問卷的答案幾乎沒有什么變化,如在態(tài)度的選項(xiàng)上全部選擇第X項(xiàng)的情況;問卷的被訪者不符合抽樣要求;問卷的回收日期超過了的訪問的時(shí)限等。問卷的校訂為了加強(qiáng)問卷的準(zhǔn)確性,對(duì)那些初步接受的問卷還要進(jìn)行進(jìn)一步的檢查和校訂,在校訂的過程中,通常會(huì)發(fā)現(xiàn)問卷中存在有字跡模糊、問題漏選的、前后回答不一致的、答案模棱兩可的和跳答錯(cuò)誤的問題。問卷的某些問題答案可能出現(xiàn)字跡模糊的情況,特別是碰上無結(jié)構(gòu)的開放式的問題時(shí),因?yàn)檎{(diào)查員記錄的不好,答案不容易識(shí)別。如果發(fā)現(xiàn)這樣的問題,必須對(duì)受訪者進(jìn)行追訪,將積極不清楚的地方填寫清楚。對(duì)于漏選的問題處理方法也是一樣,出現(xiàn)漏選的題
5、目因?yàn)楦鞣N原因,無法進(jìn)行補(bǔ)充訪問事后,普通的問題,而且數(shù)目不大的情況,通常作為缺失值處理;如果涉及到是受訪對(duì)象的個(gè)人特征的問題,通常只能作為廢卷處理。問卷中有些問題的答案會(huì)出現(xiàn)不容易理解的模棱兩可的情況,或者是使用了不是通用的縮寫方式或詞語,或者在該單選一項(xiàng)的問題中,圈選了兩項(xiàng)等,都必須通過追訪進(jìn)行補(bǔ)救。另外就是回答時(shí)可能出現(xiàn)跳答錯(cuò)誤的情況,這可能是因?yàn)楸辉L對(duì)象沒有很好的理解問題。如果出現(xiàn)這種情況,首先要核實(shí)被訪對(duì)象是否符合抽樣調(diào)查的條件(跳答題目往往是篩選條件),如果符合,進(jìn)行追問補(bǔ)充,如果不符合條件,問卷只能作廢,重新補(bǔ)充樣本。問卷的回收、檢查與校訂可能是非常繁瑣、且工作時(shí)間很長的工作,但
6、是卻是保證數(shù)據(jù)處理過程中較少誤差的重要的步驟。問卷的編碼編碼是指對(duì)一個(gè)問題的不同答案進(jìn)行分組和確定數(shù)字代碼的過程。大多數(shù)問卷的大多數(shù)問題都是封閉式的,在調(diào)查之前就已經(jīng)完成了編碼的過程,即每一組問題的不同答案的數(shù)字編碼已經(jīng)確定。而開放式問題,因?yàn)椴恢罆?huì)得到什么答案,或者是希望得到比列出的封閉式的選項(xiàng)更詳盡的答案,所以在調(diào)查結(jié)束后,必須對(duì)這些開放式的問題進(jìn)行事后編碼。開放題的事后編碼的工作量很大,無法預(yù)知會(huì)出現(xiàn)多少個(gè)新的代碼和答案,而且有些答案是非常類似的,必須決定是否合并成一類呢,還是分成不同的代碼。具體地說明編碼需要以下幾個(gè)步驟:(1)每個(gè)需要編碼的項(xiàng)目都必須有一份編碼表,將問題和項(xiàng)目的代碼
7、詳細(xì)的標(biāo)注在編碼表的頂端位置,由于事先不知道會(huì)有多少新的代碼或答案出現(xiàn),所以一定要預(yù)備足夠的空間。(2)如果編碼的工作由一個(gè)編碼員完成,出現(xiàn)錯(cuò)誤的可能性相對(duì)較小。但實(shí)際上,因?yàn)樾枰幋a的問題可能很多,一個(gè)認(rèn)識(shí)沒有辦法按時(shí)完成的,這就需要多個(gè)編碼員。在這樣的情況下,一定要注意多個(gè)編碼員工作的協(xié)調(diào)。應(yīng)該安排編碼員在不同的時(shí)間,或者相同的時(shí)間相同的地點(diǎn),使用同一個(gè)編碼表。這樣可以避免編碼重復(fù)的情況。(3)研究人員應(yīng)詳細(xì)制定編碼的守則,指導(dǎo)編碼員如何識(shí)別答案,并且將其歸類,以及如何分配編碼等等,并同時(shí)對(duì)編碼的過程進(jìn)行監(jiān)督和檢查。編碼員在編碼的過程中可能有兩種傾向:一種是事無巨細(xì)將出現(xiàn)的每一種答案夠給與
8、新的代碼,結(jié)果代碼的數(shù)量比預(yù)料的要多出很多;另一種情況是對(duì)答案的歸類過于粗糙,可能丟棄了數(shù)據(jù)中有意義的差異。對(duì)于這兩種情況都必須通過守則的規(guī)定,盡量避免。碰到無法確認(rèn)的分類的時(shí)候,通常的做法是付與一個(gè)新的代碼,如果需要合并,可以在將來的數(shù)據(jù)處理過程中完成。(4)可以對(duì)“不知道”、“無所謂”、“不清楚”、“缺失”事先規(guī)定,但是一定要注意規(guī)定的編碼與實(shí)現(xiàn)對(duì)該問題的最大編碼的預(yù)計(jì)的數(shù)量一致。(5)編碼的字跡必須清楚,如果可能的話,及時(shí)的進(jìn)行計(jì)算機(jī)的錄入管理。見圖15-1問卷的編碼圖問卷的編碼(4個(gè)城市,每個(gè)域市針對(duì)1譏哆的冗0個(gè)樣本量進(jìn)行問巻調(diào)查)變量編號(hào)變量名稱及說明變量位數(shù)編碼說明1何卷編號(hào)瀚者
9、編號(hào))3001-5002城市編碼11-北京、2-上嫁玉廣地成郡3訪員編號(hào)3首泣是城市編碼,后兩位是訪員輪碼。01-504Q1被訪者性8U(誼員記錄)1.1黒2-i5Q2被訪者年齡:t出2按照訪問對(duì)象的實(shí)際年齡埴寫,1M06QJ1S訪者的學(xué)帀:扌學(xué)股以下.初中.高中或中?!巴鑼W(xué)??仆鑼W(xué)本科、研究生或以上11-小學(xué)班以下*2初孔玉高中咸中致乩大學(xué)???5夫?qū)W本科&研究生或以上I15Q1工1譜問您在購買時(shí)考慮的因索有(限選3項(xiàng)):商品陰;對(duì)能、商品的品質(zhì)*商品的外觀*商品的價(jià)格r商品的品牌商品的售后服務(wù)朋站漑卓茸地11-商品的功能、2商陽的品庇3-商外觀從商品的價(jià)格5-商品牌,6-商品的售后腿.券工
10、朋友的棒.E茸他16Q1羸諳問悠在購買時(shí)考慮的因素有(限加頊):商品的勸能*商品的品質(zhì)*商品的外觀*商品的價(jià)格*商品的品牌*商品的售后服務(wù)朋立讎薦.其他t1-商品的曲竄2商石吉池品質(zhì)、?-商:鬲的外觀、比商品的if)格工商制?1品睥6-商品的售后聽務(wù)、入朋友的摘X苴他17Q12M訥悠在購買吋考慮的因素有(限直項(xiàng)):商品的功能、戲品的品質(zhì)*商品的外觀、商品的10格*商品的品牌、商品的售后服冬朋賀跳穰苴他11-商品的功能12商品的品質(zhì)、工商外觀、乩齋品的價(jià)格5-商品的晶牌r6-商品的售后跟務(wù)、入朋友的摘&苴他18Q負(fù)正的奸產(chǎn)品不需要廠吿:非常同意*同意、無所謂不同盍.非常不甌1工非常同意r乩同意r
11、M無所謂、工不同意r非常不同意19Q1收東西時(shí)我經(jīng)常貨比三家:非常同意.同鳶無所謂.不同意*菲常不同隱1二非吊同意*乩同意無所謂、工孑同意*1-非常不同意第二節(jié)調(diào)查資料的錄入和整理數(shù)據(jù)錄入數(shù)據(jù)錄入是指將問卷或編碼表中的每一個(gè)項(xiàng)目對(duì)應(yīng)的代碼轉(zhuǎn)化成計(jì)算機(jī)能夠識(shí)別的形式的過程。這個(gè)過程需要數(shù)據(jù)錄入裝置(計(jì)算機(jī))和一個(gè)存儲(chǔ)介質(zhì)(數(shù)據(jù)庫軟件、磁盤)。市場調(diào)查發(fā)達(dá)的國家在數(shù)據(jù)的采集中使用CATI、CAPI的方式很普遍,因此鍵盤錄入的過程已在訪問的時(shí)候就已經(jīng)完成了。而且對(duì)于簡單的問卷調(diào)查,使用調(diào)查卡進(jìn)行光學(xué)掃描錄入也能從時(shí)間上節(jié)約不少成本。但是國內(nèi)目前主要還是紙面問卷調(diào)查的形式居多,所以在問卷完成后,還需要
12、對(duì)問卷進(jìn)行錄入的操作。大多數(shù)問卷信息通過智能錄入系統(tǒng)進(jìn)行,即使用相關(guān)的數(shù)據(jù)庫軟件包。數(shù)據(jù)庫軟件不僅可以存儲(chǔ)數(shù)據(jù),而且在錄入過程中,通過事先的數(shù)據(jù)庫結(jié)構(gòu)的編輯,可以對(duì)錄入員錄入的過程進(jìn)行邏輯檢查,避免數(shù)據(jù)錄入過程中出現(xiàn)某種類型的錯(cuò)誤,如錄入無效的編碼或者是太廣的編碼,同時(shí)對(duì)于跳答問題的錄入也能進(jìn)行很好的控制,減少錯(cuò)誤的條約模式。數(shù)據(jù)庫軟件的錄入檢查的范圍,限制在最常見的邏輯錯(cuò)誤上,對(duì)于在選項(xiàng)范圍內(nèi),因?yàn)殇浫雴T的疏忽而出錯(cuò)的信息,往往是不能察覺,而錄入員在問卷的輸入過程中,因?yàn)樗俣确浅??,即使是非常老練的錄入員,也會(huì)出現(xiàn)錄入錯(cuò)誤的情況。為了保證數(shù)據(jù)錄入的準(zhǔn)確性,有必要對(duì)錄入的結(jié)果進(jìn)行核查,核查的方
13、式主要有雙機(jī)錄入或三機(jī)錄入。所謂雙機(jī)錄入的方式,是將同一份問卷分別由兩個(gè)錄入員進(jìn)行兩次錄入,將兩次的結(jié)果進(jìn)行逐個(gè)比較,相同的部分是被認(rèn)為沒有錯(cuò)誤的,如果出現(xiàn)不同的部分,檢查問卷,及時(shí)修正。所謂三機(jī)錄入,即將同一份問卷由不同的錄入員錄入3次,將3次的結(jié)果通過計(jì)算機(jī)進(jìn)行比較,采用“2排1”的選擇,如果2個(gè)結(jié)果是相同的,排除那個(gè)不同的答案。三機(jī)錄入的方式可以減少翻閱問卷的人工。無論是雙機(jī)錄入還是三機(jī)錄入,都會(huì)增加調(diào)查的時(shí)間和費(fèi)用成本,而且是成倍地增加。但是為求得數(shù)據(jù)的收集錄入各個(gè)環(huán)節(jié)的準(zhǔn)確性,越來越多的企業(yè)和市場調(diào)查公司要求數(shù)據(jù)的正確錄入的操作。如將在圖15-1問卷的編碼中出現(xiàn)的問題進(jìn)行錄入,問卷編
14、號(hào),城市編碼,調(diào)查員編號(hào),Q1、Q2、Q3LLQ12-1、Q12-2、Q12-3、Q13、Q14,對(duì)應(yīng)的數(shù)據(jù)庫結(jié)構(gòu)見圖15-2。這樣,輸入時(shí)每份問卷按數(shù)據(jù)庫中指定的位置輸入相應(yīng)變量的取值,一行數(shù)字就是一份問卷。結(jié)果所有問卷依次輸入完畢就形成一個(gè)數(shù)據(jù)庫。問卷編碼是001號(hào),城市是北京市,12號(hào)調(diào)查員完成的問卷,圈選的結(jié)果是:Q1男性;Q230歲;Q3大學(xué)???;LLQ12圈選的235;Q13非常同意;Q14不同意;問卷編碼是005號(hào),城市是上海市,2號(hào)調(diào)查員完成的問卷,圈選的結(jié)果是:Q1女性;Q222歲;Q3大學(xué)本科;LLQ12圈選的13;Q13不同意;Q14非常同意;對(duì)應(yīng)的數(shù)據(jù)庫1)001112
15、130423552;2)005202222513045數(shù)據(jù)的整理如果在錄入過程中,沒有實(shí)行雙機(jī)錄入(三機(jī)錄入)的措施,在錄入完成之后,有必要對(duì)數(shù)據(jù)進(jìn)行全面的整理檢查。數(shù)據(jù)整理主要是盡可能的處理錯(cuò)誤或不合理的信息以及進(jìn)行一致性的檢查。雖然經(jīng)過回收問卷、編碼過程以及錄入的重重檢查,但是數(shù)據(jù)的整理過程是使用計(jì)算機(jī)進(jìn)行的,對(duì)數(shù)據(jù)的矯正將更為徹底。數(shù)據(jù)整理可使用SPSS或SAS統(tǒng)計(jì)軟件進(jìn)行,可以很方便的尋找出超出選項(xiàng)范圍、極端值或邏輯上不一樣的數(shù)據(jù)。通常的做法是首先對(duì)所有變量進(jìn)行頻數(shù)的計(jì)算,對(duì)連續(xù)性的變量進(jìn)行均值、標(biāo)準(zhǔn)差、最小值、最大值等統(tǒng)計(jì)分析,超出范圍的數(shù)據(jù)和極端的數(shù)值很容易檢查出來。例如,圖15-
16、1問卷的編碼的調(diào)查中,關(guān)于年齡的填寫,假定缺失值為“0”,如果出現(xiàn)小于16,或者大于60的數(shù)值就是超出范圍的。根據(jù)對(duì)應(yīng)的問卷編號(hào),變量編碼找出問卷,進(jìn)行核實(shí)。數(shù)據(jù)整理是對(duì)數(shù)據(jù)進(jìn)行的最后一道檢查程序,這一步完成后,數(shù)據(jù)應(yīng)該是“整齊、干凈的”,然后進(jìn)入下一步,對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理分析。本章小結(jié)1回收問卷:數(shù)據(jù)資料的處理過程是從回收第一份問卷開始的,按照事先調(diào)查方案的計(jì)劃,盡量確保每份問卷都是有效問卷(所謂“有效”問卷,指的是在調(diào)查過程中按照正確的方式執(zhí)行完成的問卷)。問卷回收以后,督導(dǎo)員必須按照調(diào)查的要求,仔細(xì)的檢查問卷。檢查問卷的目的在于將有錯(cuò)誤填寫,或者是挑出不完整或不規(guī)范的問卷,保證數(shù)據(jù)的準(zhǔn)確
17、性。2問卷編碼:編碼是指對(duì)一個(gè)問題的不同答案進(jìn)行分組和確定數(shù)字代碼的過程。大多數(shù)問卷的大多數(shù)問題都是封閉式的,在調(diào)查之前就已經(jīng)完成了編碼的過程,即每一組問題的不同答案的數(shù)字編碼已經(jīng)確定。而開放式問題,因?yàn)椴恢罆?huì)得到什么答案,或者是希望得到比列出的封閉式的選項(xiàng)更詳盡的答案,所以在調(diào)查結(jié)束后,必須對(duì)這些開放式的問題進(jìn)行事后編碼。開放題的事后編碼的工作量很大,無法預(yù)知會(huì)出現(xiàn)多少個(gè)新的代碼和答案,而且有些答案是非常類似的,必須決定是否合并成一類呢,還是分成不同的代碼。3數(shù)據(jù)錄入:數(shù)據(jù)錄入是指將問卷或編碼表中的每一個(gè)項(xiàng)目對(duì)應(yīng)的代碼轉(zhuǎn)化成計(jì)算機(jī)能夠識(shí)別的形式的過程。這個(gè)過程需要數(shù)據(jù)錄入裝置(計(jì)算機(jī))和一
18、個(gè)存儲(chǔ)介質(zhì)(數(shù)據(jù)庫軟件、磁盤)。為了保證數(shù)據(jù)錄入的準(zhǔn)確性,有必要對(duì)錄入的結(jié)果進(jìn)行核查,核查的方式主要有雙機(jī)錄入或三機(jī)錄入。第十六章數(shù)據(jù)分析第一節(jié)常用的統(tǒng)計(jì)方法變量類型在編碼時(shí)我們已經(jīng)提到過,問卷的每一個(gè)題目都可以看做是一個(gè)變量,由于所提問題的性質(zhì)不同,對(duì)應(yīng)的變量類別就不一樣,變量的類別由低到高依次為:定類變量、定序變量、定距變量(定比變量)。(1)定類變量:變量的不同取值僅僅代表了不同類的事物,這樣的變量叫定類變量。問卷的人口特征中最常使用的問題,而調(diào)查被訪對(duì)象的“性別”,就是定類變量。對(duì)于定類變量,加減乘除等運(yùn)算是沒有實(shí)際意義的。(2)定序變量:變量的值不僅能夠代表事物的分類,還能代表事物按
19、某種特性的排序,這樣的變量叫定序變量。問卷的人口特征中最常使用的問題“教育程度”,以及態(tài)度量表題目等都是定序變量,定序變量的值之間可以比較大小,或者有強(qiáng)弱順序,但兩個(gè)值的差一般沒有什么實(shí)際意義。(3)定距變量:變量的值之間可以比較大小,兩個(gè)值的差有實(shí)際意義,這樣的變量叫定距變量。有時(shí)問卷在調(diào)查被訪者的“年齡”和“每月平均收入”,都是定距變量。定比變量與定距變量在市場調(diào)查中一般不加以區(qū)分,它們的差別在于,定距變量取值為“0”時(shí),不表示“沒有”,僅僅是取值為0。定比變量取值為“0”時(shí),則表示“沒有”。上面舉的“年齡”、“每月平均收入”也是定比變量,因?yàn)樗鼈兊摹?”值都表示“沒有”。而像“溫度”這樣
20、的變量中的“0”值并不表示“沒有”,而是表示“oc”這一特定溫度,這樣的變量是定距變量,但不是定比變量。在統(tǒng)計(jì)分析時(shí),對(duì)不同類型的變量要選用不同的方法。一般的原則是適于較低類別變量的統(tǒng)計(jì)方法也可用于較高類別的變量,反之則不行。比如適用于定類變量的分析方法,同時(shí)也可用于其他類別的變量,反過來適于定距變量的分析方法,一般不能用于其他類別的變量。由于市場調(diào)查中的定類、定序變量較多,為了能夠使用更多的統(tǒng)計(jì)方法,常常將有些定類和定序變量通過某些轉(zhuǎn)換變成定距變量或近似看成定距變量,這樣只適用于定距變量的統(tǒng)計(jì)方法,就可以用于這些定類和定序變量了。對(duì)于缺失值的處理在數(shù)據(jù)整理中,經(jīng)常會(huì)碰到缺失值的問題,缺失值的
21、數(shù)量過多的話,說明數(shù)據(jù)收集過程中存在著嚴(yán)重的問題。可以接受的標(biāo)準(zhǔn)是,缺失值的數(shù)量在10%以下。處理缺失值的方法有下面4種:(1)用一個(gè)樣本統(tǒng)計(jì)量的值代替缺失值缺失值可以使用一個(gè)樣本的統(tǒng)計(jì)量去代替,最典型的做法就是使用該變量的樣本平均值。由于該變量的平均值保持不變,其他的統(tǒng)計(jì)量如標(biāo)準(zhǔn)差、相關(guān)系數(shù)等都不會(huì)受到影響。如在收入或者年齡問題中出現(xiàn)缺失值,可以使用收入、年齡的平均值代替缺失值。(2)用從一個(gè)統(tǒng)計(jì)模型計(jì)算出來的值去代替缺失值另一種缺失值的處理方法就是利用由某些統(tǒng)計(jì)模型計(jì)算得到的比較合理的值代替,常使用的模型有回歸模型、判別模型等等。如“個(gè)人收入”、“年齡”與“品牌的選擇”可能存在關(guān)系,利用這
22、三個(gè)問題的被訪者問答數(shù)據(jù),可能構(gòu)造出一個(gè)回歸方程。根據(jù)這個(gè)回歸方程,對(duì)于沒有回答“品牌選擇”的被訪者,可以根據(jù)“個(gè)人收入”和“年齡”的選項(xiàng),利用回歸方程式,計(jì)算出品牌選擇的值。(3)將有缺失值的個(gè)案刪除將有缺失值的個(gè)鞍刪除的方法,結(jié)果可能會(huì)導(dǎo)致樣本量的減少,如果調(diào)查在收集過程中控制得不是很好,被訪對(duì)象多多少少都會(huì)出現(xiàn)一些問題沒有回答的情況,刪除個(gè)案的方法,會(huì)導(dǎo)致大量的樣本減少。(4)將有缺失值的個(gè)案保留,僅在相應(yīng)的分析中做必要的刪除將有缺失值的個(gè)案保留,僅在相應(yīng)的分析中做必要的排除的方法,會(huì)使分析中不同計(jì)算的樣本量不同,也有可能導(dǎo)致不適宜的結(jié)果。調(diào)查的樣本量比較大,缺失值的數(shù)量又不是很多,而且
23、變量之間也不存在高度的相關(guān)的情況下,市場研究者經(jīng)常采用這種方式處理缺失值。統(tǒng)計(jì)方法根據(jù)研究的目的與要求,要選擇不同的統(tǒng)計(jì)方法。如果是對(duì)一個(gè)變量取值的歸納整理及對(duì)其分布形態(tài)的研究,用頻數(shù)分析(計(jì)算百分比等)、眾數(shù)、中位數(shù)、均值和標(biāo)準(zhǔn)差等方法或統(tǒng)計(jì)量來描述;對(duì)兩個(gè)變量的相關(guān)性分析,可以用卡方分析、單因素方差分析、簡單相關(guān)系數(shù)、一元線性回歸分析等方法;對(duì)多個(gè)變量間的相關(guān)性分析,可以用多元線性回歸、判別分析、聚類分析、因子分析等方法。在學(xué)習(xí)掌握這些統(tǒng)計(jì)方法的同時(shí),還應(yīng)該會(huì)熟練使用相關(guān)的統(tǒng)計(jì)軟件,因?yàn)楹芏嘟y(tǒng)計(jì)方法靠手工計(jì)算是難以完成的。現(xiàn)在普遍使用的統(tǒng)計(jì)軟件是SPSS、SAS。下面我們分單變量的分析、兩
24、個(gè)變量的相關(guān)分析、多個(gè)變量的相關(guān)分析三部分,介紹一些常用的統(tǒng)計(jì)方法,主要介紹如何應(yīng)用這些方法,并列舉模擬的例子,給出相應(yīng)的用SPSS統(tǒng)計(jì)軟件分析的結(jié)果,使讀者能夠較快地學(xué)會(huì)使用這些方法。第二節(jié)單變量分析頻數(shù)和百分比所謂頻數(shù)(Frequencies),時(shí)變量某一個(gè)去值的個(gè)案數(shù);所謂百分比(Percentage),是表示該取值的個(gè)案數(shù)占總樣本的比例,即頻數(shù)/樣本量xlOO%。將變量所有取值的頻數(shù)和百分比列在一個(gè)表中,這種表叫頻數(shù)表,從中可以看出變量各個(gè)取值的分布情況。頻數(shù)表分析方式一般適用于定序變量和定類變量,對(duì)定距變量,必須先將變量的取值進(jìn)行分組,每一個(gè)分組作為一個(gè)新的選項(xiàng),然后對(duì)這些新的選項(xiàng)進(jìn)
25、行頻數(shù)表的計(jì)算。ValidCum.ValueLabileValueFreqnencyPercentPercentPercent11.2.2.22102.02.32.531933S.544.3465421643.149.596.35163.237100.06513.0missingTotal501100.0100.0Valid436Missingcase65(例1)表1名1頻數(shù)數(shù)據(jù)計(jì)算結(jié)果表中第一列是“變量標(biāo)簽”,是對(duì)變量取值的說明(現(xiàn)在使用的SPSS軟件雖然是英文版,但是已經(jīng)可以兼容中文,變量標(biāo)簽可以使用中文表示)。第二列是“變量取值”,即:T”至“5”分別代表了“非常不好”到“非常好”,其中
26、“.”代表缺失值,即有些人沒有回答此題;第三列是“頻數(shù)”,對(duì)應(yīng)的數(shù)值表示各個(gè)取值的個(gè)案數(shù),這里認(rèn)為“非常好”有16樣本、認(rèn)為“好”的有216個(gè)樣本、認(rèn)為“一般”的有193人認(rèn)為“不好”的有10個(gè)樣本、認(rèn)為“非常不好”的有1個(gè)人,而沒回答此題約有65人。第四列是“百分比”,是頻數(shù)對(duì)樣本量(501人)的比率。第五列是“有效百分比”,是頻數(shù)對(duì)有效個(gè)案數(shù)(所謂有效個(gè)案數(shù),即樣本量減去缺失個(gè)案數(shù))的比例,這里有效個(gè)案數(shù)是436人。第六列是“累計(jì)百分比”,是對(duì)有效百分比的逐行累加的結(jié)果。從對(duì)該題的頻數(shù)分析的結(jié)果來看,對(duì)A品牌廣告的評(píng)價(jià)總的來說還是傾向于比較好的,所有的樣本中,認(rèn)為“不好”或者“非常不好”的
27、比例合計(jì)只有2.5%,即占樣本2.5%的人不喜歡A品牌的廣告。頻數(shù)和百分比計(jì)算中,百分比大小比較是一個(gè)相對(duì)的概念,頻數(shù)大小則是絕對(duì)的數(shù)值,在市場分析報(bào)告中,經(jīng)常利用百分比來說明結(jié)果,但是有時(shí)也需要頻數(shù)進(jìn)一步的說明之間的差異。在比較兩個(gè)公司的營業(yè)額的增長幅度時(shí),A公司和B公司的經(jīng)營規(guī)模差異巨大的情況下,雖然A公司的增長幅度沒有B公司快,這是因?yàn)锳公司的實(shí)際規(guī)??赡苁荁公司的幾十倍,在這種情況下,也需要比較增長的實(shí)際數(shù)額,才能全面的說明問題。指數(shù)指數(shù)(Index)的計(jì)算方法很多,最常用的一種方法是,將一些待比較的數(shù)字中的一個(gè)特定的數(shù)字定為基數(shù)100,計(jì)算其他數(shù)字相對(duì)于基數(shù)的百分?jǐn)?shù)。用各種指數(shù)來描述
28、和比較一些特定的市場的問題,既方便又直觀。定義適當(dāng)?shù)闹笖?shù)不但可以進(jìn)行橫向(不同空間)的比較,還可以進(jìn)行縱向(不同時(shí)間)的比較。為了說明20多年來廣告的發(fā)展情況,可以1978廣告營業(yè)額作為基數(shù),計(jì)算以后每年廣告經(jīng)營額與基數(shù)的百分比,如果小于100的指數(shù)表明廣告經(jīng)營額的負(fù)增長,如果大于100的指數(shù),代表增長,而且還能夠計(jì)算出來增長的幅度。指數(shù)的使用和計(jì)算方法多種多樣,在使用時(shí)要注意幾個(gè)問題:首先,自定義指數(shù)時(shí),應(yīng)以簡便的、合理的描述研究結(jié)果為原則;在自定義指數(shù)時(shí),在考慮定義的合理性和科學(xué)性的基礎(chǔ)上,還需要考慮其計(jì)算是否方便可行。因此使用指數(shù)進(jìn)行比較時(shí),首先應(yīng)該查閱和參考那些已經(jīng)明確定義的、使用廣泛
29、的指數(shù),避免重復(fù)制造。其次,在應(yīng)用這些指數(shù)的概念時(shí),還必須詳細(xì)了解其定義和計(jì)算方法,以便正確的使用。目前國內(nèi)的中國統(tǒng)計(jì)年鑒和各個(gè)省市的統(tǒng)計(jì)年鑒中,指數(shù)使用已經(jīng)非常平常。包括價(jià)格指數(shù)、消費(fèi)指數(shù)、收入指數(shù)等,同時(shí)類似于房地產(chǎn)價(jià)格指數(shù)、股票價(jià)格指數(shù)等在相應(yīng)的專業(yè)領(lǐng)域里使用的也是非常廣泛。最后,指數(shù)定義的基數(shù)一定要與研究目的緊密結(jié)合,根據(jù)調(diào)查的目的,確定是進(jìn)行橫向比較,還是進(jìn)行縱向比較更為有效,從而確定基數(shù)的訂立基準(zhǔn)。眾數(shù)、中位數(shù)、均值和標(biāo)準(zhǔn)差用于描述一組市場調(diào)查數(shù)據(jù)或資料的中心的常用的統(tǒng)計(jì)量有三種:眾數(shù)、中位數(shù)和平均數(shù)。所謂眾數(shù)(Mode),是表示一組數(shù)據(jù)中出現(xiàn)次數(shù)最多或最常見的數(shù)值。在市場調(diào)查的數(shù)
30、據(jù)中,眾數(shù)代表了典型的個(gè)案,或者是分布的高峰所對(duì)應(yīng)的變量取值。變量的所有取值中頻數(shù)最大的取值,如在消費(fèi)者的教育程度問題里,初中學(xué)歷程度選項(xiàng)最多,所以初中相對(duì)應(yīng)的變量編碼,就是眾數(shù)。眾數(shù)適于描述定序和定類變量,對(duì)于定距變量,可先將數(shù)據(jù)分組,分組后頻數(shù)最大的那一組的組中值,被近似的認(rèn)為是該變量的眾數(shù)。中位數(shù)(Median)表示一組數(shù)據(jù)按照大小的順序排列時(shí),中間位置的那個(gè)數(shù)值,即針對(duì)某個(gè)變量,有50%的個(gè)案的取值在中位數(shù)以下。通俗的講,樣本的所有觀測值中,有一半數(shù)比中位數(shù)大,有一半數(shù)比中位數(shù)小。中位數(shù)的計(jì)算時(shí)會(huì)面臨兩種情況:當(dāng)樣本數(shù)(n)是奇數(shù)時(shí),將樣本的所有觀測值按由小到大(或由大到小)的順序排列
31、,排在中間位置上的數(shù)值即為中位數(shù);當(dāng)樣本為偶數(shù)時(shí),排在中間兩個(gè)位置上的數(shù)值的平均值即為中位數(shù)。中位數(shù)適用于定序變量,對(duì)于定距變量,還是首先對(duì)觀測值進(jìn)行分組,簡單的方法就是用中間那一組的組中值作為變量的中位數(shù)。平均數(shù)(Mean)也叫均值,等于樣本的所有n個(gè)觀測值之和除以樣本量。假設(shè)n個(gè)觀測值用xl,x2,xn表示,均值用x表示,均值的公式為:這里公式(2)是針對(duì)分組的數(shù)據(jù)而言,其中X表示某變量的取值,f表示變量落在某一組中的頻數(shù),E表示對(duì)所有的值求和(或者對(duì)所有的組求和)。平均數(shù)是最典型也是最常用的統(tǒng)計(jì)量,適用于定距變量和定比變量。平均數(shù)也是最有“意義”的統(tǒng)計(jì)量,它可以看作是數(shù)據(jù)的“平衡點(diǎn)”或“
32、重心”位置所在。因?yàn)橹形粩?shù)在計(jì)算時(shí),使用到了所有的數(shù)據(jù),所以與眾數(shù)和中位數(shù)相比,所包含的信息量最大。但是平均數(shù)受受極端值的影響很大,個(gè)別的極端值會(huì)直接影響平均數(shù)的熟知的變化,不如中位數(shù)和眾數(shù)穩(wěn)定。因此當(dāng)調(diào)查的數(shù)據(jù)分布比較規(guī)則,不存在什么極端值,或數(shù)據(jù)對(duì)中心的偏離不是很大的情況下,平均數(shù)是很好的描述統(tǒng)計(jì)量;如果存在極端值或分布步偏離比較大時(shí),還必須使用眾數(shù)和中位數(shù)的來補(bǔ)充描述。眾數(shù)、中位數(shù)、均值都是對(duì)變量分布中心的描述,其中均值最為常用。對(duì)變量的分布形狀的描述,最常用的統(tǒng)計(jì)量是方差或標(biāo)準(zhǔn)差。所謂方差(Variance)或標(biāo)準(zhǔn)差(Standardvariance)是表示分布對(duì)平均數(shù)的偏離程度或伸展
33、程度的度量。計(jì)算公式是:標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差的大小反映了數(shù)據(jù)對(duì)均值的離散程度,標(biāo)準(zhǔn)差越小,表明數(shù)據(jù)越集中于均值附近,反之則越分散。任何統(tǒng)計(jì)分析軟件都有標(biāo)準(zhǔn)差的計(jì)算,標(biāo)準(zhǔn)差是描述分布的分散(伸展)程度的經(jīng)常使用的統(tǒng)計(jì)量。例2:在表16-1是頻數(shù)和百分比計(jì)算的結(jié)果,使用的變量是定序變量,也可以近似看成定距變量,所以眾數(shù)、中位數(shù)、均值和標(biāo)準(zhǔn)差都是有意義的。見表16-2。對(duì)中位數(shù)金數(shù)、平均範(fàn)標(biāo)誰差的計(jì)算ValidCuiriValueLableVdwFreqweiLcyPercentPereentPercent11.2.2.22102.02.3319338.544.3亞.5421643.149.596.35163.23.7100.0使用圖形表示分析的結(jié)果使用圖表的形式將更為直觀的描述調(diào)查的結(jié)果,有助于客戶更容易理解數(shù)據(jù)的內(nèi)容。在報(bào)告中使用的圖形的格式非常多,最經(jīng)常使用的包括直方圖、面積圖、折線圖和雷
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年液壓折邊機(jī)項(xiàng)目可行性研究報(bào)告
- 2024-2025學(xué)年高中歷史專題二近代中國維護(hù)國家主權(quán)的斗爭2.2中國軍民維護(hù)國家主權(quán)的斗爭教案含解析人民版必修1
- 2025年半哚拉唑主環(huán)行業(yè)深度研究分析報(bào)告
- 婚禮現(xiàn)場致辭(32篇)
- 2025年中國氣門挺柱市場供需現(xiàn)狀及投資戰(zhàn)略研究報(bào)告
- 一建建筑實(shí)務(wù)物資采購重點(diǎn)管理
- 2025年度房地產(chǎn)項(xiàng)目稅收籌劃合同范本
- 《小數(shù)除法-解決問題》(教學(xué)設(shè)計(jì))-2024-2025學(xué)年五年級(jí)上冊(cè)數(shù)學(xué)北京版
- 電動(dòng)自行車共享項(xiàng)目可行性分析報(bào)告
- Unit 1 You and me. SectionB1a-2b讀寫課教學(xué)設(shè)計(jì) 2024-2025學(xué)年人教版英語七年級(jí)上冊(cè)
- 2016年輸電線路評(píng)價(jià)與分析報(bào)告
- 全名校初二物理期末沖刺30題:力與運(yùn)動(dòng)、壓強(qiáng)和浮力
- 因公出國(境)管理辦法
- 別讓心態(tài)毀了你:受益一生的情緒掌控法
- 電梯控制技術(shù)PPT完整全套教學(xué)課件
- 甲狀腺旁腺分泌的激素及功能
- 中央財(cái)政成品油價(jià)格調(diào)整對(duì)漁業(yè)補(bǔ)助資金項(xiàng)目實(shí)施方案
- 論生產(chǎn)安全對(duì)于家庭的重要性
- 風(fēng)力發(fā)電變槳系統(tǒng)外文翻譯
- 教學(xué)能力比賽決賽 《英語》教案
- ECMO IABP完整版可編輯
評(píng)論
0/150
提交評(píng)論