資料的基礎(chǔ)分析-描述統(tǒng)計(jì)課件_第1頁
資料的基礎(chǔ)分析-描述統(tǒng)計(jì)課件_第2頁
資料的基礎(chǔ)分析-描述統(tǒng)計(jì)課件_第3頁
資料的基礎(chǔ)分析-描述統(tǒng)計(jì)課件_第4頁
資料的基礎(chǔ)分析-描述統(tǒng)計(jì)課件_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第八章資料的基礎(chǔ)分析:——描述統(tǒng)計(jì)1第八章資料的基礎(chǔ)分析:——描述統(tǒng)計(jì)1學(xué)習(xí)目標(biāo)了解資料輸入計(jì)算機(jī)之前的處理工作掌握如何列表(雙向交叉列表)了解如何對(duì)資料進(jìn)行統(tǒng)計(jì)分析2學(xué)習(xí)目標(biāo)了解資料輸入計(jì)算機(jī)之前的處理工作28.1數(shù)據(jù)的確認(rèn)、編輯和編碼確認(rèn)訪談是否以適當(dāng)?shù)姆绞竭M(jìn)行,訪問員是否造假(回訪10%~20%)電話確認(rèn)確認(rèn)此人是否真正接受了調(diào)查?被調(diào)查者是否符合條件?是否按要求的方式調(diào)查?確認(rèn)調(diào)查是否完整?檢查其他問題確認(rèn)的目的38.1數(shù)據(jù)的確認(rèn)、編輯和編碼確認(rèn)3編輯對(duì)訪問員和應(yīng)答者的錯(cuò)誤進(jìn)行檢查確定訪問員是否沒有問某些問題或者沒有記錄某些問題的答案核實(shí)問卷,以保證遵循了規(guī)定的跳躍模式檢查開放式問題的答案要求訪問員逐字記錄答案,不以任何方式重新釋義、表達(dá)或插入自己的語言。同時(shí)對(duì)問題的答案進(jìn)行“追問”4編輯對(duì)訪問員和應(yīng)答者的錯(cuò)誤進(jìn)行檢查4編輯實(shí)地編輯完整性清楚性內(nèi)容的一致性明確性單位的統(tǒng)一性5編輯實(shí)地編輯5編輯辦公室編輯更完整、確切地審查和校正回收的資料重點(diǎn)在于所查出問題的如何處理方面不完整答卷的對(duì)策大面積不回答,廢卷;個(gè)別問題無回答,有效問卷并補(bǔ)救;相當(dāng)多問卷對(duì)同一問題無回答,有效。明顯回答錯(cuò)誤對(duì)策無興趣答卷的對(duì)策糾正對(duì)開放性問題的打亂順序的回答。6編輯辦公室編輯6編輯開放式問題的記錄對(duì)于開放式問題的回答,訪問員記錄不當(dāng)?shù)睦訂栴}:你為什么在眾多的快捷/方便的餐館中選擇經(jīng)常去肯德基?回答記錄:顧客似乎覺的肯德基有更加美味的食物和一流的服務(wù)環(huán)境服務(wù)員沒有進(jìn)一步追問的例子問題:同上回答記錄:因?yàn)楦杏X比較好。7編輯開放式問題的記錄7編輯適當(dāng)?shù)挠涗浐妥穯柕睦訂栴}:同上回答記錄:因?yàn)楦杏X比較好。那里的服務(wù)員態(tài)度好,而且環(huán)境比較好。8編輯適當(dāng)?shù)挠涗浐妥穯柕睦?編碼編碼定義對(duì)一個(gè)問題的不同回答進(jìn)行分組和確定數(shù)字代碼的過程。大多數(shù)問卷中的大多數(shù)問題是封閉式的,并且已預(yù)先編碼。編碼主要是針對(duì)開放式問題進(jìn)行。編碼的原因文字記錄對(duì)于定量分析不合適:1)對(duì)于用計(jì)算機(jī)分析,文字不太有效;2)調(diào)查分析記錄不便于計(jì)量,100人有100種回答。編碼就是把相似的進(jìn)行歸類。9編碼編碼定義9編碼編碼過程列出答案合并答案:一些形式上不同的答案,在本質(zhì)上是一致的,可以被合并為一類。設(shè)置編碼4、輸入編碼讀取每組問題中每個(gè)開放式問題的回答。找出與按步驟2得到的合并類別相符的回答把每個(gè)具體的回答得數(shù)字編碼填入相應(yīng)的類別中在調(diào)查表的適當(dāng)?shù)胤剑⒚髅總€(gè)問題回答的數(shù)字編碼10編碼編碼過程10編碼例:對(duì)于您最近一次購買體育用品、運(yùn)動(dòng)鞋或運(yùn)動(dòng)服裝,您買的是什么?假設(shè)有6位被訪者分別購買了一個(gè)籃球、一雙跑鞋、一副網(wǎng)球拍、一雙網(wǎng)球鞋,羽毛球,運(yùn)動(dòng)服?!?”代表運(yùn)動(dòng)器材;“2”代表運(yùn)動(dòng)服裝“3”代表運(yùn)動(dòng)鞋11編碼例:對(duì)于您最近一次購買體育用品、運(yùn)動(dòng)鞋或運(yùn)動(dòng)服裝,您買編碼明細(xì)單為把資料準(zhǔn)確地輸入計(jì)算機(jī),需要制定一套規(guī)則,即編碼明細(xì)單。一份說明文件中各個(gè)問題(變量)及其答案,與計(jì)算機(jī)數(shù)據(jù)文件中的字段、數(shù)碼位置及數(shù)碼之間一一對(duì)應(yīng)關(guān)系的文件。12編碼明細(xì)單為把資料準(zhǔn)確地輸入計(jì)算機(jī),需要制定一套規(guī)則,即編碼編碼明細(xì)單需要注意的問題:所有資料轉(zhuǎn)化為數(shù)值,不允許有字母或其他字符每一個(gè)數(shù)值碼占據(jù)一列,(單選題和多選題)無信息的答案賦予標(biāo)準(zhǔn)代碼每條記錄的第一個(gè)字段都為問卷的編號(hào)。例:P14713編碼明細(xì)單需要注意的問題:138.2資料的初步分析——列表

列表:把調(diào)查資料按照一定的目的、用表格的形式展現(xiàn)出來;單項(xiàng)列表:僅計(jì)數(shù)一個(gè)變量不同數(shù)值的出現(xiàn)次數(shù)的列表;交叉列表:同時(shí)計(jì)數(shù)兩個(gè)或兩個(gè)變量的不同數(shù)值聯(lián)合出現(xiàn)的次數(shù)的列表。148.2資料的初步分析——列表列表:把調(diào)查資料按照一定的8.2.1單因素表格化分析目的:1、弄清無回答現(xiàn)象的程度;2、弄清編誤和飛點(diǎn)發(fā)生在何處;3、弄清變量的經(jīng)驗(yàn)分布;4、計(jì)算主要的描述指標(biāo)。158.2.1單因素表格化分析目的:158.2.1單因素表格化分析無回答無回答數(shù)目過多會(huì)影響調(diào)研的數(shù)據(jù)分析和最終質(zhì)量指定一些特別的數(shù)字表示無回答(缺省值)對(duì)于缺省值可用的方法:1.保留下來作為單獨(dú)的一組;2.臨時(shí)排除含有缺省值的記錄;3.以其它數(shù)值替補(bǔ)缺省值(其中趨勢(shì)量最常用)168.2.1單因素表格化分析無回答168.2.1單因素表格化分析編誤與飛點(diǎn)作單項(xiàng)列表時(shí),可能發(fā)現(xiàn)一些不正常的數(shù)值,經(jīng)查對(duì)原值并非如此,這種誤差稱之為“編誤”,可被糾正。飛點(diǎn)——經(jīng)查對(duì)與原值相符,但是與其他的觀察值相比,特別大或者特別小,無法糾正。箱線圖有助于發(fā)現(xiàn)飛點(diǎn)。(由上四分位數(shù)、下四分位數(shù)、最大值和最小值決定的)178.2.1單因素表格化分析編誤與飛點(diǎn)178.2.1單因素表格化分析頻數(shù)分布表對(duì)于有飛點(diǎn)的數(shù)據(jù)宜采用不等組距,并設(shè)立開口單項(xiàng)列表的主要描述量眾數(shù)、中位數(shù)、平均值和標(biāo)準(zhǔn)差等。(可用相關(guān)軟件直接進(jìn)行計(jì)算)188.2.1單因素表格化分析頻數(shù)分布表18描述性統(tǒng)計(jì)集中趨勢(shì)測(cè)量類別和順序量表等距和等比量表均值中位數(shù)眾數(shù)19描述性統(tǒng)計(jì)集中趨勢(shì)測(cè)量19描述性統(tǒng)計(jì)眾數(shù)一串?dāng)?shù)字中出現(xiàn)次數(shù)最多的值。通過制作頻數(shù)分布表,可以較容易的找出。分類變量宜采用眾數(shù)。中位數(shù)一組有序值得列里居中的那個(gè)值。其余值中一半要大于這個(gè)值,而剩余的一般要小于這個(gè)值。n是奇數(shù)或偶數(shù)。通過計(jì)算累計(jì)百分?jǐn)?shù)20描述性統(tǒng)計(jì)眾數(shù)20均值:刻畫一組數(shù)字的算術(shù)平均值。描述性統(tǒng)計(jì)其中:fi=第i組的頻數(shù)Xi=組中值h=組數(shù)21均值:刻畫一組數(shù)字的算術(shù)平均值。描述性統(tǒng)計(jì)其中:fi=離散程度的計(jì)量標(biāo)準(zhǔn)差其中S=樣本標(biāo)準(zhǔn)差Xi=第i個(gè)的觀察值X=樣本均值n=樣本容量描述性統(tǒng)計(jì)22離散程度的計(jì)量其中S=樣本標(biāo)準(zhǔn)差描述性統(tǒng)計(jì)22描述性統(tǒng)計(jì)離散程度的計(jì)量方差標(biāo)準(zhǔn)差的平方全距最大值減去最小值23描述性統(tǒng)計(jì)離散程度的計(jì)量23例:十名被訪者給其電腦速度打分的數(shù)據(jù)集被訪者等級(jí)142534425364

738495104“1”表示很慢“5”表示很快24例:十名被訪者給其電腦速度打分的數(shù)據(jù)集被訪者對(duì)十位被訪者的等級(jí)分析25對(duì)十位被訪者的等級(jí)分析25對(duì)十位被訪者的等級(jí)分析百分率分布每個(gè)不同的數(shù)字出現(xiàn)的頻率一般分率計(jì)算出來等級(jí)百分率(%)210320450520總計(jì)100累計(jì)百分率次數(shù)或百分率的動(dòng)態(tài)總合26對(duì)十位被訪者的等級(jí)分析百分率分布累計(jì)百分率26對(duì)十位被訪者的等級(jí)分析中位數(shù)通過累計(jì)百分率計(jì)算眾數(shù)通過百分率計(jì)算均值極差標(biāo)準(zhǔn)差27對(duì)十位被訪者的等級(jí)分析中位數(shù)均值27描述性統(tǒng)計(jì)類別量表:眾數(shù),頻率或百分率順序量表:中位數(shù),累積百分率等距量表:極差,均值,方差等等比量表:還可以計(jì)算幾何平均數(shù)P10028描述性統(tǒng)計(jì)類別量表:眾數(shù),頻率或百分率288.2.2多因素列表分析雙向交叉列表最常用,應(yīng)用最廣泛的一種方法同時(shí)有兩個(gè)變量參加交叉分組的頻數(shù)分布表例如研究家庭收入對(duì)汽車保有量的影響:家庭收入在平均數(shù)之上的家庭是否比收入在平均數(shù)以下的家庭擁有更多的汽車298.2.2多因素列表分析雙向交叉列表29雙向交叉列表

表8.9家庭收入與汽車保有量交叉分組行百分比家庭收入汽車保有量個(gè)案數(shù)1輛以內(nèi)1輛以上合計(jì)低收入高收入89%59%11%41%100%100%5446

表8.10家庭收入與汽車保有量交叉分組列百分比家庭收入汽車保有量1輛以內(nèi)1輛以上低收入高收入合計(jì)64%36%100%24%76%100%30雙向交叉列表表8.9家庭收入與汽車保有量交叉雙向交叉列表不同的表格形式有不同的含義,表8.9與8.10提供的信息不同。交叉列表一般都將自變量沿橫向展開,將因變量沿縱向展開,相對(duì)頻數(shù)計(jì)算行百分比。同樣可以做出家庭規(guī)模與汽車保有量的交叉列表31雙向交叉列表不同的表格形式有不同的含義,表8.9與8.10提雙向交叉列表表8.11家庭規(guī)模與汽車保有量交叉分組列百分比家庭規(guī)模汽車保有量1輛以內(nèi)1輛以上合計(jì)4口以內(nèi)4口以上70(90%)5(23%)8(10%)17(77%)78(100%)22(100%)合計(jì)752510032雙向交叉列表表8.11家庭規(guī)模與汽車保有量交叉分組列百分三向交叉列表以上的分析發(fā)現(xiàn)汽車保有量受到家庭規(guī)模和家庭收入的共同影響。如果同時(shí)考慮兩種因素,汽車保有量會(huì)受到什么樣的影響?33三向交叉列表以上的分析發(fā)現(xiàn)汽車保有量受到家庭規(guī)模和家庭收入的三向交叉列表三變量的交叉列表的步驟:1、把其中一個(gè)自變量穩(wěn)定在其各種量值之中的一個(gè)量值上,然后對(duì)另一自變量與因變量作雙向交叉分組;2、再將第一個(gè)自變量穩(wěn)定在下一個(gè)量值上,作另外兩個(gè)變量的交叉列表,以此類推,直至窮盡第一個(gè)自變量的所有量值;3、最后列出沒有第一個(gè)自變量介入的另外兩個(gè)變量的交叉列表。34三向交叉列表三變量的交叉列表的步驟:34三向交叉列表

表8.13家庭收入、家庭規(guī)模與汽車保有量交叉分組頻數(shù)收入水平家庭規(guī)模4口以內(nèi)4口以上全部家庭1輛以內(nèi)1輛以上合計(jì)1輛以內(nèi)1輛以上合計(jì)1輛以內(nèi)1輛以上合計(jì)低高4496%2681%24%619%46100%32100%450%17%450%1393%8100%14100%4889%2759%611%1941%54100%46100%合計(jì)70878517227525100

81%及59%的含義。

35三向交叉列表表8.13家庭收入、家庭規(guī)模與汽車保三向交叉列表由上表可知在家庭規(guī)模一定的條件下,家庭收入對(duì)汽車保有量有一定的影響,但是無法確定家庭規(guī)模和家庭收入兩個(gè)變量中,哪個(gè)變量對(duì)汽車保有量的影響大。可從上表中取出局部雙向交叉進(jìn)行分析:36三向交叉列表由上表可知在家庭規(guī)模一定的條件下,家庭收入對(duì)汽車三向交叉列表表8.14按家庭收入和家庭規(guī)模交叉分組的擁有1輛以上汽車的家庭百分比家庭收入家庭規(guī)模4口以內(nèi)(78)4口以上(22)合計(jì)低(54)高(46)4%19%50%93%11%41%對(duì)于4口以內(nèi)家庭,收入水平的提升是的某戶擁有1輛以上汽車的機(jī)會(huì)增加0.19-0.04=0.15,而對(duì)于4口以上家庭,這種機(jī)會(huì)卻有0.43。家庭規(guī)模的不同就相應(yīng)的具有不同的機(jī)會(huì),說明自變過來之間有交互作用??梢酝ㄟ^算數(shù)加權(quán)平均法求得不論家庭規(guī)模的大小與否,單純提升某戶收入水平,該戶擁有1輛以上汽車的機(jī)會(huì)所增加的百分點(diǎn)。算式是:(0.15×78+0.43×22)/(78+22)=0.21(縱向)37三向交叉列表表8.14按家庭收入和家庭規(guī)模交叉分組的三向交叉列表按照同樣的道理,因家庭規(guī)模擴(kuò)大擁有1輛以上汽車機(jī)會(huì)所增加的百分點(diǎn)為:(0.46×54+0.74×46)/(54+46)=0.59(橫向)通過以上兩步,可知家庭規(guī)模對(duì)汽車保有量的影響遠(yuǎn)比家庭收入水平的影響大。與表8.9相比較,說明附加自變量的引入有助于修正說明第一個(gè)自變量對(duì)因變量的影響。38三向交叉列表按照同樣的道理,因家庭規(guī)模擴(kuò)大擁有1輛以上汽車機(jī)三向交叉列表引入附加自變量也可以顯示出原先被隱含的關(guān)系等。課本p164初始結(jié)論認(rèn)為自變量與因變量間存在某種因果關(guān)系,初始結(jié)論認(rèn)為兩變量間無關(guān)系,39三向交叉列表引入附加自變量也可以顯示出原先被隱含的關(guān)系等。課數(shù)據(jù)的圖形化線形圖最簡單的圖形餅狀圖在市場(chǎng)調(diào)研中經(jīng)常常用柱形圖1.簡明柱形圖2.聚類柱形圖3.堆積柱形圖4.多行三維柱形圖40數(shù)據(jù)的圖形化線形圖40資料的解釋和分析分析與解釋對(duì)研究者要求最高的就是資料的分析與解釋事實(shí)本身沒有用處,只有經(jīng)過比較和分析才有用例如:某企業(yè)今年的年產(chǎn)值為8000萬元。分析是以某種有意義的形式或次序把收集的資料重新展現(xiàn)出來。(找出資料中有什么信息)解釋是在資料分析的基礎(chǔ)上,找出信息之間或手中信息與其它已知信息的聯(lián)系。(獲得結(jié)論)41資料的解釋和分析分析與解釋41資料的解釋和分析季度A牌(萬支)B牌(萬支)1100229043851547530表8.6兩種產(chǎn)品銷售量的比較公司的營業(yè)部經(jīng)理從表上資料發(fā)現(xiàn),A牌銷售量的下降與B牌銷售量的上升相似,因此作出結(jié)論,A牌產(chǎn)品顧客轉(zhuǎn)向了B牌,并建議這個(gè)時(shí)刻將A牌退出市場(chǎng)。上例表明分析適當(dāng),解釋并一定適當(dāng)。42資料的解釋和分析季度A牌(萬支)B牌(萬支)11002290案例分析P17043案例分析P17043CDMA調(diào)查報(bào)告44CDMA調(diào)查報(bào)告44第八章資料的基礎(chǔ)分析:——描述統(tǒng)計(jì)45第八章資料的基礎(chǔ)分析:——描述統(tǒng)計(jì)1學(xué)習(xí)目標(biāo)了解資料輸入計(jì)算機(jī)之前的處理工作掌握如何列表(雙向交叉列表)了解如何對(duì)資料進(jìn)行統(tǒng)計(jì)分析46學(xué)習(xí)目標(biāo)了解資料輸入計(jì)算機(jī)之前的處理工作28.1數(shù)據(jù)的確認(rèn)、編輯和編碼確認(rèn)訪談是否以適當(dāng)?shù)姆绞竭M(jìn)行,訪問員是否造假(回訪10%~20%)電話確認(rèn)確認(rèn)此人是否真正接受了調(diào)查?被調(diào)查者是否符合條件?是否按要求的方式調(diào)查?確認(rèn)調(diào)查是否完整?檢查其他問題確認(rèn)的目的478.1數(shù)據(jù)的確認(rèn)、編輯和編碼確認(rèn)3編輯對(duì)訪問員和應(yīng)答者的錯(cuò)誤進(jìn)行檢查確定訪問員是否沒有問某些問題或者沒有記錄某些問題的答案核實(shí)問卷,以保證遵循了規(guī)定的跳躍模式檢查開放式問題的答案要求訪問員逐字記錄答案,不以任何方式重新釋義、表達(dá)或插入自己的語言。同時(shí)對(duì)問題的答案進(jìn)行“追問”48編輯對(duì)訪問員和應(yīng)答者的錯(cuò)誤進(jìn)行檢查4編輯實(shí)地編輯完整性清楚性內(nèi)容的一致性明確性單位的統(tǒng)一性49編輯實(shí)地編輯5編輯辦公室編輯更完整、確切地審查和校正回收的資料重點(diǎn)在于所查出問題的如何處理方面不完整答卷的對(duì)策大面積不回答,廢卷;個(gè)別問題無回答,有效問卷并補(bǔ)救;相當(dāng)多問卷對(duì)同一問題無回答,有效。明顯回答錯(cuò)誤對(duì)策無興趣答卷的對(duì)策糾正對(duì)開放性問題的打亂順序的回答。50編輯辦公室編輯6編輯開放式問題的記錄對(duì)于開放式問題的回答,訪問員記錄不當(dāng)?shù)睦訂栴}:你為什么在眾多的快捷/方便的餐館中選擇經(jīng)常去肯德基?回答記錄:顧客似乎覺的肯德基有更加美味的食物和一流的服務(wù)環(huán)境服務(wù)員沒有進(jìn)一步追問的例子問題:同上回答記錄:因?yàn)楦杏X比較好。51編輯開放式問題的記錄7編輯適當(dāng)?shù)挠涗浐妥穯柕睦訂栴}:同上回答記錄:因?yàn)楦杏X比較好。那里的服務(wù)員態(tài)度好,而且環(huán)境比較好。52編輯適當(dāng)?shù)挠涗浐妥穯柕睦?編碼編碼定義對(duì)一個(gè)問題的不同回答進(jìn)行分組和確定數(shù)字代碼的過程。大多數(shù)問卷中的大多數(shù)問題是封閉式的,并且已預(yù)先編碼。編碼主要是針對(duì)開放式問題進(jìn)行。編碼的原因文字記錄對(duì)于定量分析不合適:1)對(duì)于用計(jì)算機(jī)分析,文字不太有效;2)調(diào)查分析記錄不便于計(jì)量,100人有100種回答。編碼就是把相似的進(jìn)行歸類。53編碼編碼定義9編碼編碼過程列出答案合并答案:一些形式上不同的答案,在本質(zhì)上是一致的,可以被合并為一類。設(shè)置編碼4、輸入編碼讀取每組問題中每個(gè)開放式問題的回答。找出與按步驟2得到的合并類別相符的回答把每個(gè)具體的回答得數(shù)字編碼填入相應(yīng)的類別中在調(diào)查表的適當(dāng)?shù)胤?,注明每個(gè)問題回答的數(shù)字編碼54編碼編碼過程10編碼例:對(duì)于您最近一次購買體育用品、運(yùn)動(dòng)鞋或運(yùn)動(dòng)服裝,您買的是什么?假設(shè)有6位被訪者分別購買了一個(gè)籃球、一雙跑鞋、一副網(wǎng)球拍、一雙網(wǎng)球鞋,羽毛球,運(yùn)動(dòng)服?!?”代表運(yùn)動(dòng)器材;“2”代表運(yùn)動(dòng)服裝“3”代表運(yùn)動(dòng)鞋55編碼例:對(duì)于您最近一次購買體育用品、運(yùn)動(dòng)鞋或運(yùn)動(dòng)服裝,您買編碼明細(xì)單為把資料準(zhǔn)確地輸入計(jì)算機(jī),需要制定一套規(guī)則,即編碼明細(xì)單。一份說明文件中各個(gè)問題(變量)及其答案,與計(jì)算機(jī)數(shù)據(jù)文件中的字段、數(shù)碼位置及數(shù)碼之間一一對(duì)應(yīng)關(guān)系的文件。56編碼明細(xì)單為把資料準(zhǔn)確地輸入計(jì)算機(jī),需要制定一套規(guī)則,即編碼編碼明細(xì)單需要注意的問題:所有資料轉(zhuǎn)化為數(shù)值,不允許有字母或其他字符每一個(gè)數(shù)值碼占據(jù)一列,(單選題和多選題)無信息的答案賦予標(biāo)準(zhǔn)代碼每條記錄的第一個(gè)字段都為問卷的編號(hào)。例:P14757編碼明細(xì)單需要注意的問題:138.2資料的初步分析——列表

列表:把調(diào)查資料按照一定的目的、用表格的形式展現(xiàn)出來;單項(xiàng)列表:僅計(jì)數(shù)一個(gè)變量不同數(shù)值的出現(xiàn)次數(shù)的列表;交叉列表:同時(shí)計(jì)數(shù)兩個(gè)或兩個(gè)變量的不同數(shù)值聯(lián)合出現(xiàn)的次數(shù)的列表。588.2資料的初步分析——列表列表:把調(diào)查資料按照一定的8.2.1單因素表格化分析目的:1、弄清無回答現(xiàn)象的程度;2、弄清編誤和飛點(diǎn)發(fā)生在何處;3、弄清變量的經(jīng)驗(yàn)分布;4、計(jì)算主要的描述指標(biāo)。598.2.1單因素表格化分析目的:158.2.1單因素表格化分析無回答無回答數(shù)目過多會(huì)影響調(diào)研的數(shù)據(jù)分析和最終質(zhì)量指定一些特別的數(shù)字表示無回答(缺省值)對(duì)于缺省值可用的方法:1.保留下來作為單獨(dú)的一組;2.臨時(shí)排除含有缺省值的記錄;3.以其它數(shù)值替補(bǔ)缺省值(其中趨勢(shì)量最常用)608.2.1單因素表格化分析無回答168.2.1單因素表格化分析編誤與飛點(diǎn)作單項(xiàng)列表時(shí),可能發(fā)現(xiàn)一些不正常的數(shù)值,經(jīng)查對(duì)原值并非如此,這種誤差稱之為“編誤”,可被糾正。飛點(diǎn)——經(jīng)查對(duì)與原值相符,但是與其他的觀察值相比,特別大或者特別小,無法糾正。箱線圖有助于發(fā)現(xiàn)飛點(diǎn)。(由上四分位數(shù)、下四分位數(shù)、最大值和最小值決定的)618.2.1單因素表格化分析編誤與飛點(diǎn)178.2.1單因素表格化分析頻數(shù)分布表對(duì)于有飛點(diǎn)的數(shù)據(jù)宜采用不等組距,并設(shè)立開口單項(xiàng)列表的主要描述量眾數(shù)、中位數(shù)、平均值和標(biāo)準(zhǔn)差等。(可用相關(guān)軟件直接進(jìn)行計(jì)算)628.2.1單因素表格化分析頻數(shù)分布表18描述性統(tǒng)計(jì)集中趨勢(shì)測(cè)量類別和順序量表等距和等比量表均值中位數(shù)眾數(shù)63描述性統(tǒng)計(jì)集中趨勢(shì)測(cè)量19描述性統(tǒng)計(jì)眾數(shù)一串?dāng)?shù)字中出現(xiàn)次數(shù)最多的值。通過制作頻數(shù)分布表,可以較容易的找出。分類變量宜采用眾數(shù)。中位數(shù)一組有序值得列里居中的那個(gè)值。其余值中一半要大于這個(gè)值,而剩余的一般要小于這個(gè)值。n是奇數(shù)或偶數(shù)。通過計(jì)算累計(jì)百分?jǐn)?shù)64描述性統(tǒng)計(jì)眾數(shù)20均值:刻畫一組數(shù)字的算術(shù)平均值。描述性統(tǒng)計(jì)其中:fi=第i組的頻數(shù)Xi=組中值h=組數(shù)65均值:刻畫一組數(shù)字的算術(shù)平均值。描述性統(tǒng)計(jì)其中:fi=離散程度的計(jì)量標(biāo)準(zhǔn)差其中S=樣本標(biāo)準(zhǔn)差Xi=第i個(gè)的觀察值X=樣本均值n=樣本容量描述性統(tǒng)計(jì)66離散程度的計(jì)量其中S=樣本標(biāo)準(zhǔn)差描述性統(tǒng)計(jì)22描述性統(tǒng)計(jì)離散程度的計(jì)量方差標(biāo)準(zhǔn)差的平方全距最大值減去最小值67描述性統(tǒng)計(jì)離散程度的計(jì)量23例:十名被訪者給其電腦速度打分的數(shù)據(jù)集被訪者等級(jí)142534425364

738495104“1”表示很慢“5”表示很快68例:十名被訪者給其電腦速度打分的數(shù)據(jù)集被訪者對(duì)十位被訪者的等級(jí)分析69對(duì)十位被訪者的等級(jí)分析25對(duì)十位被訪者的等級(jí)分析百分率分布每個(gè)不同的數(shù)字出現(xiàn)的頻率一般分率計(jì)算出來等級(jí)百分率(%)210320450520總計(jì)100累計(jì)百分率次數(shù)或百分率的動(dòng)態(tài)總合70對(duì)十位被訪者的等級(jí)分析百分率分布累計(jì)百分率26對(duì)十位被訪者的等級(jí)分析中位數(shù)通過累計(jì)百分率計(jì)算眾數(shù)通過百分率計(jì)算均值極差標(biāo)準(zhǔn)差71對(duì)十位被訪者的等級(jí)分析中位數(shù)均值27描述性統(tǒng)計(jì)類別量表:眾數(shù),頻率或百分率順序量表:中位數(shù),累積百分率等距量表:極差,均值,方差等等比量表:還可以計(jì)算幾何平均數(shù)P10072描述性統(tǒng)計(jì)類別量表:眾數(shù),頻率或百分率288.2.2多因素列表分析雙向交叉列表最常用,應(yīng)用最廣泛的一種方法同時(shí)有兩個(gè)變量參加交叉分組的頻數(shù)分布表例如研究家庭收入對(duì)汽車保有量的影響:家庭收入在平均數(shù)之上的家庭是否比收入在平均數(shù)以下的家庭擁有更多的汽車738.2.2多因素列表分析雙向交叉列表29雙向交叉列表

表8.9家庭收入與汽車保有量交叉分組行百分比家庭收入汽車保有量個(gè)案數(shù)1輛以內(nèi)1輛以上合計(jì)低收入高收入89%59%11%41%100%100%5446

表8.10家庭收入與汽車保有量交叉分組列百分比家庭收入汽車保有量1輛以內(nèi)1輛以上低收入高收入合計(jì)64%36%100%24%76%100%74雙向交叉列表表8.9家庭收入與汽車保有量交叉雙向交叉列表不同的表格形式有不同的含義,表8.9與8.10提供的信息不同。交叉列表一般都將自變量沿橫向展開,將因變量沿縱向展開,相對(duì)頻數(shù)計(jì)算行百分比。同樣可以做出家庭規(guī)模與汽車保有量的交叉列表75雙向交叉列表不同的表格形式有不同的含義,表8.9與8.10提雙向交叉列表表8.11家庭規(guī)模與汽車保有量交叉分組列百分比家庭規(guī)模汽車保有量1輛以內(nèi)1輛以上合計(jì)4口以內(nèi)4口以上70(90%)5(23%)8(10%)17(77%)78(100%)22(100%)合計(jì)752510076雙向交叉列表表8.11家庭規(guī)模與汽車保有量交叉分組列百分三向交叉列表以上的分析發(fā)現(xiàn)汽車保有量受到家庭規(guī)模和家庭收入的共同影響。如果同時(shí)考慮兩種因素,汽車保有量會(huì)受到什么樣的影響?77三向交叉列表以上的分析發(fā)現(xiàn)汽車保有量受到家庭規(guī)模和家庭收入的三向交叉列表三變量的交叉列表的步驟:1、把其中一個(gè)自變量穩(wěn)定在其各種量值之中的一個(gè)量值上,然后對(duì)另一自變量與因變量作雙向交叉分組;2、再將第一個(gè)自變量穩(wěn)定在下一個(gè)量值上,作另外兩個(gè)變量的交叉列表,以此類推,直至窮盡第一個(gè)自變量的所有量值;3、最后列出沒有第一個(gè)自變量介入的另外兩個(gè)變量的交叉列表。78三向交叉列表三變量的交叉列表的步驟:34三向交叉列表

表8.13家庭收入、家庭規(guī)模與汽車保有量交叉分組頻數(shù)收入水平家庭規(guī)模4口以內(nèi)4口以上全部家庭1輛以內(nèi)1輛以上合計(jì)1輛以內(nèi)1輛以上合計(jì)1輛以內(nèi)1輛以上合計(jì)低高4496%2681%24%619%46100%32100%450%17%450%1393%8100%14100%4889%2759%611%1941%54100%46100%合計(jì)70878517227525100

81%及59%的含義。

79三向交叉列表表8.13家庭收入、家庭規(guī)模與汽車保三向交叉列表由上表可知在家庭規(guī)模一定的條件下,家庭收入對(duì)汽車保有量有一定的影響,但是無法確定家庭規(guī)模和家庭收入兩個(gè)變量中,哪個(gè)變量對(duì)汽車保有量的影響大。可從上表中取出局部雙向交叉進(jìn)行分析:80三向交叉列表由上表可知在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論