




已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第10章 定量資料整理(2學(xué)時(shí))當(dāng)我們運(yùn)用前述的各種方法收集到一批數(shù)據(jù)資料后,接下來(lái)的任務(wù)就是要對(duì)這些資料進(jìn)行統(tǒng)計(jì)分析。在這一章中,我們將按定量資料分析的程序,對(duì)原始數(shù)據(jù)的整理、錄人,以及單變量分析、雙變量統(tǒng)計(jì)表格的制作做簡(jiǎn)要的介紹。第一節(jié) 資料的整理與錄入 、資料的審核 資料的審核是資料處理的第一步工作。它是指研究者對(duì)所收集的原始資料(主要是問(wèn)卷)進(jìn)行初步的審閱,校正錯(cuò)填、誤填的答案,剔出亂填、空白和嚴(yán)重缺答的廢卷。其目的是使得原始資料具有較好的準(zhǔn)確性、完整性和真實(shí)性,從而為后續(xù)資料整理錄人與統(tǒng)計(jì)分析工作打下較好的基礎(chǔ)。 資料的審核工作包含兩方面的內(nèi)容:一是檢查出問(wèn)卷資料中的問(wèn)題;二是重新向被調(diào)查者核實(shí)。 二、資料的編碼 在前面介紹問(wèn)卷設(shè)計(jì)時(shí),我們?cè)赋?,編碼就是給每個(gè)問(wèn)題及答案一個(gè)數(shù)字作為它的代碼。從資料處理的角度看,編碼就是用阿拉伯?dāng)?shù)字來(lái)代替問(wèn)卷中每一個(gè)問(wèn)題的回答,或者說(shuō)是將問(wèn)卷中的答案轉(zhuǎn)換成數(shù)字的過(guò)程。表10一l就是一份問(wèn)卷中前幾個(gè)問(wèn)題的答案和編碼。表101 資料轉(zhuǎn)換示例 轉(zhuǎn)換成的數(shù)字(編碼)A1 你的性別: 男 女 1A2 你的年齡:_28_周歲 28A3 你的文化程度: 小學(xué)及以下 初中 高中及中專 大專以上 3A4 你的婚姻狀況未婚 已婚 離婚 喪偶 其他 2 表格式問(wèn)題的答案進(jìn)行轉(zhuǎn)換時(shí)還要特別注意它的方向性,比如(見(jiàn)表102)。表102 對(duì)婚事花費(fèi)態(tài)度的調(diào)查 在每一行所在選項(xiàng)下打“”非常同意同意無(wú)所謂不同意很不同意1、婚事應(yīng)該盡量辦的簡(jiǎn)單一些2、結(jié)婚式人生大事,應(yīng)該辦的隆重?zé)狒[,花再多錢(qián)也值得3、就是有錢(qián),婚事也不應(yīng)該大操大辦 對(duì)于贊同節(jié)儉辦婚事的看法,我們按1非常問(wèn)意,2同意,3無(wú)所謂,4不同意,5很不同意來(lái)賦值;而對(duì)贊同婚事大操大辦的看法,我們則按5非常同意,4同意,3無(wú)所謂,2不同意,1很不同意來(lái)賦值。這樣上例三種看法的賦值情況如表103。表103 三種看法的賦值非常同意同意無(wú)所謂不同意很不同意看法112345看法254321看法312345 所以,對(duì)于這個(gè)回答者的答案,我們應(yīng)該將其轉(zhuǎn)換為:2、2、1。 每一個(gè)回答者在這一量表上的三個(gè)得分(每行一個(gè)答案所對(duì)應(yīng)的碼值)加起來(lái),就構(gòu)成他對(duì)婚事操辦方式的態(tài)度得分。按我們上述賦值方式,則一個(gè)回答者在該量表上的得分越高,表明他的態(tài)度越傾向干婚事大操大辦。 在對(duì)問(wèn)卷中的問(wèn)題進(jìn)行編碼時(shí),要給不同的問(wèn)題分配合適的欄碼,即指定該問(wèn)題的編碼值在整個(gè)數(shù)據(jù)文件中所處的位置。這種欄碼有時(shí)在問(wèn)卷設(shè)計(jì)時(shí)就印在問(wèn)卷上(每頁(yè)的右邊,用一條豎線與問(wèn)題及答案隔開(kāi)),但也有很多情況下是在問(wèn)卷收回后編碼時(shí)再指定。欄碼的指定方法是從問(wèn)卷的第一個(gè)項(xiàng)目或問(wèn)題開(kāi)始,先根據(jù)每一個(gè)項(xiàng)目或問(wèn)題答案數(shù)碼的位數(shù),束確定該項(xiàng)日或問(wèn)題所占有的寬度,再根據(jù)的后順序來(lái)確定其在整個(gè)數(shù)據(jù)排列中所處的位置,這樣從頭依次往后排列。表104就是指定欄碼的一個(gè)例子。表104 編碼制定例 寬度 欄碼A1 你的性別: 男 女 1 1A2 你的年齡:_周歲 2 23A3 你的文化程度: 1 4小學(xué)及以下 初中 高中及中專 大專以上 A4 你的婚姻狀況未婚 已婚 離婚 喪偶 其他 1 5 第一個(gè)問(wèn)題的答案代碼只有1和2,是一位數(shù),故寬度為1。因是第一個(gè)問(wèn)題,故序號(hào)為1。第二個(gè)問(wèn)題是“年齡”,一般情況下,人們的年齡不會(huì)超過(guò)100歲,是2位數(shù),寬度為2,接上題序號(hào),給定欄碼23號(hào),第三與第四個(gè)問(wèn)題的答案均為一位數(shù),故按順序分別給予4號(hào)和5號(hào)。需要說(shuō)明的是,在給年齡、工資收入、時(shí)間、人數(shù)等定距變量分配欄碼時(shí),一定要根據(jù)實(shí)際情況,確定合適的寬度。 三、數(shù)據(jù)錄入 數(shù)據(jù)錄入的方式主要有兩種:一是直接從問(wèn)卷上將編好碼的數(shù)據(jù)輸入計(jì)算機(jī);另一種是先將問(wèn)卷上編好碼的數(shù)據(jù)轉(zhuǎn)錄到專門(mén)的登錄表上,然后再?gòu)牡卿洷砩蠈?shù)據(jù)輸入計(jì)算機(jī)。登錄表的橫欄為問(wèn)題及變量名,且都有給定的欄碼,縱欄為個(gè)案記錄,表106就是登錄表的一部分。表106 數(shù)據(jù)登錄表(部分)城區(qū)個(gè)案號(hào)A1A2A3A4A5A6A7125678910111214個(gè)案12038723832211個(gè)案24044124123410個(gè)案33102415025221個(gè)案46003612837100 四、數(shù)據(jù)清理 1有效范圍清理 對(duì)于問(wèn)卷中的任何一個(gè)變量來(lái)說(shuō),它的有效的編碼值往往都有某種范圍,而當(dāng)數(shù)據(jù)中的數(shù)字超出了這一范圍時(shí),可以肯定這個(gè)數(shù)字一定是錯(cuò)誤的。比如,如果在數(shù)據(jù)文件的“性別”這一變量欄中,出現(xiàn)了數(shù)字5或者7、8等,我們馬上可以判定這是錯(cuò)誤的編碼值。因?yàn)楦鶕?jù)編碼手冊(cè)中的規(guī)定,“性別”這一變量的隕值是1男,2女,0無(wú)回答。凡是超出這三者范圍的其他的編碼值,都肯定是錯(cuò)誤的。要檢查出所有不符合要求的編碼值,我們只需在計(jì)算機(jī)上,用spss軟件(或其他軟件)執(zhí)行一條統(tǒng)計(jì)各變量頗數(shù)分布的命令。計(jì)算機(jī)很快就能給出下述形式的結(jié)果:A5 Valid CumValue Label Value Frequency Percent Percent Percent 1 316 31.4 31.5 31.5 2 428 42.5 42.6 74.1 3 121 12.0 12.1 86.2 4 128 12.7 12.7 98.9 7 9 0.9 0.9 99.8 7 2 0.2 0.2 100.0 0 3 0.3 Missing Total 1007 100.0 100.0 Valid cases 1004 Missing cases 3 2邏輯一致性清理邏輯一致性清理則是從另一種角度來(lái)查找數(shù)據(jù)中所存在的問(wèn)題。它比有效范圍清理要稍微復(fù)雜一些。其基本思路是依據(jù)問(wèn)卷中的問(wèn)題相互之間所存在的某種內(nèi)在的邏輯聯(lián)系,來(lái)檢查前后數(shù)據(jù)之間的合理性要查找和清理有著上述錯(cuò)誤的個(gè)案,需要在SPSS軟件中,執(zhí)行條件選擇命令(IF)。比如,先用IF命令將所有回答“沒(méi)有孩子”的個(gè)案挑出來(lái),單獨(dú)做頻數(shù)統(tǒng)計(jì);再按前述有效范圍清理的方法,找到那些在“孩子的年齡”變量上編碼值不為零的個(gè)案;同樣地,先用IF命令將未婚者挑出來(lái),單獨(dú)做頻數(shù)統(tǒng)計(jì);然后找到那些在變量子女?dāng)?shù)日或者子女年齡上,出現(xiàn)有非零編碼值的個(gè)案。再根據(jù)這些個(gè)案的編號(hào)找來(lái)原始問(wèn)卷進(jìn)行核對(duì),糾正錯(cuò)誤。邏輯一致性清理還可以采取SPSS中構(gòu)成新變量的命令(即compute命令)來(lái)進(jìn)行。讀者可參考有關(guān)SPSS統(tǒng)計(jì)分析的著作。3數(shù)據(jù)質(zhì)量抽查盡管采取了上述兩種方法對(duì)數(shù)據(jù)進(jìn)行清理,但仍會(huì)有一些錯(cuò)誤的數(shù)據(jù)無(wú)法查出來(lái)。人們往往采用隨機(jī)抽樣的方法,從樣本的全部個(gè)案中,抽取部分個(gè)案,進(jìn)行這種形式的校對(duì)工作。用這一部分個(gè)案校對(duì)的結(jié)果,來(lái)估計(jì)和評(píng)價(jià)全部數(shù)據(jù)的質(zhì)量。第二節(jié) 統(tǒng)計(jì)表的制作一、統(tǒng)計(jì)表的構(gòu)成與制作 1、統(tǒng)計(jì)表的構(gòu)成從統(tǒng)計(jì)表的結(jié)構(gòu)上看,通常都由表號(hào)、總標(biāo)題、橫行標(biāo)題、縱欄標(biāo)題、數(shù)字注釋和資料來(lái)源等要素組成。表號(hào)式表的序號(hào),位于表頂端的左角。其作用是便于指示和查找??倶?biāo)題是表的名稱。作用是簡(jiǎn)要說(shuō)明表中資料的內(nèi)容,指明資料的時(shí)間與空間范圍等。橫行標(biāo)題是橫行的名稱,對(duì)于頻數(shù)統(tǒng)計(jì)表來(lái)說(shuō),一般用來(lái)統(tǒng)計(jì)所要說(shuō)明的主題;而對(duì)于交互分類統(tǒng)計(jì)表來(lái)說(shuō),它也是表示其中一個(gè)變量的類別。數(shù)字是統(tǒng)計(jì)表的實(shí)質(zhì)性內(nèi)容,是對(duì)調(diào)查資料進(jìn)行統(tǒng)計(jì)匯總、整理和計(jì)算的結(jié)果體現(xiàn)。注釋或資料來(lái)源是對(duì)表中資料的一種說(shuō)明。表107、表108是一般統(tǒng)計(jì)表的兩個(gè)例子。 表號(hào) 總標(biāo)題表107 1990年全國(guó)城鄉(xiāng)人口及其比重人口數(shù)(億)比重() 縱欄標(biāo)題市2.1118.69橫行標(biāo)題鎮(zhèn)0.857.54 數(shù)字鄉(xiāng)8.3473.77合計(jì)11.30100.0 資料來(lái)源:中國(guó)人口統(tǒng)計(jì)年鑒(1991年).北京:中國(guó)統(tǒng)計(jì)出版社,1992.14注釋和資料來(lái)源 表號(hào) 總標(biāo)題表108 年齡與生育意愿交互分類()青 年35歲以下中年3655歲老年56歲及以上 縱欄標(biāo)題不生510橫行標(biāo)題生一個(gè)6053 生兩個(gè)358577 數(shù)字三個(gè)以上0920(n)(100)(100)(100)2、統(tǒng)計(jì)表的制作統(tǒng)計(jì)表的制作原則是:科學(xué)、規(guī)范、簡(jiǎn)明、實(shí)用、美觀。具體的說(shuō),在制作統(tǒng)計(jì)表時(shí),應(yīng)注意以下幾個(gè)方面:首先,表的標(biāo)題要簡(jiǎn)短明了,要能確切說(shuō)明表中數(shù)據(jù)的內(nèi)容,使人一目了然。其次,表的縱欄標(biāo)題與橫行標(biāo)題要準(zhǔn)確反映變量取值的含義,他們的排列順序也應(yīng)具有一定的邏輯性。第三,表中的數(shù)據(jù)資料必須注明計(jì)量單位。第四,對(duì)于一般的頻數(shù)分布表,則應(yīng)列出合計(jì)欄,一邊獲得整體情況的資料。最后,各種表格均應(yīng)以橫線為主,能夠不用豎線的盡量不用。表109 1990年全國(guó)城鄉(xiāng)人口及其比重人口數(shù)(億)比重()市2.1118.69鎮(zhèn)0.857.54鄉(xiāng)8.3473.77合計(jì)11.30100.0表1010 住戶人口密度與婆媳沖突間的關(guān)系()婆媳沖突住 戶 密 度高中低高54.819.67.1中26.253.950.0低19.026.542.9(n)(42)(102)(56)G=+0.463 Z=3.346 p0.001(一端檢定)二、單變量統(tǒng)計(jì)表單變量統(tǒng)計(jì)表的制作要求,我們剛才已經(jīng)介紹了,為了加深印象,在這里再舉個(gè)例子。例:?jiǎn)巫兞繂伪恚ㄔ谝粋€(gè)企業(yè)進(jìn)行的調(diào)查,對(duì)調(diào)查對(duì)象年齡的描述)在被調(diào)查者中,青年和中年人占了絕大多數(shù),約占總體比率的95.6%;其中又以3039歲的人最多,其人數(shù)比率接近一半;4049歲和1829歲的被調(diào)查者人數(shù)比率接近,在25%左右;而調(diào)查對(duì)象在50歲以上的人非常少,這說(shuō)明本單位職工的年齡結(jié)構(gòu)比較合理。表1011 調(diào)查對(duì)象的年齡構(gòu)成 N=431頻數(shù)(人)有效百分比(%)1829歲1062463039歲1934484049歲1132625059歲184260歲及以上102 三、雙變量統(tǒng)計(jì)表1、交互分類表的形式要求雙變量統(tǒng)計(jì)表格叫交互分類表,也叫列聯(lián)表,我們?cè)谇懊媾e過(guò)一個(gè)例子,見(jiàn)表1010。它的形式要求主要有7點(diǎn):(1)每個(gè)表的頂端要有表號(hào)和標(biāo)題。(2)表格中的線條一定要規(guī)范、簡(jiǎn)潔,最好不用豎線。(3)表中的百分比符號(hào)有兩種簡(jiǎn)便處理的方法:一種是在表頂端的右角,也即是標(biāo)題的盡頭出,標(biāo)上一個(gè)“()”符號(hào)(見(jiàn)表1010),它表示此表中的數(shù)字都是百分比;另一種方式是在表中每一縱欄數(shù)字的頭上(也就是上方變量的每個(gè)取值下面)寫(xiě)上一個(gè)“”,這樣就可以省去在表中每一個(gè)數(shù)字后都標(biāo)上一個(gè)“”的麻煩。(4)在表的下端用括號(hào)標(biāo)出每一縱欄所對(duì)應(yīng)的頻數(shù),以指示每一欄百分比所具有的基礎(chǔ)(個(gè)案的多少),同時(shí)也可供讀者據(jù)此計(jì)算每一類別中的個(gè)案數(shù)目。(5)表內(nèi)百分比通常保留一位小數(shù)。對(duì)那些整數(shù)形式的百分比,仍要在后面寫(xiě)出0。(6)對(duì)交互分類的兩個(gè)變量的安排,通常是將自變量、或被看作自變量的、或用來(lái)做解釋的那個(gè)變量放在上層,而將因變量、或被看作因變量的、或被解釋的那個(gè)變量放在表的左側(cè)。表中百分比的方向一般情況下是按自變量的方向,即縱欄方向。(7)交互分類的兩個(gè)變量的變量值應(yīng)有所限制,特別是不能同時(shí)具有多個(gè)變量值。2、交互分類表舉例例(對(duì)某企業(yè)關(guān)于改制的調(diào)查),自變量:年齡,因變量:“改制是大勢(shì)所趨”觀念:經(jīng)過(guò)分析,可以看出年齡與職工對(duì)“改制是大勢(shì)所趨”觀念的認(rèn)知相關(guān)。1829歲的人中,有90.4%的人贊成這個(gè)觀點(diǎn);3039歲的人有72.2%的人贊成;4049歲的人有66%的人贊成;50歲及以上的被調(diào)查者由于人數(shù)較少
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 服裝設(shè)計(jì)師與時(shí)尚公司長(zhǎng)期合作協(xié)議
- 智能門(mén)鎖集成安裝與定期檢修服務(wù)協(xié)議
- 灘涂貝類養(yǎng)殖權(quán)委托經(jīng)營(yíng)管理全面合作協(xié)議
- 康養(yǎng)中心護(hù)理服務(wù)委托專業(yè)運(yùn)營(yíng)協(xié)議
- 跨界腦機(jī)接口技術(shù)研發(fā)與市場(chǎng)推廣合作協(xié)議
- 留學(xué)中介服務(wù)及海外院校錄取通知書(shū)獲取及簽證申請(qǐng)輔導(dǎo)及生活適應(yīng)輔導(dǎo)協(xié)議
- 耕地流轉(zhuǎn)規(guī)?;N植項(xiàng)目委托管理合同
- 班組長(zhǎng)現(xiàn)場(chǎng)管理
- 全身人物繪畫(huà)美術(shù)課件
- 癱瘓人員護(hù)理要點(diǎn)與規(guī)范
- 小班語(yǔ)言《水珠寶寶》課件
- 加油站職業(yè)危害防治計(jì)劃和實(shí)施方案
- 路面彎沉溫度修正系數(shù)
- 山東省濟(jì)南市槐蔭區(qū)2024屆中考聯(lián)考化學(xué)試題含解析
- (完整版)xx中學(xué)“雙積雙評(píng)”積分入團(tuán)實(shí)施方案
- 拖拉機(jī)和聯(lián)合收割機(jī)安全技術(shù)檢驗(yàn)合格證明
- 文化產(chǎn)業(yè)政策與法規(guī)
- 第四講嬰幼兒情緒情感及社會(huì)功能的發(fā)育
- (完整word版)餐券模板
- 平野蒼流:打漁張引黃灌區(qū)開(kāi)灌60周年紀(jì)念專輯
- 電梯安全風(fēng)險(xiǎn)管控清單
評(píng)論
0/150
提交評(píng)論