數(shù)據(jù)組織和展示講義_第1頁(yè)
數(shù)據(jù)組織和展示講義_第2頁(yè)
數(shù)據(jù)組織和展示講義_第3頁(yè)
數(shù)據(jù)組織和展示講義_第4頁(yè)
數(shù)據(jù)組織和展示講義_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第三章 數(shù)據(jù)的組織與展示學(xué)習(xí)目標(biāo):1、了解數(shù)據(jù)的篩選與排序,掌握使用SPSS進(jìn)行數(shù)據(jù)的篩選與排序2、了解常用統(tǒng)計(jì)圖和統(tǒng)計(jì)表,明確不同統(tǒng)計(jì)圖和統(tǒng)計(jì)表適用的數(shù)據(jù)類型。3、能使用SPSS繪制統(tǒng)計(jì)圖表。統(tǒng)計(jì)數(shù)據(jù)的整理:是對(duì)統(tǒng)計(jì)數(shù)據(jù)的加工處理過(guò)程,以使統(tǒng)計(jì)數(shù)據(jù)系統(tǒng)化、條理化、符合統(tǒng)計(jì)分析的需要,它是收集數(shù)據(jù)與數(shù)據(jù)分析之間的必要環(huán)節(jié)。收集數(shù)據(jù)數(shù)據(jù)分析數(shù)據(jù)整理第一節(jié) 數(shù)據(jù)的整理 一、數(shù)據(jù)整理 數(shù)據(jù)整理是使用數(shù)據(jù)之前對(duì)數(shù)據(jù)進(jìn)行必要的處理,包括數(shù)據(jù)的審核、篩選和排序等。這樣可以保證數(shù)據(jù)的質(zhì)量,并且選擇符合研究要求的數(shù)據(jù),為數(shù)據(jù)的使用與分析打下堅(jiān)實(shí)的根底。一數(shù)據(jù)審核 數(shù)據(jù)審核是指從數(shù)據(jù)的完整性、準(zhǔn)確性、適用性及

2、時(shí)效性等方面對(duì)數(shù)據(jù)進(jìn)行檢查,保障數(shù)據(jù)質(zhì)量,為之后進(jìn)一步的分析打下根底。數(shù)據(jù)審核 數(shù)據(jù)篩選 數(shù)據(jù)排序1 2 3數(shù)據(jù) 完整、準(zhǔn)確、適用、時(shí)效完整性:數(shù)據(jù)是否完整、調(diào)查單位是否全面覆蓋、調(diào)查工程問(wèn)題是否全部答復(fù)。 總體不漏人,個(gè)體不漏項(xiàng)準(zhǔn)確性:數(shù)據(jù)是否真實(shí)、準(zhǔn)確,數(shù)據(jù)是否真實(shí)反映實(shí)際情況,數(shù)據(jù)是否有誤。適用性:審核數(shù)據(jù)的來(lái)源、口徑、背景等是否符合研究需要,假設(shè)不符合研究需要那么不應(yīng)該生搬硬套。時(shí)效性:審核數(shù)據(jù)是否滯后、是否具有研究意義。對(duì)于原始數(shù)據(jù),只需要從完整性和準(zhǔn)確性兩方面進(jìn)行審核。對(duì)于二手?jǐn)?shù)據(jù),不僅需要。還需要進(jìn)行適用性和時(shí)效性審核。二數(shù)據(jù)篩選 數(shù)據(jù)篩選是指將不符合要求的數(shù)據(jù)或者有明顯錯(cuò)誤的數(shù)

3、據(jù)剔除掉,或者將某些不符合研究需要的數(shù)據(jù)剔除掉,只留下符合需要的數(shù)據(jù)。數(shù)據(jù)經(jīng)過(guò)篩選后使其結(jié)果符合研究需要,為以后研究打下良好根底。 三數(shù)據(jù)排序 數(shù)據(jù)排序是指按照一定順序?qū)?shù)據(jù)進(jìn)行排列,為數(shù)據(jù)分組、分析數(shù)據(jù)提供方便。 不同數(shù)據(jù)的排序標(biāo)準(zhǔn)不同。對(duì)于分類數(shù)據(jù),排序方式多種多樣,可以按照字母順序進(jìn)行排序,如按姓氏首字母對(duì)姓名進(jìn)行排序,也可以按照姓氏筆畫進(jìn)行排序;而對(duì)于數(shù)值型數(shù)據(jù),那么只有遞增和遞減兩種排序方式,如按照收入從高到低對(duì)某類人進(jìn)行排序,也可以從低到高排序。二、數(shù)據(jù)分組 針對(duì)數(shù)值型數(shù)據(jù) 數(shù)據(jù)分組就是根據(jù)研究需要,按照某種標(biāo)準(zhǔn)將原始數(shù)據(jù)分為不同的組,分組后的數(shù)據(jù)叫做分組數(shù)據(jù)。包括單變量分組和組距

4、分組,其中組距分組又包括等距分組和不等距分組兩類。一單變量分組 在分組時(shí)將每一個(gè)變量作為一組。 只適合離散變量。例如,將婦女生育數(shù)0,1,2,3,4,5,6,7,8.分別分組。 二組距分組重點(diǎn)組距分組是指將全部變量值按照次序劃分為多個(gè)區(qū)間,每一區(qū)間里的值作為一組。組距分組適合連續(xù)變量且數(shù)據(jù)較多的情況。上限值:每一組最大的值下限值:每一組最小的值組距:上限值-下限值操作步驟:1、對(duì)數(shù)據(jù)進(jìn)行排序 2、確定分組數(shù)。K=1+lgn/lg2 其中n為數(shù)據(jù)總個(gè)數(shù) 3、確定組距。 組距=最大值-最小值/組數(shù)二組距分組原那么不重不漏:一個(gè)數(shù)據(jù)必須屬于且僅屬于一組,不能重復(fù)出現(xiàn),也不能遺漏。上限值不在組內(nèi):當(dāng)相

5、鄰兩組的上限值與下限值重疊時(shí),恰好等于某一組上限值的變量值不放在該組內(nèi),而放在下一組。當(dāng)存在極端值,使得最大值和最小值相差懸殊時(shí),我們可以將第一組改為“XX以下,或?qū)⒆詈笠唤M改為“XX以上,防止遺漏。三等距分組和不等距分組在分組時(shí),如果各組組距相等,那么稱為等距分組;如果各組組距不相等,那么稱為不等距分組。不等距分組eg:嬰幼兒組06歲 少年兒童組717歲 中青年組1859歲 老年人組60歲及以上三、應(yīng)用SPSS對(duì)數(shù)據(jù)進(jìn)行整理與分組1、排序 點(diǎn)擊DateSort Cases指定需要進(jìn)行排序的變量到Sort by 框中,同時(shí)在Sort Order中選擇是升序排列還是降序排列。 升序:Ascend

6、ing 降序:Descending三、應(yīng)用SPSS對(duì)數(shù)據(jù)進(jìn)行整理與分組2、篩選 點(diǎn)擊DateSelect Cases 然后選擇何種方式篩選個(gè)案。if condition is satisfied 是根據(jù)某特定條件選擇個(gè)案 random sample of case 是隨機(jī)選取個(gè)案然后指定未選中個(gè)案的處理方式。 filter out unselected cases 表示在那些未選中的個(gè)案號(hào)碼上做一個(gè)/標(biāo)記;delete unselected cases 表示刪除未選中的個(gè)案;copy selected to a new detaset 表示將選中的個(gè)案復(fù)制為一個(gè)新文件。三、應(yīng)用SPSS對(duì)數(shù)據(jù)進(jìn)

7、行整理與分組3、分組 相當(dāng)于變量的重新編碼。首先選中要賦值的變量,點(diǎn)擊箭頭進(jìn)入它右邊的空白框中。在Output Variable 下面的Name and Label 框中填寫要新生成的變量的名稱和標(biāo)簽,點(diǎn)擊change 按鈕,那么對(duì)中間的新舊變量名配對(duì),然后點(diǎn)擊Old and New Value 進(jìn)行變量的重新賦值,賦值完畢之后點(diǎn)擊OK即可。操作示范第二節(jié) 頻數(shù)分布表 一相關(guān)概念 1、頻數(shù) 頻數(shù)就是某個(gè)類別或某個(gè)小組中的數(shù)據(jù)個(gè)數(shù),也稱次數(shù)。例如根據(jù)測(cè)試成績(jī),將學(xué)生分為優(yōu)、良、及格、不及格四個(gè)組,如果18個(gè)同學(xué)為優(yōu),那么這組的頻數(shù)就是18。 2、頻率或比例 頻率就是一個(gè)總體或者樣本中,某一類別或

8、某一小組中數(shù)據(jù)個(gè)數(shù)即頻數(shù)占總數(shù)據(jù)個(gè)數(shù)的比重,也稱為比例。例如根據(jù)測(cè)試成績(jī),將100個(gè)學(xué)生分為優(yōu)、良、及格、不及格四個(gè)組,如果四個(gè)組人數(shù)分別為18、52、21、9,那么四個(gè)組的頻率分別為0.18、0.52、0.21、0.09。比例通常用于反響總體的構(gòu)成情況,一個(gè)數(shù)據(jù)中各局部比例之和為1。 第二節(jié) 頻數(shù)分布表 一相關(guān)概念 3、百分比 百分比就是一個(gè)總體中某一類別或某一小組中數(shù)據(jù)個(gè)數(shù)頻數(shù)占總體數(shù)據(jù)的比重乘以100,各個(gè)小組百分比之和為100,即頻率乘以100。它是將比照的基數(shù)抽象為100而計(jì)算出來(lái)的,用%號(hào)表示,數(shù)值表示每100個(gè)分母中包含多少個(gè)分子。上面例子中,優(yōu)、良、及格、不及格四個(gè)組的百分比分

9、別為18%、52%、21%、9%。 4、比率 比率就是各個(gè)不同類別或小組的數(shù)值之間的比值。例如,上面例子中,優(yōu)與良的比率為18/520.35。 頻數(shù)分布表頻數(shù)分布表是各類別及其對(duì)應(yīng)的頻數(shù)形成的分布。表 某專業(yè)一年級(jí)學(xué)生平均上網(wǎng)時(shí)間的頻數(shù)分布二、累積頻數(shù)和累積頻率 一相關(guān)概念 1、累積頻數(shù) 累積頻數(shù)就是將各類別或組的頻數(shù)逐級(jí)累加起來(lái),這樣可以很清楚的看出某一類別或組以上或以下的頻數(shù)之和。 2、累積頻率或累積百分比累積頻率就是將各類別或組的頻率逐級(jí)累加起來(lái),這樣可以很清楚的看出某一類別或組以上或以下的頻率之和。二、累積頻數(shù)和累積頻率 二累積方法 1、向上累積 從開始一方向最后一方逐級(jí)累加,從最小值

10、開始向最大值方向逐級(jí)累加 2、累積頻率或累積百分比 從最后一方向開始一方逐級(jí)累加,從最大值開始向最小值方向逐級(jí)累加小大舉例說(shuō)明三、利用SPSS制作頻數(shù)分布表 具體步驟:AnalyzeDescriptive StatisticsFrequenciesFrequency tables就可輸出頻數(shù)分布表。第三節(jié) 統(tǒng)計(jì)圖 一、條形圖bar chart 用寬度相同的條形的高度或者長(zhǎng)度來(lái)表示數(shù)據(jù)多少的圖形。適合定類數(shù)據(jù)、定序數(shù)據(jù)或者數(shù)值型數(shù)據(jù)ouke第三節(jié) 統(tǒng)計(jì)圖 二、餅圖pie chart 用圓形以及圓內(nèi)扇形的角度來(lái)表示數(shù)值大小。 主要反映總體的構(gòu)成問(wèn)題第三節(jié) 統(tǒng)計(jì)圖 三、環(huán)形圖annual chart

11、 空心圓 它用環(huán)上的一段來(lái)表示總體或者樣本中的各局部數(shù)據(jù)餅圖與環(huán)形圖的區(qū)別1、餅圖是實(shí)心圓,是用圓內(nèi)扇形的角度來(lái)表示總體或者樣本中的某一局部。 環(huán)形圖中間有一個(gè)洞,是空心圓,是用環(huán)形上的一段來(lái)表示總體或者樣本中的某一局部。2、餅圖每次只能顯示一個(gè)總體或者樣本中各局部所占的比例。 環(huán)形圖那么可以同時(shí)顯示多個(gè)總體或樣本中各局部的比例,更有利于進(jìn)行比較研究。3、餅圖和環(huán)形圖更適用于結(jié)構(gòu)分析,環(huán)形圖更適用于多個(gè)總體或樣本數(shù)據(jù)的展示。第三節(jié) 統(tǒng)計(jì)圖 四、直方圖histogram 用矩形的寬度和高度來(lái)表示頻數(shù)分布。即用矩形的面積表示頻數(shù)的分布。直方圖與條形圖的區(qū)別第三節(jié) 統(tǒng)計(jì)圖 五、折線圖frequency polygon 以直方圖為根底,把直方圖頂部的中點(diǎn)用直線依次連接起來(lái),然后把原來(lái)的直方圖抹掉后得到的圖形。第三節(jié) 統(tǒng)計(jì)圖 六、線圖line plot 在平面直角坐標(biāo)系中用折線表示數(shù)量隨著時(shí)間而變化的趨勢(shì)和特征的圖形。適用于時(shí)間序列數(shù)據(jù),即數(shù)據(jù)是在不同時(shí)點(diǎn)上取得的。 具體步驟:AnalyzeDesc

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論