版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
復習串講2一、社會統(tǒng)計學知識體系的邏輯兩條線索:單變量到多變量描述到推論統(tǒng)計方法描述統(tǒng)計推論統(tǒng)計參數(shù)估計假設檢驗描述統(tǒng)計一、測量層次二、數(shù)據的組織與展示三、集中趨勢與離散趨勢4一、四種測量層次的數(shù)學特性定類測量定序測量定距測量定比測量類別區(qū)分(=、≠)√√√√次序區(qū)分(>、<)√√√距離區(qū)分(+、-)√√比例區(qū)分(×、÷)√二、數(shù)據的組織與展示(一)定類數(shù)據的組織與展示(二)定序數(shù)據的組織與展示(三)定距數(shù)據的組織與展示(一)定類數(shù)據的組織與展示定類:表:頻數(shù)分布表
圖:條形圖餅圖
對比條形圖
項目1998199920002001(一)優(yōu)撫對象補助金額國家支出集體供給(二)農村傳統(tǒng)救濟金額國家支出集體供給(三)城鄉(xiāng)各種福利院支出國家支出集體供給68.032.435.629.87.022.820.210.39.991.451.140.328.57.920.623.113.79.4
107.660.746.931.78.323.428.719.09.7
108.169.538.6
29.512.117.440.526.414.1合計118.0143.0168.0178.1蘇州科技學院7(二)定序數(shù)據的組織與展示表:累加頻次,簡寫為cf兩種形式:cf頻次從低到高向上累加(“小于該組上限的頻數(shù)和”)cf頻次從高到低向下累加(“大于該組下限的頻數(shù)和”)圖:條形圖累積頻數(shù)表(CF)向上累加——以變量數(shù)列首組的頻數(shù)為始點,逐個累計各組的頻數(shù),展示小于該組上限的頻數(shù)和。向下累加——以變量數(shù)列末組的頻數(shù)為始點,逐個累計各組的頻數(shù),展示大于該組下限的頻數(shù)和。受教育程度頻數(shù)百分比Cfcf初中高中、職高、技校大專大學本科研究生及以上1723786627524340.45.520.163.910.10.45.926.089.9100.0100.099.694.174.010.1總計4306100蘇州科技學院9(三)定距數(shù)據的組織與展示表:統(tǒng)計表組距、組數(shù)、組限圖:直方圖折線圖直方圖和條形圖的區(qū)別:條形圖的寬度無意義,用長度表示頻數(shù)或百分比;直方圖的寬度代表組距,面積代表頻數(shù)或百分比。直方圖的矩形是連續(xù)排列的,條形圖的矩形可以分開可以連續(xù)。三、集中趨勢與離散趨勢變量的測度離散程度集中趨勢眾數(shù)中位數(shù)均值方差和標準差四分位差異眾比率為了簡化資料,用眾值、中位值、均值來代表變量分布的集中趨勢;
但為了說明它們的所能代表集中趨勢的可靠程度,還需用變量的離散程度加以補充。(一)變量類型與集中趨勢測度值表
變量類型和所適用的集中趨勢測度值變量類型定類變量定序變量定距變量適用的測度值※眾數(shù)※中位數(shù)※均值—眾數(shù)眾數(shù)——中位數(shù)分布的形狀與
眾數(shù)、中位數(shù)和均值的關系對稱分布
均值=中位數(shù)=眾數(shù)左偏分布均值
中位數(shù)
眾數(shù)右偏分布眾數(shù)
中位數(shù)
均值高層次變量可以用低層次變量的測量方法但統(tǒng)計分析中,更多的是用均值。對于偏態(tài)的分布,應使用中位值作為集中趨勢。只有單峰和基本對稱的圖形,用均值作為集中趨勢才是合理的。1.眾數(shù)MO(概念要點)集中趨勢的測度值之一出現(xiàn)次數(shù)最多的變量值不受極端值的影響可能沒有眾數(shù)或有幾個眾數(shù)主要用于定類變量,也可用于定序變量和定距變量2.中位值(概念要點)集中趨勢的測度值之一排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于定序變量,也可用定距變量,但不能用于定類變量中位值的計算公式(計算公式)未分組數(shù)據的計算公式分組數(shù)據的計算公式P973.均值(概念要點)1. 集中趨勢的測度值之一2. 最常用的測度值3. 一組數(shù)據的均衡點所在4. 易受極端值的影響5.用于定距變量,不能用于定類變量和定序變量均值(計算公式)設一組數(shù)據為:X1,X2,…,XN簡單均值的計算公式為設分組后的數(shù)據為:X1,X2,…,XK(組中值)相應的頻數(shù)為:f1,f2,…,fi分組均值的計算公式為??===++++++=KiiKiiiNNNffXffffXfXfXX11212211LL&均值(數(shù)學性質)1. 各變量值與均值的離差之和等于零
2.各變量值與均值的離差平方和最小——最小平方的性質3、算術平均數(shù)受抽樣變動影響微小,通常它是總體資料集中趨勢的最佳度量;4、算術平均數(shù)受極端值的影響頗大,遇到這種情況時,就不宜用它代表集中趨勢了;5、分組資料如果遇到開放組距時,不經過特殊處理將無法得到算術平均數(shù),一般不建議計算;6、用于數(shù)值型數(shù)據,不能用于定類數(shù)據和定序數(shù)據;調和平均數(shù)1. 集中趨勢的測度值之一2. 均值的另一種表現(xiàn)形式3. 易受極端值的影響4. 用于定比數(shù)據5.計算公式為原來只是計算時使用了不同的數(shù)據!(二)變量類型與離散趨勢測度值表
變量類型和所適用的離散趨勢測度值變量類型定類變量定序變量定距變量適用的測度值※異眾比率※四分位差※方差或標準差—異眾比率異眾比率——四分位差高層次變量可以用低層次變量的測量方法離散趨勢數(shù)據分布的另一個重要特征如果個案之間的差異很大,則集中趨勢的代表性就會很低從另一個側面說明了集中趨勢測度值的代表程度不同類型的數(shù)據有不同的離散程度測度值1.定類數(shù)據:異眾比率1.離散程度的測度值之一2.又稱離異比率或者質異指數(shù)3.非眾數(shù)的頻數(shù)占總頻數(shù)的比率4. 計算公式為
5.用于衡量眾數(shù)的代表性;不屬于眾數(shù)的個案所占比例愈大,表示眾數(shù)的代表性愈小V=2.中位數(shù):四分位差、極差四分位差1. 上四分位數(shù)與下四分位數(shù)之差
Q
=Q75–Q252. 離散程度的測度值之一3. 反映了中間50%數(shù)據的離散程度4.不受極端值的影響5.用于衡量中位數(shù)的代表性(值越大,中位數(shù)的代表性越?。┧姆治恢担号判蚝筇幱?5%和75%位置上的值Q25Q50Q7525%25%25%25%Q1與Q3差異越大,表示有50%的個案越是遠離中位值,因此中位值的代表性就越差。定距數(shù)據:極差1.一組數(shù)據的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據的分布7891078910未分組數(shù)據R=max(Xi)-min(Xi).=組距分組數(shù)據R
最高組上限-最低組下限5.計算公式為定距數(shù)據:方差和標準差1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據的分布反映了各變量值與均值的平均差異,具體意義表示以均值作為代表值時會引起的偏差或者錯誤。根據總體數(shù)據計算的,稱為總體方差或標準差;根據樣本數(shù)據計算的,稱為樣本方差或標準差4681012X=8.3相對離勢:離散系數(shù)凡是用相對數(shù)來表達的變異指標,統(tǒng)稱為相對離勢,主要有異眾比率、標準差系數(shù)、平均差系數(shù)和一些偏態(tài)系數(shù);比較具有不同單位的資料的參差程度;比較單位雖然相同而均值不相同的資料的參差程度;要想實現(xiàn)計量單位不同或者平均水平不一的對象之間的直接比較:絕對離勢/平均指標=相對離勢;全距系數(shù)、標準差系數(shù)全距系數(shù):全距與其算術平均數(shù)之比標準差系數(shù):數(shù)據的標準差與算術平均數(shù)之比;用百分比表示。例題:根據10個人的身高和體重資料,計算出平均身高為172.0厘米,平均體重為70.0千克,身高的標準差為4.98厘米,體重的標準差為4.77千克,問:身高和體重的離散程度的大小?描述統(tǒng)計與推斷統(tǒng)計的關系反映客觀現(xiàn)象的數(shù)據總體內在的數(shù)量規(guī)律性推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進行估計和檢驗等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(統(tǒng)計數(shù)據的搜集、整理、顯示和分析等)總體數(shù)據樣本數(shù)據統(tǒng)計學探索現(xiàn)象數(shù)量規(guī)律性的過程抽樣分布:描述到推論的理論基礎(1)如果樣本相當大(n大于30,50),則抽樣分布接近正態(tài)分布;(2)抽樣分布的均值就是總體均值;(3)抽樣分布的標準差稱為標準誤差,是總體方差除以樣本大?。╪)的平方根;揚州大學32二、推論統(tǒng)計參數(shù)估計(parameter’sestimation)根據隨機樣本的統(tǒng)計值對總體之參數(shù)值進行邏輯:先看樣本情況,才問總體情況。類型:點估計參數(shù)估計假設檢驗
邏輯:先假設總體的情況,然后再抽樣和分析樣本的資料,進而驗證假設是否正確。類型:差異性檢驗、獨立性檢驗揚州大學33(一)參數(shù)估計點估計區(qū)間估計用一個數(shù)值來估計總體參數(shù)。用一個取值范圍(區(qū)間)來估計總體參數(shù)。揚州大學34大樣本總體均值區(qū)間估計的常用公式置信度為90%:置信度為95%:置信度為99%:統(tǒng)計量的選擇:z,t?分布,樣本容量,總體方差?總體服從正態(tài)分布,且總體方差(2)已知如果不是正態(tài)分布,可以由正態(tài)分布來近似(n≥30)使用正態(tài)分布統(tǒng)計量Z正態(tài),小樣本,總體方差δ2未知用t值估計(二)假設檢驗按總體的對象個數(shù)分:單總體兩總體多總體按總體的內容:均值成數(shù)方差是否相關1.一個總體的檢驗Z檢驗(一端與二端)t檢驗(一端與二端)Z檢驗(一端與二端)
2檢驗(一端與二端)均值一個總體比例方差單總體假設檢驗選擇統(tǒng)計量Z?
t
?
是正態(tài)分布還是非正態(tài)是大樣本還是小樣本總體方差已知還是未知2.兩個正態(tài)總體的參數(shù)檢驗兩個總體的檢驗Z
檢驗(大樣本)t
檢驗(小樣本)t
檢驗(小樣本)Z檢驗F
檢驗獨立樣本配對樣本均值比例方差一、兩個獨立樣本均值之差的檢驗(一)兩個總體均值之差的Z檢驗(12、22
已知)(二)兩個總體均值之差的Z檢驗
(12、22
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 劉胡蘭課件教學課件
- 廣東省韶關市曲江區(qū)2023-2024學年六年級上學期期末道德與法治模擬試題5
- 裝修防坑合同模板
- 青島勞動合同模板
- 青磚銷售合同模板
- 小暑的由來課件
- 租房合同模板公積金
- 鋁窗安裝合同模板
- 銷售綠化苗木合同模板
- 車位評估租賃合同模板
- 普通高考考生戶籍情況審查登記表
- 南京文化創(chuàng)意和設計服務與相關產業(yè)融合發(fā)展報告
- 社區(qū)工作者考試考前必背300題
- 2023年陜煤集團招聘筆試題庫及答案解析
- 清華大學2023年11月(高三)中學生標準學術能力診斷測試理綜生物試題
- 凸透鏡成像規(guī)律動畫可拖動最佳版swf
- 教育培訓記錄表(液化氣站)
- 外科學-第六十二章-脊柱、脊髓損傷課件
- 電力基礎知識匯總課件
- 大象版小學科學二年級上冊實驗報告單全冊
- 2020-2022學年部編版八年級語文古詩詞專項練習卷 部編人教版八年級上冊
評論
0/150
提交評論