版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
復(fù)習(xí)串講2一、社會(huì)統(tǒng)計(jì)學(xué)知識(shí)體系的邏輯兩條線索:?jiǎn)巫兞康蕉嘧兞棵枋龅酵普摻y(tǒng)計(jì)方法描述統(tǒng)計(jì)推論統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)描述統(tǒng)計(jì)一、測(cè)量層次二、數(shù)據(jù)的組織與展示三、集中趨勢(shì)與離散趨勢(shì)4一、四種測(cè)量層次的數(shù)學(xué)特性定類測(cè)量定序測(cè)量定距測(cè)量定比測(cè)量類別區(qū)分(=、≠)√√√√次序區(qū)分(>、<)√√√距離區(qū)分(+、-)√√比例區(qū)分(×、÷)√二、數(shù)據(jù)的組織與展示(一)定類數(shù)據(jù)的組織與展示(二)定序數(shù)據(jù)的組織與展示(三)定距數(shù)據(jù)的組織與展示(一)定類數(shù)據(jù)的組織與展示定類:表:頻數(shù)分布表
圖:條形圖餅圖
對(duì)比條形圖
項(xiàng)目1998199920002001(一)優(yōu)撫對(duì)象補(bǔ)助金額國(guó)家支出集體供給(二)農(nóng)村傳統(tǒng)救濟(jì)金額國(guó)家支出集體供給(三)城鄉(xiāng)各種福利院支出國(guó)家支出集體供給68.032.435.629.87.022.820.210.39.991.451.140.328.57.920.623.113.79.4
107.660.746.931.78.323.428.719.09.7
108.169.538.6
29.512.117.440.526.414.1合計(jì)118.0143.0168.0178.1蘇州科技學(xué)院7(二)定序數(shù)據(jù)的組織與展示表:累加頻次,簡(jiǎn)寫為cf兩種形式:cf頻次從低到高向上累加(“小于該組上限的頻數(shù)和”)cf頻次從高到低向下累加(“大于該組下限的頻數(shù)和”)圖:條形圖累積頻數(shù)表(CF)向上累加——以變量數(shù)列首組的頻數(shù)為始點(diǎn),逐個(gè)累計(jì)各組的頻數(shù),展示小于該組上限的頻數(shù)和。向下累加——以變量數(shù)列末組的頻數(shù)為始點(diǎn),逐個(gè)累計(jì)各組的頻數(shù),展示大于該組下限的頻數(shù)和。受教育程度頻數(shù)百分比Cfcf初中高中、職高、技校大專大學(xué)本科研究生及以上1723786627524340.45.520.163.910.10.45.926.089.9100.0100.099.694.174.010.1總計(jì)4306100蘇州科技學(xué)院9(三)定距數(shù)據(jù)的組織與展示表:統(tǒng)計(jì)表組距、組數(shù)、組限圖:直方圖折線圖直方圖和條形圖的區(qū)別:條形圖的寬度無意義,用長(zhǎng)度表示頻數(shù)或百分比;直方圖的寬度代表組距,面積代表頻數(shù)或百分比。直方圖的矩形是連續(xù)排列的,條形圖的矩形可以分開可以連續(xù)。三、集中趨勢(shì)與離散趨勢(shì)變量的測(cè)度離散程度集中趨勢(shì)眾數(shù)中位數(shù)均值方差和標(biāo)準(zhǔn)差四分位差異眾比率為了簡(jiǎn)化資料,用眾值、中位值、均值來代表變量分布的集中趨勢(shì);
但為了說明它們的所能代表集中趨勢(shì)的可靠程度,還需用變量的離散程度加以補(bǔ)充。(一)變量類型與集中趨勢(shì)測(cè)度值表
變量類型和所適用的集中趨勢(shì)測(cè)度值變量類型定類變量定序變量定距變量適用的測(cè)度值※眾數(shù)※中位數(shù)※均值—眾數(shù)眾數(shù)——中位數(shù)分布的形狀與
眾數(shù)、中位數(shù)和均值的關(guān)系對(duì)稱分布
均值=中位數(shù)=眾數(shù)左偏分布均值
中位數(shù)
眾數(shù)右偏分布眾數(shù)
中位數(shù)
均值高層次變量可以用低層次變量的測(cè)量方法但統(tǒng)計(jì)分析中,更多的是用均值。對(duì)于偏態(tài)的分布,應(yīng)使用中位值作為集中趨勢(shì)。只有單峰和基本對(duì)稱的圖形,用均值作為集中趨勢(shì)才是合理的。1.眾數(shù)MO(概念要點(diǎn))集中趨勢(shì)的測(cè)度值之一出現(xiàn)次數(shù)最多的變量值不受極端值的影響可能沒有眾數(shù)或有幾個(gè)眾數(shù)主要用于定類變量,也可用于定序變量和定距變量2.中位值(概念要點(diǎn))集中趨勢(shì)的測(cè)度值之一排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于定序變量,也可用定距變量,但不能用于定類變量中位值的計(jì)算公式(計(jì)算公式)未分組數(shù)據(jù)的計(jì)算公式分組數(shù)據(jù)的計(jì)算公式P973.均值(概念要點(diǎn))1. 集中趨勢(shì)的測(cè)度值之一2. 最常用的測(cè)度值3. 一組數(shù)據(jù)的均衡點(diǎn)所在4. 易受極端值的影響5.用于定距變量,不能用于定類變量和定序變量均值(計(jì)算公式)設(shè)一組數(shù)據(jù)為:X1,X2,…,XN簡(jiǎn)單均值的計(jì)算公式為設(shè)分組后的數(shù)據(jù)為:X1,X2,…,XK(組中值)相應(yīng)的頻數(shù)為:f1,f2,…,fi分組均值的計(jì)算公式為??===++++++=KiiKiiiNNNffXffffXfXfXX11212211LL&均值(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零
2.各變量值與均值的離差平方和最小——最小平方的性質(zhì)3、算術(shù)平均數(shù)受抽樣變動(dòng)影響微小,通常它是總體資料集中趨勢(shì)的最佳度量;4、算術(shù)平均數(shù)受極端值的影響頗大,遇到這種情況時(shí),就不宜用它代表集中趨勢(shì)了;5、分組資料如果遇到開放組距時(shí),不經(jīng)過特殊處理將無法得到算術(shù)平均數(shù),一般不建議計(jì)算;6、用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù);調(diào)和平均數(shù)1. 集中趨勢(shì)的測(cè)度值之一2. 均值的另一種表現(xiàn)形式3. 易受極端值的影響4. 用于定比數(shù)據(jù)5.計(jì)算公式為原來只是計(jì)算時(shí)使用了不同的數(shù)據(jù)!(二)變量類型與離散趨勢(shì)測(cè)度值表
變量類型和所適用的離散趨勢(shì)測(cè)度值變量類型定類變量定序變量定距變量適用的測(cè)度值※異眾比率※四分位差※方差或標(biāo)準(zhǔn)差—異眾比率異眾比率——四分位差高層次變量可以用低層次變量的測(cè)量方法離散趨勢(shì)數(shù)據(jù)分布的另一個(gè)重要特征如果個(gè)案之間的差異很大,則集中趨勢(shì)的代表性就會(huì)很低從另一個(gè)側(cè)面說明了集中趨勢(shì)測(cè)度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值1.定類數(shù)據(jù):異眾比率1.離散程度的測(cè)度值之一2.又稱離異比率或者質(zhì)異指數(shù)3.非眾數(shù)的頻數(shù)占總頻數(shù)的比率4. 計(jì)算公式為
5.用于衡量眾數(shù)的代表性;不屬于眾數(shù)的個(gè)案所占比例愈大,表示眾數(shù)的代表性愈小V=2.中位數(shù):四分位差、極差四分位差1. 上四分位數(shù)與下四分位數(shù)之差
Q
=Q75–Q252. 離散程度的測(cè)度值之一3. 反映了中間50%數(shù)據(jù)的離散程度4.不受極端值的影響5.用于衡量中位數(shù)的代表性(值越大,中位數(shù)的代表性越?。┧姆治恢担号判蚝筇幱?5%和75%位置上的值Q25Q50Q7525%25%25%25%Q1與Q3差異越大,表示有50%的個(gè)案越是遠(yuǎn)離中位值,因此中位值的代表性就越差。定距數(shù)據(jù):極差1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡(jiǎn)單測(cè)度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布7891078910未分組數(shù)據(jù)R=max(Xi)-min(Xi).=組距分組數(shù)據(jù)R
最高組上限-最低組下限5.計(jì)算公式為定距數(shù)據(jù):方差和標(biāo)準(zhǔn)差1. 離散程度的測(cè)度值之一2. 最常用的測(cè)度值3. 反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異,具體意義表示以均值作為代表值時(shí)會(huì)引起的偏差或者錯(cuò)誤。根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差4681012X=8.3相對(duì)離勢(shì):離散系數(shù)凡是用相對(duì)數(shù)來表達(dá)的變異指標(biāo),統(tǒng)稱為相對(duì)離勢(shì),主要有異眾比率、標(biāo)準(zhǔn)差系數(shù)、平均差系數(shù)和一些偏態(tài)系數(shù);比較具有不同單位的資料的參差程度;比較單位雖然相同而均值不相同的資料的參差程度;要想實(shí)現(xiàn)計(jì)量單位不同或者平均水平不一的對(duì)象之間的直接比較:絕對(duì)離勢(shì)/平均指標(biāo)=相對(duì)離勢(shì);全距系數(shù)、標(biāo)準(zhǔn)差系數(shù)全距系數(shù):全距與其算術(shù)平均數(shù)之比標(biāo)準(zhǔn)差系數(shù):數(shù)據(jù)的標(biāo)準(zhǔn)差與算術(shù)平均數(shù)之比;用百分比表示。例題:根據(jù)10個(gè)人的身高和體重資料,計(jì)算出平均身高為172.0厘米,平均體重為70.0千克,身高的標(biāo)準(zhǔn)差為4.98厘米,體重的標(biāo)準(zhǔn)差為4.77千克,問:身高和體重的離散程度的大?。棵枋鼋y(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系反映客觀現(xiàn)象的數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(jì)(利用樣本信息和概率論對(duì)總體的數(shù)量特征進(jìn)行估計(jì)和檢驗(yàn)等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(jì)(統(tǒng)計(jì)數(shù)據(jù)的搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計(jì)學(xué)探索現(xiàn)象數(shù)量規(guī)律性的過程抽樣分布:描述到推論的理論基礎(chǔ)(1)如果樣本相當(dāng)大(n大于30,50),則抽樣分布接近正態(tài)分布;(2)抽樣分布的均值就是總體均值;(3)抽樣分布的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤差,是總體方差除以樣本大?。╪)的平方根;揚(yáng)州大學(xué)32二、推論統(tǒng)計(jì)參數(shù)估計(jì)(parameter’sestimation)根據(jù)隨機(jī)樣本的統(tǒng)計(jì)值對(duì)總體之參數(shù)值進(jìn)行邏輯:先看樣本情況,才問總體情況。類型:點(diǎn)估計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)
邏輯:先假設(shè)總體的情況,然后再抽樣和分析樣本的資料,進(jìn)而驗(yàn)證假設(shè)是否正確。類型:差異性檢驗(yàn)、獨(dú)立性檢驗(yàn)揚(yáng)州大學(xué)33(一)參數(shù)估計(jì)點(diǎn)估計(jì)區(qū)間估計(jì)用一個(gè)數(shù)值來估計(jì)總體參數(shù)。用一個(gè)取值范圍(區(qū)間)來估計(jì)總體參數(shù)。揚(yáng)州大學(xué)34大樣本總體均值區(qū)間估計(jì)的常用公式置信度為90%:置信度為95%:置信度為99%:統(tǒng)計(jì)量的選擇:z,t?分布,樣本容量,總體方差?總體服從正態(tài)分布,且總體方差(2)已知如果不是正態(tài)分布,可以由正態(tài)分布來近似(n≥30)使用正態(tài)分布統(tǒng)計(jì)量Z正態(tài),小樣本,總體方差δ2未知用t值估計(jì)(二)假設(shè)檢驗(yàn)按總體的對(duì)象個(gè)數(shù)分:?jiǎn)慰傮w兩總體多總體按總體的內(nèi)容:均值成數(shù)方差是否相關(guān)1.一個(gè)總體的檢驗(yàn)Z檢驗(yàn)(一端與二端)t檢驗(yàn)(一端與二端)Z檢驗(yàn)(一端與二端)
2檢驗(yàn)(一端與二端)均值一個(gè)總體比例方差單總體假設(shè)檢驗(yàn)選擇統(tǒng)計(jì)量Z?
t
?
是正態(tài)分布還是非正態(tài)是大樣本還是小樣本總體方差已知還是未知2.兩個(gè)正態(tài)總體的參數(shù)檢驗(yàn)兩個(gè)總體的檢驗(yàn)Z
檢驗(yàn)(大樣本)t
檢驗(yàn)(小樣本)t
檢驗(yàn)(小樣本)Z檢驗(yàn)F
檢驗(yàn)獨(dú)立樣本配對(duì)樣本均值比例方差一、兩個(gè)獨(dú)立樣本均值之差的檢驗(yàn)(一)兩個(gè)總體均值之差的Z檢驗(yàn)(12、22
已知)(二)兩個(gè)總體均值之差的Z檢驗(yàn)
(12、22
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 飛機(jī)材料選擇與性能優(yōu)化考核試卷
- 虛擬現(xiàn)實(shí)技術(shù)對(duì)口碑傳播的影響-洞察分析
- 水源保護(hù)與農(nóng)業(yè)用水-洞察分析
- 虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用-洞察分析
- 遠(yuǎn)程醫(yī)療服務(wù)模式探索-洞察分析
- 墻體砌筑安全、文明施工控制措施
- 銷售預(yù)測(cè)與風(fēng)險(xiǎn)管理-洞察分析
- 2024-2025學(xué)年福建省部分達(dá)標(biāo)高中高三上學(xué)期期中考試生物試題(解析版)
- 2025年-2025學(xué)年度八年級(jí)班主任工作計(jì)劃
- 諧波傳播特性研究-洞察分析
- erdas2015操作手冊(cè)給客戶imagine
- 裝配式鋼筋混凝土簡(jiǎn)支T梁設(shè)計(jì)
- COMMERCIAL INVOICE 商業(yè)發(fā)票
- 大氣課程設(shè)計(jì)-—袋式除塵器
- 普天超五類檢測(cè)報(bào)告
- 會(huì)計(jì)師事務(wù)所業(yè)務(wù)培訓(xùn)制度
- CMM2-18錨桿機(jī)(新)說明書
- 12噸汽車起重機(jī)基本技術(shù)規(guī)格資料
- WEB開發(fā)基礎(chǔ)-2021秋本-計(jì)算機(jī)科學(xué)與技術(shù)本復(fù)習(xí)資料-國(guó)家開放大學(xué)2022年1月期末考試復(fù)習(xí)資料
- 安徽省政協(xié)機(jī)關(guān)文件材料歸檔范圍
- 本質(zhì)安全理論綜述研究
評(píng)論
0/150
提交評(píng)論