北京林業(yè)大學(xué)數(shù)理統(tǒng)計(jì)期末復(fù)習(xí)提綱_第1頁
北京林業(yè)大學(xué)數(shù)理統(tǒng)計(jì)期末復(fù)習(xí)提綱_第2頁
北京林業(yè)大學(xué)數(shù)理統(tǒng)計(jì)期末復(fù)習(xí)提綱_第3頁
北京林業(yè)大學(xué)數(shù)理統(tǒng)計(jì)期末復(fù)習(xí)提綱_第4頁
北京林業(yè)大學(xué)數(shù)理統(tǒng)計(jì)期末復(fù)習(xí)提綱_第5頁
已閱讀5頁,還剩165頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

相對(duì)數(shù)的分類相對(duì)數(shù)不同時(shí)間上的比較【空間固定】(動(dòng)態(tài)相對(duì)數(shù))相同時(shí)間上的比較【時(shí)間固定】(靜態(tài)相對(duì)數(shù))不同數(shù)據(jù)的比較【大多為有名數(shù)】(強(qiáng)度相對(duì)數(shù))相同數(shù)據(jù)的比較【無名數(shù)】實(shí)際與計(jì)劃的比較(計(jì)劃完成數(shù))不同總體的比較(比較相對(duì)數(shù))同一總體內(nèi)部的比較部分與全體的比較(結(jié)構(gòu)相對(duì)數(shù))部分與部分的比較(比例相對(duì)數(shù))2.2統(tǒng)計(jì)數(shù)據(jù)的來源統(tǒng)計(jì)數(shù)據(jù)的來源間接來源直接來源第二手?jǐn)?shù)據(jù)二手?jǐn)?shù)據(jù)的特點(diǎn)收集容易,采集成本低作用廣泛分析所要研究的問題提供研究問題的背景幫助研究者更好地定義問題檢驗(yàn)和回答某些疑問和假設(shè)尋找研究問題的思路和途徑收集二手資料在研究中應(yīng)優(yōu)先考慮統(tǒng)計(jì)調(diào)查統(tǒng)計(jì)整理統(tǒng)計(jì)分析有組織、有計(jì)劃地搜集資料。要求:準(zhǔn)確、完整、及時(shí)對(duì)調(diào)查資料去偽存真、去粗取精、科學(xué)分類、濃縮簡(jiǎn)化描述性分析推斷分析、決策分析。要求:定性定量結(jié)合統(tǒng)計(jì)工作的三個(gè)中心階段2.2.1數(shù)據(jù)的直接來源數(shù)據(jù)的直接來源

(原始數(shù)據(jù))調(diào)查數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)一、調(diào)查組織方式統(tǒng)計(jì)調(diào)查二、調(diào)查方案設(shè)計(jì)報(bào)表制度普查重點(diǎn)調(diào)查典型調(diào)查抽樣調(diào)查方案內(nèi)容調(diào)查表、問卷設(shè)計(jì)制度化的經(jīng)常性調(diào)查專門組織調(diào)查全面調(diào)查非全面調(diào)查統(tǒng)計(jì)調(diào)查抽樣調(diào)查特點(diǎn):1·按隨機(jī)原則從總體中抽取樣本;2·以樣本指標(biāo)(統(tǒng)計(jì)量)為依據(jù)推斷總體參數(shù)或檢驗(yàn)總體的某種假設(shè);3·抽樣誤差可以事先計(jì)算并加以控制。調(diào)查誤差登記性誤差代表性誤差偏差隨機(jī)誤差抽樣平均誤差實(shí)際誤差統(tǒng)計(jì)推斷中的抽樣誤差就是抽樣平均誤差。它是處于調(diào)查所固有的,是對(duì)抽樣推斷精確度的量度。調(diào)查方案的結(jié)構(gòu)

(surveyplan)調(diào)查方案的內(nèi)容調(diào)查目的調(diào)查對(duì)象調(diào)查單位調(diào)查項(xiàng)目其他問卷的基本結(jié)構(gòu)問卷的基本結(jié)構(gòu)開頭部分甄別部分主體部分背景部分問候語填寫說明問卷編號(hào)提問項(xiàng)目的設(shè)計(jì)提問的內(nèi)容盡可能短用詞要確切、通俗可按6W準(zhǔn)則加以推敲。6W即Who(誰),Where(何處),When(何時(shí)),Why(為什么),What(什么事),How(如何)一項(xiàng)提問只包含一項(xiàng)內(nèi)容避免誘導(dǎo)性提問避免否定形式的提問避免敏感性問題回答的類型與方法回答的類型與方法開放性問題(自由回答型)封閉性問題(選擇回答型)兩項(xiàng)選擇法多項(xiàng)選擇法順序選擇法評(píng)定尺度法雙向列聯(lián)法限制選擇型多項(xiàng)選擇型單項(xiàng)選擇型2.2.3數(shù)據(jù)的收集方法數(shù)據(jù)的收集方法詢問調(diào)查訪問調(diào)查觀察實(shí)驗(yàn)電話調(diào)查郵寄調(diào)查觀察電腦輔助座談會(huì)個(gè)別深訪實(shí)驗(yàn)數(shù)據(jù)的誤差

抽樣誤差(抽樣誤差可計(jì)算和控制

(samplingerror)由于抽樣的隨機(jī)性所帶來的誤差所有樣本可能的結(jié)果與總體真值之間的平均性差異影響抽樣誤差的大小的因素抽取樣本時(shí)沒有按照隨機(jī)原則樣本量的大小總體結(jié)構(gòu)的變異性統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量要求1.精

度:最低的抽樣誤差或隨機(jī)誤差2.準(zhǔn)確性:最小的非抽樣誤差或偏差3.關(guān)聯(lián)性:滿足用戶決策、管理和研究的需要4.及時(shí)性:在最短的時(shí)間里取得并公布數(shù)據(jù)5.一致性:保持時(shí)間序列的可比性6.最低成本:以最經(jīng)濟(jì)的方式取得數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)的整理流程主要任務(wù)數(shù)據(jù)的預(yù)處理、分類或分組、匯總、制表、制圖等。分組頻數(shù)分布統(tǒng)計(jì)表統(tǒng)計(jì)圖2.4.1數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核檢查數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)篩選(分類數(shù)據(jù)的排序數(shù)值型數(shù)據(jù)的排序)3數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征2.4.2統(tǒng)計(jì)數(shù)據(jù)的分組數(shù)據(jù)分組的意義:

數(shù)據(jù)分組就是根據(jù)研究現(xiàn)象的特點(diǎn)和數(shù)據(jù)分析的目的,將原始數(shù)據(jù)按照總體單位的某一特征分為不同的組別.

經(jīng)過數(shù)據(jù)分組后形成的分布在各個(gè)組里的數(shù)據(jù)稱為分組數(shù)據(jù).作為數(shù)據(jù)分組的標(biāo)準(zhǔn)的這一特征稱為分組標(biāo)志分組標(biāo)志的選擇與分組形式關(guān)鍵:服從研究任務(wù)需要,反映總體本質(zhì)特征形式按分組標(biāo)志性質(zhì)分品質(zhì)標(biāo)志分組數(shù)量標(biāo)志分組按分組標(biāo)志個(gè)數(shù)分簡(jiǎn)單分組復(fù)合分組分組體系數(shù)值型數(shù)據(jù)的整理與顯示:分組方法分組方法等距分組異距分組單變量值分組組距分組組距分組

(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),可以按

Sturges

提出的經(jīng)驗(yàn)公式來確定組數(shù)K確定組距:組距(ClassWidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即

組距=(最大值-最小值)÷組數(shù)

統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表組距分組

(幾個(gè)概念)1.下限(lowlimit)

:一個(gè)組的最小值2.上限(upperlimit)

:一個(gè)組的最大值3.組距(classwidth)

:上限與下限之差4.組中值(classmidpoint)

:下限與上限之間的中點(diǎn)值下限值+上限值2組中值=等距分組與不等距分組

(在表現(xiàn)頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對(duì)頻數(shù)來觀察頻數(shù)分布的特征不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對(duì)頻數(shù)的多少不能反映頻數(shù)分布的實(shí)際狀況需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實(shí)際狀況組距分組時(shí)組中值的計(jì)算上下組限重疊與上下組限間斷的組中值:開口組的組中值:組距分組掩蓋了各組內(nèi)的數(shù)據(jù)分布狀況,為反映各組數(shù)據(jù)的一般水平,常用組中值作為該組數(shù)據(jù)的代表值。下限值+上限值2組中值=該組的上限值—鄰組組距/2缺少下限的組的組中值=缺少上限的組的組中值=該組的下限值+鄰組組距/2數(shù)值型數(shù)據(jù)的圖示Excel分組數(shù)據(jù)—直方圖和折線圖未分組數(shù)據(jù)—莖葉圖和箱線圖時(shí)間序列數(shù)據(jù)—線圖分組數(shù)據(jù)—直方圖

(histogram)用矩形的寬度和高度來表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖直方圖下的總面積等于1(頻率)分組數(shù)據(jù)—直方圖

(直方圖與條形圖的區(qū)別)條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)分組數(shù)據(jù)—折線圖

(frequencypolygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的未分組數(shù)據(jù)—莖葉圖

(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字對(duì)于n(20n300)個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過

L=[10×lgn]

6.莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息未分組數(shù)據(jù)—莖葉圖

(例題分析)未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡(jiǎn)單箱線圖時(shí)間序列數(shù)據(jù)—線圖

(lineplot)繪制線圖時(shí)應(yīng)注意以下幾點(diǎn)時(shí)間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸圖形的長(zhǎng)寬比例要適當(dāng),其長(zhǎng)寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時(shí),可以采取折斷的符號(hào)將縱軸折斷時(shí)間序列數(shù)據(jù)—線圖

(例題分析)時(shí)間序列數(shù)據(jù)—線圖

(例題分析)集中趨勢(shì)

(centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值低層次數(shù)據(jù)的測(cè)度值適用于高層次的測(cè)量數(shù)據(jù),但高層次數(shù)據(jù)的測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù)數(shù)值型數(shù)據(jù)的眾數(shù)數(shù)據(jù)未分組整理時(shí):出現(xiàn)次數(shù)最多的變量值即為眾數(shù)數(shù)據(jù)分組整理后:先確定眾數(shù)組(頻數(shù)最大組);再利用公式計(jì)算:公式:其中:中位數(shù)

(位置的確定)原始數(shù)據(jù):(未分組)順序數(shù)據(jù):(分組數(shù)據(jù))各變量值與中位數(shù)的離差絕對(duì)值之和最小,即數(shù)值型分組數(shù)據(jù)的中位數(shù)根據(jù)公式n/2確定中位數(shù)的位置,并確定中位數(shù)所在的組利用公式計(jì)算中位數(shù)的近似值

其中:n為數(shù)據(jù)的個(gè)數(shù)(總次數(shù)),L為中位數(shù)組的下限,為中位數(shù)組以前各組的累積頻數(shù),為中位數(shù)組的頻數(shù),i為中位數(shù)組的組距。四分位數(shù)

(位置的確定)原始數(shù)據(jù):(未分組)順序數(shù)據(jù):(已分組)數(shù)值型數(shù)據(jù)的四分位數(shù)

(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789數(shù)值型數(shù)據(jù)的四分位數(shù)

(10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:

660

75078085096010801250150016302000位置:1234

5678910數(shù)值型分組數(shù)據(jù)的四分位數(shù)

(計(jì)算公式)上四分位數(shù):

下四分位數(shù):

簡(jiǎn)單平均數(shù)與加權(quán)平均數(shù)

(simplemean/weightedmean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn各組的組中值為:M1,M2,…,Mk

相應(yīng)的頻數(shù)為:f1,f2,…,fk簡(jiǎn)單平均數(shù)加權(quán)平均數(shù)簡(jiǎn)單平均數(shù)與加權(quán)平均數(shù)

(simplemean/weightedmean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn各組的組中值為:M1,M2,…,Mk

相應(yīng)的頻數(shù)為:f1,f2,…,fk簡(jiǎn)單平均數(shù)加權(quán)平均數(shù)調(diào)和平均數(shù)

(harmonicmean)平均數(shù)的另一種表現(xiàn)形式易受極端值的影響計(jì)算公式為原來只是計(jì)算時(shí)使用了不同的數(shù)據(jù)!幾何平均數(shù)

(geometricmean)

n個(gè)變量值乘積的

n次方根適用于對(duì)比率數(shù)據(jù)的平均主要用于計(jì)算平均增長(zhǎng)率計(jì)算公式為5.可看作是平均數(shù)的一種變形平均增長(zhǎng)率眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系

(從分布角度)左偏分布均值

<中位數(shù)

<眾數(shù)對(duì)稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

>中位數(shù)>均值眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系

(從數(shù)值角度)在偏斜不大時(shí)數(shù)據(jù)分布特征的測(cè)度

(本節(jié)位置)數(shù)據(jù)特征的測(cè)度眾數(shù)中位數(shù)平均數(shù)離散系數(shù)方差和標(biāo)準(zhǔn)差峰態(tài)四分位差異眾比率偏態(tài)分布的形狀集中趨勢(shì)離散程度異眾比率

(variationratio)1. 對(duì)分類數(shù)據(jù)離散程度的測(cè)度2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比例3. 計(jì)算公式為

4.用于衡量眾數(shù)的代表性異眾比率

(例題分析)解:

在所調(diào)查的50人當(dāng)中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”代表消費(fèi)者購買飲料品牌的狀況,其代表性不是很好不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)

可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計(jì)501100四分位差

(quartiledeviation)對(duì)順序數(shù)據(jù)離散程度的測(cè)度也稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差

Qd=QU

–QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性極差

(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡(jiǎn)單測(cè)度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910

R

=max(xi)-min(xi)計(jì)算公式為平均差

(meandeviation)各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù)能全面反映一組數(shù)據(jù)的離散程度數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)總體方差和標(biāo)準(zhǔn)差

(populationvarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:總體方差用N去除!樣本方差和標(biāo)準(zhǔn)差

(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!標(biāo)準(zhǔn)分?jǐn)?shù)

(standardscore)1.也稱標(biāo)準(zhǔn)化值2. 對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量3. 可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)4. 用于對(duì)變量的標(biāo)準(zhǔn)化處理5.計(jì)算公式為(均值等于0方差等于1)離散系數(shù)

(coefficientofvariation)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4. 用于對(duì)不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為偏態(tài)系數(shù)

(skewnesscoefficient)根據(jù)原始數(shù)據(jù)計(jì)算根據(jù)分組數(shù)據(jù)計(jì)算2. 偏態(tài)系數(shù)=0為對(duì)稱分布3. 偏態(tài)系數(shù)>0為右偏分布4. 偏態(tài)系數(shù)<0為左偏分布峰態(tài)系數(shù)

(kurtosiscoefficient)根據(jù)原始數(shù)據(jù)計(jì)算根據(jù)分組數(shù)據(jù)計(jì)算峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)<0為扁平分布峰態(tài)系數(shù)>0為尖峰分布【習(xí)題】某班40名學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)分別為:57、89、49、84、86、87、75、73、72、68、75、82、97、81、

67、81、54、79、87、95、76、71、60、90、65、76、72、70、

86、85、89、89、64、57、83、81、78、87、72、61學(xué)校規(guī)定:60分以下為不及格,60─70分為及格,70─80分為中,80─90分為良,90─100分為優(yōu)。要求:(1)將該班學(xué)生分為不及格、及格、中、良、優(yōu)五組,編制一張次數(shù)分配表,并繪制直方圖。

(2)根據(jù)次數(shù)分配表,計(jì)算該班學(xué)生統(tǒng)計(jì)學(xué)的平均成績(jī)。(3)根據(jù)次數(shù)分配表,計(jì)算該班成績(jī)的標(biāo)準(zhǔn)差(4)請(qǐng)說明其屬于哪種偏態(tài)形式。1.統(tǒng)計(jì)表的結(jié)構(gòu)統(tǒng)計(jì)表由以下幾個(gè)部分組成:(統(tǒng)計(jì)表的分類:簡(jiǎn)單表和復(fù)合表)①標(biāo)題、②標(biāo)目、③線條、④數(shù)字、⑤備注1.標(biāo)題位于表的上方,概括地說明表的主要內(nèi)容。必要時(shí)注明時(shí)間和地點(diǎn)。若一篇論文中有兩張以上統(tǒng)計(jì)表,則每張統(tǒng)計(jì)表的標(biāo)題前應(yīng)加序號(hào)。2.標(biāo)目根據(jù)其位置與作用可分為橫標(biāo)目、縱標(biāo)目和總標(biāo)目。橫標(biāo)目位于表的左側(cè),說明各橫行數(shù)字的涵義,一般為研究的事情;縱標(biāo)目位于表的右側(cè),說明各縱欄數(shù)字的涵義,即研究事物的指標(biāo)。只有組合表才有總標(biāo)目,它是對(duì)橫標(biāo)目或縱標(biāo)目?jī)?nèi)容的概括。

統(tǒng)計(jì)表的結(jié)構(gòu)××.××┋┋×.××××.××縱標(biāo)目總標(biāo)目(單位)××.××××××××合計(jì)┋┋┋┋┋┋┋┋×.××××××┋××.××××××××橫標(biāo)目縱標(biāo)目縱標(biāo)目縱標(biāo)目總標(biāo)目橫標(biāo)目的總標(biāo)目備注:表號(hào)標(biāo)題(包括何時(shí)、何地、何事)1.統(tǒng)計(jì)圖的結(jié)構(gòu)統(tǒng)計(jì)圖由以下幾個(gè)部分組成:①標(biāo)題、②標(biāo)目、③點(diǎn)線條面、④刻度、⑤圖(為了圖形美觀,圖形的長(zhǎng)寬比例習(xí)慣上為7:5或5:7。)

1.標(biāo)題其作用及要求與統(tǒng)計(jì)表的標(biāo)題相同,但位置是在圖的下方。若同一篇論文中有兩個(gè)以上統(tǒng)計(jì)圖時(shí),則標(biāo)題前應(yīng)有序號(hào)。2.標(biāo)目分為縱標(biāo)目與橫標(biāo)目,分別表示縱軸與橫軸數(shù)字刻度的意義,一般有度量衡單位。按中文排版習(xí)慣,縱標(biāo)目由上而下,橫標(biāo)目由左向右。如果橫軸的分組標(biāo)志十分明確,也可省略橫標(biāo)目。(1)條圖

條圖:用直條的長(zhǎng)度表示相互獨(dú)立的統(tǒng)計(jì)指標(biāo)的大小,可分為:①單式條圖:具有一個(gè)統(tǒng)計(jì)指標(biāo),一個(gè)分組標(biāo)志。②復(fù)式條圖:具有一個(gè)統(tǒng)計(jì)指標(biāo),兩個(gè)分組因素。③分段條圖

④誤差條圖分段條圖:具有兩個(gè)統(tǒng)計(jì)指標(biāo),一個(gè)分組因素,且兩個(gè)統(tǒng)計(jì)指標(biāo)必須有隸屬關(guān)系。如左圖。誤差條圖:用條圖或線圖表示均數(shù)的基礎(chǔ)上,在圖中附上標(biāo)準(zhǔn)差的范圍。如右圖。

圖2-27四種營(yíng)養(yǎng)素喂養(yǎng)小白鼠三周后所增體重(克)圖2-26老、中、青三代的結(jié)核菌素陽性率與強(qiáng)陽性率(%)繪制條圖注意事項(xiàng)

⑴縱軸的刻度必須從“0”開始,否則會(huì)改變各對(duì)比組間的比例關(guān)系。

(2)橫軸各直條一般按統(tǒng)計(jì)指標(biāo)由大到小排列,也可按事物本身的自然順序排列。

(3)各直條的寬度要一致,各直條應(yīng)有相等的間隔,其寬度一般與直條的寬度相等或?yàn)橹睏l寬度的一半。

繪制條圖注意事項(xiàng)

⑴縱軸的刻度必須從“0”開始,否則會(huì)改變各對(duì)比組間的比例關(guān)系。

(2)橫軸各直條一般按統(tǒng)計(jì)指標(biāo)由大到小排列,也可按事物本身的自然順序排列。

(3)各直條的寬度要一致,各直條應(yīng)有相等的間隔,其寬度一般與直條的寬度相等或?yàn)橹睏l寬度的一半。

繪制條圖注意事項(xiàng)

⑴縱軸的刻度必須從“0”開始,否則會(huì)改變各對(duì)比組間的比例關(guān)系。

(2)橫軸各直條一般按統(tǒng)計(jì)指標(biāo)由大到小排列,也可按事物本身的自然順序排列。

(3)各直條的寬度要一致,各直條應(yīng)有相等的間隔,其寬度一般與直條的寬度相等或?yàn)橹睏l寬度的一半。

(4)線圖①普通線圖:用線段的升降表示某事物動(dòng)態(tài)變化,或某現(xiàn)象隨另一現(xiàn)象變遷的情況(絕對(duì)差)。適用于連續(xù)性資料??v軸:算術(shù)尺度;橫軸:連續(xù)性變量(時(shí)間、年齡等)②半對(duì)數(shù)線圖:表示事物發(fā)展速度(相對(duì)比)。縱軸:對(duì)數(shù)尺度;橫軸:連續(xù)性變量(時(shí)間、年齡等)表2-13某市1949~1957年15歲以下兒童結(jié)核病和白喉死亡率(1/10萬)年份

結(jié)核病死亡率百喉死亡率194919501951195219531954195519561957150.2148.0141.0130.0110.498.272.668.054.820.116.614.011.810.76.53.92.41.3(4)線圖①普通線圖:用線段的升降表示某事物動(dòng)態(tài)變化,或某現(xiàn)象隨另一現(xiàn)象變遷的情況(絕對(duì)差)。適用于連續(xù)性資料??v軸:算術(shù)尺度;橫軸:連續(xù)性變量(時(shí)間、年齡等)②半對(duì)數(shù)線圖:表示事物發(fā)展速度(相對(duì)比)??v軸:對(duì)數(shù)尺度;橫軸:連續(xù)性變量(時(shí)間、年齡等)表2-13某市1949~1957年15歲以下兒童結(jié)核病和白喉死亡率(1/10萬)年份

結(jié)核病死亡率百喉死亡率194919501951195219531954195519561957150.2148.0141.0130.0110.498.272.668.054.820.116.614.011.810.76.53.92.41.3(6)散點(diǎn)圖散點(diǎn)圖:用點(diǎn)的密集程度和趨勢(shì)表示兩種現(xiàn)象間的相關(guān)關(guān)系。橫軸:自變量X

縱軸:應(yīng)變量Y縱軸與橫軸的起點(diǎn)可根據(jù)資料的情況而定。4.1

概率抽樣方法4.1.1簡(jiǎn)單隨機(jī)抽樣4.1.2分層抽樣4.1.3系統(tǒng)抽樣4.1.4整群抽樣4.1

概率抽樣方法4.1.1簡(jiǎn)單隨機(jī)抽樣4.1.2分層抽樣4.1.3系統(tǒng)抽樣4.1.4整群抽樣簡(jiǎn)單隨機(jī)抽樣

(simplerandomsampling)從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,使得每一個(gè)容量為n的樣本都有相同的機(jī)會(huì)(概率)被抽中抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣特點(diǎn)簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒有利用其他輔助信息以提高估計(jì)的效率分層抽樣

(stratifiedsampling)將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本優(yōu)點(diǎn)保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)分層抽樣

(stratifiedsampling)將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本優(yōu)點(diǎn)保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)整群抽樣

(clustersampling)將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差多階段抽樣

(multi-stagesampling)先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點(diǎn),保證樣本相對(duì)集中,節(jié)約調(diào)查費(fèi)用需要包含所有低階段抽樣單位的抽樣框;同時(shí)由于實(shí)行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法

總體中各元素的觀察值所形成的分布分布通常是未知的通??梢愿鶕?jù)經(jīng)驗(yàn)大致了解總體的分布類型,或者可以假定它服從某種分布總體分布

(populationdistribution)總體一個(gè)樣本(容量為n)中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本分布

(sampledistribution)樣本樣本統(tǒng)計(jì)量的概率分布,是樣本分布的概率分布,是一種理論分布從理論上說就是在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布樣本統(tǒng)計(jì)量是隨機(jī)變量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本,反映了依據(jù)樣本計(jì)算出來統(tǒng)計(jì)量數(shù)值的概率分布,提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)一個(gè)樣本(容量為n)中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本分布

(sampledistribution)樣本樣本統(tǒng)計(jì)量的概率分布,是樣本分布的概率分布,是一種理論分布從理論上說就是在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布樣本統(tǒng)計(jì)量是隨機(jī)變量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本,反映了依據(jù)樣本計(jì)算出來統(tǒng)計(jì)量數(shù)值的概率分布,提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)一個(gè)樣本(容量為n)中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本分布

(sampledistribution)樣本樣本統(tǒng)計(jì)量的概率分布,是樣本分布的概率分布,是一種理論分布從理論上說就是在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布樣本統(tǒng)計(jì)量是隨機(jī)變量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本,反映了依據(jù)樣本計(jì)算出來統(tǒng)計(jì)量數(shù)值的概率分布,提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)樣本均值的抽樣分布

(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)

,即總體單位數(shù)N=4。4

個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4

??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布

(例題分析)計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x抽樣均值分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布(t分布)樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布

(數(shù)學(xué)期望與方差)比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值

2.樣本均值的方差等于總體方差的1/n均值的抽樣標(biāo)準(zhǔn)誤差所有可能的樣本均值的標(biāo)準(zhǔn)差,測(cè)度所有樣本均值的離散程度也稱標(biāo)準(zhǔn)誤差小于總體標(biāo)準(zhǔn)差計(jì)算公式為均值的抽樣標(biāo)準(zhǔn)誤差總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

比例

(proportion)樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布

(數(shù)學(xué)期望與方差)樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布

(數(shù)學(xué)期望與方差)樣本方差的分布在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布對(duì)于來自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布樣本統(tǒng)計(jì)量的抽樣分布(總結(jié))樣本統(tǒng)計(jì)量樣本均值x樣本方差s2樣本比率pt分布正態(tài)總體或非正態(tài)總體大樣本非正態(tài)總體(小樣本)大樣本正態(tài)分布正態(tài)分布x2分布樣本統(tǒng)計(jì)量的抽樣分布(總結(jié))樣本統(tǒng)計(jì)量樣本均值x樣本方差s2樣本比率pt分布正態(tài)總體或非正態(tài)總體大樣本非正態(tài)總體(小樣本)大樣本正態(tài)分布正態(tài)分布x2分布樣本統(tǒng)計(jì)量的抽樣分布(總結(jié))樣本統(tǒng)計(jì)量樣本均值x樣本方差s2樣本比率pt分布正態(tài)總體或非正態(tài)總體大樣本非正態(tài)總體(小樣本)大樣本正態(tài)分布正態(tài)分布x2分布兩個(gè)樣本方差比的抽樣分布

兩個(gè)總體都為正態(tài)分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)從兩個(gè)總體中分別抽取容量為n1和n2的獨(dú)立樣本兩個(gè)樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1)的F分布,即兩個(gè)樣本統(tǒng)計(jì)量的抽樣分布(總結(jié))兩個(gè)樣本統(tǒng)計(jì)量均值之差方差之比比率之差t分布正態(tài)總體或非正態(tài)總體大樣本非正態(tài)總體(小樣本)大樣本正態(tài)分布正態(tài)分布F分布參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)點(diǎn)估計(jì)

(pointestimate)用樣本估計(jì)量直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì)例如:用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)沒有給出估計(jì)值接近總體參數(shù)程度的信息;點(diǎn)估計(jì)的結(jié)果只有正確與錯(cuò)誤之分,哪怕只相差.01也算不正確;大多數(shù)情況下,要點(diǎn)估計(jì)決定正確幾乎是不可能的.5.點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等區(qū)間估計(jì)

(intervalestimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減允許誤差而得到的根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量比如,某班級(jí)平均分?jǐn)?shù)在75~85之間,置信水平是95%

樣本統(tǒng)計(jì)量

(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限區(qū)間估計(jì)

(內(nèi)容)2

已知2未知均值方差比例置信區(qū)間無偏性

(unbiasedness)無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù),即P(

)BA無偏有偏有效性

(efficiency)有效性:對(duì)同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效

AB

的抽樣分布

的抽樣分布P(

)一致性

(consistency)一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)AB較小的樣本容量較大的樣本容量P(

)5.2一個(gè)總體參數(shù)的區(qū)間估計(jì)5.2.1總體均值的區(qū)間估計(jì)5.2.2總體比例的區(qū)間估計(jì)5.2.3總體方差的區(qū)間估計(jì)總體均值的區(qū)間估計(jì)

(大樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

已知如果不是正態(tài)分布,可由正態(tài)分布來近似(n

30)使用正態(tài)分布統(tǒng)計(jì)量z總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計(jì)

(正態(tài)總體:實(shí)例)解:已知X~N(,0.152),x=2.14,n=9,1-=0.95,Z/2=1.96

總體均值的置信區(qū)間為我們可以95%的概率保證該種零件的平均長(zhǎng)度在21.302~21.498mm之間【例】某種零件長(zhǎng)度服從正態(tài)分布,從該批產(chǎn)品中隨機(jī)抽取9件,測(cè)得其平均長(zhǎng)度為21.4mm。已知總體標(biāo)準(zhǔn)差=0.15mm,試建立該種零件平均長(zhǎng)度的置信區(qū)間,給定置信水平為0.95。總體均值的區(qū)間估計(jì)

(正態(tài)總體:實(shí)例)解:已知X~N(,0.152),x=2.14,n=9,1-=0.95,Z/2=1.96

總體均值的置信區(qū)間為我們可以95%的概率保證該種零件的平均長(zhǎng)度在21.302~21.498mm之間【例】某種零件長(zhǎng)度服從正態(tài)分布,從該批產(chǎn)品中隨機(jī)抽取9件,測(cè)得其平均長(zhǎng)度為21.4mm。已知總體標(biāo)準(zhǔn)差=0.15mm,試建立該種零件平均長(zhǎng)度的置信區(qū)間,給定置信水平為0.95。小樣本總體均值的區(qū)間估計(jì)

(小樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

未知小樣本(n<30)使用t

分布統(tǒng)計(jì)量總體均值在1-置信水平下的置信區(qū)間為小樣本總體均值的區(qū)間估計(jì)

(小樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

未知小樣本(n<30)使用t

分布統(tǒng)計(jì)量總體均值在1-置信水平下的置信區(qū)間為特別注意:1-=95%,t/2=2.131小樣本總體均值的區(qū)間估計(jì)

(小樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

未知小樣本(n<30)使用t

分布統(tǒng)計(jì)量總體均值在1-置信水平下的置信區(qū)間為t分布

t分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z不同情況下總體均值的區(qū)間估計(jì)總體分布樣本容量已知未知正態(tài)分布大樣本(n>=30)小樣本(n<30)非正態(tài)分布大樣本(n>=30)總體比例的區(qū)間估計(jì)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量z3.總體比例在1-置信水平下的置信區(qū)間為總體比例的區(qū)間估計(jì)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計(jì)量z3.總體比例在1-置信水平下的置信區(qū)間為總體比例的區(qū)間估計(jì)

(例題分析)【例】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

總體方差的區(qū)間估計(jì)1. 估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布總體方差2

的點(diǎn)估計(jì)量為s2,且4.總體方差在1-置信水平下的置信區(qū)間為總體方差的區(qū)間估計(jì)

(例題分析)解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計(jì)算得

s2=93.21

2置信度為95%的置信區(qū)間為該企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的的置信區(qū)間為7.54g~13.43g兩個(gè)總體均值之差的估計(jì)

(大樣本)1. 假定條件兩個(gè)總體都服從正態(tài)分布,12、22已知若不是正態(tài)分布,可以用正態(tài)分布來近似(n130和n230)兩個(gè)樣本是獨(dú)立的隨機(jī)樣本使用正態(tài)分布統(tǒng)計(jì)量z兩個(gè)總體均值之差的估計(jì)

(大樣本)1. 12,22已知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為12、22未知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為兩個(gè)總體均值之差的估計(jì)

(小樣本:

12=22

)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知但相等:12=22兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)總體方差的合并估計(jì)量估計(jì)量x1-x2的抽樣標(biāo)準(zhǔn)差獨(dú)立小樣本兩個(gè)總體均值之差的估計(jì)

(小樣本:12=22

)兩個(gè)樣本均值之差的標(biāo)準(zhǔn)化兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】為估計(jì)兩種方法組裝產(chǎn)品所需時(shí)間的差異,分別對(duì)兩種不同的組裝方法各隨機(jī)安排12名工人,每個(gè)工人組裝一件產(chǎn)品所需的時(shí)間(分鐘)下如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得合并估計(jì)量為:兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.14分鐘~7.26分鐘兩個(gè)總體均值之差的估計(jì)

(小樣本:1222n1n2)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知且不相等:1222兩個(gè)獨(dú)立的小樣本(n1<30和n2<30),且容量不等使用統(tǒng)計(jì)量?jī)蓚€(gè)總體均值之差的估計(jì)

(小樣本:1222

)兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為自由度兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】沿用前例。假定第一種方法隨機(jī)安排12名工人,第二種方法隨機(jī)安排8名工人,即n1=12,n2=8,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得自由度為:兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.192分鐘~9.058分鐘匹配樣本

(數(shù)據(jù)形式)

觀察序號(hào)樣本1樣本2差值1x11x21d1=x11-x212x12x22d2=x12-x22MMMMix1ix2idi

=x1i

-x2iMMMMnx1nx2ndn

=x1n-x2n兩個(gè)總體均值之差的估計(jì)

(匹配小樣本)假定條件兩個(gè)匹配的小樣本(n1<30和n2<30)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布

兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為兩個(gè)總體均值之差的估計(jì)

(例題分析)【例】由10名學(xué)生組成一個(gè)隨機(jī)樣本,讓他們分別采用A和B兩套試卷進(jìn)行測(cè)試,結(jié)果如下表。試建立兩種試卷分?jǐn)?shù)之差d=1-2

95%的置信區(qū)間

10名學(xué)生兩套試卷的得分學(xué)生編號(hào)試卷A試卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916STATISTICS兩個(gè)總體均值之差的估計(jì)

(例題分析)解:根據(jù)樣本數(shù)據(jù)計(jì)算得兩種試卷所產(chǎn)生的分?jǐn)?shù)之差的置信區(qū)間為6.33分~15.67分1. 假定條件兩個(gè)總體服從二項(xiàng)分布可以用正態(tài)分布來近似兩個(gè)樣本是獨(dú)立的2. 兩個(gè)總體比例之差1-2在1-置信水平下的置信區(qū)間為兩個(gè)總體比例之差的區(qū)間估計(jì)兩個(gè)總體比例之差的估計(jì)

(例題分析)【例】在某個(gè)電視節(jié)目的收視率調(diào)查中,農(nóng)村隨機(jī)調(diào)查了400人,有32%的人收看了該節(jié)目;城市隨機(jī)調(diào)查了500人,有45%的人收看了該節(jié)目。試以90%的置信水平估計(jì)城市與農(nóng)村收視率差別的置信區(qū)間12兩個(gè)總體比例之差的估計(jì)

(例題分析)解:已知

n1=500,n2=400,p1=45%,p2=32%,

1-=95%,z/2=1.96

1-2置信度為95%的置信區(qū)間為城市與農(nóng)村收視率差值的置信區(qū)間為6.68%~19.32%兩個(gè)總體方差比的區(qū)間估計(jì)1. 比較兩個(gè)總體的方差比用兩個(gè)樣本的方差比來判斷如果S12/S22接近于1,說明兩個(gè)總體方差很接近如果S12/S22遠(yuǎn)離1,說明兩個(gè)總體方差之間存在差異總體方差比在1-置信水平下的置信區(qū)間為估計(jì)總體均值時(shí)樣本容量n為樣本容量n與總體方差2、邊際(允許)誤差E、可靠性系數(shù)Z或t之間的關(guān)系為與總體方差成正比與邊際誤差成反比與可靠性系數(shù)成正比樣本容量的圓整法則:當(dāng)計(jì)算出的樣本容量不是整數(shù)時(shí),將小數(shù)點(diǎn)后面的數(shù)值一律進(jìn)位成整數(shù),如24.68取25,24.32也取25等等估計(jì)總體均值時(shí)樣本容量的確定:估計(jì)總體均值時(shí)樣本容量的確定

(例題分析)【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計(jì)年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?估計(jì)總體均值時(shí)樣本容量的確定

(例題分析)解:已知=2000,E=400,1-=95%,z/2=1.96

應(yīng)抽取的樣本容量為即應(yīng)抽取97人作為樣本根據(jù)比例區(qū)間估計(jì)公式可得樣本容量n為估計(jì)總體比例時(shí)樣本容量的確定

E的取值一般小于0.1

未知時(shí),可取最大值0.5估計(jì)總體比例時(shí)樣本容量的確定

(例題分析)【例】根據(jù)以往的生產(chǎn)統(tǒng)計(jì),某種產(chǎn)品的合格率約為90%,現(xiàn)要求邊際誤差為5%,在求95%的置信區(qū)間時(shí),應(yīng)抽取多少個(gè)產(chǎn)品作為樣本?解:已知=90%,=0.05,z/2=1.96,E=5%

應(yīng)抽取的樣本容量為

應(yīng)抽取139個(gè)產(chǎn)品作為樣本估計(jì)總體比例時(shí)樣本容量的確定

(例題分析)【例】根據(jù)以往的生產(chǎn)統(tǒng)計(jì),某種產(chǎn)品的合格率約為90%,現(xiàn)要求邊際誤差為5%,在求95%的置信區(qū)間時(shí),應(yīng)抽取多少個(gè)產(chǎn)品作為樣本?解:已知=90%,=0.05,z/2=1.96,E=5%

應(yīng)抽取的樣本容量為

應(yīng)抽取139個(gè)產(chǎn)品作為樣本假設(shè)檢驗(yàn)看概率論,不做重點(diǎn)要求總體均值的檢驗(yàn)

(大樣本)1. 假定條件正態(tài)總體或非正態(tài)總體大樣本(n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論