中山大學(xué)2014生物統(tǒng)計學(xué)考試復(fù)習(xí)_第1頁
中山大學(xué)2014生物統(tǒng)計學(xué)考試復(fù)習(xí)_第2頁
中山大學(xué)2014生物統(tǒng)計學(xué)考試復(fù)習(xí)_第3頁
中山大學(xué)2014生物統(tǒng)計學(xué)考試復(fù)習(xí)_第4頁
中山大學(xué)2014生物統(tǒng)計學(xué)考試復(fù)習(xí)_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、1 名詞解釋n 概率與概率分析相關(guān)概念n 樣本統(tǒng)計量的抽樣分布相關(guān)概念第一節(jié) 抽樣與抽樣分布 一. 總體、個體和樣本總體(Population):調(diào)查研究的事物或現(xiàn)象的全體個體(Item unit):組成總體的每個元素樣本(Sample):從總體中所抽取的部分個體樣本容量(Sample size):樣本中所含個體的數(shù)量二. 關(guān)于抽樣方法概率抽樣:根據(jù)已知的概率選取樣本 1.簡單隨機抽樣:完全隨機地抽選樣本 2.分層抽樣:總體分成不同的“層”,在每一層內(nèi)進行抽樣 3.整群抽樣:將一組被調(diào)查者(群)作為一個抽樣單位 4.等距抽樣:在樣本框中每隔一定距離抽選一個被調(diào)查者非概率抽樣:不是完全按隨機原則

2、選取樣本 1.非隨機抽樣:由調(diào)查人員自由選取被調(diào)查者 2.判斷抽樣:通過某些條件過濾來選擇被調(diào)查者配額抽樣:選擇一群特定數(shù)目、滿足特定條件的被調(diào)查者三. 樣本均值的抽樣分布與中心極限定理抽樣分布:1.所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布2.是一種理論概率分布3.隨機變量是 樣本統(tǒng)計量樣本均值, 樣本比例和樣本方差等4.結(jié)果來自容量相同的所有可能樣本樣本均值的均值(數(shù)學(xué)期望)等于總體均值樣本均值的方差等于總體方差的1/n樣本均值的抽樣分布規(guī)律:當(dāng)總體服從正態(tài)分布N(, 2)時,來自該總體的所有容量為n的樣本的均值也服從正態(tài)分布,的數(shù)學(xué)期望為,方差為2/n。即 N(, 2/

3、n)中心極限定理:設(shè)從均值為,方差為2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時(n > 30),樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布 四. 樣本方差的抽樣分布(Pearson)設(shè)總體服從正態(tài)分布N(, 2 ), X1,X2,Xn為來自該正態(tài)總體的樣本,則樣本方差S2 的分布為,將稱為自由度為(n-1)的卡方分布均值的標(biāo)準(zhǔn)誤五. 兩個樣本方差比的分布(R. A. Fisher)設(shè)X1,X2,Xn1是來自于一個正態(tài)分布總體X N(1,12 )的一個樣本,Y1,Y2, ,Yn2是來自正態(tài)總體YN(2, 22)的一個樣本,且Xi(i=1,2,,n1),Yi(i=1,2

4、, ,n2)相互獨立,則 將F(n1-1 , n2-1 )稱為第一自由度為(n1-1),第二自由度為(n2-1)的F分布六. T 統(tǒng)計量的分布(Willam Sealy Gosset)設(shè)X1,X2,Xn是來自正態(tài)總體N(1, 12)的一個樣本, 稱為統(tǒng)計量,它服從自由度為n-1的t 分布n 假設(shè)檢驗、參數(shù)估計相關(guān)概念(例如獨立樣本、配對樣本、 Aspin-Welch檢驗法、方差齊性檢驗)獨立樣本配對樣本Aspin-Welch檢驗法 兩個總體均值之差的 t 檢驗(12、22未知但不相等)1. 檢驗具有等方差的兩個總體的均值2. 假定條件 兩個樣本是獨立的隨機樣本 兩個總體都是正態(tài)分布 兩個總體方

5、差未知但不相等12 223. 近似 t 檢驗, Aspin-Welch檢驗法,檢驗統(tǒng)計量 方差齊性檢驗n ANOVA,LSD法,隨機誤差和系統(tǒng)誤差,因素和水平n ANOVA1. 檢驗多個總體均值是否相等§ 通過對各觀察數(shù)據(jù)誤差來源的分析來判斷多個總體均值是否相等2.變量n 1個定類尺度的自變量 2個或多個 (k 個) 處理水平或分類n 1個定距或定比尺度的因變量3.用于分析完全隨機化試驗設(shè)計LSD法隨機誤差在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異系統(tǒng)誤差在因素的不同水平(不同總體)下,各觀察值之間的差異因素所要檢驗的對象稱為因素或因子水平因素的具體表現(xiàn)稱為水平n 相

6、關(guān)和回歸分析及與之關(guān)聯(lián)的概念例如n 總體(Population)n 所關(guān)心的所有元素的集合n 樣本(Sample)n 總體的一部分n 參數(shù)(Parameter)n 總體的數(shù)字特征n 統(tǒng)計量(Statistic)n 樣本的概括性測度值2 簡答題統(tǒng)計數(shù)據(jù)的如何收集與整理?抽樣調(diào)查1. 從總體中隨機抽取一部分單位(樣本)進行調(diào)查2. 目的是推斷總體的未知數(shù)字特征3. 最常用的調(diào)查方式4. 具有經(jīng)濟性、時效性強、適應(yīng)面 廣、準(zhǔn)確性高等特點抽樣調(diào)查5. 從總體中隨機抽取一部分單位(樣本)進行調(diào)查6. 目的是推斷總體的未知數(shù)字特征7. 最常用的調(diào)查方式8. 具有經(jīng)濟性、時效性強、適應(yīng)面 廣、準(zhǔn)確性高等特點

7、重點調(diào)查和典型調(diào)查1.重點調(diào)查從調(diào)查對象的全部單位中選擇少數(shù)重點單位進行調(diào)查調(diào)查結(jié)果不能用于推斷總體2. 典型調(diào)查從調(diào)查對象的全部單位中選擇少數(shù)典型單位進行調(diào)查目的是描述和揭示事物的本質(zhì)特征和規(guī)律調(diào)查結(jié)果不能用于推斷總體統(tǒng)計報表1統(tǒng)計調(diào)查方式之一2過去曾經(jīng)是我國主要的數(shù)據(jù)收集方式3按照國家有關(guān)法規(guī)的規(guī)定、自上而下地統(tǒng)一布置、自下而上地逐級提供基本統(tǒng)計數(shù)據(jù)4有各種各樣的類型n統(tǒng)計數(shù)據(jù)的初步處理一 頻數(shù)表和頻數(shù)圖二 整理和展示數(shù)據(jù)定序數(shù)據(jù)的整理(可計算的指標(biāo))1.累計頻數(shù):將各類別的頻數(shù) 逐級累加2.累計頻率:將各類別的頻率 (百分比)逐級累加3.圖形:累計頻數(shù)分布圖、環(huán)形圖定類數(shù)據(jù)的整理1. 列

8、出各類別2. 計算各類別的頻數(shù)3. 制作頻數(shù)分布表4. 用圖形顯示數(shù)據(jù)(條形圖和餅圖)頻數(shù)分布表的編制 數(shù)據(jù)類型及圖示頻數(shù)分布的類型n 點估計的常見方法及應(yīng)用點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等n 如何區(qū)分假設(shè)檢驗問題?決策:雙尾檢驗H0: m = H1: m研究:將認(rèn)為研究結(jié)果是無效的說法或理論作為H0;是把希望證明的有效假設(shè)作為H1;先確立H1聲明:將所作出的聲明作為H0,對該說明的質(zhì)疑作為H1;先確立H0除非我們有證據(jù)表明“聲明”無效,否則就應(yīng)認(rèn)為該“聲明”是有效的n 介紹兩種以上多重比較方法Fisher提出的最小顯著差異方法,簡寫為LSD,該方法可用于判斷到底

9、哪些均值之間有差異n 分子生物學(xué)方差分析的作用和意義?n 數(shù)據(jù)缺失如何處理?為何要進行數(shù)據(jù)的變換?P171n 相關(guān)系數(shù)的其它計算形式n 聚類分析的思想和步驟a) 對數(shù)據(jù)進行變換;b) 定義樣品間的距離(如歐氏距離)、類別之間的距離(如最短距離);c) 首先將t個樣品各自視為一類:得到初始的分類G(1) (含有t類),計算t個樣品兩兩之間的距離,它們等價于初始的類間距離,得到初始的距離矩陣D(1) ;d) 將距離最近的兩類合并為一新類,得到新的分類G(2)(含有t-1類),并計算新類與其它類的類間距離,得到新的類間距離矩陣D(2) ,再按照最小距離準(zhǔn)則并類,得到G(3)(含有t-2類)、D(3)

10、, 。直到所有樣品都并成一類 ;畫出譜系聚類圖,決定分類的個數(shù)及各類的成員。n Stata的背景和功能,操作特點和心得3 計算題n 區(qū)間估計一 總體均值的區(qū)間估計(已知)1.假定條件總體服從正態(tài)分布,且總體方差()已知如果不是正態(tài)分布,可以由正態(tài)分布來近似 (n 30)2.使用正態(tài)分布統(tǒng)計量3.總體均值在1-置信水平下的置信區(qū)間為二 總體均值的區(qū)間估計(未知)1.假定條件總體方差()未知總體必須服從正態(tài)分布1. 使用 t 分布統(tǒng)計量2. 總體均值 m 在1-a置信水平下的置信區(qū)間為三 總體比例的區(qū)間估計1.假定條件兩類結(jié)果總體服從二項分布可以由正態(tài)分布來近似1. 使用正態(tài)分布統(tǒng)計量2. 總體比

11、例P 的置信區(qū)間為三樣本容量的確定估計總體均值時樣本容量的確定1. 根據(jù)均值區(qū)間估計公式可得樣本容量其中:2. 樣本容量n與總體方差s2、允許誤差D、可靠性系數(shù)Z之間的關(guān)系為與總體方差成正比與允許誤差成反比與可靠性系數(shù)成正比估計總體比例時樣本容量的確定1. 根據(jù)比例區(qū)間估計公式可得樣本容量其中:2. 若總體比例P未知時,可用樣本比例來代替第四節(jié) 兩個總體均值及兩個總體比例之差的估計一. 兩個總體均值之差估計(12 ,22已知)1. 假定條件兩個樣本是獨立的隨機樣本兩個總體都服從正態(tài)分布若不是正態(tài)分布, 可以用正態(tài)分布來近似(n130和n230)2. 兩個獨立樣本均值之差的抽樣分布服從正態(tài)分布,

12、其期望值為其標(biāo)準(zhǔn)誤差為3. 使用正態(tài)分布統(tǒng)計量4. 兩個總體均值之差1-2在1-置信水平下的置信區(qū)間為二兩個總體均值之差估計(12 ,22未知,但相等)1. 假定條件兩個總體都服從正態(tài)分布12 ,22未知,但相等 2. 總體方差2的聯(lián)合估計量為3. 估計量x1-x2的標(biāo)準(zhǔn)差為4. 使用 t 分布統(tǒng)計量5. 兩個總體均值之差m1-m2在1-a 置信水平下的置信區(qū)間為自由度三兩個總體均值之差估計(12 ,22未知,且不相等)1.假定條件兩個總體都服從正態(tài)分布s12、s22未知,且s12 ¹ s222.使用的統(tǒng)計量為 3. 兩個總體均值之差m1-m2在1-a 置信水平下的置信區(qū)間為四兩個總

13、體比例之差估計1.假定條件兩個總體是獨立的兩個總體服從二項分布可以用正態(tài)分布來近似2.兩個總體比例之差P1-P2在1-置信水平下的置信區(qū)間為第五節(jié) 正態(tài)總體方差及兩正態(tài)總體方差比的區(qū)間估計一. 正態(tài)總體方差的區(qū)間估計1.估計一個總體的方差或標(biāo)準(zhǔn)差2.假設(shè)總體服從正態(tài)分布3. 總體方差2 的點估計量為S2,且4. 總體方差在1-a置信水平下的置信區(qū)間為二. 兩個正態(tài)總體方差比的區(qū)間估計1. 比較兩個總體的方差比2. 用兩個樣本的方差比來判斷如果S12/ S22接近于1,說明兩個總體方差很接近如果S12/ S22遠離1,說明兩個總體方差之間存在差異3. 總體方差比在1-a置信水平下的置信區(qū)間為 n

14、 一般假設(shè)檢驗問題的計算一. 總體方差已知時的均值檢驗(雙尾 Z 檢驗)1.假定條件總體服從正態(tài)分布若不服從正態(tài)分布, 可用正態(tài)分布來近似(n³30)2.原假設(shè)為:H0: m=m0;備擇假設(shè)為:H1:m ¹m03.使用Z-統(tǒng)計量總體方差已知時的均值檢驗(單尾 Z 檢驗)1. 假定條件 總體服從正態(tài)分布 若不服從正態(tài)分布,可以用正態(tài)分布來近似 (n³30)2.備擇假設(shè)有< 或 >符號3.使用Z- 統(tǒng)計量二. 總體方差未知時的均值檢驗( t 檢驗)1.假定條件 總體為正態(tài)分布 如果不是正態(tài)分布, 只有輕微偏斜和大樣本 (n ³30)條件下2.使用

15、t- 統(tǒng)計量三. 總體比例的假設(shè)檢驗(Z 檢驗)1. 假定條件 有兩類結(jié)果 總體服從二項分布 可用正態(tài)分布來近似P0為假設(shè)的總體比例2. 比例檢驗的 Z-統(tǒng)計一 總體方差的檢驗(2 檢驗)1.檢驗一個總體的方差或標(biāo)準(zhǔn)差2.假設(shè)總體近似服從正態(tài)分布3.原假設(shè)為 H0: s2 = s02S2 樣本方差; 2假設(shè)的總體方差4.檢驗統(tǒng)計量 第三節(jié) 兩個正態(tài)總體的參數(shù)檢驗一 兩個總體參數(shù)之差的抽樣分布二 兩個總體均值之差的Z檢驗(12、22已知)1. 假定條件 兩個樣本是獨立的隨機樣本 兩個總體都是正態(tài)分布 若不是正態(tài)分布, 可以用正態(tài)分布來近似(n1³30和 n2³30)2. 原假

16、設(shè):H0: m1- m2 =0;備擇假設(shè):H1: m1- m2 ¹ 03. 檢驗統(tǒng)計量為兩個總體均值之差的 t 檢驗(12、22未知但相等)1. 檢驗具有等方差的兩個總體的均值2. 假定條件 兩個樣本是獨立的隨機樣本 兩個總體都是正態(tài)分布 兩個總體方差未知但相等12=223. 檢驗統(tǒng)計量兩個總體均值之差的 t 檢驗(12、22未知但不相等)4. 檢驗具有等方差的兩個總體的均值5. 假定條件 兩個樣本是獨立的隨機樣本 兩個總體都是正態(tài)分布 兩個總體方差未知但不相等12 226. 近似 t 檢驗, Aspin-Welch檢驗法,檢驗統(tǒng)計量 三 假設(shè)檢驗中相關(guān)樣本的利用兩個相關(guān)(配對或匹配

17、)樣本的均值檢驗四 兩個總體比例之差的檢驗(配對樣本的 t 檢驗)1.檢驗兩個相關(guān)總體的均值 配對或匹配 重復(fù)測量 (前/后)2.利用相關(guān)樣本可消除項目間的方差3.假定條件 兩個總體都服從正態(tài)分布 如果不服從正態(tài)分布,可用正態(tài)分布來近似 (n1 ³ 30 , n2 ³ 30 )統(tǒng)計量55 自由度df nD - 1樣本均值 樣本標(biāo)準(zhǔn)差兩個總體比例之差的檢驗(Z 檢驗)1.假定條件 兩個總體是獨立的 兩個總體都服從二項分布 可以用正態(tài)分布來近似2. 檢驗統(tǒng)計量n 單因素方差分析問題計算和檢驗提出假設(shè)l H0: m1 = m2 = mk (因素有k個水平)l H1: m1 ,m2

18、 , ,mk不全相等構(gòu)造檢驗統(tǒng)計量1. 為檢驗H0是否成立,需確定檢驗的統(tǒng)計量 2. 構(gòu)造統(tǒng)計量需要計算 總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和 (SSA) 之間的關(guān)系 SST = SSE + SSASSA的均方也稱為組間方差,記為MSA,計算公式為SSE的均方也稱為組內(nèi)方差,記為MSE,計算公式為統(tǒng)計決策將統(tǒng)計量的值F與給定的顯著性水平a的臨界值Fa進行比較,作出接受或拒絕原假設(shè)H0的決策§ 根據(jù)給定的顯著性水平a,在F分布表中查找與第一自由度df1k-1、第二自由度df2=n-k 相應(yīng)的臨界值 Fa § 若F>Fa ,則拒絕原假設(shè)H0 ,表明均值之間的差異是顯著的,所檢驗的因素(A)對觀察值有顯著影響§ 若F£Fa ,則不能拒絕原假設(shè)H0 ,表明所檢驗的因素(A)對觀察值沒有顯著影響 n 相關(guān)系數(shù)計算1.三相關(guān)系數(shù)的顯著性檢驗1. 檢驗兩個變量之間是否存在線性相關(guān)關(guān)系2. 等價于對相關(guān)系數(shù) r 的檢驗3. 采用 t 檢驗4. 檢驗的步驟為1. 提出假設(shè):H0:r = 0 ;H1: r ¹ 02. 計算檢驗的統(tǒng)計量: 3. 確定顯著性水平a,并作出決策1. 若|t|>ta

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論