生物醫(yī)學研究的統(tǒng)計學方法課后習題答案 2014 主編 方積乾_第1頁
生物醫(yī)學研究的統(tǒng)計學方法課后習題答案 2014 主編 方積乾_第2頁
生物醫(yī)學研究的統(tǒng)計學方法課后習題答案 2014 主編 方積乾_第3頁
生物醫(yī)學研究的統(tǒng)計學方法課后習題答案 2014 主編 方積乾_第4頁
生物醫(yī)學研究的統(tǒng)計學方法課后習題答案 2014 主編 方積乾_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 思考與練習參考答案第1章 緒論一、選擇題1. 研究中的基本單位是指 ( D )。A樣本 B. 全部對象 C影響因素D. 個體 E. 總體2. 從總體中抽取樣本的目的是( B )。A研究樣本統(tǒng)計量 B. 由樣本統(tǒng)計量推斷總體參數(shù)C研究典型案例 D. 研究總體統(tǒng)計量 . 計算統(tǒng)計指標3. 參數(shù)是指( B )。A參與個體數(shù) B. 描述總體特征的統(tǒng)計指標C描述樣本特征的統(tǒng)計指標 D. 樣本的總和 E. 參與變量數(shù) 4. 下列資料屬名義變量的是( E )。A白細胞計數(shù) B住院天數(shù)C門急診就診人數(shù) D患者的病情分級 E. ABO血型5關(guān)于隨機誤差下列不正確的是( C )。A受測量精密度限制 B無方向性

2、C. 也稱為偏倚不可避免 E. 增加樣本含量可降低其大小二、名稱解釋(答案略)1. 變量與隨機變量 2. 同質(zhì)與變異 3. 總體與樣本4. 參數(shù)與統(tǒng)計量 5. 誤差 6. 隨機事件7. 頻率與概率三、思考題1. 生物統(tǒng)計學與其他統(tǒng)計學有什么區(qū)別和聯(lián)系? 答:統(tǒng)計學可細分為數(shù)理統(tǒng)計學、經(jīng)濟統(tǒng)計學、生物統(tǒng)計學、衛(wèi)生統(tǒng)計學、醫(yī)學統(tǒng)計學等,都是關(guān)于數(shù)據(jù)的學問,是從數(shù)據(jù)中提取信息、知識的一門科學與藝術(shù)。而生物統(tǒng)計學是統(tǒng)計學原理與方法應用于生物學、醫(yī)學的一門科學,與醫(yī)學統(tǒng)計學和衛(wèi)生統(tǒng)計學很相似,其不同之處在于醫(yī)學統(tǒng)計學側(cè)重于介紹醫(yī)學研究中的統(tǒng)計學原理與方法,而衛(wèi)生統(tǒng)計學更側(cè)重于介紹社會、人群健康研究中的統(tǒng)

3、計學原理與方法。2. 某年級甲班、乙班各有男生50人。從兩個班各抽取10人測量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推論甲班所有同學的平均身高大于乙班?為什么?答:不能。因為,從甲、乙兩班分別抽取的10人,測量其身高,得到的分別是甲、乙兩班的一個樣本。樣本的平均身高只是甲、乙兩班所有同學平均身高的一個點估計值。即使是按隨機化原則進行抽樣,由于存在抽樣誤差,樣本均數(shù)與總體均數(shù)一般很難恰好相等。因此,不能僅憑兩個樣本均數(shù)高低就作出兩總體均數(shù)熟高熟低的判斷,而應通過統(tǒng)計分析,進行統(tǒng)計推斷,才能作出判斷。3. 某地區(qū)有10萬個7歲發(fā)育正常的男孩,為了研究這些7歲發(fā)育正常男孩的身高和體重

4、,在該人群中隨機抽取200個7歲發(fā)育正常的男孩,測量他們的身高和體重,請回答下列問題。(1)該研究中的總體是什么?答:某地區(qū)10萬個7歲發(fā)育正常的男孩。(2)該研究中的身高總體均數(shù)的意義是什么? 答:身高總體均數(shù)的意義是: 10萬個7歲發(fā)育正常的男孩的平均身高。(3)該研究中的體重總體均數(shù)的意義是什么? 答:體重總體均數(shù)的意義是: 10萬個7歲發(fā)育正常的男孩的平均體重(4) 該研究中的總體均數(shù)與總體是什么關(guān)系? 答:總體均數(shù)是反映總體的統(tǒng)計學特征的指標。(5)該研究中的樣本是什么? 答:該研究中的樣本是:隨機抽取的200個7歲發(fā)育正常的男孩。 (宇傳華 方積乾) 第2章 統(tǒng)計描述 思考與練習參

5、考答案一、最佳選擇題1. 編制頻數(shù)表時錯誤的作法是( E )。A. 用最大值減去最小值求全距 B. 組距常取等組距,一般分為1015組C. 第一個組段須包括最小值 D. 最后一個組段須包括最大值E. 寫組段,如“1.53,35, 56.5,”2. 描述一組負偏峰分布資料的平均水平時,適宜的統(tǒng)計量是( A )。A. 中位數(shù) B. 幾何均數(shù) C. 調(diào)和均數(shù) D. 算術(shù)均數(shù) E. 眾數(shù)3. 比較5年級小學生瞳距和他們坐高的變異程度,宜采用( A )。A. 變異系數(shù) B. 全距 C. 標準差D. 四分位數(shù)間距 E. 百分位數(shù)P2.5與P97.5的間距4. 均數(shù)和標準差S的關(guān)系是( A )。A. S越小

6、,對樣本中其他個體的代表性越好 B. S越大,對樣本中其他個體的代表性越好C. 越小,S越大D. 越大,S越小E. 必小于5. 計算乙肝疫苗接種后血清抗-HBs的陽轉(zhuǎn)率,分母為( B )。A. 陽轉(zhuǎn)人數(shù) B. 疫苗接種人數(shù) C. 乙肝患者數(shù)D. 乙肝病毒攜帶者數(shù) E. 易感人數(shù)6. 某醫(yī)院的院內(nèi)感染率為5.2人/千人日,則這個相對數(shù)指標屬于( C )。A. 頻率 B. 頻率分布 C. 強度 D. 相對比 E. 算術(shù)均數(shù)7. 縱坐標可以不從0開始的圖形為( D )。A. 直方圖 B. 單式條圖 C. 復式條圖 D. 箱式圖 E. 以上均不可二、簡答題1. 對定量資料進行統(tǒng)計描述時,如何選擇適宜的

7、指標? 答:詳見教材表2-18。教材表2-18 定量資料統(tǒng)計描述常用的統(tǒng)計指標及其適用場合描述內(nèi)容指 標意 義適 用 場 合平均水平均 數(shù)個體的平均值對稱分布幾何均數(shù)平均倍數(shù)取對數(shù)后對稱分布中 位 數(shù)位次居中的觀察值非對稱分布;半定量資料;末端開口資料;分布不明眾 數(shù)頻數(shù)最多的觀察值不拘分布形式,概略分析調(diào)和均數(shù)基于倒數(shù)變換的平均值正偏峰分布資料變 異 度全 距觀察值取值范圍不拘分布形式,概略分析標 準 差(方 差)觀察值平均離開均數(shù)的程度對稱分布,特別是正態(tài)分布資料四分位數(shù)間距居中半數(shù)觀察值的全距非對稱分布;半定量資料;末端開口資料;分布不明變異系數(shù)標準差與均數(shù)的相對比不同量綱的變量間比較;

8、量綱相同但數(shù)量級相差懸殊的變量間比較2. 舉例說明頻率和頻率分布的區(qū)別和聯(lián)系。 答:2005年某醫(yī)院為了調(diào)查肺癌患者接受姑息手術(shù)治療1年后的情況,被調(diào)查者150人,分別有30人病情穩(wěn)定,66人處于進展狀態(tài),54人死亡。當研究興趣只是了解死亡發(fā)生的情況,則只需計算死亡率54/150=36%,屬于頻率指標。當研究者關(guān)心患者所有可能的結(jié)局時,則可以算出反映3種結(jié)局的頻率分別為20%、44%、36%,它們共同構(gòu)成所有可能結(jié)局的頻率分布,是若干陽性率的組合。兩者均為“陽性率”,都是基于樣本信息對總體特征進行估計的指標。不同的是:頻率只是一種結(jié)局發(fā)生的頻率,計算公式的分子是某一具體結(jié)局的發(fā)生數(shù);頻率分布則

9、由諸結(jié)局發(fā)生的頻率組合而成,計算公式的分子分別是各種可能結(jié)局的發(fā)生數(shù),而分母則與頻率的計算公式中分母相同,是樣本中被觀察的單位數(shù)之和。3. 應用相對數(shù)時應注意哪些問題?答:(1)防止概念混淆 相對數(shù)的計算是兩部分觀察結(jié)果的比值,根據(jù)這兩部分觀察結(jié)果的特點,就可以判斷所計算的相對數(shù)屬于前述何種指標。(2)計算相對數(shù)時分母不宜過小 樣本量較小時以直接報告絕對數(shù)為宜。(3)觀察單位數(shù)不等的幾個相對數(shù),不能直接相加求其平均水平。(4)相對數(shù)間的比較須注意可比性,有時需分組討論或計算標準化率。4. 常用統(tǒng)計圖有哪些?分別適用于什么分析目的? 答:詳見教材表2-20。教材表2-20 常用統(tǒng)計圖的適用資料及

10、實施方法圖 形適 用 資 料實 施 方 法條 圖組間數(shù)量對比用直條高度表示數(shù)量大小直 方 圖定量資料的分布用直條的面積表示各組段的頻數(shù)或頻率百分條圖構(gòu)成比用直條分段的長度表示全體中各部分的構(gòu)成比餅 圖構(gòu)成比用圓餅的扇形面積表示全體中各部分的構(gòu)成比線 圖定量資料數(shù)值變動線條位于橫、縱坐標均為算術(shù)尺度的坐標系半對數(shù)線圖定量資料發(fā)展速度線條位于算術(shù)尺度為橫坐標和對數(shù)尺度為縱坐標的坐標系散 點 圖雙變量間的關(guān)聯(lián)點的密集程度和形成的趨勢,表示兩現(xiàn)象間的相關(guān)關(guān)系箱 式 圖定量資料取值范圍用箱體、線條標志四分位數(shù)間距及中位數(shù)、全距的位置莖 葉 圖定量資料的分布用莖表示組段的設置情形,葉片為個體值,葉長為頻數(shù)

11、三、計算題1. 某內(nèi)科醫(yī)生調(diào)查得到100名4050歲健康男子總膽固醇(mg/dl),結(jié)果如下22719022425922523818019321419521319320917224419915520820319925318119622421022025525721624923522019020319714917523620220917418417418516723516721017124820126618922219919721419919823024620920218621720620020319716124713818615619516327317819020725918619424617

12、2234232189172235207208231234226174199278277181(1)編制頻數(shù)表,繪制直方圖,討論其分布特征。答:頻數(shù)表見練習表2-1。根據(jù)直方圖(練習圖2-1),可認為資料為基本對稱分布,其包絡線見練習圖2-2。練習表2-1 某地100名4050歲健康男子總膽因醇/(mg·dl-1)FrequencyPercentValid PercentCumulative PercentValid 130145160175190205220235250265280Total1 3 11 12 25 15 13 11 5 4 100 1.0 3.011.012.025

13、.015.013.011.05.04.0100.0 1.0 3.011.012.025.015.013.011.05.04.0100.0 1.04.015.027.052.067.080.091.096.0100.0 練習圖2-1 直方圖練習圖2-2 包絡線圖(2)根據(jù)(1)的討論結(jié)果,計算恰當?shù)慕y(tǒng)計指標描述資料的平均水平和變異度。答:利用原始數(shù)據(jù),求出算術(shù)均數(shù) mg/dl 和標準差mg/dl。(3)計算P25,P75和P95。答:利用原始數(shù)據(jù),求出P25=186.8 mg/dl,P75=229.3 mg/dl,P95=259.0 mg/dl。2. 某地對120名微絲蚴血癥患者治療3個療程后,

14、用IFA間接熒光抗體試驗測得抗體滴度如下,求抗體滴度的平均水平。抗體滴度1:51:101:201:401:801:1601:320例 數(shù)516273422133利用上述頻數(shù)表,得平均滴度為1:36.3。3. 某地19751980年出血熱發(fā)病和死亡資料如教材表2-21,設該地人口數(shù)在此6年間基本保持不變。教材表2-21 某地6年間出血熱的發(fā)病與死亡情況年 份發(fā)病數(shù)病死數(shù)1975324197656519771621219782411319793301019802745試分析:(1)粗略判斷發(fā)病率的變化情況怎樣。答:該地人口數(shù)在此6年間基本保持不變,發(fā)病人數(shù)在1979年前逐年上升,1980年略有下降

15、??梢哉J為發(fā)病率大致呈上升趨勢,1980年略有下降。(2)病死率的變化情況怎樣? 答: 病死率由各年度病死數(shù)除以發(fā)病數(shù)獲得,病死率依次為12.5%、8.9%、7.4%、5.4%、3.0%和1.8%,呈逐年下降趨勢。(3)上述分析內(nèi)容可用什么統(tǒng)計圖繪制出來? 答:由于沒有給出該地人口數(shù),故不能計算發(fā)病率,可用普通線圖表示發(fā)病數(shù)變化情況。病死率的下降情況可以用普通線圖表示,下降速度則可以用半對數(shù)線圖表示。(4)評述該地區(qū)出血熱防治工作的效果。答:隨著時間的推移,預防工作做得不好,治療水平則逐年提高(體現(xiàn)在病死率下降)。 (張晉昕)第3章 概率分布思考與練習參考答案一、最佳選擇題1. 某資料的觀察值

16、呈正態(tài)分布,理論上有( C )的觀察值落在范圍內(nèi)。A. 68.27% B. 90% C. 95% D. 99% E. 45%2. 正態(tài)曲線下,從均數(shù)到的面積為( A )。A. 45% B. 90% C. 95% D. 47.5% E. 99%3. 若正常人的血鉛含量X近似服從對數(shù)正態(tài)分布,則制定X的95%參考值范圍,最好采用(其中 , 為Y的標準差)( C )。A. B. C. D. E.4. 在樣本例數(shù)不變的情況下,若( D ),則二項分布越接近對稱分布。 A. 總體率越大 B. 樣本率p越大 C. 總體率越小 D. 總體率越接近0.5 E. 總體率接近0.1或0.55. 鉛作業(yè)工人周圍血象

17、點彩紅細胞在血片上的出現(xiàn)數(shù)近似服從( D )。A. 二項分布 B. 正態(tài)分布 C. 偏態(tài)分布 D. Poisson分布 E. 對稱分布6. Poisson分布的均數(shù)與標準差的關(guān)系是( E )。A. B. C. D. E. 二、思考題1. 服從二項分布及Poisson分布的條件分別是什么?簡答:二項分布成立的條件:每次試驗只能是互斥的兩個結(jié)果之一;每次試驗的條件不變;各次試驗獨立。Poisson分布成立的條件:除二項分布成立的三個條件外,還要求試驗次數(shù)很大,而所關(guān)心的事件發(fā)生的概率很小。2. 二項分布、Poisson分布分別在何種條件下近似正態(tài)分布?簡答: 二項分布的正態(tài)近似:當n較大,不接近0

18、也不接近1時,二項分布B(,)近似正態(tài)分布N(, )。Poisson分布的正態(tài)近似:Poisson分布,當相當大時(20),其分布近似于正態(tài)分布。三、計算題1. 已知某種非傳染性疾病常規(guī)療法的有效率為80%,現(xiàn)對10名該疾病患者用常規(guī)療法治療,問至少有9人治愈的概率是多少?解:對10名該疾病患者用常規(guī)療法治療,各人間對藥物的反應具有獨立性,且每人服藥后治愈的概率均可視為0.80,這相當于作10次獨立重復試驗,即=0.80,n=10的貝努利試驗,因而治愈的人數(shù)X服從二項分布。至少有9人治愈的概率為: 至少有9人治愈的概率是37.58%?;蛘?. 據(jù)以往的統(tǒng)計資料,某地新生兒染色體異常率為1%,問

19、100名新生兒中染色體異常不少于2名的概率是多少?解:=3. 調(diào)查某市2000年110名20歲男性青年的身高(cm)資料如下:173.1 166.8 172.9 175.9 172.8 170.5 174.1 174.2 175.7 173.5168.2 173.7 184.4 174.8 172.5 174.9 174.9 174.2 173.8 176.2170.9 165.0 176.3 174.2 179.8 174.5 180.5 171.5 178.9 171.5166.7 170.8 168.8 177.5 174.5 183.5 182.0 170.9 173.5 177.51

20、81.2 177.1 172.3 176.5 174.0 174.3 174.6 172.6 171.3 173.1176.9 170.5 174.2 177.5 176.6 182.3 172.1 169.9 179.5 175.8178.6 180.6 175.6 173.3 168.7 174.5 178.5 171.3 172.0 173.2168.8 176.0 182.6 169.5 177.5 180.6 181.5 175.1 165.2 168.0175.4 169.2 170.0 171.9 176.6 178.8 177.2 173.4 168.5 177.6175.8

21、164.8 175.6 180.0 176.6 176.5 177.7 174.1 180.8 170.6173.8 180.7 176.3 177.5 178.3 176.0 174.8 180.8 176.5 179.2(1)試估計當年該市20歲男性青年中,身高在175.0178.0(cm)內(nèi)的占多大比例?(2)估計當年該市95%以及99%的20歲男青年身高范圍。(3)若當年由該市隨機抽查1名20歲男青年,試估計其身高超過180 cm的概率。解:用SPSS計算本題。數(shù)據(jù)文件:data3-n.sav。數(shù)據(jù)格式:數(shù)據(jù)庫2列110行,變量n為男性青年序號,x表示身高。操作步驟:操作說明Analy

22、ze Descriptive StatisticsDescriptives Options Mean Std. Deviation Continue Variables: x OK調(diào)用Descriptives過程計算得均數(shù)=174.766,標準差=4.150 9TransformCompute調(diào)用“變量計算(Compute Variable)”對話框Target Variable P 定義目標變量“P”Numeric Expression:CDF.NORMAL(178.0,174.766,4.1509)-CDF.NORMAL(175.0,174.766,4.1509) OK當年該市20歲男性青

23、年中,身高在175.0178.0 cm內(nèi)的比例Target Variable x1 該市95%以及99%的20歲男青年身高范圍間的比例Numeric Expression:174.766-1.96*4.1509OKTarget Variable x2 Numeric Expression:174.766+1.96*4.1509OKTarget Variable x3 Numeric Expression:174.766-2.58*4.1509OKTarget Variable x4 Numeric Expression:174.766+2.58*4.1509OKTarget Variable

24、p1 Numeric Expression:1-CDF.NORMAL(180.0,174.766,4.1509)OK由該市隨機抽查1名20歲男青年,其身高超過180 cm的概率計算結(jié)果(練習圖3-1):Descriptive StatisticsNMeanStd. Deviationx110174.7664.1509Valid N (listwise)110練習圖3-1 SPSS輸出結(jié)果以上是SPSS輸出結(jié)果,得到均數(shù)(Mean)為174.766 cm,標準差(Std. Deviation)為4.150 9 cm。估計當年該市20歲男性青年中,身高在175.0178.0 cm內(nèi)的比例為25.9

25、56%,身高在175.0178.0 cm內(nèi)的約有29人。 估計當年該市95%的20歲男青年身高范圍為166.63182.90 cm,99% 的20歲男青年身高范圍為164.06185.48 cm。 由該市隨機抽查1名20歲男青年,估計其身高超過180 cm的概率約為10%。 (祁愛琴 高 永 石德文)第4章 參數(shù)估計思考與練習參考答案 一、最佳選擇題1.關(guān)于以0為中心的t分布,錯誤的是()A. t分布的概率密度圖是一簇曲線B. t分布的概率密度圖是單峰分布C. 當n®時,t分布®Z分布 D. t分布的概率密度圖以0為中心,左右對稱E. n相同時,值越大,P值越大2.某指標的

26、均數(shù)為,標準差為S,由公式計算出來的區(qū)間常稱為()。A. 99%參考值范圍 B. 95%參考值范圍 C. 99%置信區(qū)間D. 95%置信區(qū)間 E. 90%置信區(qū)間3.樣本頻率與總體概率均已知時,計算樣本頻率p的抽樣誤差的公式為()。A. B. C. D. E. 4在已知均數(shù)為, 標準差為 的正態(tài)總體中隨機抽樣, ()的概率為5%。A. B. C. D. E.5. ()小,表示用樣本均數(shù)估計總體均數(shù)的精確度高。A. CV B. S C. D. R E. 四分位數(shù)間距6. 95%置信區(qū)間的含義為():A. 此區(qū)間包含總體參數(shù)的概率是95% B. 此區(qū)間包含總體參數(shù)的可能性是95%C. “此區(qū)間包含

27、總體參數(shù)”這句話可信的程度是95%D. 此區(qū)間包含樣本統(tǒng)計量的概率是95% E. 此區(qū)間包含樣本統(tǒng)計量的可能性是95%二、思考題1. 簡述標準誤與標準差的區(qū)別。 答: 區(qū)別在于:(1)標準差反映個體值散布的程度,即反映個體值彼此之間的差異;標準誤反映精確知道總體參數(shù)(如總體均數(shù))的程度。(2)標準誤小于標準差。(3)樣本含量越大,標準誤越小,其樣本均數(shù)更有可能接近于總體均數(shù),但標準差不隨樣本含量的改變而有明顯方向性改變,隨著樣本含量的增大,標準差有可能增大,也有可能減小。2. 什么叫抽樣分布的中心極限定理? 答: 樣本含量n越大,樣本均數(shù)所對應的標準差越小,其分布也逐漸逼近正態(tài)分布,這種現(xiàn)象統(tǒng)

28、計學上稱為中心極限定理(central limit theorem)。當有足夠的樣本含量(如)時,從任何總體中抽取隨機樣本的樣本均數(shù)近似地服從正態(tài)分布。樣本含量越大,抽樣分布越接近于正態(tài)分布。正態(tài)分布的近似程度與總體自身的概率分布和樣本含量有關(guān)。如果總體原本就是正態(tài)分布,那么對于所有值,抽樣分布均為正態(tài)分布。如果總體為非正態(tài)分布,僅在n值較大情況下近似服從正態(tài)分布。一般說,時的抽樣分布近似為正態(tài)分布;但是,如果總體分布極度非正態(tài)(如雙峰分布、極度偏峰分布),即使有足夠大的值,抽樣分布也將為非正態(tài)。3. 簡述置信區(qū)間與醫(yī)學參考值范圍的區(qū)別。 答: 置信區(qū)問與醫(yī)學參考值范圍的區(qū)別見練習表4-1。練

29、習表4-1 置信區(qū)間與醫(yī)學參考值范圍的區(qū)別區(qū)別置信區(qū)間參考值范圍含義用途計算公式總體參數(shù)的波動范圍,即按事先給定的概率100(1-a)%所確定的包含未知總體參數(shù)的一個波動范圍估計未知總體均數(shù)所在范圍s未知: s已知或s未知但n30,有或個體值的波動范圍,即按事先給定的范圍100(1-a)%所確定的“正常人”的解剖、生理、生化指標的波動范圍供判斷觀察個體某項指標是否“正常”時參考(輔助診斷)正態(tài)分布: 偏峰分布:PXP100-X4. 何謂置信區(qū)間準確度與精確度?如何協(xié)調(diào)兩者間的關(guān)系。答:置信區(qū)間有準確度(accuracy)與精密度(precision)兩個要素。準確度由置信度(1a) 的大小確定

30、,即由置信區(qū)間包含總體參數(shù)的可能性大小來反映。從準確度的角度看,置信度愈接近于1愈好,如置信度99比95好。精密度是置信區(qū)間寬度的一半(即、),意指置信區(qū)間的兩端點值離樣本統(tǒng)計量(如、p)的距離。從精密度的角度看,置信區(qū)間寬度愈窄愈好。在抽樣誤差確定的情況下,兩者是相互矛盾的。為了同時兼顧置信區(qū)間的準確度與精密度,可適當增加樣本含量。三、計算題1.隨機抽取了100名一年級大學生,測得空腹血糖均數(shù)為4.5 mmol/L,標準差為0.61 mmol/L。試估計一年級大學生空腹血糖總體均數(shù)及方差的95置信區(qū)間。答:總體均數(shù)95置信區(qū)間為(4.379,4.621),方差的95置信區(qū)間為(0.286 9

31、, 0.502 1)。2.調(diào)查某地蟯蟲感染情況,隨機抽樣調(diào)查了260人,感染人數(shù)為100。試估計該地蟯蟲感染率的95%置信區(qū)間。 答:該地蟯蟲感染率的95%置信區(qū)間為(32.55,44.38)。(宇傳華) 第5章 假設檢驗 思考與練習參考答案一、最佳選擇題1. 樣本均數(shù)比較作t檢驗時,分別取以下檢驗水準,以( E )所取類錯誤最小。A. B. C. D. E. 2. 在單組樣本均數(shù)與一個已知的總體均數(shù)比較的假設檢驗中,結(jié)果t=3.24,t0.05,v =2.086, t0.01,v =2.845。正確的結(jié)論是( E )。A. 此樣本均數(shù)與該已知總體均數(shù)不同B. 此樣本均數(shù)與該已知總體均數(shù)差異很

32、大C. 此樣本均數(shù)所對應的總體均數(shù)與該已知總體均數(shù)差異很大D. 此樣本均數(shù)所對應的總體均數(shù)與該已知總體均數(shù)相同E. 此樣本均數(shù)所對應的總體均數(shù)與該已知總體均數(shù)不同3. 假設檢驗的步驟是( A )。 A. 建立假設,選擇和計算統(tǒng)計量,確定P值和判斷結(jié)果B. 建立無效假設,建立備擇假設,確定檢驗水準C. 確定單側(cè)檢驗或雙側(cè)檢驗,選擇t檢驗或Z檢驗,估計類錯誤和類錯誤D. 計算統(tǒng)計量,確定P值,作出推斷結(jié)論E. 以上都不對4. 作單組樣本均數(shù)與一個已知的總體均數(shù)比較的t檢驗時,正確的理解是( C )。A. 統(tǒng)計量t越大,說明兩總體均數(shù)差別越大B. 統(tǒng)計量t越大,說明兩總體均數(shù)差別越小C. 統(tǒng)計量t越

33、大,越有理由認為兩總體均數(shù)不相等D. P值就是aE. P值不是a,且總是比a小5. 下列( E )不是檢驗功效的影響因素的是:A. 總體標準差 B. 容許誤差 C. 樣本含量nD. 類錯誤 E. 類錯誤二、思考題1試述假設檢驗中與P的聯(lián)系與區(qū)別。答:a值是決策者事先確定的一個小的概率值。P值是在成立的條件下,出現(xiàn)當前檢驗統(tǒng)計量以及更極端狀況的概率。Pa時,拒絕假設。2. 試述假設檢驗與置信區(qū)間的聯(lián)系與區(qū)別。答:區(qū)間估計與假設檢驗是由樣本數(shù)據(jù)對總體參數(shù)作出統(tǒng)計學推斷的兩種主要方法。置信區(qū)間用于說明量的大小,即推斷總體參數(shù)的置信范圍;而假設檢驗用于推斷質(zhì)的不同,即判斷兩總體參數(shù)是否不等。 3. 怎

34、樣正確運用單側(cè)檢驗和雙側(cè)檢驗?答:選用雙側(cè)檢驗還是單側(cè)檢驗需要根據(jù)數(shù)據(jù)的特征及專業(yè)知識進行確定。若比較甲、乙兩種方法有無差異,研究者只要求區(qū)分兩方法有無不同,無需區(qū)分何者為優(yōu),則應選用雙側(cè)檢驗。若甲法是從乙法基礎(chǔ)上改進而得,已知如此改進可能有效,也可能無效,但不可能改進后反不如以前,則應選用單側(cè)檢驗。在沒有特殊專業(yè)知識說明的情況下,一般采用雙側(cè)檢驗即可。4. 試述兩類錯誤的意義及其關(guān)系。答:類錯誤(typeerror):如果檢驗假設實際是正確的,由樣本數(shù)據(jù)計算獲得的檢驗統(tǒng)計量得出拒絕的結(jié)論,此時就犯了錯誤,統(tǒng)計學上將這種拒絕了正確的零假設(棄真)的錯誤稱為類錯誤。類錯誤(type error)

35、:假設檢驗的另一類錯誤稱為類錯誤(type error),即檢驗假設原本不正確(正確),由樣本數(shù)據(jù)計算獲得的檢驗統(tǒng)計量得出不拒絕(納偽)的結(jié)論,此時就犯了類錯誤。類錯誤的概率用b 表示。在假設檢驗時,應兼顧犯類錯誤的概率()和犯類錯誤的概率()。犯類錯誤的概率()和犯類錯誤的概率()成反比。如果把類錯誤的概率定得很小,勢必增加犯類錯誤的概率,從而降低檢驗效能;反之,如果把類錯誤的概率定得很小,勢必增加犯類錯誤的概率,從而降低了置信度。為了同時減小和,只有通過增加樣本含量,減少抽樣誤差大小來實現(xiàn)。5試述檢驗功效的概念和主要影響因素。答:拒絕不正確的的概率,在統(tǒng)計學中稱為檢驗功效(power of

36、 test),記為。檢驗功效的意義是:當兩個總體參數(shù)間存在差異時(如備擇假設:成立時),所使用的統(tǒng)計檢驗能夠發(fā)現(xiàn)這種差異(拒絕零假設:)的概率,一般情況下要求檢驗功效應在0.8以上。影響檢驗功效的四要素為總體參數(shù)的差異、總體標準差、檢驗水準及犯類錯誤的概率。6簡述假設檢驗的基本思想。答:假設檢驗是在H0成立的前提下,從樣本數(shù)據(jù)中尋找證據(jù)來拒絕、接受的一種“反證”方法。如果從樣本數(shù)據(jù)中得到的證據(jù)不足,則只能不拒絕,暫且認為成立(因為拒絕的證據(jù)不足),即樣本與總體間的差異僅僅是由于抽樣誤差所引起。拒絕是根據(jù)某個界值,即根據(jù)小概率事件確定的。所謂小概率事件是指如果比檢驗統(tǒng)計量更極端(即絕對值更大)的

37、概率較小,比如小于等于0.05(各種科研雜志習慣上采用這一概率值),則認為零假設的事件在某一次抽樣研究中不會發(fā)生,此時有充分理由拒絕,即有足夠證據(jù)推斷差異具有統(tǒng)計學意義。三、計算題1. 一般正常成年男子血紅蛋白的平均值為140 g/L,某研究者隨機抽取25名高原地區(qū)成年男子進行檢查,得到血紅蛋白均數(shù)為155 g/L,標準差25 g/L。問:高原地區(qū)成年男子的血紅蛋白是否比一般正常成年男子的高? 解: : (單側(cè))=3.00 t=3,可認為高原地區(qū)居民的血紅蛋白比一般正常成年男子的高。2. 一般而言,對某疾病采用常規(guī)治療,其治愈率約為45%。現(xiàn)改用新的治療方法,并隨機抽取180名該疾病患者進行了

38、新療法的治療,治愈117人。問新治療方法與常規(guī)療法的效果是否有差別?解:,:,5.41Z=5.41,可認為新治療方法與常規(guī)療法的效果不同,新療法優(yōu)于常規(guī)療法。 (林愛華 宇傳華)第6章 兩樣本定量資料的比較思考與練習參考答案一、 最佳選擇題1. 正態(tài)性檢驗,按 =0.10檢驗水準,認為其總體服從正態(tài)分布,此時若推斷有錯,其錯誤的概率為( D )。A. 大于0.10 B. 等于0.10 C. 小于0.10 D. 等于,而未知 E. 等于1-,而未知2. 甲、乙兩人分別從同一隨機數(shù)字表抽取30個(各取兩位數(shù)字)隨機數(shù)字作為兩個樣本,求得、,則理論上( C )。A. B. C. 由甲、乙兩樣本均數(shù)之

39、差求出的總體均數(shù)95%可信區(qū)間,很可能包括0D. 作兩樣本均數(shù)比較的t檢驗,必然得出無統(tǒng)計學意義的結(jié)論E. 作兩樣本方差比較的F檢驗,必然方差齊3. 兩樣本均數(shù)比較時,能用來說明兩組總體均數(shù)間差別大小的是( D )。 A. t值 B. P值 C. F值 D. 兩總體均數(shù)之差的95%置信區(qū)間E. 上述答案均不正確4. 兩小樣本均數(shù)比較,方差不齊時,下列說法不正確的是( C )。A. 采用秩和檢驗 B. 采用t檢驗 C. 仍用t檢驗 D. 變量變換后再作決定E. 要結(jié)合正態(tài)性檢驗結(jié)果方能作出決定5. 兩樣本秩和檢驗的是 ( B )。A. 兩樣本秩和相等 B. 兩總體分布相同 C. 兩樣本分布相同

40、D. 兩總體秩和相等 E. 兩總體均數(shù)相等6. 在統(tǒng)計檢驗中是否選用非參數(shù)統(tǒng)計方法( A )。 A. 要根據(jù)研究目的和數(shù)據(jù)特征作決定 B. 可在算出幾個統(tǒng)計量和得出初步結(jié)論后進行選擇 C. 要看哪個統(tǒng)計結(jié)論符合專業(yè)理論 D. 要看哪個值更小 E. 既然非參數(shù)統(tǒng)計對資料沒有嚴格的要求,在任何情況下均能直接使用7. 配對樣本差值的Wilcoxon符號秩和檢驗,確定P值的方法是( D )。A. T越大,P值越小B. T越大,P值越大C. T值在界值范圍內(nèi),P值小于相應的D. T值界值,P值大于相應的值E. T值在界值范圍上,P值大于相應的8. 成組設計兩樣本比較的秩和檢驗,其檢驗統(tǒng)計量T是( C )

41、。A. 為了查T界值表方便,一般以秩和較小者為TB. 為了查T界值表方便,一般以秩和較大者為TC. 為了查T界值表方便,一般以例數(shù)較小者秩和為TD. 為了查T界值表方便,一般以例數(shù)較大者秩和為TE. 當兩樣本例數(shù)不等時,任取一樣本的秩和為T都可以查T界值表二、思考題1假設檢驗中,P值和的含義是什么?兩者有什么關(guān)系? 答:P是指H0成立時出現(xiàn)目前樣本情形的概率最多是多大, 是事先確定的檢驗水準。但P值的大小和沒有必然關(guān)系。2. 既然假設檢驗的結(jié)論有可能有錯,為什么還要進行假設檢驗? 答:假設檢驗中,無論拒絕不拒絕H0,都可能會犯錯誤,表現(xiàn)為拒絕H0時,會犯類錯誤,不拒絕H0時,會犯類錯誤,但這并

42、不能否認假設檢驗的作用。只要涉及到抽樣,就會有抽樣誤差的存在,因此就需要進行假設檢驗。只是要注意,假設檢驗的結(jié)論只是個概率性的結(jié)論,它的理論基礎(chǔ)是“小概率事件不可能原理”。3. 配對設計資料能否用完全隨機設計資料的統(tǒng)計檢驗方法?為什么?答:不能。采用完全隨機設計資料的t檢驗會使檢驗效能降低,從而可能會使應有的差別檢驗不出來。4. 對于完全隨機設計兩樣本定量資料的比較,如何選擇統(tǒng)計方法? 答:完全隨機設計兩樣本定量資料比較統(tǒng)計方法的選擇最關(guān)鍵的是看是否滿足正態(tài)性(樣本量較大時不必進行正態(tài)性檢驗)和方差齊性。如果資料來自正態(tài)總體且總體方差齊,采用t 檢驗;如果滿足正態(tài)性但總體方差不齊,采用t檢驗;

43、當兩者都不滿足時,才考慮選用秩和檢驗。當然,我們也可采用變量變換的方法使其滿足t或t檢驗的條件。5. 為什么在秩和檢驗編秩次時不同組間出現(xiàn)相同數(shù)據(jù)要給予“平均秩次”,而同一組的相同數(shù)據(jù)不必計算“平均秩次”? 答:秩和檢驗編秩次時不同組間出現(xiàn)相同數(shù)據(jù)要給予“平均秩次”,而同一組的相同數(shù)據(jù)不必計算“平均秩次”,是因為取不取“平均秩次”對該組的總的秩和沒有影響。三、計算題 1. 某單位研究飼料中維生素E缺乏對肝中維生素A含量的影響,將同種屬、同年齡、同性別、同體重的大白鼠配成8對,并將每對動物隨機分配到正常飼料組和缺乏維生素E的飼料組,定期將大白鼠殺死,測定其肝中維生素A的含量(教材表6-12),問

44、飼料中維生素E缺乏對肝中維生素A的平均含量有無影響? 教材表6-12 正常飼料組與維生素E缺乏組大白鼠肝中維生素A含量/(U·mg-1) 大白鼠對別12345678正常飼料組3.552.603.003.953.803.753.453.05維生素E缺乏組2.452.401.803.203.252.702.401.75解:此題是個配對設計的資料,差值的正態(tài)性檢驗結(jié)果表明:差值來自正態(tài)總體(檢驗:P=0.268),所以采用配對t檢驗。結(jié)果為:t=6.837,=7,P0.001,拒絕H0,可以認為維生素E缺乏對肝中維生素A含量有影響。2. 某實驗室觀察局部溫熱治療小鼠移植性腫瘤的療效,以生存

45、日數(shù)作為觀察指標。實驗結(jié)果如下,請比較兩組的平均生存日數(shù)有無差別。實驗組10121415151718202680對照組2367891012121330解:此題是個完全隨機設計的資料。兩組資料的正態(tài)性檢驗結(jié)果表明,差值來自正態(tài)總體(檢驗:P10.001,P2=0.011),所以采用兩樣本比較的秩和檢驗。結(jié)果為:T1=150.5, T2=80.5,本例中n110,n2n11,對應雙側(cè)0.05的界值為81139,故在0.05的水平上拒絕H0,認為兩組小鼠生存日數(shù)不同。 (施學忠 楊永利 趙耐青)第7章 多組定量資料的比較思考與練習參考答案一、最佳選擇題1. 完全隨機設計資料的方差分析中,必然有( C

46、 )。 A. > B. C. =+ D. E. 2. 定量資料兩樣本均數(shù)的比較,可采用( D )。 A. 檢驗 B.檢驗 C. Bonferroni檢驗 D. 檢驗與檢驗均可 E. LSD檢驗3. 當組數(shù)等于2時,對于同一資料,方差分析結(jié)果與檢驗結(jié)果相比,( C )。A. 檢驗結(jié)果更為準確 B. 方差分析結(jié)果更為準確 C. 完全等價且D. 完全等價且 E. 兩者結(jié)果可能出現(xiàn)矛盾4. 若單因素方差分析結(jié)果為,則統(tǒng)計推斷是( D )。A. 各樣本均數(shù)都不相等 B. 各樣本均數(shù)不全相等 C. 各總體均數(shù)都不相等 D. 各總體均數(shù)不全相等 E. 各總體均數(shù)全相等5. 完全隨機設計資料的方差分析中

47、,組間均方表示( C )。 A. 抽樣誤差的大小 B. 處理效應的大小 C. 處理效應和抽樣誤差綜合結(jié)果 D. 個數(shù)據(jù)的離散程度 E. 隨機因素的效應大小6. 多樣本定量資料比較,當分布類型不清時應選擇( D )。A. 方差分析 B. 檢驗 C. Z檢驗 D. Kruskal-Wallis檢驗 E. Wilcoxon檢驗7. 多組樣本比較的Kruskal-Wallis檢驗中,當相同秩次較多時,如果用值而不用校正后的值,則會( C )。A 提高檢驗的靈敏度 B把一些無差別的總體推斷成有差別C. 把一些有差別的總體推斷成無差別 D、類錯誤概率不變 E. 以上說法均不對二、思考題1. 方差分析的基本思想和應用條件是什么?答:方差分析的基本思想是,對于不同設計的方差分析,其思想都一樣,即均將處理間平均變異與誤差平均變異比較。不同之處在于變異分解的項目因設計不同而異。具體來講, 根據(jù)試驗設計的類型和研究目的,將全部觀測值總的離均差平方和及其自由度分解為兩個或多個部分,除隨機誤差作用外,每個部分的變異可由某個因素的作用加以解釋,通過比較不同變異來源的均方,借助F分布作出統(tǒng)計推斷,從而推論各種研究因素對試驗結(jié)果有無影響。其應用條件是, 各樣本是相互獨立的隨機樣本,均服從正態(tài)分布; 各樣本的總體方差相等,即方差齊性。2. 多組定量資料比較時,統(tǒng)計處理的基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論