統(tǒng)計學(第六版)賈俊平--課后習題答案_第1頁
統(tǒng)計學(第六版)賈俊平--課后習題答案_第2頁
統(tǒng)計學(第六版)賈俊平--課后習題答案_第3頁
統(tǒng)計學(第六版)賈俊平--課后習題答案_第4頁
統(tǒng)計學(第六版)賈俊平--課后習題答案_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、僅供個人參考僅供個人參考不得用于商業(yè)用途不得用于商業(yè)用途不得用于商業(yè)用途不得用于商業(yè)用途第一章導論1.11數(shù)值型變量。分類變量。離散型變量。順序變量。分類變量。1.2總體是該市所有職工家庭的集合;樣本是抽中的2000個職工家庭的集合。參數(shù)是該市所有職工家庭的年人均收入;統(tǒng)計量是抽中的2000個職工家庭的年人均收入。1.3(1)總體是所有IT從業(yè)者的集合。(2)數(shù)值型變量。(3)分類變量。(4)截面數(shù)據(jù)。1.4(1)總體是所有在網(wǎng)上購物的消費者的集合。(2)分類變量。參數(shù)是所有在網(wǎng)上購物者的月平均花費。(4)參數(shù)(5)推斷統(tǒng)計方法。第二章數(shù)據(jù)的搜集什么是二手資料?使用二手資料需要注意些什么?與研

2、究內(nèi)容有關的原始信息已經(jīng)存在,是由別人調(diào)查和實驗得來的,并會被我們利用的資料稱為“二手資料”。使用二手資料時需要注意:資料的原始搜集人、搜集資料的目的、搜集資料的途徑、搜集資料的時間,要注意數(shù)據(jù)的定義、含義、計算口徑和計算方法,避免錯用、誤用、濫用。在引用二手資料時,要注明數(shù)據(jù)來源。比較概率抽樣和非概率抽樣的特點,舉例說明什么情況下適合采用概率抽樣,什么情況下適合采用非概率抽樣。概率抽樣是指抽樣時按一定概率以隨機原則抽取樣本。每個單位被抽中的概率已知或可以計算,當用樣本對總體目標量進行估計時,要考慮到每個單位樣本被抽中的概率,概率抽樣的技術含量和成本都比較高。如果調(diào)查的目的在于掌握和研究總體的

3、數(shù)量特征,得到總體參數(shù)的置信區(qū)間,就使用概率抽樣。非概率抽樣是指抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查。非概率抽樣操作簡單、實效快、成本低,而且對于抽樣中的專業(yè)技術要求不是很高。它適合探索性的研究,調(diào)查結(jié)果用于發(fā)現(xiàn)問題,為更深入的數(shù)量分析提供準備。非概率抽樣也適合市場調(diào)查中的概念測試。調(diào)查中搜集數(shù)據(jù)的方法主要有自填式、面方式、電話式,除此之外,還有那些搜集數(shù)據(jù)的方法?實驗式、觀察式等。自填式、面方式、電話式調(diào)查個有什么利弊?自填式優(yōu)點:調(diào)查組織者管理容易,成本低,可以進行較大規(guī)模調(diào)查,對被調(diào)查者可以刻選擇方便時間答卷,減少回答敏感

4、問題的壓力。缺點:返回率低,調(diào)查時間長,在數(shù)據(jù)搜集過程中遇到問題不能及時調(diào)整。面談式優(yōu)點:回答率高,數(shù)據(jù)質(zhì)量高,在數(shù)據(jù)搜集過程中遇到問題可以及時調(diào)整可以充分發(fā)揮調(diào)查員的作用。缺點:成本比較高,對調(diào)查過程的質(zhì)量控制有一定難度。對于敏感問題,被訪者會有壓力。電話式優(yōu)點:速度快,對調(diào)查員比較安全,對訪問過程的控制比較容易,缺點:實施地區(qū)有限,調(diào)查時間不宜過長,問卷要簡單,被訪者不愿回答時,不宜勸服。請舉出(或設計)幾個實驗數(shù)據(jù)的例子。不同飼料對牲畜增重有無影響,新舊技術的機器對組裝同一產(chǎn)品所需時間的影響。你認為應當如何控制調(diào)查中的回答誤差?對于理解誤差,要注意表述中的措辭,學習一定的心里學知識。對于

5、記憶誤差,盡量縮短所涉及問題的時間范圍。對于有意識誤差,調(diào)查人員要想法打消被調(diào)查者得思想顧慮,調(diào)查人員要遵守職業(yè)道德,為被調(diào)查者保密,盡量避免敏感問題。怎樣減少無回答?請通過一個例子,說明你所考慮到的減少無回答的具體措施。對于隨機誤差,可以通過增加樣本容量來控制。對于系統(tǒng)誤差,做好預防,在調(diào)查前做好各方面的準備工作,盡量把無回答率降到最低程度。無回答出現(xiàn)后,分析武回答產(chǎn)生的原因,采取補救措施。比如要收回一百份,就要做好一百二十份或一百三十份問卷的準備,當被調(diào)查者不愿意回答時,可以通過一定的方法勸服被訪者,還可以通過饋贈小禮品等的方式提高回收率。第三章數(shù)據(jù)的圖表搜集一、思考題數(shù)據(jù)的預處理包括哪些

6、內(nèi)容?答:審核、篩選、排序等。分類數(shù)據(jù)和順序數(shù)據(jù)的整理和顯示方法各有哪些?答:分類數(shù)據(jù)在整理時候先列出所分的類別,計算各組的頻數(shù)、頻率,得到頻數(shù)分布表,如果是兩個或兩個以上變量可以制作交叉表。對于分類數(shù)據(jù)可以繪制條形圖、帕累托圖、餅圖、環(huán)形圖等。根據(jù)不同的資料或者目的選擇不同的圖。對于順序數(shù)據(jù),可以計算各種的頻數(shù)、頻率,以及累計頻數(shù)、累計頻率??筛鶕?jù)需要繪制條形圖、餅圖、環(huán)形圖等。數(shù)值型數(shù)據(jù)的分組方法有哪些?簡述組距分組的步驟。答:單變量值分組和組距分組。其中組距分組:第一步,確定組數(shù),組數(shù)多少由數(shù)據(jù)的多少和特點等決定,一般515組;第二步,確定各組組距,宜取5或10的倍數(shù);第三步,根據(jù)分組整

7、理出頻數(shù)分布表,注意遵循“不重不漏”和“上限不在內(nèi)”的原則。直方圖和條形圖有何區(qū)別?答:1,條形圖使用圖形的長度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻率,寬度表示組距,高度與寬度都有意義;2直方圖各矩形連續(xù)排列,條形圖分開排列;3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。繪制線圖應注意問題?答:時間在橫軸,觀測值繪在縱軸。一般是長寬比例10:7的長方形,縱軸下端一般從0開始,數(shù)據(jù)與0距離過大的話用折斷符號折斷。餅圖和環(huán)形圖的不同?答:餅圖只能顯示一個樣本或總體各部分所占比例,環(huán)形圖可以同時繪制多個樣本或總體的數(shù)據(jù)系列,其圖形中間有個“

8、空洞”,每個樣本或總體的數(shù)據(jù)系類為一個環(huán)。莖葉圖比直方圖的優(yōu)勢,他們各自的應用場合?答:莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出每一個原始數(shù)據(jù),即保留了原始數(shù)據(jù)的信息。在應用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。鑒別圖標優(yōu)劣的準則?答:P65明確有答案,我就不寫了。制作統(tǒng)計表應注意的問題?答:1,合理安排統(tǒng)計表結(jié)構;2表頭一般包括表號,總標題和表中數(shù)據(jù)的單位等內(nèi)容;3表中的上下兩條橫線一般用粗線,中間的其他用細線,兩端開口,數(shù)字右對齊,不要有空白格;4在使用統(tǒng)計表時,必要時可在下方加注釋,注明數(shù)據(jù)來源。二、練習題3.1答:(1)表中數(shù)據(jù)屬于順序數(shù)據(jù)。(2)用Excel制作一張

9、頻數(shù)分布表。(較差183)繪差15制張條形圖,反映評價等級的分布。繪制評價等級的帕累托圖。32某行業(yè)管理局所屬40個企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并計算出累積頻數(shù)和累積頻率。lg(n)g(40)1.602061、確定組數(shù):K-1+漢丿-1+-:1+6.32,取k=6lg(2)lg20.301032、確定組

10、距:組距=(最大值-最小值)三組數(shù)=(152-87)三6=10.83,取103、分組頻數(shù)表銷售收入頻數(shù)頻率向上累計頻數(shù)向上累計頻率80-90252590-10037.5512.5100-110922.51435110-12012302665120-130717.53382.5130-1404103792.5140-15025.03997.5150以上12.540100合計40100.0(2)按規(guī)定,銷售收入在125萬元以上為先進企業(yè),115125萬元為良好企業(yè),105115萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進行分組。頻數(shù)頻率向上累計頻數(shù)向上累計頻

11、率%先進企業(yè)10251025良好企業(yè)12302255頻數(shù)頻率向上累計頻數(shù)向上累計頻率%先進企業(yè)10251025良好企業(yè)12302255一般企業(yè)922.53177.5落后企業(yè)922.540100合計4010033某百貨公司連續(xù)40天的商品銷售額如下:單位:萬元41252947383430384340463645373736454333443528463430374426384442363737493942323635要求:根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖。答:1、確定組數(shù):lg(n)1lg(40)1.60206K=1+1+=1+=632m1plg(2)lg20.3010

12、3,k=62、確定組距:組距=(最大值-最小值)三組數(shù)=(4925)三6=4,取53、分組頻數(shù)表(根據(jù)實際資料,調(diào)整成分5個組)銷售收入(萬兀)頻數(shù)頻率向上累計頻數(shù)向上累計頻率30以下41041030-35615102535-401537.52562.540-45922.5348545以上61540100合計40100.04、直方圖3.4利用下面的數(shù)據(jù)構建莖葉圖和箱線圖。572929363123472328283551391846182650293321464152282143194220答:莖葉圖FrequencyStem&Leaf3.001.8895.002.011337.002.6888

13、9992.003.133.003.5693.004.1233.004.6673.005.0121.005.7箱線圖3.5答:頻數(shù)分布表燈泡壽命660以下660-670670-6802%7%13%680-6901427%690-7002653%700-7101871%710-7201384%720-7301094%730-740740以上合計97%100%燈泡壽命660以下660-670670-6802%7%13%680-6901427%690-7002653%700-7101871%710-7201384%720-7301094%730-740740以上合計97%100%直方圖直方圖頻率(個)

14、302520120.00%100.00%80.00%60.00%頻率(個)302520120.00%100.00%80.00%60.00%40.00%20.00%0.00%15燈泡壽命的直方圖匚二1頻率-累積燈泡壽命(小時)從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.6從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.6答:頻數(shù)分布表1+陽=11+陽=1+=1+0.30=6.64取k=72、確定組距:組距=(最大值-最小值)三組數(shù)=(61-40)三7=3,取33、分組頻數(shù)表(根據(jù)實際資料,調(diào)整成分5個組)食品重量(g)頻數(shù)頻率向上累計頻數(shù)向上累計頻率43以下334343-4699121246-492424363

15、649-521919555552-552424797955-581414939358以上77100100合計100100.0從直方圖看,數(shù)據(jù)的分布呈雙峰分布。3.7頻數(shù)分布表重量誤差(g)頻數(shù)頻率向上累計頻數(shù)向上累計頻率19-2951051029-39714122439-49816204049-591326336659-69918428469-79612489679-892450100合計50100從直方圖看,數(shù)據(jù)的分布呈左偏分布3.81)數(shù)值型數(shù)據(jù)2)頻數(shù)分布表=6.91取k=7k二i+也二i+=i+177815lg(2)lg20.30103=6.91取k=72、確定組距:組距=(最大值-最

16、小值)三組數(shù)=(9+25)三7=4.86,取5氣溫(C)頻數(shù)頻率向上累計頻數(shù)向上累計頻率%(25,-20)10.0010.00(20,15)13.331423.33(15,10)1016.672440.00(10.5)1321.673761.67(5.0)1220.004981.67(0,5)6.675388.33(5,10)11.6760100.00合計60100從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.9年齡分布直方圖年齡分布直方圖自學考試人員年齡分布集中在2024之間,分布圖呈右偏。3.103.11(1)復式條形圖(2)甲班成績分布圖近似正態(tài)分布,分布較均衡;乙班成績分布圖右偏(3)根據(jù)雷達

17、圖,兩班成績分布不相似。3.133.14第四章習題答案4.1數(shù)據(jù)排列:2,4,7,10,10,10,12,12,14,15眾數(shù):10;中位數(shù):10平均數(shù):9.64+7TOC o 1-5 h z四分位數(shù):Q位置=10=2.5所以Q=5.5L4L2Q位置二-30=7.5,所以Q=12+14=13U4U2標準差:4.17(4)峰度0.25,偏度0.694.2眾數(shù):19;23中位數(shù):23平均數(shù):24四分位數(shù):Q位置=25=6.25.所以Q=19+0.250=19L4LQ位置=75=18.75,所以Q=25+20.75=26.5U4U(3)標準差:6.65峰度0.77,偏度1.084.3(1)莖葉圖略(

18、2)平均數(shù):7,標準差0.71TOC o 1-5 h zs1.97第一種方式的離散系數(shù)v二=0.28sx7.2s0.71第二種方式的離散系數(shù)v二=0.10sx7所以,第二種排隊方式等待時間更集中。選擇第二種,因為平均等待的時間短,而且等待時間的集中程度高4.4(1)平均數(shù):274.1,中位數(shù):272.5(2)Q厶位置=曽=7.5.所以Ql=258+0-253=258-75Q位置=見=22.5,所以Q=284+70.75=289.25U4U(3)日銷售額的標準差:21.174.5產(chǎn)品名稱單位成本(元)15甲企業(yè)2100總成本/元乙企業(yè)3255產(chǎn)量甲企業(yè)140乙企業(yè)2172030001500150

19、75C產(chǎn)品名稱單位成本(元)15甲企業(yè)2100總成本/元乙企業(yè)3255產(chǎn)量甲企業(yè)140乙企業(yè)217203000150015075C合計3015001500505066006255340342藝Mf甲企業(yè)總平均成本x二十=當=19-41(元)藝Mf乙企業(yè)總平均成本X=41=18.29(兀)n342所以甲企業(yè)的總平均成本比乙企業(yè)的高,原因是甲企業(yè)高成本的產(chǎn)品B生產(chǎn)的產(chǎn)量比乙企業(yè)多,所以把總平均成本提高了。4.6計算數(shù)據(jù)如表:按利潤額分組(萬元)組中值企業(yè)數(shù)(個)利潤額200300250194750593033300400350301050017634940050045042189002286050

20、0600550189900273785600以上650117150548639合計120512001614666工Mfii51200利潤總額的平均數(shù)X二4=二426.67(萬兀)n120(x-X)2*fH614666利潤總額標準差b和b訃=115.99(萬元)n120丈(M-丈(M-x)4fii峰態(tài)系數(shù)K=4ns43_510874416483-120 x(115.99)4_2.352-3_0.6479i=i_1120 x(115.99)3丈(M-X)3ff(Mi=i_1120 x(115.99)3iiii偏態(tài)系數(shù)SK_i二4_0.2057ns34.7(1)不同。1000名的平均身高較高;(2)

21、不同。100名的樣本容量的標準差更大;(3)不同,調(diào)查1000名的樣本容量得到最高和最低者的機會較大。4.8對于不同的總體的差異程度的比較采用標準差系數(shù),計算如下:s5s5v男_8.3%;v女_10%sx60sx50(1)女生的體重差異大,因為離散系數(shù)大;(2)以磅為單位,男生的平均體重為132.6磅,標準差為11.05磅;女生的平均體重為110.5磅,標準差為11.05磅3)zi4)zi4.9z二x_65560_13)zi4)zi4.9zs5匸丄_羋聖_2,所以大約有95%的女生體重在40kg60kg之間。s5115-10015i425-400i425-40050_0.5;由此可以判斷第二項

22、測試更理想。時間周一周二周三周四周五周六產(chǎn)量385036703690372036103590z值30.60.20.41.82.24.10周日3700可以看出,周一和周六兩天生產(chǎn)線失去了控制。4.11(1)采用離散系數(shù),因為如果比較身高差異,兒童和成年人屬于不同的總體;Vs成年4.20172.1_2.44%Vs成年4.20172.1_2.44%,2.50s兒童71.3_3.5%所以,兒童的身高差異更大。4.12(1)對集中程度和離散程度分別評價,選擇集中趨勢數(shù)值大的,而且離散程度數(shù)值小的方式(2)選擇方法A,因為A方法下,工人的平均組裝數(shù)量為165.6,而且該方法下,工人組裝數(shù)量的離散系數(shù)只有0

23、.012,所以選擇A方法。4.13(1)用離散系數(shù)(2)商業(yè)類(3)高科技第六章統(tǒng)計量與抽樣分布1、設X,X,-,X是從總體X中抽取的容量為n的一個樣本,如果由此樣本構造一個函數(shù)T(X,X?,,X),不依賴于任何未知參數(shù),則稱函數(shù)T(X,X,X)是一個統(tǒng)計量。12n由樣本構建具體的統(tǒng)計量,實際上是對樣本所含的總體信息按某種要求進行加工處理,把分散在樣本中的信息集中到統(tǒng)計量的取值上,不同的統(tǒng)計推斷問題要求構造不同的統(tǒng)計量。構造統(tǒng)計量的主要目的就是對總體的未知參數(shù)進行推斷,如果統(tǒng)計量中含有總體的未知參數(shù)就沒辦法再對參數(shù)進行統(tǒng)計推斷。2、T和T是統(tǒng)計量,T和T在卩和o未知的情況下不是統(tǒng)計量。1234

24、3、設X,X,X是從總體X中抽取的一個樣本,X稱為第i個次序統(tǒng)計量,TOC o 1-5 h z12n(i)它是樣本(X,X,X滿足如下條件的函數(shù):每當樣本得到一組觀測值12nx,x,,x時,其由小至【j大的排序xWx()xWx(中第i個值x就作12n(1)(2)(i)(n)(i)為次序統(tǒng)計量x(|)的觀測值,而x),X),,Xq稱為次序統(tǒng)計量。4、假若一個統(tǒng)計量能把含在樣本中有關總體的信息一點都不損失地提取出來,這樣的統(tǒng)計量稱充分統(tǒng)計量。5、統(tǒng)計學上的自由度指當以樣本的統(tǒng)計量來估計總體的參數(shù)時,樣本中獨立或能自由變化的資料的個數(shù)。6、咒2分布和正態(tài)分布關系:nT+a時,咒2分布的極限分布是正態(tài)

25、分布。t分布和正態(tài)分布的關系:t分布的密度函數(shù)曲線與標準正態(tài)分布的密度函數(shù)曲線非常相似,但tCi)分布的密度函數(shù)在兩狽的尾部都要比標準正態(tài)的兩側(cè)尾部粗一些,方差也比標準正態(tài)分布的方差大。隨著自由度n的增加,t分布的密度函數(shù)越來越接近標準正態(tài)分布的密度函數(shù)。僅供個人參考僅供個人參考僅供個人參考僅供個人參考2不得用于商業(yè)用途2不得用于商業(yè)用途2不得用于商業(yè)用途2不得用于商業(yè)用途F分布和正態(tài)分布關系:若Xt(n)貝懷Fl,n)并且隨著自由度的增加,X也越來越接近于標準正態(tài)笳,若扌把C看成近似服從標準正粉布的一個隨機變量,則X2fCnl7、在重復選取容量為n的樣本時,由樣本統(tǒng)計量的所有取值形成的相對頻

26、數(shù)分布為統(tǒng)計量的抽樣分布。8、中心極限定理:設從均值為卩,方差為Q2的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值X的抽樣分布近似服從均值為卩,方差為壬的n正態(tài)分布。中心極限定理解決了在總體為非正態(tài)的情況下,樣本平均數(shù)的抽樣分布問題,為總體參數(shù)的推斷提供了理論基礎。二、練習x2、若0.3)_0.95,貝yP1、易知由這臺機器灌裝的x2、若0.3)_0.95,貝yP0.3_0.95,即_1.96,ggnn_196丫_42.68,故n_43oI0.3丿3、易知丈Z2服從自由度為6的卡方分布,得b_x2(6)_12.59(左側(cè)分位數(shù))i0.95i_1(n-1)S24、因為服從X2(n-

27、1)分布,我們已知n_10,g_1,故9S2服從咒2(9)g2S2b29S29bS2b29S29b)_0.05,229b10.05,貝可以得到9b2_X02.95(9)_16.929b_x2_3.33,故b_0.37,b_1.88。(題中均為左側(cè)分位數(shù))10.0512第七章參數(shù)估計7.1(1)g_G_-_0.79xn40(2)由于1-a=95%a=5%Z_1.96a2所以估計誤差Z_L96x沁L55n.40僅供個人參考僅供個人參考僅供個人參考僅供個人參考不得用于商業(yè)用途不得用于商業(yè)用途不得用于商業(yè)用途不得用于商業(yè)用途7.2(1)c-=2.14Xvnv49(2)因為Z=1.96o2所以Z2=1.

28、96xE沁4.20oQnv492M的置信區(qū)間為xZ需=120土420273由于Z二1.96x二104560c二85414n=100o2所以M的95%置信區(qū)間為7.4(1)M的90%置信區(qū)間為XZ応=81心珞=8122)的95%置信區(qū)間為X土Z=81土1.96x=81土2.35oJnJ10023)的99%置信區(qū)間為xZ-僉=81土258=81土09627.5(1)X+Z二=25土1.96X=25土0.89oJn6022)s2389X土Z=119.6土2.326x=119.6土6.416oJn#7523)x土Zo.2s0.974.=3.419土1.645x.=3.419土0.283n327.6(1

29、)X土Z二=8900土1.96x型=8900土253.035fnJ1522)X土Z二=8900土1.96x聖=8900土165.650oInv3523)X土ZX=8900土1.645x聖=8900土139.028ovn3524)X土Zo=8900土2.326XH=8900土196.58327.7x=-工x=3.317藝(x-x=1.609nii=1TOC o 1-5 h zs1.60990%置信區(qū)間為x土Z=3.317土1.645x=3.317土0.441aJn362s1609a、:n95%置信區(qū)間為x土Z一=3.317土1.96x=3.317a、:n HYPERLINK l bookmark

30、117 o Current Document nv36s160999%置信區(qū)間為x土Z一=3.317土2.576x=3.317土0.6908367.8x=-7.8x=-工x=10s=.工(x-x=3.464nii=13.464所以95%置信區(qū)間為x土t=10土2.3646x=10土2.896a(n-i)Jn寸827.9x=丄Vx=9.375ni由于t:(n-7.9x=丄Vx=9.375ni由于t:(n-1)=t(15)=2.1310.025所以95%置信區(qū)間為x土ts4.113=9.375土2.131x=9.375土2.191亠(n-1)51627.10(1)x土Zs1.93丄=149.5土1

31、.96x=149.5土0.63n3622)中心極限定理7.11-1V(1)x=x=ni1x5066=101.1325045(2)由于p=50=0.9所以合格率的95%置信區(qū)間為7.12=-工x7.12=-工x=16.128nita(n-1)2=t(24)=3.7450.005所以99%置信區(qū)間為x土t(n1)2=161.28土3.745x。空6=161.28土0.653avnJ2527.13t(n-1)=t(17)=1.7396x=1工x=13.5567.13niani2s7.8所以90%置信區(qū)間為x土t(n1)13.556土1.7396x13.556土3.198aVn(n1)scX2,a!2

32、(1)1414sS23.6848x.2c叫65x.2-.15c.433)X2(n1)=Xa/、2,(n1)20.052a1-a2(221)=32.676XscX2aI2,(n1)s=,X211-a27.20(1)1x=Yx.=7.15ni2(n1)=X2(221)=11.59131a.95122121Ex31氣為x31n2485c41725s飛n15x.4767V19.228V19.228x4767時x4767=328-87,l(n1)scX2fa12(2)(n1)Isn.X211-a27.21s2=(n1Ds12+(n2D汽=13x%8+6x1298.442pn+n212cz19片一巴的9%

33、置信區(qū)間為:_11_11(xx)t(n+n2)s+12a212p.n111=9.8土1.729xJ98.442x、n1472.Tn=9.8土7.9411(2)卩-M的95%置信區(qū)間為:=9.8土7.9411(2)卩-M的95%置信區(qū)間為:12(xx)土t(n+n2)s112a212p111+=9.8土2.093x、.98.442x+- HYPERLINK l bookmark294 o Current Document nn14712=9.8土9.613巴的%置信區(qū)間為:n19.8土2.86。9心喬卞+7=98土131407.22(1)(xx)za+“12a2Vnn121s2亶=2土1.96x

34、J036=2土1.176(2)s2=p(n1)s2+(n1)s29x16+9x201122=18n+n212僅供個人參考僅供個人參考僅供個人參考僅供個人參考不得用于商業(yè)用途不得用于商業(yè)用途不得用于商業(yè)用途不得用于商業(yè)用途|11,_11(X-X)t(n+n-2)s+=22.1X;18x=23.9812a212pnn512(注+逞)2nnV=(s2n)2&2n)2=17-7811+22-n-1n-112Is2s2i(X-X)土t(V).+=2土2.1x3.6=2土3.9812a2nn121(4)t(28)=2.0480.025(n-1)s2+(n-1)s2s2二+22=18.714pn+n-212

35、TOC o 1-5 h z111.I11(X-X)土t(n+n-2)s+=2土2.04818.714x+-12a?127pnn102012s2s2(十+4s2s2(十+4)2nn121(5)V=12-(s2,n)2(s2.n)211+22-n-1n一1121620(+)2420=20.051.6212+-919Is2s2,X)t(v)a+a=22.086xv1.6+1=2+3.3642a2nnl1217.231)巴匕-d)27.231)巴匕-d)2=JHl“閒1n-1482)d土t(n一1)a2s7需=4土4.1857.24:0一1)二2.6216d二11,s廠6.53197卩的置信區(qū)間為:7

36、.24_s653197d土t(n-1)亠=11土2.6216x=11土5.4152a2壬n2.16)=1-0.9846=0.0154。所以在a=0.01的顯著水平,不能拒絕H0,認為貸款的平均規(guī)模沒有明顯超過60萬元。8.13解:根據(jù)題意,這是左單側(cè)檢驗問題。p1已知:pp1已知:p2104=,n=11000,11000i189=,n=11000,110002293p=,顯著水平a=0.0522000在大樣本條件下當a=0.05,杳表得z=1.645。1-a拒絕域W=ZYz1-a因為z=-4.9992Yz,所以拒絕H0,認為阿司匹林可以降低心臟病發(fā)生率。1a0(注:z為正態(tài)分布的1-a下側(cè)分位

37、點)1-a8.14解:(1)根據(jù)題意,這是雙側(cè)檢驗問題。已知:52=0.03,s2=0.0375,n=80,顯著水平a=0.050當a=0.05,利用EXCEL提供的統(tǒng)計函數(shù)“CHIINV”,得X2(79)=56.3089,咒2(79)=105.4727。TOC o 1-5 h z1-a/2a/2拒絕域W=X2YX2(79)或咒2AX2(79) HYPERLINK l bookmark213 o Current Document 1-a、2a、2因為X2(79)YX2=98.75YX2(79),所以不能拒絕也,認為H:52=0.03 HYPERLINK l bookmark215 o Curr

38、ent Document 1-a/2a/200成立。(注:X2(79)為X2-分布的a上側(cè)分位點)a(2)根據(jù)題意,這是雙側(cè)檢驗問題。已知:總體方差52=0.03當a=0.05,查表得z=1.96。1-a/2拒絕域W=比卜乂_a/2l因為|z|=0.5196Y|z10t/2|,所以不能拒絕H0,認為螺栓口徑為7.0cm。(注:z為正態(tài)分布的1-a/2下側(cè)分位點)1-a/2因此,由(1)和(2)可得:這批螺栓達到了規(guī)定的要求。8.15(1)根據(jù)題意,這是雙側(cè)檢驗問題。已知:s2=56,n=25,s2=49,n=16,顯著水平a=0.051122當a二0.05,利用EXCEL提供的統(tǒng)計函數(shù)“FIN

39、V”,得F(79)二0.4195,F(79)二2.6138。TOC o 1-5 h z1-a/2a/2拒絕域W=FYF(79)或尸AF(79)1-a、2a、2因為F(25,16)YF=2.6138YF(25,16),所以不能拒絕H0,認為1-a/2a/20H92=2成立。012(注:F(25,16)為F-分布的a/2上側(cè)分位點)a/2(2)根據(jù)題意,這是右單側(cè)檢驗問題。由(1)的分析可知:總體方差2=2,但未知12當a=0.05,查表得t(39)=1.6849。a拒絕域W=tAt(39)因為t=1.7112At(39),所以拒絕H0,認為有顯著大學中男生學習成績比女生a/20好。(注:t(39

40、)為t分布的a上側(cè)分位點)a第十章方差分析一、思考題什么是方差分析?它研究的是什么?答:方差分析就是通過檢驗各總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。它所研究的是分類型自變量對數(shù)值型因變量的影響。要檢驗多個總體均值是否相等時,為什么不作兩兩比較,而用方差分析方法?答:做兩兩比較十分繁瑣,進行檢驗的次數(shù)較多,會使得犯第I類錯誤的概率相應增加,而且隨著增加個體顯著性檢驗的次數(shù),偶然因素導致差別的可能性也會增加。而方差分析方法是同時考慮所有的樣本,因此排除了錯誤累積的概率,從而避免一個真實的原假設。方差分析包括哪些類型?它們有何區(qū)別?答:方差分析可分為單因素方差分析和雙因素

41、方差分析。區(qū)別:單因素方差分析研究的是一個分類自變量對一個數(shù)值型因變量的影響,而雙因素涉及兩個分類型自變量。方差分析中有哪些基本假定?答:(1)每個總體都應服從正態(tài)分布(2)各個總體的方差宀必須相同(3)觀測值是獨立的簡述方差分析的基本思想答:它是通過對數(shù)據(jù)誤差來源的分析來判斷不同總體的均值是否相等,進而分析自變量對因變量是否有顯著影響。解釋因子和處理的含義答:在方差分析中,所要檢驗的對象稱為因素或因子,因素的不同表現(xiàn)稱為水平或處理。解釋組內(nèi)誤差和組間誤差的含義答:組內(nèi)平均值誤差的誤差(SSE)是指每個水平或組的各個樣本數(shù)據(jù)與其組平均值誤差平方和,反映了每個樣本個觀測值的離散狀況;組間誤差(S

42、SA)是指各組平均值與總平均值的誤差平方和,反映了各樣本均值之間的差異程度。解釋組內(nèi)方差和組間方差的含義答:組內(nèi)方差指因素的同一個水平下樣本數(shù)據(jù)的方差;組間方差指因素的不同水平下各個樣本之間的方差。簡述方差分析的基本步驟答:(1)提出假設(2)構造檢驗統(tǒng)計量(3)統(tǒng)計決策方差分析中多重比較的作用是什么?答:通過對總體均值之間的配對比較來進一步檢驗哪些均值之間存在差異。二、練習題10.1解:方差分析差異源SSdfMSFPvalue組間618.91672309.45834.65740.04087724組內(nèi)598966.44444總計1216.91711相同10.2解:方差分析差異源SSdfMSFP

43、-value組間93.76812423.4420315.823371.02431E-05組內(nèi)26.66667181.481481總計120.434822不相同10.3解ANOVA每桶容量(L)平方和df均方F顯著性組間0.00730.0028.7210.001組內(nèi)0.004150.000總數(shù)0.01118不相同。10.4解:方差分析差異源SSdfMSFP-value組間29.60952214.8047611.755730.000849組內(nèi)18.89048151.259365總計48.517有顯著性差異。10.5解:方差分析差異源SSdfMSFP-value組間615.62307.817.068

44、390.00031組內(nèi)216.41218.03333總計83214有顯著差異。LSD檢驗:計算得XA=44.4,XB=30,XC=42.6,有因為nA=nB=nc=5,則決策:(1)X一x|=|44.4一30=14.45.62,所以a生產(chǎn)企業(yè)生產(chǎn)的電池與B生產(chǎn)企AB業(yè)生產(chǎn)的電池平均壽命有顯著差異;(2)X一x|=|44.4一42.6=1.8v5.62,所以不能AC認為A生產(chǎn)企業(yè)生產(chǎn)的電池與C生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異;(3)X-X=|30-42.6=12.65.62,所以b生產(chǎn)企業(yè)生產(chǎn)的電池與C生產(chǎn)企業(yè)生產(chǎn)的電BC池平均壽命有顯著差異。10.6解:方差分析差異源SSdfMSFP-va

45、lue組間5.34915622.6745788.2745180.001962組內(nèi)7.434306230.323231總計12.7834625有顯著性差異1071)方差分析表差異源SSDfMSFP-valueFcrit組間42022101.0.2459463.354131組內(nèi)383627142.0740741總計425629(2)若顯著性水平a=0.05,檢驗三種方法組裝的產(chǎn)品數(shù)量之間是否有顯著差異?P=0.025a=0.05,沒有顯著差異。10.8解:方差分析差異源SSdfMSFP-valueFcrit行1.54933340.38733321.719630.0002367.006077列3.4

46、8421.74297.682242.39E-068.649111誤差0.14266780.017833總計5.17614F=21.71963F=7.006077或p=0.000236F=8.649111或p=2.39E-06vx=0.01,所以不同供應商生Cx產(chǎn)的輪胎的磨損程度有顯著性差異。10.9解:方差分析差異源SSdfMSFP-valueFcrit行19.06744.766757.2397160.0033153.259167列18.181536.06059.2046580.0019493.490295誤差7.901120.658417總計45.149519結(jié)果表明施肥方法和品種都對收獲量

47、有顯著影響。10.10解:方差分析差異源SSdfMSFP-valueFcrit行22.22222211.111110.0727270.9310566.944272列955.55562477.77783.1272730.1521556.944272誤差611.11114152.7778總計1588.8898F=0.072727vF=6.944272或p=0.931056x=0.05,所以不同銷售地區(qū)Rx對食品的銷售量無顯著性差異;=3.127273vF=6.944292或p=0.i52x=0.05,所以不同包裝對食品的銷售量無顯著性差異。解:方差分析差異源SSdfMSFP-valueFcrit樣

48、本1752287648.666675.49E-086.012905列798239922.166671.4E-056.012905交互182.6667445.666672.5370370.0759024.579036內(nèi)部3241818總計3056.667261)競爭者的數(shù)量對銷售額有顯著影響(2)超市位置對銷售額有顯著影響(3)無交互作用10.12解:方差分析差異源SSdfMSFP-valueFcrit樣本344217210.750.0103865.143253列4814830.1339755.987378交互562281.750.2519325.143253內(nèi)部96616總計54411廣告方案

49、對銷售量有顯著影響廣告媒體形式對銷售量無顯著影響無交互作用第11章一元線性回歸一、思考題111變量之間存在的互相依存的不確定的數(shù)量關系,稱為相關關系。相關關系的特點:八、變量之間確實存在著數(shù)量上的依存關系;變量之間數(shù)量上的關系是不確定、不嚴格的依存關系。112相關分析通過對兩個變量之間的線性關系的描述與度量,主要解決的問題包括:變量之間是否存在關系?如果存在關系,它們之間是什么樣的關系?變量之間的關系強度如何?樣本所反映的變量之間的關系能否代表總體變量之間的關系?113在進行相關分析時,對總體主要有以下兩個假定:1兩個變量之間是線性關系;兩個變量都是隨機變量。11.4.相關系數(shù)的性質(zhì):(l)r

50、的取值范圍是-1,1,r為正表示正相關,r為負表示負相關,r絕對值的大小表示相關程度的高低;對稱性:X與Y的相關系數(shù)r和Y與X之xy間的相關系數(shù)r相等;相關系數(shù)與原點和尺度無關;相關系數(shù)是線性關聯(lián)或線性相依yx的一個度量,它不能用于描述非線性關系;相關系數(shù)只是兩個變量之間線性關聯(lián)的一個度量,卻不一定意味兩個變量之間有因果關系;若X與Y統(tǒng)計上獨立,則它們之間的相關系數(shù)為零;但r=0不等于說兩個變量是獨立的。即零相關并不一定意味著獨立性。11.5.在實際的客觀現(xiàn)象分析研究中,相關系數(shù)一般都是利用樣本數(shù)據(jù)計算的,因而帶有一定的隨機性。樣本容量越小,其可信程度就越差,抽取的樣本不同,r的取值也會不同,

51、因此r是一個隨機變量。能否用樣本相關系數(shù)來反映總體的相關程度,需要考察樣本相關系數(shù)的可靠性,因此要進行顯著性檢驗。11.6.相關系數(shù)顯著性檢驗的步驟:(1)提出假設;計算檢驗統(tǒng)計量t值;在給定的顯著性水平Q和自由度,查t分布表中相應的臨界值,作出決策。11.7.回歸模型是對統(tǒng)計關系進行定量描述的一種數(shù)學模型,例如:對于具有線性關系的兩個變量,可以有一元線性方程來描述它們之間的關系,描述因變量y如何依賴自變量x和誤差項的方程稱為回歸模型。回歸方程是對變量之間統(tǒng)計關系進行定量描述的一種數(shù)學表達式。指具有相關的隨機變量和固定變量之間關系的方程。當總體回歸系數(shù)未知時,必須用樣本數(shù)據(jù)去估計,用樣本統(tǒng)計量

52、代替回歸方程中的未知參數(shù),就得到了估計的回歸方程。11.8.元線性回歸模型通常有以下幾條基本的假定:變量之間存在線性關系;在重復抽樣中,自變量x的取值是固定的;誤差項是一個期望為零的隨機變量;)對于所有的X值,誤差項的方差b2都相同;誤差項是一個服從正態(tài)分布的隨機變量,且相互獨立。即口N(0Q2)。11.9.參數(shù)最小二乘法的基本原理是:因變量的觀測值與估計值之間的離差平方和最小。11.10.總平方和指n次觀測值的的離差平方和,衡量的是被解釋變量y波動的程度或不確定性的程度回歸平方和反映y的總變差中由于x與y之間的線性關系引起的y的變化部分,這是可以由回歸直線來解釋的部分,衡量的是被解釋變量y不

53、確定性程度中能被解釋變量x解釋的部分殘差平方和是除了x對y的線性影響之外的其他因素引起的y的變化部分,是不能由回歸直線來解釋的部分。它們之間的關系是:總平方和=回歸平方和+殘差平方和。11.11.回歸平方和占總平方和的比例稱為判定系數(shù)。判定系數(shù)測量了回歸直線對觀測數(shù)據(jù)的擬合程度。11.12.在回歸分析中,F(xiàn)檢驗是為檢驗自變量和因變量之間的線性關系是否顯著,通過均方回歸與均方殘差之比,構造F檢驗統(tǒng)計量,提出假設,根據(jù)顯著性水平,作出判斷。t檢驗是回歸系數(shù)的顯著性檢驗,要檢驗自變量對因變量的影響是否顯著,通過構造t檢驗統(tǒng)計量,提出假設,根據(jù)顯著性水平,作出判斷。11.13.線性關系檢驗的步驟:提出

54、假設;H:0=0;構造F檢驗統(tǒng)計量;01SSR/1SSR/1MSRF=SSE/(n-2)MSE;根據(jù)顯著性水平,作出判斷?;貧w系數(shù)檢驗的步驟:提出假設;Ho:0i二0;Hi:0i豐0;構造t檢驗統(tǒng)計量;t二T;根據(jù)顯著性水平,作出判斷。sB111.14.回歸分析結(jié)果的評價可以從以下幾個方面:回歸系數(shù)的符號是否與理論或事先預期相一致;自變量與因變量之間的線性關系,在統(tǒng)計上是否顯著;根據(jù)判定系數(shù)的大小,判斷回歸模型解釋因變量取值差異的程度;誤差項的正態(tài)假定是否成立。11.15.置信區(qū)間估計是對X的一個給定值X,求出y的平均值的區(qū)間估計。預測區(qū)0間估計是對x的一個給定值X,求出y的一個個別值的區(qū)間估

55、計。二者的區(qū)別是:置信區(qū)0間估計的區(qū)間長度通常較短,而預測區(qū)間估計的區(qū)間長度要長,也就是說,估計y的平均值比預測y的一個特定值或個別值更精確。11.16.殘差分析在回歸分析中的作用:回歸分析是確定兩種或兩種以上變量間的定量關系的一種統(tǒng)計分析方法.判斷回歸模型的擬合效果是回歸分析的重要內(nèi)容,在回歸分析中,通常用殘差分析來判斷回歸模型的擬合效果,并判定關于誤差項的正態(tài)假設是否成立。二、練習題11.1.(1)散點圖如下:從散點圖可以看出,產(chǎn)量與生產(chǎn)費用之間為正的線性相關關系。利用Excel的“CORREL”函數(shù)計算的相關系數(shù)為r二0.920232。首先提出如下假設:H0:p=0,H1:pH0。計算檢

56、驗的統(tǒng)計量當a=0.05時,t(122)=2.228。由于檢驗統(tǒng)計量t7.435t=2.228,拒0.052a2絕原假設。表明產(chǎn)量與生產(chǎn)費用之間的線性關系顯著。11.2(1)散點圖如下:從散點圖可以看出,復習時間與考試分數(shù)之間為正的線性相關關系。利用Excel的“C0RREL”函數(shù)計算的相關系數(shù)為r0.8621。相關系數(shù)r0.8,表明復習時間與考試分數(shù)之間有較強的正線性相關關系。11.3.(1)匚10表示當x0時y的期望值為10。(2)B0.5表示x每增加一個01單位,y平均下降0.5個單位。(3)X6時,E(y)100.5x67。1.4.(1)R2SSR1.4.(1)R2SSRSSTSSRS

57、SR+SSE3636+490%R290%表示,在因變量y取值的變差中,有90%可以由x與y之間的線性關系來解釋。s=Js=J巫“工n-218-2=0.5S二0.5表示,當用x來預測y時,平均的預測誤差為0.5。e115(1)散點圖如下:從散點圖可以看出,運送距離與運送時間之間為正的線性相關關系。利用Excel的“C0RREL”函數(shù)計算的相關系數(shù)為r二0.9489。相關系數(shù)r0.8,表明運送距離與運送時間之間有較強的正線性相關關系。由Excel輸出的回歸結(jié)果如下表:回歸統(tǒng)計MultipleR0.948943RSquare0.900492AdjustedRSquare0.888054標準誤差0.4

58、80023觀測值10方差dfSSMSFSignificanceF回歸分析116.6816216.6816272.395852.79E-05殘差81.8433790.230422總計918.525Coefficients標準誤差tStatP-valueIntercept0.1181290.3551480.332620.74797XVariable10.0035850.000421&5085752.79E-050.002613得到的回歸方程為:y=0.118129+0.003585x回歸系數(shù)=0.003585表示運送距離每增加1公里,運送時間平均增加0.003585天。116(1)散點圖如下:從散

59、點圖可以看出,人均GDP與人均消費水平為正的線性相關關系。利用Excel的“C0RREL”函數(shù)計算的相關系數(shù)為r二0.998128。相關系數(shù)接近于1,表明人均GDP與人均消費水平之間有非常強的正線性相關關系。Excel輸出的回歸結(jié)果如下表:回歸統(tǒng)計MultipleR0.998128RSquare0.996259AdjustedRSquare0.995511標準誤差247.3035觀測值7方差分析dfSSMSFSignificanceF回歸11331.6922.91E-07殘差530579561159.01總計6Coefficients標準誤差tStatP-valueIntercept734.6

60、928139.54035.2650940.003285XVariable10.3086830.00845936.492362.91E-07得到的回歸方程為:y二734.6928+0.308683x?;貧w系數(shù)P=0.308683表示人均1GDP每增加1元,人均消費水平平均增加0.308683元。判定系數(shù)R2二0.996259。表明在人均消費水平的變差中,有99.6259%是由人均GDP決定的。首先提出如下假設:H:0=0,H:0H00111由于SignificanceFa二0.05,拒絕原假設,表明人均GDP與人均消費水平之間的線性關系顯著。y二734.6928+0.308683x5000二22

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論