統(tǒng)計學思考題答案_第1頁
統(tǒng)計學思考題答案_第2頁
統(tǒng)計學思考題答案_第3頁
統(tǒng)計學思考題答案_第4頁
免費預覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、4.1 一組數(shù)據(jù)的分布特征可以從哪幾個方面進行測度?數(shù)據(jù)分布特征可以從三個方面 進行測度和描述:一是分布的集中趨勢,反 映各數(shù)據(jù)向其中心值靠攏或集中的程度; 二是分布的離散程度,反映各數(shù)據(jù)遠離其中心值的趨勢;三是分布的形狀,反映數(shù)據(jù) 分布的偏態(tài)和峰態(tài)。2. 4.5簡述眾數(shù)、中位數(shù)和平均數(shù)的特點和應用場合。眾數(shù)是一組數(shù)據(jù)分布的峰值,不受極端值的影響,缺點是具有不唯一性。眾數(shù) 只有在數(shù)據(jù)量較多時才有意義,數(shù)據(jù)量較少時不宜使用。主要適合作為分類數(shù)據(jù)的集 中趨勢測度值。中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受極端值的影響。當數(shù)據(jù)的分布偏斜 較大時,使用中位數(shù)也許不錯。主要適合作為順序數(shù)據(jù)的集中趨勢測度

2、 值。平均數(shù)對數(shù)值型數(shù)據(jù)計算的,而且利用了全部數(shù)據(jù)信息,在實際應用中最廣泛。 當數(shù)據(jù)呈對稱分布或近似對稱分布時,三個代表值相等或相近,此時應選擇平均數(shù)。 但平均數(shù)易受極端值的影響,對于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差,此時應考 慮中位數(shù)或眾數(shù)。4.7標準分數(shù)有哪些用途?標準分數(shù)給出了一組數(shù)據(jù)中各數(shù)值的相對位置。在對多個具有不同量綱的變量進 行處理時,常需要對各變量進行標準化處理。它還可以用來判斷一組數(shù)據(jù)是否有離群 數(shù)據(jù)。7.3怎樣理解置信區(qū)間?置信區(qū)間:由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間 7.4解釋95%的置信區(qū)間。95%的置信區(qū)間指用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的

3、真值。7.5 Za/2的含義是什么含義:Za/2是標準正態(tài)分布上側(cè)面積為a/2的z值,公式是統(tǒng)計總體均值時的邊際誤 差。7.6解釋獨立樣本和匹配樣本的含義。獨立樣本:如果兩個樣本是從兩個總體中獨立 抽取的,即一個樣本中的元素與另一個樣本中的元素相互獨立。匹配樣本:一個樣本中的數(shù)據(jù)與另一個樣本中的數(shù)據(jù)相對應。7. 8簡述樣本量與置信水平、總體方差、邊際誤差的關(guān)系。樣本量越大置信水平越高, 總體方差和邊際誤差越小10.1什么是方差分析?它研究的是什么?答:方差分析就是通過檢驗各總體的均值 是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。它所研究的是非類型 自變量對數(shù)值型因變量的影響。10.

4、4方差分析中有哪些基本假定?答:方差分析中有三個基本假定:(1)每個總體都應服從正態(tài)分布(2) 各個總體的方差c :必須相同(3) 觀測值是獨立的說明誤差分解的基本原理是通過計算來比較因某一特定因素帶來的樣本值的差異與隨機偶然因素對樣本值的差異的大小,從而 判斷該因素對總體是否有統(tǒng)計意義。解釋主效應和交互效應在多因素實驗研究屮,主效應就是在考察一個變量是否會對因變量的變化發(fā)生影響的時候,不考慮 其他研究變量的變化,或者說將其他變量的變化效應平均掉。換句話說,就是其他研究變量都不變化 的情況下,單獨考察一個自變量對因變量的變化效應。交互效應,則是反映兩個或兩個以上自變量相互依賴、相互制約,共同對

5、因變量的變化發(fā)生影響。換句話說,如果個自變量對因變量的影響效應會因另一個自變量的水平不同而有所 不同,則我們說這兩個變量之間具有交互效應。10. 15簡述完全隨機化設計、隨機化區(qū)組設計、因子設計的含義和區(qū)別。(4)答:完全隨機化設計是將k種“處理”隨機地指派給試驗單元的設計。隨機化區(qū)組設計是先按一定規(guī)則將試驗單元劃分為若干同質(zhì)組, 稱為“區(qū) 組”,然后再將各種處理隨機地指派給各個區(qū)組。因子設計指考慮兩個因素 (可推廣到多個因素)的搭配試驗設計。區(qū)間估計的基本原理是什么?參數(shù)估計一般是指根據(jù)樣本信息,對總體分布中的未知參數(shù)9進行估計,而我們通常都是對均值或方差進行估計。區(qū)間估計是參數(shù)估計的一種,

6、它是 指對于給定的置信度1- &總體參數(shù)9的取值在某一區(qū)間內(nèi)的概率是1- a,而 這一置信區(qū)間正是我們需要求解的。用公式表示就是:P 9 19 9刃乞其中9 1 9 2是兩個統(tǒng)計量。(9 19 2)就 是置信區(qū)間,顯然因為是來自于樣本,而抽樣帶有隨機性,所以它是一個隨 機區(qū)間。置信區(qū)間代表的意義就是:樣本容量固定為n,假如對總體進行N=1000次抽樣,就得到了 1000個置信區(qū)間,這些區(qū)間有的包含 9的真實值,有的不包含。但假設當置信度1- a二95%時,這一千個區(qū)間就大約有 1000*95%二950個包含了 9的真實值。簡述評價估計量的標準1、無偏性:無偏性不是要求估計量與總體參數(shù)不得有偏差

7、,因為這是不可能的, 既然是抽樣,必然存在抽樣誤差,不可能與總體完全相同。無偏性指的是如果對這同 一個總體反復多次抽樣,則要求各個樣本所得出的估計量(統(tǒng)計量)的平均值等于總 體參數(shù)。符合這種要求的估計量被稱為無偏估計量。2、有效性:估計量與總體之間必然存在著一定的誤差,衡量這個誤差大小的一個指 標就是方差,方差越小,估計量對總體的估計也就越準確,這個估計量也就越有效。3、一致性:一致性指的是當樣本量逐漸增加時,樣本的估計量(統(tǒng)計量)能夠 逐漸逼近總體參數(shù)。解釋置信水平的含義置信水平是指總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)內(nèi)的概率;而置信區(qū)間是指在某一置信水平下,樣本統(tǒng)計值與總體參數(shù)值間誤差范圍。置信

8、區(qū)間越大,置信水平越高。什么是P值?利用P值進行檢驗和利用統(tǒng)計量進行檢驗有什么不同犯第I類錯誤的真實概率就是P值。用統(tǒng)計術(shù)語來說,如果原假設Ho是正確的,所得到的樣本結(jié)果P值,也稱為觀察到的會像實際觀測結(jié)果那么極端或更極端的概率成為 顯著性水平。1統(tǒng)計量相比,P值決策優(yōu)先于統(tǒng)計量決策。與傳統(tǒng)的P值決策提供了更多的信息。2根據(jù)統(tǒng)計量決策,如果拒絕原假設,也僅僅是知道犯錯誤的可能性是那么大,但究竟是多少卻不知道。而P值則是算出的犯第I類錯誤的實際概率。在假設檢驗屮,為什么采取不拒絕原假設而不采取接受原假設1. 接受”的說法有時會產(chǎn)生誤導2. 采用“不拒絕”的表述方法更合理一些,因為這種表述意味著樣

9、本提供的證據(jù)不夠強大,因而 沒有足夠的理由拒絕,這不等于已經(jīng)證明原假設正確為什么說假設檢驗不能證明原假設正確1. 假設檢驗的目的主要是收集證據(jù)拒絕原假設,而支持你所傾向的備擇假設2. 假設檢驗只提供不利于原假設的證據(jù)。因此,當拒絕原假設時,表明樣本提供的證據(jù)證明它是 錯誤的,當沒有拒絕原假設時,我們也沒法證明它是正確的,因為假設檢驗的程序沒有提供它 正確的證據(jù)樣本量的大小與顯著性有怎樣的關(guān)系通常在做某種統(tǒng)計推斷時,顯著性水平要求越高,要達到該顯著性水平的樣本量越大。樣本量越 大,檢驗統(tǒng)計量的值夜就越大,P值就越小,就越有可能拒絕原假設。反之則相反。解釋原假設和備擇假設原假設:研究者想收集證據(jù)予

10、以反對的假設。備擇假設:研究者想收集證據(jù)予以 支持的假設什么是標準化檢驗統(tǒng)計量?為什么要對統(tǒng)計量進行標準化?標準化檢驗統(tǒng)計量是根據(jù)樣本觀測結(jié)果計算出對原假設和備擇假設作出決策的檢驗統(tǒng)計量,對樣本估計量標準化的結(jié)果,它反映了點估計量與假設的總體參數(shù)相比相差多少個標準差的距離。 沒標準化的統(tǒng)計量不能直接作為判斷的依據(jù),只有將其標準化后,才能用于度量它與原假設的參 數(shù)值之間的差異程度。怎樣理解顯著性水平通常以a表示,是一個臨界概率值。它表示在統(tǒng)計假設檢驗”中,用樣本資料推斷總體時,犯拒絕假設”錯誤的可能性大小。 a越小,犯拒絕假設”的錯誤可能性越小。6第I類錯誤和第II類錯誤分別是指什么?它們發(fā)生的

11、概率大小之間存在怎樣的關(guān)系?第I類錯誤原假設為正確時拒絕原假設所犯的錯誤,第I類錯誤的概率記為,被稱為顯著性水平。原假設是錯誤的卻沒拒絕原假設,這時所犯的錯誤稱為第口類錯誤,犯第n類錯誤的概率記為,因此也成為錯誤。假設檢驗屮犯的第I類錯誤的概率也稱為顯著性水平,記為,它是人們事先指定的犯第I類錯 誤概率的最大允許值。顯著性水平越小,犯第I類錯誤的可能性自然越小,但犯第II類錯誤的 可能性則隨之增大。反之相反。怎樣理解統(tǒng)計上是顯著地?當拒絕原假設時,我們稱樣本結(jié)果是統(tǒng)計上顯著的,這樣的(樣本)結(jié)果不是偶然得到的,或 者說,不是靠機遇能夠得到的同樣,結(jié)果是不顯著的,則表明這樣的樣本結(jié)果很可能是偶然得到 的。怎樣理解統(tǒng)計顯著性與實際顯著性在假設檢驗屮,拒絕原假設稱樣本結(jié)果在“統(tǒng)計上是顯著的”; 不拒絕原假設則稱結(jié)果是“統(tǒng)計上不顯著的”?!帮@著的”在這里的意義是指“非偶然的”,它 表示這樣的樣本結(jié)果不是偶然得到的,同樣,結(jié)果是不顯著的,則表明這樣的樣本結(jié)果很可能是偶 然得到的。在進行決策時,我們只能說P值越小,拒絕原假設的證據(jù)就越強,檢驗的結(jié)果也就越顯著。當P值 很小而拒絕原假設時,并不一定意味著檢驗的結(jié)果就有實際意義,因為假設檢驗屮所說的“顯著” 僅僅是“統(tǒng)計意義上的顯著”。也就是說,一個在統(tǒng)計上顯著的結(jié)論在實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論