統(tǒng)計分析_P值的含義_第1頁
統(tǒng)計分析_P值的含義_第2頁
統(tǒng)計分析_P值的含義_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、.P值是怎么來的從某總體中抽、這一樣本是由該總體抽出,其差別是由抽樣誤差所致;、這一樣本不是從該總體抽出,所以有所不同。如何判斷是那種原因呢?統(tǒng)計學中用顯著性檢驗賴判斷。其步驟是:、建立檢驗假設(又稱無效假設,符號為H0):如要比較A藥和B藥的療效是否相等,則假設兩組樣本來自同一總體,即A藥的總體療效和B藥相等,差別僅由抽樣誤差引起的碰巧出現(xiàn)的。、選擇適當?shù)慕y(tǒng)計方法計算H0成立的可能性即概率有多大,概率用P值表示。、根據(jù)選定的顯著性水平(0.05或0.01),決定接受還是拒絕H0。如果P0.05,不能否定“差別由抽樣誤差引起”,則接受H0;如果P0.05或P 0.01,可以認為差別不由抽樣誤差

2、引起,可以拒絕H0,則可以接受令一種可能性的假設(又稱備選假設,符號為H1),即兩樣本來自不同的總體,所以兩藥療效有差別。統(tǒng)計學上規(guī)定的P值意義見下表P值 碰巧的概率 對無效假設 統(tǒng)計意義 P0.05 碰巧出現(xiàn)的可能性大于5% 不能否定無效假設 兩組差別無顯著意義 P0.05 碰巧出現(xiàn)的可能性小于5% 可以否定無效假設 兩組差別有顯著意義 P 0.01 碰巧出現(xiàn)的可能性小于1% 可以否定無效假設 兩者差別有非常顯著意義 理解P值,下述幾點必須注意:P的意義不表示兩組差別的大小,P反映兩組差別有無統(tǒng)計學意義,并不表示差別大小。因此,與對照組相比,C藥取得P0.05,D藥取得P 0.01并不表示D

3、的藥效比C強。 P0.05時,差異無顯著意義,根據(jù)統(tǒng)計學原理可知,不能否認無效假設,但并不認為無效假設肯定成立。在藥效統(tǒng)計分析中,更不表示兩藥等效。哪種將“兩組差別無顯著意義”與“兩組基本等效”相同的做法是缺乏統(tǒng)計學依據(jù)的。統(tǒng)計學主要用上述三種P值表示,也可以計算出確切的P值,有人用P 0.001,無此必要。顯著性檢驗只是統(tǒng)計結論。判斷差別還要根據(jù)專業(yè)知識。樣所得的樣本,其統(tǒng)計量會與總體參數(shù)有所不同,這可能是由于兩種原因P值是最常用的一個統(tǒng)計學指標,幾乎統(tǒng)計軟件輸出結果都有P值。了解p值的由來、計算和意義很有必要。 統(tǒng)計學意義(p值)(這是經理每次爭論的焦點) 結果的統(tǒng)計學意義是結果真實程度(

4、能夠代表總體)的一種估計方法。專業(yè)上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯(lián)是總體中各變量關聯(lián)的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯(lián)有5%的可能是由于偶然性造成的。即假設總體中任意變量間均無關聯(lián),我們重復類似實驗,會發(fā)現(xiàn)約20個實驗中有一個實驗,我們所研究的變量關聯(lián)將等于或強于我們的實驗結果。(這并不是說如果變量間存在關聯(lián),我們可得到5%或95%次數(shù)的相同結果,當總體中的變量存在關聯(lián),重復研究和發(fā)現(xiàn)關聯(lián)的可能性與設計的統(tǒng)計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。如

5、何判定結果具有真實的顯著性在最后結論中判斷什么樣的顯著性水平具有統(tǒng)計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最后的決定通常依賴于數(shù)據(jù)集比較和分析過程中結果是先驗性還是僅僅為均數(shù)之間的兩兩比較,依賴于總體數(shù)據(jù)集里結論一致的支持性證據(jù)的數(shù)量,依賴于以往該研究領域的慣例。通常,許多的科學領域中產生p值的結果0.05被認為是統(tǒng)計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.05p0.01被認為是具有統(tǒng)計學意義,而0.01p0.001被認為具有高度統(tǒng)計學意義。但要注意這種分類僅僅是研究基礎上非正規(guī)的判斷常規(guī)。所有的檢驗統(tǒng)計都是

6、正態(tài)分布的嗎?并不完全如此,但大多數(shù)檢驗都直接或間接與之有關,可以從正態(tài)分布中推導出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變量在總體中呈正態(tài)分布,即滿足所謂的正態(tài)假設。許多觀察變量的確是呈正態(tài)分布的,這也是正態(tài)分布是現(xiàn)實世界的基本特征的原因。當人們用在正態(tài)分布基礎上建立的檢驗分析非正態(tài)分布變量的數(shù)據(jù)時問題就產生了,(參閱非參數(shù)和方差分析的正態(tài)性檢驗)。這種條件下有兩種方法:一是用替代的非參數(shù)檢驗(即無分布性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統(tǒng)計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基于正態(tài)分布前提下的檢驗。后

7、一種方法是基于一個相當重要的原則產生的,該原則對正態(tài)方程基礎上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分布形狀趨于正態(tài),即使所研究的變量分布并不呈正態(tài)。1統(tǒng)計軟件的選擇 在進行統(tǒng)計分析時,作者常使用非專門的數(shù)理統(tǒng)計軟件Excel進行統(tǒng)計分析。由于Excel提供的統(tǒng)計分析功能十分有限,很難滿足實際需要。目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商業(yè)軟件很多,比較著名有SPSS(Statistical Package for Social Sciences)、SAS(Statistical Analysis System)、BMDP和STATISTICA等。其中,SPSS是專門為社會科

8、學領域的研究者設計的(但是,此軟件在自然科學領域也得到廣泛應用);BMDP是專門為生物學和醫(yī)學領域研究者編制的統(tǒng)計軟件。目前,國際學術界有一條不成文的約定:凡是用SPSS和SAS軟件進行統(tǒng)計分析所獲得的結果,在國際學術交流中不必說明具體算法。由此可見,SPSS和SAS軟件已被各領域研究者普遍認可。建議作者們在進行統(tǒng)計分析時盡量使用這2個專門的統(tǒng)計軟件。2均值的計算 在處理實驗數(shù)據(jù)或采樣數(shù)據(jù)時,經常會遇到對相同采樣或相同實驗條件下同一隨機變量的多個不同取值進行統(tǒng)計處理的問題。此時,多數(shù)作者會不假思索地直接給出算術平均值和標準差。顯然,這種做法是不嚴謹?shù)摹T跀?shù)理統(tǒng)計學中,作為描述隨機變量總體大小特

9、征的統(tǒng)計量有算術平均值、幾何平均值和中位數(shù)等。何時用算術平均值?何時用幾何平均值?以及何時用中位數(shù)?這不能由研究者根據(jù)主觀意愿隨意確定,而要根據(jù)隨機變量的分布特征確定。反映隨機變量總體大小特征的統(tǒng)計量是數(shù)學期望,而在隨機變量的分布服從正態(tài)分布時,其總體的數(shù)學期望就是其算術平均值。此時,可用樣本的算術平均值描述隨機變量的大小特征。如果所研究的隨機變量不服從正態(tài)分布,則算術平均值不能準確反映該變量的大小特征。在這種情況下,可通過假設檢驗來判斷隨機變量是否服從對數(shù)正態(tài)分布。如果服從對數(shù)正態(tài)分布,則可用幾何平均值描述該隨機變量總體的大小。此時,就可以計算變量的幾何平均值。如果隨機變量既不服從正態(tài)分布也

10、不服從對數(shù)正態(tài)分布,則按現(xiàn)有的數(shù)理統(tǒng)計學知識,尚無合適的統(tǒng)計量描述該變量的大小特征。退而求其次,此時可用中位數(shù)來描述變量的大小特征。3相關分析中相關系數(shù)的選擇 在相關分析中,作者們常犯的錯誤是簡單地計算Pearson積矩相關系數(shù),而且既不給出正態(tài)分布檢驗結果,也往往不明確指出所計算的相關系數(shù)就是Pearson 積矩相關系數(shù)。常用的相關系數(shù)除有Pearson積矩相關系數(shù)外,還有Spearman秩相關系數(shù)和Kendall秩相關系數(shù)等。其中,Pearson 積矩相關系數(shù)可用于描述2個隨機變量的線性相關程度(相應的相關分析方法稱為“參數(shù)相關分析”,該方法的檢驗功效高,檢驗結果明確);Spearman或

11、Kendall秩相關系數(shù)用來判斷兩個隨機變量在二維和多維空間中是否具有某種共變趨勢,而不考慮其變化的幅度(相應的相關分析稱為“非參數(shù)相關分析” ,該方法的檢驗功效較參數(shù)方法稍差,檢驗結果也不如參數(shù)方法明確)。各種成熟的統(tǒng)計軟件如SPSS、SAS等均提供了這些相關系數(shù)的計算模塊。在相關分析中,計算各種相關系數(shù)是有前提的。對于二元相關分析,如果2個隨機變量服從二元正態(tài)分布,或2個隨機變量經數(shù)據(jù)變換后服從二元正態(tài)分布,則可以用Pearson積矩相關系數(shù)描述這2個隨機變量間的相關關系(此時描述的是線性相關關系),而不宜選用功效較低的Spearman或Kendall秩相關系數(shù)。如果樣本數(shù)據(jù)或其變換值不服

12、從正態(tài)分布,則計算Pearson 積矩相關系數(shù)就毫無意義。退而求其次,此時只能計算Spearman或Kendall秩相關系數(shù)(盡管這樣做會導致檢驗功效的降低)。因此,在報告相關分析結果時,還應提供正態(tài)分布檢驗結果,以證明計算所選擇的相關系數(shù)是妥當?shù)?。需要指出的是,由于Spearman或Kendall秩相關系數(shù)是基于順序變量(秩)設計的相關系數(shù),因此,如果所采集的數(shù)據(jù)不是確定的數(shù)值而僅僅是秩,則使用Spearman或Kendall秩相關系數(shù)進行非參數(shù)相關分析就成為唯一的選擇。4相關分析與回歸分析的區(qū)別 相關分析和回歸分析是極為常用的2種數(shù)理統(tǒng)計方法,在地質學研究領域有著廣泛的用途。然而,由于這2

13、種數(shù)理統(tǒng)計方法在計算方面存在很多相似之處,且在一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這2種數(shù)理統(tǒng)計方法的內在差別,從而使一些研究者不能嚴格區(qū)分相關分析與回歸分析。最常見的錯誤是,用回歸分析的結果解釋相關性問題。例如,作者將“回歸直線(曲線)圖”稱為“相關性圖”或“相關關系圖”;將回歸直線的R2(擬合度,或稱“可決系數(shù)”)錯誤地稱為“相關系數(shù)”或“相關系數(shù)的平方”;根據(jù)回歸分析的結果宣稱2個變量之間存在正的或負的相關關系。這些情況在國內極為普遍。 相關分析與回歸分析均為研究2個或多個隨機變量間關聯(lián)性的方法,但2種數(shù)理統(tǒng)計方法存在本質的差別,即它們用于不同的研究目的。相關分析的目的在于檢驗兩個隨機變量的

14、共變趨勢(即共同變化的程度),回歸分析的目的則在于試圖用自變量來預測因變量的值。在相關分析中,兩個變量必須同時都是隨機變量,如果其中的一個變量不是隨機變量,就不能進行相關分析。這是相關分析方法本身所決定的。對于回歸分析,其中的因變量肯定為隨機變量(這是回歸分析方法本身所決定的),而自變量則可以是普通變量(規(guī)范的叫法是“固定變量”,有確定的取值)也可以是隨機變量。如果自變量是普通變量,采用的回歸方法就是最為常用的“最小二乘法”,即模型回歸分析;如果自變量是隨機變量,所采用的回歸方法與計算者的目的有關-在以預測為目的的情況下,仍采用“最小二乘法”,在以估值為目的的情況下須使用相對嚴謹?shù)摹爸鬏S法”、“約化主軸法”或“Bartlett法”,即模型回歸分析。顯然,對于回歸分析,如果是模型回歸分析,就根本不可能回答變量的“相關性”問題,因為普通變量與隨機變量之間不存在“相關性”這一概念(問題在于,大多數(shù)的回歸分析都是模型回歸分析?。4藭r,即使作者想描述2個變量間的“共變趨勢”而改用相關分析,也會因相關分析的前提不存在而使分析結果毫無意義。如果是模型回歸分析,鑒于兩個隨機變量客觀上存在“相關性”問題,但因回歸分析方法本身不能提供針對自變量和因變量之間相關關系的準確的檢驗手段,因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論