數(shù)理統(tǒng)計(jì)分析課件_第1頁
數(shù)理統(tǒng)計(jì)分析課件_第2頁
數(shù)理統(tǒng)計(jì)分析課件_第3頁
數(shù)理統(tǒng)計(jì)分析課件_第4頁
數(shù)理統(tǒng)計(jì)分析課件_第5頁
已閱讀5頁,還剩963頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章緒論

1試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)分析在食品科學(xué)研究中的作用

下一張

主頁

退出

上一張

為了推動(dòng)食品科學(xué)的發(fā)展,常常要進(jìn)行科學(xué)研究。進(jìn)行科學(xué)研究離不開調(diào)查或試驗(yàn)。進(jìn)行調(diào)查或試驗(yàn)必須解決兩個(gè)問題:(1)如何合理地進(jìn)行調(diào)查或試驗(yàn)設(shè)計(jì);(2)如何科學(xué)地整理、分析所收集的具有變異的數(shù)據(jù)資料,揭示出隱藏在其內(nèi)部的規(guī)律性。下一張

主頁

退出

上一張

食品試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)分析總體上講屬於生物統(tǒng)計(jì)學(xué)(Biometrics)範(fàn)疇。合理地進(jìn)行調(diào)查或試驗(yàn)設(shè)計(jì)、科學(xué)地整理、分析所收集得來的資料是生物統(tǒng)計(jì)的根本任務(wù)。食品試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)分析是數(shù)理統(tǒng)計(jì)原理和方法在食品科學(xué)研究中的具體應(yīng)用。它在食品科學(xué)研究中的作用主要體現(xiàn)在兩方面:下一張

主頁

退出

上一張

(1)提供試驗(yàn)或調(diào)查設(shè)計(jì)的方法試驗(yàn)設(shè)計(jì)有廣義與狹義之分。

廣義的試驗(yàn)設(shè)計(jì)是指試驗(yàn)研究的課題設(shè)計(jì),也就是指整個(gè)試驗(yàn)計(jì)畫的擬定。主要包含課題名稱、試驗(yàn)?zāi)康摹⒀芯恳罁?jù)、內(nèi)容以及預(yù)期達(dá)到的效果,試驗(yàn)方案,經(jīng)濟(jì)效益或社會(huì)效益的估計(jì),已具備的研究條件,參加研究人員的分工,試驗(yàn)時(shí)間、地點(diǎn)、進(jìn)度安排和經(jīng)費(fèi)預(yù)算,成果鑒定,學(xué)術(shù)論文撰寫等等內(nèi)容。下一張

主頁

退出

上一張

狹義的試驗(yàn)設(shè)計(jì)主要是指試驗(yàn)單位(試驗(yàn)單元)的選取、重複數(shù)目的確定、試驗(yàn)單位的分組和試驗(yàn)處理的安排。通常講的試驗(yàn)設(shè)計(jì)主要指狹義的試驗(yàn)設(shè)計(jì)。合理的試驗(yàn)設(shè)計(jì)能控制和降低試驗(yàn)誤差,提高試驗(yàn)的精確性,為統(tǒng)計(jì)分析獲得試驗(yàn)處理效應(yīng)和試驗(yàn)誤差的無偏估計(jì)提供必要的數(shù)據(jù)。食品試驗(yàn)研究中常用的試驗(yàn)設(shè)計(jì)方法有完全隨機(jī)設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、正交設(shè)計(jì)、均勻設(shè)計(jì)、回歸正交設(shè)計(jì)和混料設(shè)計(jì)等。下一張

主頁

退出

上一張

調(diào)查設(shè)計(jì)也有廣義與狹義之分:

廣義的調(diào)查設(shè)計(jì)是指整個(gè)調(diào)查計(jì)畫的制定,包括調(diào)查研究的目的、對(duì)象與範(fàn)圍,調(diào)查專案及調(diào)查表,抽樣方法的選取,抽樣單位、抽樣數(shù)量的確定,數(shù)據(jù)處理方法,調(diào)查組織工作,調(diào)查報(bào)告撰寫與要求,經(jīng)費(fèi)預(yù)算等內(nèi)容。下一張

主頁

退出

上一張

狹義的調(diào)查設(shè)計(jì)主要包含抽樣方法的選取,抽樣單位、抽樣數(shù)目的確定等等。通常講的調(diào)查設(shè)計(jì)主要是指狹義的調(diào)查設(shè)計(jì)。合理的調(diào)查設(shè)計(jì)能控制與降低抽樣誤差,提高調(diào)查的精確性,為獲得總體參數(shù)的可靠估計(jì)提供必要的數(shù)據(jù)。

試驗(yàn)或調(diào)查設(shè)計(jì)主要解決合理地收集必要而有代表性資料的問題。下一張

主頁

退出

上一張

(2)提供整理、分析數(shù)據(jù)資料的方法整理資料的基本方法是根據(jù)資料的特性將其整理成統(tǒng)計(jì)表、繪製成統(tǒng)計(jì)圖。通過統(tǒng)計(jì)表、圖可以大致看到所得資料集中、離散的情況,並利用所收集得來的數(shù)據(jù)計(jì)算樣本統(tǒng)計(jì)量,以表示該資料的數(shù)量特徵、估計(jì)相應(yīng)的總體參數(shù)。下一張

主頁

退出

上一張

統(tǒng)計(jì)分析的主要內(nèi)容有兩方面:

①統(tǒng)計(jì)分析最重要的內(nèi)容是差異顯著性檢驗(yàn),即統(tǒng)計(jì)假設(shè)檢驗(yàn)。通過抽樣調(diào)查或控制試驗(yàn),獲得的是具有變異的資料。那麼產(chǎn)生變異的原因是什麼?是由於處理間(例如不同原料、不同工藝、不同配比間)的實(shí)質(zhì)性差異所引起的,還是由於無法控制的偶然因素所引起的?顯著性檢驗(yàn)的目的就在於承認(rèn)並儘量排除這些無法控制的偶然因素的干擾,將處理間是否存在本質(zhì)差異揭示出來。下一張

主頁

退出

上一張

t檢驗(yàn)——主要用於檢驗(yàn)兩個(gè)處理平均數(shù)差異是否顯著;

方差分析——主要用於檢驗(yàn)多個(gè)處理平均數(shù)間差異是否顯著(F檢驗(yàn));

檢驗(yàn)——

主要用於由品質(zhì)性狀得來的次數(shù)資料的顯著性檢驗(yàn)等。下一張

主頁

退出

上一張

顯著性檢驗(yàn)的方法很多,常用的有:

②統(tǒng)計(jì)分析的另一個(gè)重要內(nèi)容是對(duì)變數(shù)(試驗(yàn)指標(biāo)或性狀)間的關(guān)係進(jìn)行研究。研究它們之間的聯(lián)繫性質(zhì)和程度,或者尋求它們之間的聯(lián)繫形式,即進(jìn)行相關(guān)分析與回歸分析。通過對(duì)資料進(jìn)行相關(guān)、回歸分析,可以揭示出試驗(yàn)指標(biāo)或性狀間的內(nèi)在聯(lián)繫,為食品新產(chǎn)品的研製開發(fā)、產(chǎn)品品質(zhì)的預(yù)測和控制提供理論依據(jù)。下一張

主頁

退出

上一張

還有一類統(tǒng)計(jì)分析方法:不考慮資料的分佈類型,也不事先對(duì)有關(guān)總體參數(shù)進(jìn)行估計(jì),這類統(tǒng)計(jì)分析方法叫非參數(shù)檢驗(yàn)法。非參數(shù)檢驗(yàn)法計(jì)算簡便。當(dāng)通常的檢驗(yàn)方法對(duì)某些試驗(yàn)或調(diào)查資料無能為力時(shí),非參數(shù)檢驗(yàn)法是比較好的統(tǒng)計(jì)方法。下一張

主頁

退出

上一張

2試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)學(xué)發(fā)展概況古典記錄統(tǒng)計(jì)學(xué)階段近代描述統(tǒng)計(jì)學(xué)階段現(xiàn)代推斷統(tǒng)計(jì)學(xué)階段為什麼要試驗(yàn)?實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn)!原理論試驗(yàn)

新理論高級(jí)試驗(yàn)假設(shè)理論驗(yàn)證、檢驗(yàn)總結(jié)、發(fā)現(xiàn)新結(jié)果科學(xué)研究的實(shí)際過程-試驗(yàn)本門課程的主要內(nèi)容及框架結(jié)構(gòu)食品試驗(yàn)設(shè)計(jì)與統(tǒng)計(jì)分析數(shù)理統(tǒng)計(jì)分析試驗(yàn)設(shè)計(jì)常用統(tǒng)計(jì)軟體簡介統(tǒng)計(jì)資料的整理與分析理論分佈與抽樣分佈統(tǒng)計(jì)假設(shè)檢驗(yàn)與參數(shù)估計(jì)方差分析回歸分析試驗(yàn)設(shè)計(jì)基礎(chǔ)全面試驗(yàn)設(shè)計(jì)正交試驗(yàn)設(shè)計(jì)均勻試驗(yàn)設(shè)計(jì)回歸正交試驗(yàn)設(shè)計(jì)Excel、SAS、SPSS1數(shù)理統(tǒng)計(jì)中的常用術(shù)語

1.1總體與樣本

總體:根據(jù)研究目的確定的研究對(duì)象的全體稱為總體(population);個(gè)體:總體中的每一個(gè)研究單位稱為個(gè)體(individual);

樣本:依據(jù)一定方法由總體中抽取部分個(gè)體所組成的集合稱為樣本(sample);

有限總體:含有有限個(gè)個(gè)體的總體稱為有限總體;

無限總體:包含有無限多個(gè)個(gè)體的總體稱為無限總體;下一張

主頁

退出

上一張

樣本容量:樣本中所包含的個(gè)體數(shù)目叫樣本容量或大小(samplesize),樣本容量常記為n。通常把n≤30的樣本叫小樣本,n>30的樣本叫大樣本。試驗(yàn)研究的目的:瞭解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計(jì)分析的基本特點(diǎn)。下一張

主頁

退出

上一張

為了能可靠地從樣本來推斷總體,要求樣本具有一定的含量和代表性。如何獲取有代表性的樣本?採用隨機(jī)抽取。所謂隨機(jī)抽取(randomsampling)是指總體中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)被抽取到樣本中。樣本畢竟只是總體的一部分,儘管樣本具有一定的含量也具有代表性,通過樣本來推斷總體也不可能是百分之百的正確。有很大的可靠性但有一定的錯(cuò)誤率這是統(tǒng)計(jì)分析的特點(diǎn)。下一張

主頁

退出

上一張

1.2參數(shù)與統(tǒng)計(jì)量為了表示總體和樣本的數(shù)量特徵,需要計(jì)算特徵數(shù)。

參數(shù):由總體計(jì)算的特徵數(shù)叫參數(shù)(parameter);常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ表示總體標(biāo)準(zhǔn)差;統(tǒng)計(jì)量:由樣本計(jì)算的特徵數(shù)叫統(tǒng)計(jì)量(staistic)。常用拉丁字母表示統(tǒng)計(jì)量,例如用表示樣本平均數(shù),用s表示樣本標(biāo)準(zhǔn)差,用R表示極差。

下一張

主頁

退出

上一張

總體樣本參數(shù)

統(tǒng)計(jì)量sμσσ2方差s2標(biāo)準(zhǔn)差平均數(shù)R極差抽樣推斷、估計(jì)為了瞭解總體分佈、特徵構(gòu)造

總體參數(shù)由相應(yīng)的統(tǒng)計(jì)量來估計(jì),例如用估計(jì)μ,用S估計(jì)σ等。

1.3準(zhǔn)確性與精確性

準(zhǔn)確性(accuracy)也叫準(zhǔn)確度,指觀測值與其真值的接近程度。設(shè)某一試驗(yàn)指標(biāo)或性狀的真值為μ,觀測值為

x,若x與μ相差的絕對(duì)值|x-μ|越小,則觀測值x的準(zhǔn)確性越高;反之則低。下一張

主頁

退出

上一張

精確性(precision)也叫精確度,指同一試驗(yàn)指標(biāo)或性狀的重複觀測值彼此接近的程度。若觀測值彼此接近,即任意二個(gè)觀測值xi

、xj

相差的絕對(duì)值|xi-xj|越小,則觀測值精確性越高;反之則低。準(zhǔn)確性、精確性的意義見圖2-1。下一張

主頁

退出

上一張

圖2-1準(zhǔn)確性與精確性的關(guān)係示意圖隨機(jī)誤差也叫抽樣誤差(samplingerror),是由于許多無法控制的內(nèi)在和外在的偶然因素所造成的。隨機(jī)誤差帶有偶然性質(zhì),在試驗(yàn)中,即使十分小心的進(jìn)行試驗(yàn)操作也難以消除。隨機(jī)誤差不可避免,但可減少。隨機(jī)誤差影響試驗(yàn)的精確性。下一張

主頁

退出

上一張

1.4

隨機(jī)誤差(randomerror)與系統(tǒng)誤差(systematicerror)

統(tǒng)計(jì)上的試驗(yàn)誤差是指隨機(jī)誤差。這種誤差愈小,試驗(yàn)的精確性愈高。

系統(tǒng)誤差也叫片面誤差(lopsidederror),這是由于試驗(yàn)對(duì)象相差較大,測量的儀器不準(zhǔn)、標(biāo)準(zhǔn)試劑未經(jīng)校正,以及觀測、記載、抄錄、計(jì)算中的錯(cuò)誤等等所引起。系統(tǒng)誤差可以通過改進(jìn)方法、正確試驗(yàn)設(shè)計(jì)來避免、消除。系統(tǒng)誤差影響試驗(yàn)的準(zhǔn)確性。下一張

主頁

退出

上一張

正確地進(jìn)行試驗(yàn)數(shù)據(jù)資料的分類是統(tǒng)計(jì)資料整理的前提。在調(diào)查或試驗(yàn)中,由觀察、測量所得的數(shù)據(jù)資料按其性質(zhì)的不同,一般可以分為數(shù)量性狀資料、品質(zhì)性狀資料和半定量(等級(jí))資料三大類。下一張

主頁

退出

上一張

2統(tǒng)計(jì)資料的分類

數(shù)量性狀(quantitativecharacter)是指能夠以測量、計(jì)量或計(jì)數(shù)的方式表示其特徵的性狀。觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料數(shù)量性狀資料的獲得有測量和計(jì)數(shù)兩種方式,因而數(shù)量性狀資料又分為計(jì)量資料和計(jì)數(shù)資料兩種。下一張

主頁

退出

上一張

2.1數(shù)量性狀資料

用測量方式獲得的數(shù)量性狀資料,即用度、量、衡等計(jì)量工具直接測定獲得的數(shù)量性狀資料。其數(shù)據(jù)是用長度、容積、重量等來表示。這種資料的各個(gè)觀測值不一定是整數(shù),兩個(gè)相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn),其小數(shù)位數(shù)的多少由度量工具的精度而定,它們之間的變異是連續(xù)性的。因此,計(jì)量資料也稱為連續(xù)性變異資料。下一張

主頁

退出

上一張

2.1.1計(jì)量資料

2.1.2計(jì)數(shù)資料

指用計(jì)數(shù)方式獲得的數(shù)量性狀資料。在這類資料中,它的各個(gè)觀察值只能以整數(shù)表示,在兩個(gè)相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn)。這些觀察值只能以整數(shù)來表示,各觀察值是不連續(xù)的,因此該類資料也稱為不連續(xù)性變異資料或間斷性變異資料。下一張

主頁

退出

上一張

2.2品質(zhì)性狀資料

品質(zhì)性狀(qualitativecharacter)是指能觀察到而不能直接測量的,只能用文字來描述其特徵的性狀,如食品顏色、風(fēng)味等等。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對(duì)其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:下一張

主頁

退出

上一張

2.2.1統(tǒng)計(jì)次數(shù)法

在一定的總體或樣本中,根據(jù)某一品質(zhì)性狀的類別統(tǒng)計(jì)其次數(shù),以次數(shù)作為品質(zhì)性狀的數(shù)據(jù)。例如,蘋果中全紅果個(gè)數(shù)與半紅果個(gè)數(shù)。由品質(zhì)性狀數(shù)量化而得來的資料又叫次數(shù)資料。下一張

主頁

退出

上一張

2.2.2評(píng)分法

對(duì)某一品質(zhì)性狀,因其類別不同,分別給予評(píng)分。例如,分析麵包的品質(zhì),可以按照國際麵包評(píng)分細(xì)則進(jìn)行打分,綜合評(píng)價(jià)麵包品質(zhì)。新產(chǎn)品開發(fā)中的評(píng)價(jià)打分等等。

2.3半定量(等級(jí))資料

半定量或等級(jí)資料(semi-quantitativeorrankeddata)是指將觀察單位按所考察的性狀或指標(biāo)的等級(jí)順序分組,然後清點(diǎn)各組觀察單位的次數(shù)而得的資料。這類資料既有次數(shù)資料的特點(diǎn),又有程度或量的不同。如某種果實(shí)的褐變程度是視果實(shí)變色面積將其分組,然後統(tǒng)計(jì)各級(jí)別果數(shù)。

三種不同類型的資料相互間是有區(qū)別的,但有時(shí)可根據(jù)研究的目的和統(tǒng)計(jì)方法的要求將一種類型資料轉(zhuǎn)化成另一種類型的資料。例如,優(yōu)酪乳中的乳桿菌總數(shù)得到的資料屬於計(jì)數(shù)資料,根據(jù)化驗(yàn)的目的,可按乳桿菌總數(shù)正常或不正常分為兩組,清點(diǎn)各組的次數(shù),計(jì)數(shù)資料就轉(zhuǎn)化為品質(zhì)性狀次數(shù)資料;如果按乳桿菌總數(shù)過高、正常、過低分為三組,清點(diǎn)各組次數(shù),就轉(zhuǎn)化成了半定量資料。下一張

主頁

退出

上一張

3數(shù)據(jù)資料的整理3.1數(shù)據(jù)資料的檢查與核對(duì)目的:在於確保原始資料的完整性和正確性。所謂完整性是指原始資料無遺缺或重複。所謂正確性是指原始資料的測量和記載無差錯(cuò)或未進(jìn)行不合理的歸併。檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結(jié)合專業(yè)知識(shí)作出判斷)。對(duì)於有重複、異常或遺漏的資料,應(yīng)予以刪除或補(bǔ)齊;對(duì)有錯(cuò)誤、相互矛盾的資料應(yīng)進(jìn)行更正,必要時(shí)進(jìn)行復(fù)查或重新試驗(yàn)。下一張

主頁

退出

上一張

未整理的資料為原始資料,是零星的、孤立的和雜亂無章,無規(guī)律可循,通過科學(xué)的整理和分析,可發(fā)現(xiàn)其規(guī)律性,揭示事物內(nèi)在本質(zhì)。3.2數(shù)據(jù)資料的整理方法當(dāng)觀測值不多(n≤30)時(shí),不必分組,可直接進(jìn)行統(tǒng)計(jì)分析。當(dāng)觀測值較多(n>30)時(shí),宜將觀測值分成若干組,以便統(tǒng)計(jì)分析。將觀測值分組後,製成次數(shù)分佈表,即可看到資料的集中和變異情況。

下一張

主頁

退出

上一張

3.2連續(xù)性資料(計(jì)量資料)的整理

連續(xù)性資料的整理,需要先確定全距、組數(shù)、組距、組中值及組限,然後將全部觀測值計(jì)數(shù)歸組。【例2.1】為了分析某生產(chǎn)廠的罐頭質(zhì)量,現(xiàn)隨機(jī)抽取100聽罐頭樣品,分別稱取其淨(jìng)重,數(shù)據(jù)資料見表2-1。下一張

主頁

退出

上一張

342.1340.7348.4346.0343.4342.7346.0341.1344.0348.0346.3346.0340.3344.2342.2344.1345.0340.5344.2344.0343.5344.2342.6343.7345.5339.3350.2337.3345.3358.2344.2345.8331.2342.1342.4340.5350.0343.2347.0340.2344.0353.3340.2336.3348.9340.2356.1346.0345.6346.2340.6339.7342.3352.8342.6350.3348.5344.0350.0335.1340.3338.2345.5345.6349.0336.7342.0338.4343.9343.7341.1347.1342.5350.0343.5345.6345.0348.6344.2341.1346.8350.2339.9346.6339.9344.3346.2338.0341.1347.3347.2339.8344.4347.2341.0341.0343.3342.3339.5343.0表2-1100聽罐頭樣品的淨(jìng)重g

1、求全距

R

全距是數(shù)據(jù)資料中的最大值與最小值之差,又稱為極差(range),用R表示。即

R=Max(xi)-Min(xi)xi為觀測值

本例Max=358.2Min=331.2

R=358.2-331.2=27.0下一張

主頁

退出

上一張

2、確定組數(shù)

k

組數(shù)的多少視樣本含量及資料的變動(dòng)範(fàn)圍大小而定,一般以達(dá)到既簡化資料又不影響反映資料的規(guī)律性為原則。組數(shù)要適當(dāng),不宜過多,亦不宜過少。分組越多所求得的統(tǒng)計(jì)量越精確,但增大了運(yùn)算量;若分組過少,資料的規(guī)律性就反映不出來,計(jì)算出的統(tǒng)計(jì)量的精確性也較差。一般組數(shù)的確定,可參考表2-2。下一張

主頁

退出

上一張

下一張

主頁

退出

上一張

樣本含量(n)組數(shù)60-1007-10100-2009-12200-50012-17500以上17-30本例中,n=100,初步確定組數(shù)為9組。表2-2樣本含量與組數(shù)3、確定組距i

每一組中的最大值與最小值之差稱為組距(Classinterval),記為i。分組時(shí)一般要求各組的組距相等。組距(i)=全距R/組數(shù)k

本例

i=27/9=3下一張

主頁

退出

上一張

4、確定組限及組中值

各組的最大值與最小值稱為組限。最小值稱為下限,最大值稱為上限。每一組的中點(diǎn)值稱為組中值,它是該組的代表值。組中值與組限、組距的關(guān)係如下:組中值=(組下限+組上限)/2=組下限+1/2組距=組上限-1/2組距

下一張

主頁

退出

上一張

組距確定後,首先要選定第一組的組中值。在分組時(shí)為了避免第一組中觀察值過多,一般第一組的組中值以接近或等於資料中的最小值為好。第一組組中值確定後,該組組限即可確定,其餘各組的組中值和組限也可相繼確定。注意:最末一組的上限應(yīng)大於資料中的最大值。

表2-1中,最小值為331.2,第一組的組中值取331.0,因組距為3.0,因此第一組的下限應(yīng)為:

331.0-(1/2)×3.0=329.5;第一組的上限也就是第二組的下限應(yīng)為:

329.5+3.0=332.5;第二組的上限也就是第三組的下限為:

332.5+3.0=335.5,……,依此類推,一直到某一組的上限大於資料中的最大值為止。依次類推分組為:

329.5-332.5,332.5-335.5,……

下一張

主頁

退出

上一張

將正好等於前一組上限和後一組下限的數(shù)據(jù),一般約定將其歸入後一組。通常將上限略去不寫。第一組記為36.0

,第二組記為39.0

……

5、製作次數(shù)分佈表分組結(jié)束後,將資料中的每一觀測值逐一歸組,統(tǒng)計(jì)每組內(nèi)所包含的觀測值個(gè)數(shù),製作次數(shù)分佈表。下一張

主頁

退出

上一張

表2-3100聽罐頭淨(jìng)重的次數(shù)分佈下一張

主頁

退出

上一張

組限組中值(x)次數(shù)(f)329.5-331.0332.5-334.0335.5-337.0338.5-340.0341.5-343.0344.5-346.0347.5-349.0350.5-352.0353.5-355.0356.5-358.011621322312211100聽罐頭的單聽淨(jìng)重多數(shù)集中在343g,約占觀測值總個(gè)數(shù)的1/3,用它來描述罐頭單聽淨(jìng)重的平均水準(zhǔn),有較強(qiáng)的代表性。由次數(shù)分佈表可以看出,每聽罐頭淨(jìng)重小於332.5g及大於356.5g的為極少數(shù)。100聽罐頭淨(jìng)重分佈基本以343.0g為中心,向兩邊做遞減對(duì)稱分佈。

表2-4100盒鮮棗每盒檢出不合格棗數(shù)下一張

主頁

退出

上一張

3.3間斷性資料(計(jì)數(shù)資料)的整理

以100盒鮮棗每盒檢出不合格棗數(shù)為例,說明間斷性資料的整理。18291924221924222220232021232126222324222324252422242324222523252623222523202225262526262526242321262123222424212324242122232022232623242224262824272324222623202625252625252625242225262524252625252728

計(jì)數(shù)資料觀察值較多時(shí),變異範(fàn)圍較大,若以每一觀察值為一組,則組數(shù)太多,而每組內(nèi)包含的觀察值太少,資料的規(guī)律性顯示不出來。對(duì)於這樣的資料,可擴(kuò)大為以幾個(gè)相鄰觀察值為一組,適當(dāng)減少組數(shù),這樣資料的規(guī)律性就較明顯,對(duì)資料進(jìn)一步計(jì)算分析也比較方便。下一張

主頁

退出

上一張

表2-5100盒鮮棗每盒檢出不合格棗數(shù)次數(shù)分佈表下一張

主頁

退出

上一張

不合格棗數(shù)次數(shù)(f)18-19320-211122-233124-253526-271728-2933.4品質(zhì)性狀資料、半定量(等級(jí))資料的整理對(duì)於品質(zhì)性狀資料、半定量(等級(jí))資料,可按性狀或等級(jí)進(jìn)行分組,分別統(tǒng)計(jì)各組的次數(shù),然後製成次數(shù)分佈表。下一張

主頁

退出

上一張

3.5常用統(tǒng)計(jì)表與統(tǒng)計(jì)圖3.5.1統(tǒng)計(jì)表(1)統(tǒng)計(jì)表的結(jié)構(gòu)和要求統(tǒng)計(jì)表由標(biāo)題、橫標(biāo)目、縱標(biāo)目、線條、數(shù)字及合計(jì)構(gòu)成,其基本格式如下表:下一張

主頁

退出

上一張

表號(hào)標(biāo)題編制統(tǒng)計(jì)表的總原則:結(jié)構(gòu)簡單,層次分明,內(nèi)容安排合理,重點(diǎn)突出,數(shù)據(jù)準(zhǔn)確,便於理解和比較分析。下一張

主頁

退出

上一張

統(tǒng)計(jì)表編制具體要求如下:

標(biāo)題標(biāo)題要簡明扼要、準(zhǔn)確地說明表的內(nèi)容,有時(shí)須注明時(shí)間、地點(diǎn)。

②標(biāo)目標(biāo)目分橫標(biāo)目和縱標(biāo)目兩項(xiàng)。橫標(biāo)目列在表的左側(cè),用以表示被說明事物的主要標(biāo)誌;縱標(biāo)目列在表的上端,說明橫標(biāo)目各統(tǒng)計(jì)指標(biāo)內(nèi)容,並注明計(jì)算單位,如%、kg、cm等等。

③數(shù)字一律用阿拉伯?dāng)?shù)字,數(shù)字以小數(shù)點(diǎn)對(duì)齊,小數(shù)位數(shù)一致,無數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫“0”。

④線條表的上下兩條邊線略粗,縱、橫標(biāo)目間及合計(jì)用細(xì)線分開,表的左右邊線可省去,表的左上角一般不用斜線。

下一張

主頁

退出

上一張

(2)統(tǒng)計(jì)表的種類

統(tǒng)計(jì)表可根據(jù)縱、橫標(biāo)目是否有分組分為簡單表和複合表兩類。

簡單表由一組橫標(biāo)目和一組縱標(biāo)目組成,縱橫標(biāo)目都未分組。此類表適於簡單資料的統(tǒng)計(jì),如表2-6。下一張

主頁

退出

上一張

②複合表由兩組或兩組以上的橫標(biāo)目與一組縱標(biāo)目結(jié)合而成,或由一組橫標(biāo)目與兩組或兩組以上的縱標(biāo)目結(jié)合而成,或由兩組或兩組以上的橫、縱標(biāo)目結(jié)合而成。此類表適用於複雜資料的統(tǒng)計(jì),如表2-11。下一張

主頁

退出

上一張

表2-11幾種動(dòng)物性食品的營養(yǎng)成分3.5.2統(tǒng)計(jì)圖常用的統(tǒng)計(jì)圖有長條圖

(barchart)、園餅圖(piechart)、線圖(linearchart)、直方圖(histogram)和折線圖(broken-linechart)等。一般情況下,計(jì)量資料採用直方圖和折線圖,計(jì)數(shù)資料、品質(zhì)性狀資料、半定量(等級(jí))資料常用長條圖、線圖或園餅圖。下一張

主頁

退出

上一張

統(tǒng)計(jì)圖繪製的基本要求

1、標(biāo)題簡明扼要,列於圖的下方。

2、縱、橫兩軸應(yīng)有刻度,注明單位。

3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形長寬比例約5:4或6:5。

4、圖中需用不同顏色或線條代表不同處理、樣品等時(shí),應(yīng)有圖例說明。下一張

主頁

退出

上一張

Excel軟體應(yīng)用工具-加載宏-分析資料庫數(shù)據(jù)分析方差分析回歸分析統(tǒng)計(jì)假設(shè)檢驗(yàn)直方圖描述統(tǒng)計(jì)4.1平均數(shù)(mean,average)下一張

主頁

退出

上一張

4統(tǒng)計(jì)資料的特徵數(shù)

平均數(shù)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,反映數(shù)據(jù)資料的相對(duì)集中位置。平均數(shù)主要包括有:

算術(shù)平均數(shù)(arithmeticmean)中位數(shù)(median)眾數(shù)(mode)

幾何平均數(shù)(geometricmean)

調(diào)和平均數(shù)(harmonicmean)

4.1.1算術(shù)平均數(shù)(arithmeticmean)

算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個(gè)數(shù)所得的商,簡稱平均數(shù)或均數(shù),記為。算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而採用直接法或加權(quán)法計(jì)算。

1.直接法

主要用於樣本含量n≤30以下、未經(jīng)分組資料平均數(shù)的計(jì)算。下一張

主頁

退出

上一張

設(shè)某一資料包含n個(gè)觀測值:x1、x2、…、xn,則樣本平均數(shù)可通過下式計(jì)算:(2-1)

其中,Σ為總和符號(hào);表示從第一個(gè)觀測值x1累加到第n個(gè)觀測值xn。當(dāng)在意義上已明確時(shí),可簡寫為Σx,(3-1)式可改寫為:下一張

主頁

退出

上一張

例:對(duì)食品科學(xué)專業(yè)2004級(jí)1班10位同學(xué)的體重進(jìn)行測定,測定結(jié)果分別為50.0、52.0、53.5、56.0、58.5、60.0、48.0、51.0、50.5、49.0(kg),求其平均數(shù)。由於Σx=50.0+52.0+53.5+56.0+58.5+60.0+48.0+51.0+50.5+49.0=528.5,

n=10

下一張

主頁

退出

上一張

那麼

10位同學(xué)的平均體重為52.85kg。

2.加權(quán)法對(duì)於樣本含量n≥30以上且已分組的資料,可以在次數(shù)分佈表的基礎(chǔ)上採用加權(quán)法計(jì)算平均數(shù),計(jì)算公式為:(2-2)下一張

主頁

退出

上一張

式中:—第i組的組中值;

—第i組的次數(shù);

—分組數(shù)第i組的次數(shù)fi是權(quán)衡第i組組中值xi在資料中所占的比重大小,因此將fi

稱為是xi的“權(quán)”,加權(quán)法也由此而得名。【例】100聽罐頭淨(jìng)重(單位:kg)資料整理成次數(shù)分佈表如下,求其加權(quán)數(shù)平均數(shù)。下一張

主頁

退出

上一張

表2-3100聽罐頭淨(jìng)重的次數(shù)分佈下一張

主頁

退出

上一張

組限組中值(x)次數(shù)(f)329.5-331.01332.5-334.03335.5-337.010338.5-340.026341.5-343.031344.5-346.017347.5-349.08350.5-352.02353.5-355.01356.5-358.01

利用加權(quán)法計(jì)算平均數(shù)公式計(jì)算:

100聽罐頭每聽淨(jìng)重的加權(quán)平均數(shù)為342.67g。

注意:計(jì)算若干個(gè)來自同一總體的樣本平均數(shù)的平均數(shù)時(shí),如果樣本含量不等,也應(yīng)採用加權(quán)法計(jì)算。

下一張

主頁

退出

上一張

【例】某牛群有黑白花奶牛1500頭,其平均體重為750kg,而另一牛群有黑白花奶牛1200頭,平均體重為725kg,如果將這兩個(gè)牛群混合在一起,其混合後平均體重為多少?此例兩個(gè)牛群所包含的牛的頭數(shù)不等,要計(jì)算兩個(gè)牛群混合后的平均體重,應(yīng)以兩個(gè)牛群牛的頭數(shù)為權(quán),求兩個(gè)牛群平均體重的加權(quán)平均數(shù),即下一張

主頁

退出

上一張

即兩個(gè)牛群混合後平均體重為738.89kg。3.平均數(shù)的基本性質(zhì)(1)樣本各觀測值與平均數(shù)之差的和為零,即離均差之和等於零?;蚝唽懗上乱粡?/p>

主頁

退出

上一張

(2)樣本各觀測值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。

(xi-)2<(xi-a)2

(常數(shù)a≠)或簡寫為:<

對(duì)於總體而言,通常用μ表示總體平均數(shù),有限總體的平均數(shù)為:下一張

主頁

退出

上一張

(2-3)式中,N表示總體所包含的個(gè)體數(shù)

當(dāng)一個(gè)統(tǒng)計(jì)量的數(shù)學(xué)期望等於所估計(jì)的總體參數(shù)時(shí),則稱此統(tǒng)計(jì)量為該總體參數(shù)的無偏估計(jì)量。統(tǒng)計(jì)學(xué)中常用樣本平均數(shù)()作為總體平均數(shù)(μ)的估計(jì)量,並已證明樣本平均數(shù)是總體平均數(shù)μ的無偏估計(jì)量。下一張

主頁

退出

上一張

4.1.2中位數(shù)(median)

將資料內(nèi)所有觀測值由小到大依次排列,位於中間的那個(gè)觀測值,稱為中位數(shù),記為Md。

當(dāng)觀測值的個(gè)數(shù)是偶數(shù)時(shí),則以中間兩個(gè)觀測值的平均數(shù)作為中位數(shù)。當(dāng)所獲得的數(shù)據(jù)資料呈偏態(tài)分佈時(shí),中位數(shù)的代表性優(yōu)於算術(shù)平均數(shù)。下一張

主頁

退出

上一張

(1)當(dāng)觀測值個(gè)數(shù)n為奇數(shù)時(shí),第(n+1)/2位置的觀測值,即x(n+1)/2為中位數(shù):

Md=

(2)當(dāng)觀測值個(gè)數(shù)為偶數(shù)時(shí),第n/2和第(n/2+1)位置的兩個(gè)觀測值之和的1/2為中位數(shù),即:

下一張

主頁

退出

上一張

(2-4)

【例】對(duì)9個(gè)小麥品種的容重進(jìn)行測定,測定結(jié)果為750、760、767、769、773、775、778、780、800(已排序),求其中位數(shù)。此例n=9,為奇數(shù),則:

Md==773(g)即九個(gè)小麥品種的中位數(shù)為773g。下一張

主頁

退出

上一張

4.1.3幾何平均數(shù)(geometricmean)

n個(gè)觀測值相乘之積開n次方所得的方根,稱為幾何平均數(shù),記為G。它主要應(yīng)用於科學(xué)研究中的動(dòng)態(tài)分析,如微生物的增長率、人口的增長率等等。當(dāng)觀測值呈幾何級(jí)數(shù)變化時(shí),用幾何平均數(shù)比用算術(shù)平均數(shù)更能代表其平均水準(zhǔn)。其計(jì)算公式如下:

下一張

主頁

退出

上一張

(2-6)

為了計(jì)算方便,可將各觀測值取對(duì)數(shù)後相加除以n,得lgG,再求lgG的反對(duì)數(shù),即得G值,即

下一張

主頁

退出

上一張

4.1.4眾數(shù)(mode)

資料中出現(xiàn)次數(shù)最多的那個(gè)觀測值或次數(shù)最多一組的組中值,稱為眾數(shù),記為M0。

下一張

主頁

退出

上一張

4.1.5調(diào)和平均數(shù)(harmonicmean)

,資料中各觀測值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記為H,即(2—8)計(jì)算平均速率4.2變異數(shù)

變異數(shù)的意義

用平均數(shù)作為樣本的代表,其代表性的強(qiáng)弱受樣本資料中各觀測值變異程度的影響。僅用平均數(shù)對(duì)一個(gè)資料的特徵作統(tǒng)計(jì)描述是不全面的,還需引入度量資料中觀測值變異程度大小的統(tǒng)計(jì)量。常用的表示變異程度的統(tǒng)計(jì)量有全距、方差、標(biāo)準(zhǔn)差和變異係數(shù)。下一張

主頁

退出

上一張

4.2.1全距(Range)

全距(極差)是表示資料中各觀測值變異程度大小最簡便的統(tǒng)計(jì)量。

R=Max-MinR值越大,平均數(shù)的代表性越差。但是全距只利用了資料中的最大值和最小值,沒有充分利用全部資料,並不能準(zhǔn)確表達(dá)資料中各觀測值的變異程度,是比較粗略的。當(dāng)資料很多而又要迅速對(duì)資料的變異程度作出判斷時(shí),可以利用全距這個(gè)統(tǒng)計(jì)量。下一張

主頁

退出

上一張

為了準(zhǔn)確地表示樣本內(nèi)各個(gè)觀測值的變異程度,人們首先會(huì)考慮到以平均數(shù)為標(biāo)準(zhǔn),求出各個(gè)觀測值與平均數(shù)的離差,(),稱為離均差。雖然離均差能表示一個(gè)觀測值偏離平均數(shù)的性質(zhì)和程度,但因?yàn)殡x均差有正、有負(fù),離均差之和為零,即=0,因而不能用離均差之和Σ()來表示資料中所有觀測值的總偏離程度。下一張

主頁

退出

上一張

4.2.2方差(Variance)

為了解決離均差有正、有負(fù),離均差之和為零的問題,可先求離均差的絕對(duì)值並將各離均差絕對(duì)值之和除以觀測值個(gè)數(shù)n求得平均絕對(duì)離差,即Σ||/n。雖然平均絕對(duì)離差可以表示資料中各觀測值的變異程度,但由於平均絕對(duì)離差包含絕對(duì)值符號(hào),使用很不方便,在統(tǒng)計(jì)學(xué)中未被採用。

採用將離均差平方的辦法來解決離均差有正、有負(fù),離均差之和為零的問題。先將各個(gè)離均差平方,即()2

,再求離均差平方和,即,簡稱平方和,記為SS;由于離差平方和常隨樣本大小而改變,為了消除樣本大小的影響,用平方和除以樣本大小,即,求出離均差平方和的平均數(shù);下一張

主頁

退出

上一張

為了使所得的統(tǒng)計(jì)量是相應(yīng)總體參數(shù)的無偏估計(jì)量,統(tǒng)計(jì)學(xué)證明,在求離均差平方和的平均數(shù)時(shí),分母不用樣本含量n,而用自由度n-1,所以,我們采用統(tǒng)計(jì)量表示資料的變異程度。統(tǒng)計(jì)量稱為均方(meansquare縮寫為MS),又稱樣本方差,記為S2,即

S2=(2—9)下一張

主頁

退出

上一張

相應(yīng)的總體參數(shù)叫總體方差,記為σ2。對(duì)於有限總體而言,σ2的計(jì)算公式為:(2—10)

統(tǒng)計(jì)學(xué)上把樣本方差S2的平方根叫做樣本標(biāo)準(zhǔn)差,記為S,即:下一張

主頁

退出

上一張

4.2.3標(biāo)準(zhǔn)差(Standdeviation)(2-11)

由於所以(2-11)式可改寫為:下一張

主頁

退出

上一張

相應(yīng)的總體參數(shù)叫總體標(biāo)準(zhǔn)差,記為σ。對(duì)於有限總體而言,σ的計(jì)算公式為:(2-12)在統(tǒng)計(jì)學(xué)中,常用樣本標(biāo)準(zhǔn)差S估計(jì)總體標(biāo)準(zhǔn)差σ。

下一張

主頁

退出

上一張

4.2.4標(biāo)準(zhǔn)差的計(jì)算方法1.直接法

對(duì)於未分組或小樣本資料,可直接利用定義公式來計(jì)算標(biāo)準(zhǔn)差。

【例】10瓶罐頭的淨(jìng)重(g)分別為450,450,500,500,500,550,550,550,600,600,650,計(jì)算標(biāo)準(zhǔn)差。由已知,計(jì)算:Σx=5400,Σx2=2955000,代入公式得:

10瓶罐頭淨(jìng)重的標(biāo)準(zhǔn)差為65.828g。下一張

主頁

退出

上一張

(g)2.加權(quán)法

對(duì)於已製成次數(shù)分佈表的大樣本資料,可利用次數(shù)分佈表,採用加權(quán)法計(jì)算標(biāo)準(zhǔn)差。計(jì)算公式為:下一張

主頁

退出

上一張

式中,fi為各組次數(shù);xi為各組的組中值;Σfi

=n為總次數(shù)。

【例】由次數(shù)分布計(jì)算100聽罐頭淨(jìng)重的標(biāo)準(zhǔn)差。下一張

主頁

退出

上一張

=4.43g3.標(biāo)準(zhǔn)差的特性

(1)標(biāo)準(zhǔn)差的大小,受資料中每個(gè)觀測值的影響,如觀測值間變異大,求得的標(biāo)準(zhǔn)差也大,反之則小。(2)計(jì)算標(biāo)準(zhǔn)差時(shí),在各觀測值加上或減去一個(gè)常數(shù),其數(shù)值不變。(3)每個(gè)觀測值乘以或除以一個(gè)常數(shù)a,則所得的標(biāo)準(zhǔn)差是原來標(biāo)準(zhǔn)差的a倍或1/a倍。下一張

主頁

退出

上一張

(4)在資料服從正態(tài)分佈的條件下,資料中約有68.26%的觀測值在平均數(shù)左右一倍標(biāo)準(zhǔn)差(±S)範(fàn)圍內(nèi);約有95.43%的觀測值在平均數(shù)左右兩倍標(biāo)準(zhǔn)差(±2S)範(fàn)圍內(nèi);約有99.73%的觀測值在平均數(shù)左右三倍標(biāo)準(zhǔn)差(±3S)范圍內(nèi)。也就是說全距近似地等于6倍標(biāo)準(zhǔn)差,可用(全距/6)來粗略估計(jì)標(biāo)準(zhǔn)差。下一張

主頁

退出

上一張

熟記4.2.5變異係數(shù)Coefficientofvariation)

變異係數(shù)是衡量資料中各觀測值變異程度的另一個(gè)統(tǒng)計(jì)量。標(biāo)準(zhǔn)差與平均數(shù)的比值稱為變異係數(shù),記為C·V。變異系數(shù)可以消除單位和(或)平均數(shù)的影響,可以比較不同樣本資料的相對(duì)變異程度。下一張

主頁

退出

上一張

變異係數(shù)的計(jì)算公式為:下一張

主頁

退出

上一張

性狀x/μmS/μmCV/%果皮厚49.64.99.9角質(zhì)層厚6.20.812.9(2—13)表2-8贊皇大棗果皮厚、角質(zhì)層厚測量結(jié)果角質(zhì)層相對(duì)變異程度大指

標(biāo)平均值標(biāo)準(zhǔn)差變幅變異係數(shù)%物理性狀水分

%13.000.6711.75-14.505.18容重

g/L766.025.0694-8433百粒重

g34.485.9714.59-44.8617.30百粒體積ml28.064.8711.0-35.817.34籽粒密度

g/ml1.230.031.14-1.332.81營養(yǎng)品質(zhì)澱粉

%69.551.3563.82-72.061.95粗蛋白

%10.970.928.63-13.888.39粗脂肪

%4.511.162.89-9.6925.63灰分

%1.460.111.20-1.787.38粗纖維

%2.190.291.58-2.8513.31

注意:變異係數(shù)的大小,同時(shí)受平均數(shù)和標(biāo)準(zhǔn)差兩個(gè)統(tǒng)計(jì)量的影響,因而在利用變異係數(shù)表示資料的變異程度時(shí),最好將平均數(shù)和標(biāo)準(zhǔn)差也列出。下一張

主頁

退出

上一張

1事件與概率1.1事件1.1.1必然現(xiàn)象與隨機(jī)現(xiàn)象

在自然界與生產(chǎn)實(shí)踐和科學(xué)試驗(yàn)中,人們會(huì)觀察到各種各樣的現(xiàn)象,把它們歸納起來,大體上分為兩大類:下一張

主頁

退出

上一張

必然現(xiàn)象:可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重複進(jìn)行試驗(yàn),其結(jié)果總是確定的,必然發(fā)生的(或必然不發(fā)生)。這類現(xiàn)象稱為必然現(xiàn)象(inevitablephenomena)或確定性現(xiàn)象(definitephenomena)。隨機(jī)現(xiàn)象:另一類是事前不可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重複進(jìn)行試驗(yàn),其結(jié)果未必相同。這類在個(gè)別試驗(yàn)中其結(jié)果呈現(xiàn)偶然性、不確定性現(xiàn)象,稱為隨機(jī)現(xiàn)象(randomphenomena)或不確定性現(xiàn)象(indefinitephenomena)。下一張

主頁

退出

上一張

隨機(jī)現(xiàn)象或不確定性現(xiàn)象,有如下特點(diǎn):在一定的條件實(shí)現(xiàn)時(shí),有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對(duì)一次或少數(shù)幾次觀察或試驗(yàn)而言,其結(jié)果呈現(xiàn)偶然性、不確定性;但在相同條件下進(jìn)行大量重複試驗(yàn)時(shí),其試驗(yàn)結(jié)果卻呈現(xiàn)出某種固有的、特定的規(guī)律性——頻率的穩(wěn)定性,通常稱之為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。下一張

主頁

退出

上一張

1.1.2隨機(jī)試驗(yàn)與隨機(jī)事件1隨機(jī)試驗(yàn)通常我們把根據(jù)某一研究目的,在一定條件下對(duì)自然現(xiàn)象所進(jìn)行的觀察或試驗(yàn)統(tǒng)稱為試驗(yàn)(trial)。當(dāng)一個(gè)試驗(yàn)如果滿足下述三個(gè)特性,則稱其為一個(gè)隨機(jī)試驗(yàn)(randomtrial),簡稱試驗(yàn)。下一張

主頁

退出

上一張

(1)試驗(yàn)可以在相同條件下多次重複進(jìn)行;(2)每次試驗(yàn)的可能結(jié)果不止一個(gè),並且事先知道會(huì)有哪些可能的結(jié)果;(3)每次試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果中的一個(gè),但在一次試驗(yàn)之前卻不能肯定這次試驗(yàn)會(huì)出現(xiàn)哪一個(gè)結(jié)果。下一張

主頁

退出

上一張

2隨機(jī)事件

隨機(jī)試驗(yàn)的每一種可能結(jié)果,在一定條件下可能發(fā)生,也可能不發(fā)生,稱為隨機(jī)事件(randomevent),簡稱事件(event),通常用A、B、C等來表示。(1)基本事件

我們把不能再分的事件稱為基本事件(elementaryevent),也稱為樣本點(diǎn)(samplepoint)。下一張

主頁

退出

上一張

例如,從編號(hào)為1、2、3、…、10的十個(gè)籃球中隨機(jī)抽取1個(gè)籃球,有10種不同的可能結(jié)果:“取得一個(gè)編號(hào)是1”、“取得一個(gè)編號(hào)是2”、…、“取得一個(gè)編號(hào)是10”,這10個(gè)事件都是不可能再分的事件,它們都是基本事件。由若干個(gè)基本事件組合而成的事件稱為複合事件(compoundevent)。如“取得一個(gè)編號(hào)是2的倍數(shù)”是一個(gè)複合事件,它由“取得一個(gè)編號(hào)是2”、“是4”、“是6、“是8”、“是10”5個(gè)基本事件組合而成。下一張

主頁

退出

上一張

(2)必然事件

把在一定條件下必然會(huì)發(fā)生的事件稱為必然事件(certainevent),用Ω表示。例如,一個(gè)大氣壓下,水加熱到100C,水會(huì)沸騰;種瓜得瓜、種豆得豆下一張

主頁

退出

上一張

(3)不可能事件

在一定條件下不可能發(fā)生的事件稱為不可能事件(impossibleevent),用ф表示。例如,在滿足一定孵化條件下,從石頭孵化出小雞,就是一個(gè)不可能事件。

必然事件與不可能事件實(shí)際上是確定性現(xiàn)象,它們不是隨機(jī)事件,但是為了方便起見,我們把它們看作為兩個(gè)特殊的隨機(jī)事件。1.2概率1.2.1概率統(tǒng)計(jì)定義研究隨機(jī)試驗(yàn),僅知道可能發(fā)生哪些隨機(jī)事件是不夠的,還需瞭解各種隨機(jī)事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計(jì)規(guī)律性,從而指導(dǎo)實(shí)踐。這就要求有一個(gè)能夠刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo),這個(gè)指標(biāo)應(yīng)該是事件本身所固有的,且不隨人的主觀意志而改變,人們稱之為概率(probability)。事件A的概率記為P(A)。下一張

主頁

退出

上一張

概率:刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo)

概率統(tǒng)計(jì)定義:

在相同條件下進(jìn)行n次重複試驗(yàn),如果隨機(jī)事件A發(fā)生的次數(shù)為m,那麼m/n稱為隨機(jī)事件A的頻率(frequency);當(dāng)試驗(yàn)重復(fù)數(shù)n逐漸增大時(shí),隨機(jī)事件A的頻率越來越穩(wěn)定地接近某一數(shù)值p,那么就把p稱為隨機(jī)事件A的概率。下一張

主頁

退出

上一張

如此定義的概率稱為統(tǒng)計(jì)概率(statisticsprobability),或者稱後驗(yàn)概率(posteriorprobability)。

表3-1拋擲一枚硬幣發(fā)生正面朝上的試驗(yàn)記錄下一張

主頁

退出

上一張

例如為了確定拋擲一枚硬幣出現(xiàn)正面朝上這個(gè)事件的概率,歷史上有人作過成千上萬次拋擲硬幣的試驗(yàn)。在表3—1中列出了他們的試驗(yàn)記錄。

從表3-1可看出,隨著實(shí)驗(yàn)次數(shù)的增多,正面朝上這個(gè)事件發(fā)生的頻率越來越穩(wěn)定地接近0.5,我們就把0.5作為這個(gè)事件的概率。在一般情況下,隨機(jī)事件的概率p是不可能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)n充分大時(shí)隨機(jī)事件A的頻率作為該隨機(jī)事件概率的近似值。即P(A)=p≈m/n

(n充分大)(3-1)下一張

主頁

退出

上一張

1.2.2概率的性質(zhì)

(1)對(duì)於任何事件A,有0≤P(A)≤1;(2)必然事件的概率為1,即P(Ω)=1;(3)不可能事件的概率為0,即P(ф)=0。2概率分佈

事件的概率表示了一次試驗(yàn)?zāi)骋粋€(gè)結(jié)果發(fā)生的可能性大小。若要全面瞭解試驗(yàn),則必須知道試驗(yàn)的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率,即必須知道隨機(jī)試驗(yàn)的概率分佈(probabilitydistribution)。為了深入研究隨機(jī)試驗(yàn),我們先引入隨機(jī)變數(shù)(randomvariable)的概念。下一張

主頁

退出

上一張

2.1隨機(jī)變數(shù)

下一張

主頁

退出

上一張

2004年奶粉事件“大頭娃”

描述隨機(jī)事件的變數(shù)稱為隨機(jī)變數(shù)。隨機(jī)變數(shù)的取值在一次試驗(yàn)前不能確定,具有隨機(jī)性。作一次試驗(yàn),其結(jié)果有多種可能。每一種可能結(jié)果都可用一個(gè)數(shù)來表示,把這些數(shù)作為變數(shù)x的取值,則試驗(yàn)結(jié)果可用變數(shù)x來表示。【例】對(duì)10種品牌袋裝奶粉進(jìn)行品質(zhì)檢測,其可能結(jié)果是“0種合格”、“1種合格”、“2種合格”、“…”、“10種袋裝奶粉都合格”。若用x表示袋裝奶粉合格品牌數(shù),則x的取值為0、1、2、…、10。【例】食品加工中高溫殺菌可能結(jié)果只有兩種,即“全部殺死細(xì)菌”與“未能全部殺死細(xì)菌”。若用變量x表示試驗(yàn)的兩種結(jié)果,則可令x=0表示“未能全部殺死細(xì)菌”,x=1表示“全部殺死細(xì)菌”?!纠繙y定關(guān)中地區(qū)不同小麥品種的蛋白質(zhì)含量,其蛋白質(zhì)含量在9.3-13.5%之間,如用x表示測定結(jié)果,那麼x值可以是這個(gè)範(fàn)圍內(nèi)的任何實(shí)數(shù)。下一張

主頁

退出

上一張

離散型隨機(jī)變量:如果表示試驗(yàn)結(jié)果的變數(shù)x,其可能取值為可列個(gè),且以各種確定的概率取這些不同的值,則稱x為離散型隨機(jī)變量

(discreterandomvariable);連續(xù)型隨機(jī)變量:如果表示試驗(yàn)結(jié)果的變數(shù)x,其可能取值為某範(fàn)圍內(nèi)的任何數(shù)值,且x在其取值範(fàn)圍內(nèi)的任一區(qū)間中取值時(shí),其概率是確定的,則稱x為連續(xù)型隨機(jī)變量

(continuousrandomvariable)。

下一張

主頁

退出

上一張

試驗(yàn)結(jié)果和取此結(jié)果的概率可以一一列出。不能列出試驗(yàn)結(jié)果和取此結(jié)果的概率,只能給出一定範(fàn)圍和在此範(fàn)圍內(nèi)取值的概率。2.2離散型隨機(jī)變數(shù)的概率分佈要瞭解離散型隨機(jī)變數(shù)x的統(tǒng)計(jì)規(guī)律,就必須知道它的一切可能值xi及取每種可能值的概率pi。如果我們將離散型隨機(jī)變量x的一切可能取值xi

(i=1,2,…),及其對(duì)應(yīng)的概率pi,記作

P(x=xi)=pi

i=1,2,…

(3—3)

則稱(3—3)式為離散型隨機(jī)變數(shù)x的概率分佈或分佈。常用分布列(distributionseries)來表示:下一張

主頁

退出

上一張

x1x2

…xn

….p1p2

…pn

從分佈列可以一目了然看出隨機(jī)變數(shù)X的可能取值及取這些值的概率。離散型隨機(jī)變數(shù)的概率分佈具有pi≥0和Σpi=1這兩個(gè)基本性質(zhì)。2.3連續(xù)型隨機(jī)變數(shù)的概率分佈

連續(xù)型隨機(jī)變數(shù)(如身高、體重等)的概率分佈不能用分佈列來表示,因?yàn)槠淇赡苋≈凳遣豢蓴?shù)的,不能一一列出。改用隨機(jī)變數(shù)x在某個(gè)區(qū)間內(nèi)取值的概率P(a≤x<b)來表示。下麵通過頻率分佈密度曲線予以說明。下一張

主頁

退出

上一張

圖4—1為數(shù)據(jù)資料的頻率分佈直方圖,圖中縱座標(biāo)取頻率與組距的比值??梢栽O(shè)想,如果樣本取得越來越大(n→+∞),組分得越來越細(xì)(i→0),某一範(fàn)圍內(nèi)的頻率將趨近於一個(gè)穩(wěn)定值-概率。這時(shí),頻率分佈直方圖各個(gè)直方上端中點(diǎn)的連線-頻率分佈折線將逐漸趨向於一條曲線。下一張

主頁

退出

上一張

當(dāng)n→+∞、i→0時(shí),頻率分佈折線的極限是一條穩(wěn)定的函數(shù)曲線。對(duì)於樣本是取自連續(xù)型隨機(jī)變數(shù)的情況,這條函數(shù)曲線將是光滑的。這條曲線排除了抽樣和測量的誤差,完全反映了數(shù)據(jù)資料的變動(dòng)規(guī)律。這條曲線叫概率分佈密度曲線,相應(yīng)的函數(shù)叫概率分佈密度函數(shù),簡稱分佈密度。下一張

主頁

退出

上一張

(3—4)式為連續(xù)型隨機(jī)變數(shù)x在區(qū)間[a,b)上取值概率的運(yùn)算式??梢姡B續(xù)型隨機(jī)變數(shù)的概率由概率分布密度函數(shù)確定。

若變數(shù)X概率分佈密度函數(shù)記為f(x),則x取值於區(qū)間[a,b)的概率為圖中陰影部分的面積,即

P(a≤x<b)=(3-4)

連續(xù)型隨機(jī)變數(shù)概率分佈的性質(zhì):

1、分佈密度函數(shù)總是大於或等於0,即f(x)≥0;

2、當(dāng)隨機(jī)變數(shù)x取某一特定值時(shí),其概率等於0;即

(c為任意實(shí)數(shù))

所以,對(duì)於連續(xù)型隨機(jī)變數(shù),僅研究其在某一個(gè)區(qū)間內(nèi)取值的概率,而不去討論取某一個(gè)值(點(diǎn))的概率。下一張

主頁

退出

上一張

連續(xù)型隨機(jī)變數(shù)某一點(diǎn)的概率為0。3、隨機(jī)變數(shù)x取值在-∞<x<+∞範(fàn)圍內(nèi),所以下一張

主頁

退出

上一張

(3-5)(3—5)式表示分佈密度曲線與橫軸所圍成的區(qū)間全部面積為1。P(a≤x<b)=4、隨機(jī)變數(shù)X取〔a,b)區(qū)間值的概率為:3理論分佈

3.1二項(xiàng)分佈

3.1.1貝努利試驗(yàn)及其概率公式貝努利試驗(yàn):對(duì)於n次獨(dú)立的試驗(yàn),如果每次試驗(yàn)結(jié)果出現(xiàn)且只出現(xiàn)對(duì)立事件A與之一,在每次試驗(yàn)中出現(xiàn)A的概率是常數(shù)p(0<p<1),因而出現(xiàn)對(duì)立事件的概率是1-p=q,則稱這一串重複的獨(dú)立試驗(yàn)為n重貝努利試驗(yàn),簡稱貝努利試驗(yàn)(Bernoullitrials)。

下一張

主頁

退出

上一張

重要的離散型分佈只有兩種可能結(jié)果的隨機(jī)試驗(yàn)稱為貝努利試驗(yàn)食品抽樣中,產(chǎn)品合格或不合格,種子發(fā)芽或不發(fā)芽,施藥後害蟲死或活等等。貝努利試驗(yàn)的概率公式

在貝努利試驗(yàn)中,事件A可能發(fā)生,也可能不發(fā)生,用隨機(jī)變數(shù)x表示貝努利試驗(yàn)的兩種結(jié)果,記A發(fā)生時(shí)取1,A不發(fā)生時(shí)取0。那麼,貝努利試驗(yàn)的概率公式可以表示為:P(x=1)=pP(x=0)=q其中x=1,A事件發(fā)生,成功0,A事件未發(fā)生,失敗也稱為兩點(diǎn)分佈(3-6)在n重貝努利試驗(yàn)中,事件A可能發(fā)生0,1,2,…,n次,現(xiàn)在我們來求事件A

恰好發(fā)生k(0≤k≤n)次的概率Pn(k)。事件A在n次試驗(yàn)中正好發(fā)生k次共有種情況。由貝努利試驗(yàn)的獨(dú)立性可知,A在k次實(shí)驗(yàn)中發(fā)生,而在其餘n-k次試驗(yàn)中不發(fā)生的概率為下一張

主頁

退出

上一張

3.1.2二項(xiàng)分佈的定義及其特點(diǎn)

一般,在n重貝努利試驗(yàn)中,事件A恰好發(fā)生k(0≤k≤n)次的概率為下一張

主頁

退出

上一張

k=0,1,2…,n(3-7)若把(3-7)式與二項(xiàng)展開式相比較就可以發(fā)現(xiàn),在n重貝努利試驗(yàn)中,事件A發(fā)生k次的概率恰好等於展開式中的第k+1項(xiàng),所以也把(3-7)式稱作二項(xiàng)概率公式。1.二項(xiàng)分佈定義

設(shè)隨機(jī)變數(shù)x所有可能取的值為零和正整數(shù):0,1,2,…,n,且有

=k=0,1,2…,n

其中p>0,q>0,p+q=1,則稱隨機(jī)變數(shù)x服從參數(shù)為n和p的二項(xiàng)分佈

(binomialdistribution),記為

x~B(n,p)。下一張

主頁

退出

上一張

二項(xiàng)分佈是一種離散型隨機(jī)變數(shù)的概率分佈。參數(shù)n稱為離散參數(shù),只能取正整數(shù);p是連續(xù)參數(shù),它能取0與1之間的任何數(shù)值(q由p確定,故不是另一個(gè)獨(dú)立參數(shù))。下一張

主頁

退出

上一張

(3-10)(5)(3)(4)(3-8)(3-9)(m1<m2)2.二項(xiàng)分佈的特點(diǎn)具有概率分佈的一切性質(zhì),即:(1)P(x=k)=Pn(k)≥0(k=0,1,…,n)

(2)二項(xiàng)分佈的概率之和等於1,即圖3-1n值不同的二項(xiàng)分佈比較

(2)當(dāng)p值趨於0.5時(shí),分布趨於對(duì)稱,如圖所示;(3)對(duì)於固定的n及p,當(dāng)k增加時(shí),Pn(k)先隨之增加並達(dá)到其極大值,以後又下降。(4)在n較大,np、nq較接近時(shí),二項(xiàng)分佈接近於正態(tài)分佈;當(dāng)n→∞時(shí),二項(xiàng)分佈的極限分佈是正態(tài)分佈。下一張

主頁

退出

上一張

二項(xiàng)分佈由n和p兩個(gè)參數(shù)決定,其特點(diǎn)是:(1)當(dāng)p值較小且n不大時(shí),分布是偏倚的。但隨著n的增大,分佈逐漸趨於對(duì)稱,如圖所示;圖3-2p值不同的二項(xiàng)分佈比較3.1.3二項(xiàng)分佈的概率計(jì)算及應(yīng)用條件(1)已知隨機(jī)變數(shù)x~

B(n,p),求x正好有k次發(fā)生的概率?!纠齪43】有一批食品,其合格率為0.85,今在該批食品中隨機(jī)抽取6份該食品,求正好有5份食品合格的概率?由題意可知,食品抽檢結(jié)果有兩種可能,合格與不合格,合格率為0.85,即P(A)=0.85,相應(yīng)不合格率為P()=1-0.85=0.15,由概率公式得,正好有5個(gè)合格產(chǎn)品的概率為:下一張

主頁

退出

上一張

(2)已知隨機(jī)變數(shù)x~

B(n,p),求x最多發(fā)生k次的概率。例:同上例,問最多有4個(gè)合格的概率是多少?當(dāng)產(chǎn)品最多有k個(gè)合格時(shí),即可能的合格數(shù)為0,1,2,…,k,那麼為最多有k個(gè)合格產(chǎn)品的概率。在本例中,下一張

主頁

退出

上一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論