![格式參考應用統(tǒng)計方法解決典型數(shù)學模型_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/cfee499a-894f-45fa-a628-a075f2774e65/cfee499a-894f-45fa-a628-a075f2774e651.gif)
![格式參考應用統(tǒng)計方法解決典型數(shù)學模型_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/cfee499a-894f-45fa-a628-a075f2774e65/cfee499a-894f-45fa-a628-a075f2774e652.gif)
![格式參考應用統(tǒng)計方法解決典型數(shù)學模型_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/cfee499a-894f-45fa-a628-a075f2774e65/cfee499a-894f-45fa-a628-a075f2774e653.gif)
![格式參考應用統(tǒng)計方法解決典型數(shù)學模型_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/cfee499a-894f-45fa-a628-a075f2774e65/cfee499a-894f-45fa-a628-a075f2774e654.gif)
![格式參考應用統(tǒng)計方法解決典型數(shù)學模型_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/10/cfee499a-894f-45fa-a628-a075f2774e65/cfee499a-894f-45fa-a628-a075f2774e655.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、東北石油大學畢業(yè)設(shè)計(論文)任務(wù)書題目 應用統(tǒng)計方法求解典型數(shù)學模型主要內(nèi)容、基本要求、主要參考資料等:主要內(nèi)容:本文擬首先簡單介紹應用統(tǒng)計方法基本理論,再通過實例來掌握如何應用統(tǒng)計方法求解典型數(shù)學模型?;疽螅?、查閱不少于10篇參考文獻,其中至少2篇外文文獻;2、完成不少于1萬5千字的論文,其中中文摘要300字左右,并寫出相應的英文摘要;3、完成與課題相關(guān)的外文資料翻譯,字數(shù)不少于5000字。主要參考資料: 1、張志涌 楊祖櫻等編著.MATLAB教程M.北京:北京航空航天大學出版社.2006年8月 2、謝中華 編著.MATLAB統(tǒng)計分析與應用:40個案例分析M.北京:北京航空航天大學出版
2、社.2010年6月 3、韓中庚 著.數(shù)學建模方法及應用M.北京:高等教育出版社.2000年完成期限: 指導教師簽名: 專業(yè)負責人簽名: 年 月 日摘 要 現(xiàn)實生活中, 由于客觀事物內(nèi)部規(guī)律的復雜性及人們認識程度的限制, 人們常搜集大量的數(shù)據(jù), 基于數(shù)據(jù)的統(tǒng)計分析建立合乎機理規(guī)律的數(shù)學模型, 然后通過計算得到的模型結(jié)果來解釋實際問題。而隨著社會的不斷發(fā)展,統(tǒng)計的知識越來越重要,運用抽樣數(shù)據(jù)進行推斷已經(jīng)成為現(xiàn)代社會一種普遍適用并且強有力的思考方式。 本文在論述統(tǒng)計思想的廣泛應用和簡介MATLAB工具箱的基礎(chǔ)上,通過介紹方差分析、判別分析、主成分分析三種常見統(tǒng)計分析方法的基礎(chǔ)原理及其應用性實例,結(jié)合
3、MATLAB編程,歸納總結(jié)了較為簡便的計算機求解方法,并給出了具體答案。 最后,本文著重的探討了典型數(shù)學模型應用統(tǒng)計方法的MATLAB求解,無論是DNA序列分類模型中運用的主成分分析法、FISHER判別分析法,還是在解決葡萄酒評價問題中所用的單因素方差分析思想,都很好的體現(xiàn)了統(tǒng)計思想方法在解決典型數(shù)學模型問題時應用的廣泛性和有效性。關(guān)鍵詞:數(shù)學模型;方差分析;判別分析;主成分分析;MatlabAbstractIn real life, because of the complexity of the internal law of objective things and people kno
4、w the degree of restriction, it is often to collect a large amount of data, based on statistical analysis of data create the mechanism mathematical model of the law, and then through the calculated model results to explain the practical problems.And with the continuous development of society, the kn
5、owledge of statistics is more and more important, using the sampling data to infer that has become a modern society widely used and powerful ways of thinking.This paper discusses the widely used of statistical thinking and on the basis of introduction to MATLAB toolbox , by introducing the variance
6、analysis, discriminant analysis, principal component analysis based on analysis of three common statistical principle and its application examples, combining with the MATLAB programming, summarized the simple computer solving method, and presents a concrete answers.Finally, this paper discusses the
7、typical statistical method of MATLAB to solve the mathematical model of the application, whether in the DNA sequence classification model using principal component analysis , Fisher discriminant analysis method, is used in solving for the evaluation of wine, the single factor analysis of variance of
8、 thoughts, all good embodies the statistical thinking method in solving mathematical model for a typical application of universality and effectiveness.Key words:Mathematical model; Analysis of variance; Discriminant analysis; Principal component analysis; MATLAB目 錄第1章 緒 論11.1 統(tǒng)計分析相關(guān)介紹11.2 MATLAB相關(guān)介紹
9、11.3 本章小結(jié)3第2 章 三類常見統(tǒng)計方法及其解決典型數(shù)學模型實例42.1 方差分析42.2 判別分析122.3 主成分分析162.4 本章小結(jié)21第3章 典型數(shù)學模型應用統(tǒng)計方法求解223.1 葡萄酒的評價223.2 DNA序列分類313.3 本章小結(jié)38結(jié) 論39參考文獻40致 謝42附 錄43第1章 緒 論1.1 統(tǒng)計分析相關(guān)介紹統(tǒng)計是隨著概率論的發(fā)展而發(fā)展起來的。只有當人們認識到必須把數(shù)據(jù)視為來自具有一定概率分布的總體,所研究的對象是這個總體而不能局限于數(shù)據(jù)本身的時候,統(tǒng)計誕生了。統(tǒng)計分析作為一項長期的社會實踐活動,在歷史的發(fā)展中已有幾千年?!敖y(tǒng)而計之”就是人們對數(shù)據(jù)統(tǒng)計分析的最樸
10、素的認識。隨著社會生產(chǎn)力的不斷進步,社會經(jīng)濟的不斷發(fā)展,當代的數(shù)據(jù)統(tǒng)計分析已不圄于“統(tǒng)而計之”的范疇。從高斯(Gauss)與勒讓德(Legendre)關(guān)于觀測數(shù)據(jù)的誤差分析和最小二乘估計方法的研究成果,到克拉默的統(tǒng)計學的數(shù)學方法,統(tǒng)計才真正的發(fā)展為一門成熟的科學。回顧概率統(tǒng)計的發(fā)展歷史,大致可分為如下三個階段:古典時期(10世紀末以前):主要是描述性的統(tǒng)計學的形成和發(fā)展,也可以說是數(shù)理統(tǒng)計的萌芽時期。近代時期(19世紀末至1945年):小樣本理論形成,數(shù)理統(tǒng)計的主要分支廷立,可以說是數(shù)理統(tǒng)計的形成時期。現(xiàn)代時期(1945年以后):這個時期,由于計算機的發(fā)明和使用,推動著數(shù)理統(tǒng)計在理論研究和應用
11、方面都不斷地向縱深發(fā)展,并產(chǎn)生一些新的分支和邊緣性的新學科,如最優(yōu)設(shè)計和非參數(shù)統(tǒng)計推斷等。隨著社會的不斷發(fā)展,統(tǒng)計的知識越來越重要,運用抽樣數(shù)據(jù)進行推斷已經(jīng)成為現(xiàn)代社會一種普遍適用并且強有力的思考方式。目前,統(tǒng)計的很多原理方法已被越來越多地應用到交通、經(jīng)濟、醫(yī)學、氣象等各種與人們生活息息相關(guān)的領(lǐng)域。本文將就統(tǒng)計的常用方法與思想,在經(jīng)典數(shù)學模型的應用中展開一些討論,推導出某些表面上并非直觀的結(jié)論,從中可以看出統(tǒng)計思想方法在解決問題中的實用性、簡捷性和高效性。1.2 MATLAB相關(guān)介紹MATLAB (Matrix & Laboratory)是美國MathWorks公司自20世紀80年代中期推出的
12、數(shù)學軟件,優(yōu)秀的數(shù)值計算能力和卓越的數(shù)據(jù)可視化能力使其很快在數(shù)學軟件中脫穎而出.目前,MATLAB已經(jīng)發(fā)展成為多學科、多種工作平臺的功能強大的大型軟件,是涵括線性代數(shù)、自動控制理論、概率論及數(shù)理統(tǒng)計、數(shù)字信號處理、時間序列分析、動態(tài)系統(tǒng)仿真等高級課程的基本教學工具。MATLAB用法簡易、靈活、程式結(jié)構(gòu)強又兼具延展性.以下為其幾個特色: 數(shù)值計算和符號計算功能(1)數(shù)值計算功能包括:矩陣運算、多項式和有理分式運算、數(shù)據(jù)統(tǒng)計分析、數(shù)值積分、優(yōu)化處理等。(2)符號計算將得到問題的解析解。 MATLAB語言除了命令行的交互式操作以外,還可以程序方式工作。使用MATLAB很容易地實現(xiàn)C或FORTRAN語
13、言的幾乎全部功能。圖形功能 兩個層次的圖形命令:一種是對圖形句柄進行的低級圖形命令,另一種是建立在低級圖形命令之上的高級圖形命令。利用MATLAB的高級圖形命令可以輕而易舉地繪制二維、三維乃至四維圖形,并可進行圖形和坐標的標識、視角和光照設(shè)計、色彩精細控制等等。如今,MATLAB廣泛應用于:數(shù)值計算、圖形處理、符號運算、數(shù)學建模、系統(tǒng)辨識、小波分析、實時控制、動態(tài)仿真等領(lǐng)域.MATLAB包括擁有數(shù)百個內(nèi)部函數(shù)的主包和三十幾種工具包.工具包又可以分為功能性工具包和學科工具包.功能型工具箱主要用來擴充MATLAB的符號計算功能、圖形建模仿真功能、文字處理功能以及與硬件實時交互功能,能用于多種學科.
14、而領(lǐng)域型工具箱是專業(yè)性很強的,如控制系統(tǒng)工具箱(Control System Toolbox)、財政金融工具箱(Financial Toolbox)等.在統(tǒng)計問題上,我們能用到的最基礎(chǔ)的工具箱就是統(tǒng)計工具箱.它包括下面幾個方面的內(nèi)容:概率分布.給出了常見的20 種概率分布類型的概率密度函數(shù)、累加分布函數(shù)、逆累加分布函數(shù)、參數(shù)估計函數(shù)、隨機數(shù)生成函數(shù)和統(tǒng)計量計算函數(shù).參數(shù)估計.提供了多種分布類型分布參數(shù)及其置信區(qū)間的估計方法. 樣本描述.中心趨勢和離中趨勢的統(tǒng)計量函數(shù),及統(tǒng)計量計算函數(shù). 方差分析.包括單因子方差分析、雙因子方差分析和多因子方差分析. 回歸分析.包括線性回歸、多項式擬合、非線性回
15、歸等.假設(shè)檢驗、分布的檢驗、非參數(shù)檢驗.判別分析、聚類分析、因子分析.統(tǒng)計過程控制.提供了常用的過程管理圖和過程性能圖.統(tǒng)計圖.箱形圖、誤差條圖、q-q 圖、交互插值等值線圖和威布爾圖等.試驗設(shè)計.包括完全析因設(shè)計、不完全析因設(shè)計和D-優(yōu)化設(shè)計.1.3 本章小結(jié)本章主要探討了統(tǒng)計問題的背景及應用,并概述了統(tǒng)計思想在各個領(lǐng)域的廣泛應用。此外,本章還簡單介紹了MATLAB軟件的特色和本文重點應用的MATLAB統(tǒng)計工具箱。第2 章 三類常見統(tǒng)計方法及其解決典型數(shù)學模型實例2.1 方差分析2.1.1 單因素一元方差分析.1 Anova1函數(shù) MATLAB統(tǒng)計工具箱中提供了anova1函數(shù),用來作單因素
16、一元方差分析,其調(diào)用格式為:(1) p = anova1(X)根據(jù)樣本觀測值矩陣X進行均衡試驗的單因素一元方差分析,檢驗矩陣X的各列所對應的總體是否具有相同的均值,原假設(shè)是X的各列所對應的總體具有相同的均值。矩陣X的列數(shù)表示因素的水平數(shù),X的每一列對應因素的一個水平,矩陣X的行數(shù)表示因素的每個水平下重復試驗的次數(shù)(即樣本容量),所謂均衡試驗是指因素的每個水平下重復試驗次數(shù)相同的試驗。anova1函數(shù)的輸出參數(shù)p是檢驗的p值,對于給定的顯著性水平,若p,則拒絕原假設(shè),認為X的各列所對應的總體具有不完全相同的均值,否則接受原假設(shè),認為X的各列所對應的總體具有相同的均值。anova1函數(shù)還生成兩個圖
17、形。第1個圖為方差分析表,它將X中數(shù)據(jù)的誤差分成兩部分:由于列值的差異導致的誤差(組間差);由于每一列數(shù)據(jù)與該列均值的差異導致的誤差(組內(nèi)差)。方差分析表中有6列:第1列顯示誤差的來源;第2列顯示每一個誤差來源的平方和(SS);第3列顯示與每一個誤差來源相關(guān)的自由度(df);第4列顯示均值平方和(MS),它是誤差來源平方和與自由度的比值,即SS/df;第5列顯示F統(tǒng)計量,它是均值平方和的比值;第6列顯示p值,p值是F函數(shù)(fcdf);當F增加時p值減小。第2個圖顯示X的每一列的箱形圖。箱形圖中心線上較大的差異對應于較大的F值和較小的p值。(2) p = anova1(X,group) 當X是一
18、個矩陣時,這種調(diào)用只適合于均衡試驗,anova1函數(shù)把X的每一列作為一個獨立的組,檢驗各組多對應總體是否具有相同的均值。輸入?yún)?shù)group可以是字符數(shù)組或者字符串元胞數(shù)組,用來指定每組的組名,X的每一列對應一個組名字符串,在箱線圖中,組名字符串被作為箱線圖的標簽。如果不需要指定組名,可以輸入空數(shù)組()或者忽略group這個輸入。當X是一個向量,這種調(diào)用不僅適用于均衡試驗,還適用于非均衡試驗。anova1函數(shù)對X中的樣本進行單因素方差分析,通過輸入變量group來標識X中的每個元素的水平,所以,group與X的長度必須相等。group中包含的標簽同樣用于箱形圖的標注。anova1函數(shù)的矢量輸入形
19、式不需要每個樣本中的觀測值個數(shù)相同,所以它適用于不平衡數(shù)據(jù)。(3) p = anova1(X,group,displayopt)當displayopt參數(shù)設(shè)置為on(默認設(shè)置)時,激活ANOVA表和箱形圖的顯示;displayopt參數(shù)設(shè)置為off時,不予顯示。(4) p,table = anova1(.)返回單元數(shù)組表中的ANOVA表(包含列標簽和行標簽)。(使用“Edit”菜單中的“Copy Text”選項可以將ANOVA表以文本形式復制到記事本中。)(5) p,table,table = anova1(.)返回stats結(jié)構(gòu),用于進行多重比較檢驗。anova1檢驗評價所有樣本均值相等的零
20、假設(shè)和均值不等的備擇假設(shè)。有時進行檢驗,決定哪對均值差異顯著,哪對均值差異不顯著是很有效的。提供stats結(jié)構(gòu)作為輸入,使用multcompare函數(shù)可以進行此項檢驗。注意:方差分析要求樣本數(shù)據(jù)滿足下面的假設(shè)條件:所有樣本數(shù)據(jù)滿足正態(tài)分布條件;所有樣本數(shù)據(jù)具有相等的方差;所有觀測值相互獨立。在基本滿足前二個假設(shè)條件的情況下,一般認為ANOVA檢驗是穩(wěn)健的。.2 Multcompare函數(shù) MTALAB統(tǒng)計工具箱中提供了Multcompare函數(shù),用來作多重比較,其調(diào)用格式如下:(1) c = multcompare(stats) 根據(jù)結(jié)構(gòu)體變量stats中的信息進行多重比較,返回兩兩比較的結(jié)果
21、矩陣c。c是一個5列的矩陣,它的每一行對應一次兩兩比較的檢驗,每一行上的元素包括作比較的兩個組的組標號、兩個組的均值差、均值差的置信區(qū)間。例如c的某行元素為:2.0000 5.0000 1.9442 8.2206 14.4971表示對第二組和第五組進行兩兩比較的檢驗,兩組的均值(即第二組的均值減去第五組的均值)為8.2206,均值差的95%置信區(qū)間為1.9442,14.4971,這個區(qū)間不包含0,說明在顯著性0.05下,兩組間均值的差異是顯著的。(2) c = multcompare(stats,param1,val1,param2,val2,.)指定一個或多個成對出現(xiàn)的參數(shù)名與參數(shù)值來控制多
22、重比較。(3) c,m = multcompare(.)還返回一個多行2列的矩陣m,第一列為每一組組均值的估計值,第二列為相應的標準誤差。(4) c,m,h = multcompare(.)還返回交互式多重比較的圖形的句柄值h,可通過h修改圖形屬性,如圖形標題和X軸標等。(5) c,m,h,games = multcompare(.)還返回組名變量gnames,它是一個元胞數(shù)組,每一行對應一個組名。.3應用實例例2-1:將四種工藝下生產(chǎn)的燈泡進行壽命測試,得到數(shù)據(jù):表2-1燈泡壽命測試表 試驗 工藝116201580146015002167016001540155031700164016201
23、610417501720168051800試檢驗工藝對壽命有無顯著影響。(=0.05)解答:程序:clear;X=1620,1670,1700,1750,1800,1580,1600,1640,1720,1460,1540,1620,1500,1550,1610,1680;group=1,1,1,1,1,2,2,2,2,3,3,3,4,4,4,4;p,tab,stats=anova1(X,group,on)運行結(jié)果:p = 0.0331tab = Source SS df MS F ProbF Groups 62820 3 20940 4.0608 0.0331 Error 61880 12
24、5.1567e+003 Total 124700 15 stats = gnames: 4x1 cell n: 5 4 3 4 source: anova1 means: 1708 1635 1540 1585 df: 12 s: 71.8099圖2-1燈泡壽命測試運行結(jié)果圖圖2-2燈泡壽命測試水箱平衡圖例2-2:研究6種農(nóng)藥對殺蟲效果的影響,試驗所得數(shù)據(jù)如下表:表2-2農(nóng)藥殺蟲量表農(nóng)藥編號殺蟲量12345687.485.080.290.588.587.394.356.262.455.048.292.099.295.391.575.272.381.3設(shè)該試驗的線性統(tǒng)計模型為:其中,。解答:程序
25、:y1=87.4 85.0 80.2;y2=90.5 88.5 87.3 94.3;y3=56.2 62.4;y4=55.0 48.2;y5=92.0 99.2 95.3 91.5;y6=75.2 72.3 81.3;y=y1 y2 y3 y4 y5 y6;A1=ones(numel(y1),1);A2=2*ones(numel(y2),1);A3=3*ones(numel(y3),1);A4=4*ones(numel(y4),1);A5=5*ones(numel(y5),1);A6=6*ones(numel(y6),1);A=A1;A2;A3;A4;A5;A6;p,table,stats=a
26、nova1(y,A)B=multcompare(stats,0.05)運行結(jié)果:p = 1.0671e-007table = Source SS df MS F ProbF Groups 3.8177e+003 5 763.5487 51.5921 1.0671e-007 Error 177.5967 12 14.7997 Total 3.9953e+003 17 stats = gnames: 6x1 cell n: 3 4 2 2 4 3 source: anova1 means: 84.2000 90.1500 59.3000 51.6000 94.5000 76.2667 df: 12
27、 s: 3.8470B = 1.0000 2.0000 -15.8193 -5.9500 3.9193 1.0000 3.0000 13.1040 24.9000 36.6960 1.0000 4.0000 20.8040 32.6000 44.3960 1.0000 5.0000 -20.1693 -10.3000 -0.4307 1.0000 6.0000 -2.6174 7.9333 18.4840 2.0000 3.0000 19.6593 30.8500 42.0407 2.0000 4.0000 27.3593 38.5500 49.7407 2.0000 5.0000 -13.4
28、872 -4.3500 4.7872 2.0000 6.0000 4.0141 13.8833 23.7526 3.0000 4.0000 -5.2219 7.7000 20.6219 3.0000 5.0000 -46.3907 -35.2000 -24.0093 3.0000 6.0000 -28.7627 -16.9667 -5.1706 4.0000 5.0000 -54.0907 -42.9000 -31.7093 4.0000 6.0000 -36.4627 -24.6667 -12.8706 5.0000 6.0000 8.3641 18.2333 28.1026:圖2-3運行結(jié)
29、果圖圖2-4分布示意圖 雙因素一元方差分析.1 Anova2函數(shù)MATLAB統(tǒng)計工具箱中提供了anova2函數(shù),用來作雙因素一元方差分析,其調(diào)用格式如下:(1) p=anova2(X,reps) 進行平衡雙因子方差分析,不同列中的數(shù)據(jù)代表一個因子A的變化。不同行中的數(shù)據(jù)代表另一因子B的變化。若在每一個行列匹配點上有一個以上的觀測值,則變量reps指示每一個單元中觀測值的個數(shù)。當reps=1 (默認值可省略)時,anova2函數(shù)返回兩個p值到p矢量中:零假設(shè)H0A的p值。零假設(shè)為源于因子A的所有樣本(如X中的所有列樣本)取自相同的總體。零假設(shè)H0B的p值。零假設(shè)為源于因子B的所有樣本(如X中的所
30、有行樣本)取自相同的總體。當reps1時,anova2在矢量中返回第3個值:零假設(shè)H0AB的p值。零假設(shè)為因子A和因子B之間沒有交互效應。如果任意一個p值接近于0,則認為相關(guān)的零假設(shè)不成立。對于零假設(shè)H0A,一個足夠小的p值表示至少有一個列樣本均值明顯地不同于其他列樣本均值,即因子A存在主效應;對于零假設(shè)H0B,一個足夠小的p值表示至少有一個行樣本均值明顯地不同于其他行樣本均值,即因子B存在主效應;對于零假設(shè)H0AB,一個足夠小的p值表示因子A與因子B之間存在交互效應。為了決定結(jié)果是否是“統(tǒng)計上顯著的”,需要確定p值。一般地,當p值小于0.05或0.01時,認為結(jié)果是顯著的。anova2函數(shù)還
31、顯示一個含方差分析表的圖形。它將X中數(shù)據(jù)的誤差根據(jù)reps的值分為3部分或4部分:由于列均值差異引起的誤差;由于行均值差異引起的誤差;由于行列交互作用引起的誤差(如果reps大于它的默認值1);剩下的誤差為不能被任何系統(tǒng)因素解釋的誤差。該方差分析表中包含6列:第1列顯示誤差的來源;第2列顯示來源于每一個誤差來源的平方和(SS);第3列為與每一個誤差來源相關(guān)的自由度(df);第4列為均值平方和(MS),它是誤差平方和與自由度的比值,即SS/df;第5列為F統(tǒng)計量,它是均值平方和的比值;第6列為p值,它是F函數(shù)(fcdf);當F增加時p值減小。(2) p=anova2(X,group,displa
32、yopt) 當displayopt參數(shù)設(shè)置為on(默認設(shè)置)時,激活ANOVA表和箱形圖的顯示;displayopt參數(shù)設(shè)置為off時,不予顯示。(3) p,table=anova2() 返回單元數(shù)組表中的ANOVA表(包含列標簽和行標簽)。(使用Edit菜單中的Copy Text選項可以將ANOVA表以文本形式復制到剪貼板中。)(4) p,table,stats=anova2() 返回stats結(jié)構(gòu),用于進行列因子均值的多重比較檢驗。.2應用實例例2-3:為了考察某種電池的最大輸出電壓受板極材料與使用電池的環(huán)境溫度的影響,材料類型(因子)取3個水平(即3種不同的材料),溫度(因子)也取3個水
33、平,每個水平組合下重復4次試驗,數(shù)據(jù)如下:表2-3電池最大輸出電壓受板極材料與環(huán)境溫度的影響試驗數(shù)據(jù)表溫度152535材料類型1130 155 174 18034 40 80 7520 70 82 582150 188 159 126136 122 106 11525 70 58 453138 110 168 160174 120 150 13996 104 82 60解答:程序:%兩因子等重復試驗(方差分析)y1=130 155 174 18034 40 80 7520 70 82 58;y2=150 188 159 126136 122 106 11525 70 58 45;y3=138
34、110 168 160174 120 150 13996 104 82 60;y=y1 y2 y3;p=anova2(y,4)運行結(jié)果:p =0.0043 0.0000 0.0008圖2-5運行結(jié)果圖2.2 判別分析 判別分析是用于判別個體所屬群體的一種統(tǒng)計方法,判別分析的特點是根據(jù)已掌握的、歷史上每個類別的若干樣本的數(shù)據(jù)信息,總結(jié)出客觀事物分類的規(guī)律性,建立判別公式和判別準則。然后,當遇到新的樣本點時,只要根據(jù)總結(jié)出來的判別公式和判別準則,就能判別該樣本點所屬的類別。判別分析是一種應用性很強的統(tǒng)計數(shù)據(jù)分析方法。判別分析的原理:為了能識別待判斷的對象x =是屬于已知類中的哪一類?事先必須要有一
35、個一般規(guī)則, 一旦知道了x的值, 便能根據(jù)這個規(guī)則立即作出判斷, 稱這樣的一個規(guī)則為判別規(guī)則.判別規(guī)則往往通過的某個函數(shù)來表達, 把它稱為判別函數(shù), 記作W(i; x).一旦知道了判別函數(shù)并確定了判別規(guī)則,最好將已知類別的對象代入檢驗,這一過程稱為回代檢驗,以便檢驗你的判別函數(shù)和判別規(guī)則是否正確。 相關(guān)函數(shù).1 classify函數(shù) 用classify函數(shù)進行線性判別分析,其調(diào)用格式如下。(1)class=classify(sample,training,group)將sample數(shù)據(jù)中的每一行分到training參數(shù)中的某一個類中。sample和training必須為列數(shù)相同的矩陣。grou
36、p 參數(shù)為training參數(shù)的分類變量。它的唯一值定義不同的組,每個元素定義training的對應行屬于哪一類。group可以是數(shù)值矢量、字符串數(shù)組成或字符串單元數(shù)組。group和training必須具有相同的行數(shù)。classify函數(shù)將group中的NaN或空字符串視為缺失值,并忽略training的對應行。該函數(shù)返回class,它是一個與sample具有相同行數(shù)的矢量。class的每個元素指定sample中每行元素的類別。(2)class,err=classify(.)返回錯判誤差率的估計。該函數(shù)返回trainin中被錯判的觀測量的百分比。.2 mahal函數(shù) 用mahal函數(shù)計算馬氏距
37、離,其調(diào)用格式如下。(1)mahal(Y,X)計算X矩陣中的樣本至Y矩陣中每個點(行)的馬氏距離。Y的列數(shù)必須等于X的列數(shù),但它們的行數(shù)可以不同。X的行數(shù)必須大于列數(shù)。馬氏距離是一個將數(shù)據(jù)集與空間點分隔開來的多變量度量。在線性判別分析中,使它最小化。 距離判別法 距離判別方法:判別函數(shù)W(i; x) = d (x, ), 其中d (x, )為待判別對象x到第i類的距離. 判別規(guī)則為若W(k; x) = minW(i; x)| i =1, 2, , r , 則x . 2.2.3 貝葉斯判別法 判別函數(shù)W(i; x ) = 其中為待判別對象x的概率,如果沒有任何這種附加的先驗信息,通常取pi =
38、1/r。為已知類別的分布密度判別規(guī)則為若W(k; x ) = maxW(i; x )| i =1, 2, , r ,則x. Fisher判別法 Fisher判別法是一種線性判別的方法。它的工作思路是對原數(shù)據(jù)系統(tǒng)進行坐標變換,尋求能將總體盡可能分開的方向。具體的作法是先引入一個與樣本同維的待定向量u,再將y取為x坐標的線性組合y=而u的選取,要使同一類別產(chǎn)生的y盡量聚攏,不同類別產(chǎn)生的y盡量拉開。 這樣,我們便可將樣品x到某一類G的距離定義為y=與 之間的歐氏距離: 其中c為G的幾何中心Fisher分類的判據(jù)為: 1若 ,則判定義為A類; 2若 ,則判定又為B類; 3若 ,則判定又為不可判類。
39、應用實例例2-4:某地大氣樣品污染分類如下:表2-4大氣樣品污染分類表氣體氯硫化氫二氧化硫碳4環(huán)氧氯丙烷環(huán)己烷污染分類10.0560.0840.0310.0380.00810.022120.0400.0550.1000.1100.02200.0073130.0500.0740.0410.0480.00710.020140.0450.0590.1100.1000.02500.0063150.0380.1300.0790.1700.05800.043260.0300.1100.0700.1600.05000.046270.0340.0950.0580.1600.2000.029180.0300.0
40、900.0680.1800.2200.039190.0840.0660.0290.3200.0120.0412100.0850.0760.0190.3000.0100.0402110.0640.0720.0200.2500.0280.0382120.0540.0650.0220.2800.0210.0402130.0480.0890.0620.2600.0380.0362140.0450.0920.0720.2000.0350.0322150.0690.0870.0270.0500.0890.0211在此地某大型化工廠的廠區(qū)及鄰近地區(qū)挑選4個有代表性的大氣樣本取樣,獲得數(shù)據(jù)如下:表2-5大氣樣
41、本取樣污染分類表氣體氯硫化氫二氧化硫碳4環(huán)氧氯丙烷環(huán)己烷污染分類樣品10.0520.0840.0210.0370.00710.022樣品20.0410.0550.1100.1100.02100.0073樣品30.0300.1120.0720.1600.0560.021樣品40.0740.0830.1050.1900.0201.000求它們的污染分類。解答:程序:training=0.056 0.084 0.031 0.038 0.0081 0.022; 0.040 0.055 0.100 0.110 0.0220 0.0073; 0.050 0.074 0.041 0.048 0.0071 0
42、.020; 0.045 0.050 0.110 0.100 0.0250 0.0063; 0.038 0.130 0.079 0.170 0.0580 0.043; 0.030 0.110 0.070 0.160 0.0500 0.046; 0.034 0.095 0.058 0.160 0.200 0.029; 0.030 0.090 0.068 0.180 0.220 0.039; 0.084 0.066 0.029 0.320 0.012 0.041; 0.085 0.076 0.019 0.300 0.010 0.040; 0.064 0.072 0.020 0.250 0.028 0
43、.038; 0.054 0.065 0.022 0.280 0.021 0.040; 0.048 0.089 0.062 0.260 0.038 0.036; 0.045 0.092 0.072 0.200 0.035 0.032; 0.069 0.087 0.027 0.050 0.089 0.021; group=1;1 ;1 ;1 ;2 ;2 ;1; 1; 2 ;2 ;2 ;2 ;2 ;2 ;1; sample=0.052 0.084 0.021 0.037 0.0071 0.022; 0.041 0.055 0.110 0.110 0.0210 0.0073; 0.030 0.112
44、0.072 0.160 0.056 0.021; 0.074 0.083 0.105 0.190 0.020 1.000; class,err=classify(sample,training,group,mahalanobis)運行結(jié)果:class = 1 1 2 2err = 02.3 主成分分析 主成分分析方法原理主成分分析是把原來多個變量化為少數(shù)幾個綜合指標的一種統(tǒng)計分析方法,從數(shù)學角度來看,這是一種降維處理技術(shù)。假定有n個地理樣本,每個樣本共有p個變量描述,這樣就構(gòu)成了一個np階的地理數(shù)據(jù)矩陣: (21)如何從這么多變量的數(shù)據(jù)中抓住地理事物的內(nèi)在規(guī)律性呢?要解決這一問題,自然要在p維
45、空間中加以考察,這是比較麻煩的。為了克服這一困難,就需要進行降維處理,即用較少的幾個綜合指標來代替原來較多的變量指標,而且使這些較少的綜合指標既能盡量多地反映原來較多指標所反映的信息,同時它們之間又是彼此獨立的。那么,這些綜合指標(即新變量)應如何選取呢?顯然,其最簡單的形式就是取原來變量指標的線性組合,適當調(diào)整組合系數(shù),使新的變量指標之間相互獨立且代表性最好。如果記原來的變量指標為,它們的綜合指標新變量指標為,(mp)。則 (22)在(2)式中,系數(shù)lij由下列原則來決定:(1)zi與zj(ij;i,j=1,2,m)相互無關(guān);(2)z1是x1,x2,xp的一切線性組合中方差最大者;z2是與z
46、1不相關(guān)的x1,x2,xp的所有線性組合中方差最大者;zm是與z1,z2,zm-1都不相關(guān)的x1,x2,xp的所有線性組合中方差最大者。這樣決定的新變量指標z1,z2,分別稱為原變量指標x1,x2,xp的第一,第二,第m主成分。其中,z1在總方差中占的比例最大,z2,z3,zm的方差依次遞減。在實際問題的分析中,常挑選前幾個最大的主成分,這樣既減少了變量的數(shù)目,又抓住了主要矛盾,簡化了變量之間的關(guān)系。從以上分析可以看出,找主成分就是確定原來變量xj(j=1,2,p)在諸主成分zi(i=1,2,m)上的載荷lij(i=1,2,m;j=1,2,p),從數(shù)學上容易知道,它們分別是x1,x2,xp的相
47、關(guān)矩陣的m個較大的特征值所對應的特征向量。 主成分分析的計算步驟(1)計算相關(guān)系數(shù)矩陣 (23) 在公式(3)中,(i,j=1,2,p)為原來變量與的相關(guān)系數(shù),其計算公式為: (24)因為R是實對稱矩陣(即rij=rji),所以只需計算其上三角元素或下三角元素即可。(2)計算特征值與特征向量首先解特征方程I-R=0求出特征值i(i=1,2,p),并使其按大小順序排列,即12,p0;然后分別求出對應于特征值i的特征向量ei(i=1,2,p)。(3)計算主成分貢獻率及累計貢獻率。一般取累計貢獻率達85-95的特征值,所對應的第一,第二,第m(mp)個主成分。(4)計算主成分載荷 (2-5)由此可以
48、進一步計算主成分得分:Z= (2-6) 主成分分析相關(guān)函數(shù)調(diào)用MATLAB工具箱princomp函數(shù)進行主成分分析:格式: PC = princomp(X) PC,SCORE,latent,tsquare = princomp(X)說明: PC,SCORE,latent,tsquare=princomp(X)對數(shù)據(jù)矩陣X進行主成分分析,給出各主成分 (PC)、所謂的Z-得分(SCORE)、X的方差矩陣的特征值(latent)和每個數(shù)據(jù)點的Hotelling統(tǒng)計量(tsquare)。 應用實例例2-5:城市環(huán)境生態(tài)化是城市發(fā)展的必然趁勢,表現(xiàn)為社會、經(jīng)濟、環(huán)境與生態(tài)全方位的現(xiàn)代化水平,一個符合生
49、態(tài)規(guī)律的生態(tài)城市應該是結(jié)構(gòu)合理、功能高效和關(guān)系協(xié)調(diào)的城市生態(tài)系統(tǒng)。所謂結(jié)構(gòu)合理是指適度的人口密度,合理的土地利用,良好的環(huán)境質(zhì)量,充足的綠地系統(tǒng),完善的基礎(chǔ)設(shè)施,有效的自然保護;功能高效是指資源的優(yōu)化配置、物力的經(jīng)濟投入、人力的充分發(fā)揮、物流的暢通有序、信息流的快捷;關(guān)系協(xié)調(diào)是指人和自然協(xié)調(diào)、社會關(guān)系協(xié)調(diào)、城鄉(xiāng)協(xié)調(diào)、資源利用和更新協(xié)調(diào)。一個城市要實現(xiàn)生態(tài)城市的發(fā)展目標,關(guān)鍵是在市場經(jīng)濟的體制下逐步改善城市的生態(tài)環(huán)境質(zhì)量,防止生態(tài)環(huán)境質(zhì)量惡化,因此,對城市的生態(tài)環(huán)境水平調(diào)查評價很有必要。我們對江蘇省十個城市的生態(tài)環(huán)境狀況進行了調(diào)查,得到生態(tài)環(huán)境指標的指數(shù)值。表2-6生態(tài)環(huán)境水平分析和評價表解答:
50、利用Matlab中的princomp命令實現(xiàn)。具體程序如下:x = 0.7883 0 .7391 0.8111 0.6587 0.6543 0.8259 0.8486 0.6834 0.8495 0.7846 0.7633 0.7287 0.7629 0.8552 0.7564 0.7455 0.7800 0.9490 0.8918 0.8954 0.4745 0.5126 0.8810 0.8903 0.8288 0.7850 0.8032 0.8862 0.3987 0.3970 0.8246 0.7603 0.6888 0.8977 0.7926 0.7856 0.6509 0.8902
51、 0.6799 0.9877 0.8791 0.8736 0.8183 0.9446 0.9202 0.9263 0.9185 0.9505 0.8620 0.8873 0.9538 0.9257 0.9285 0.9434 0.9154 0.8871 0.9357 0.8760 0.9579 0.9741 0.8785 0.8542 0.8537 0.9027 0.8729 0.8485 0.8473 0.9044 0.8866 0.9035 0.6305 0.6187 0.6313 0.7415 0.6398 0.6142 0.5734 0.8980 0.6186 0.7382 0.8928 0.7831 0.5608 0.8419 0.8464 0.7616 0.8234 0.6384 0.9604 0.8514x = ;stdr = std(x); %求各變量標準差n,m = size(x);sddata = x./stdr(ones(n,1),:); %標準化變換p,princ,egenvalue = princomp(sddata) %調(diào)用主成分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 時尚產(chǎn)業(yè)辦公空間裝修協(xié)議
- 游泳池裝修終止合同
- 化妝品店內(nèi)部裝修合同細則
- 海上夜游航線乘客協(xié)議
- 智能園區(qū)砂石運輸服務(wù)合同
- 潤滑油國內(nèi)運輸協(xié)議
- 2025年度安防設(shè)備展覽會專業(yè)展臺搭建合同
- 醫(yī)療器械配送服務(wù)合同
- 物業(yè)小區(qū)翻新服務(wù)方案
- 外架工勞務(wù)合同范例
- (康德一診)重慶市2025屆高三高三第一次聯(lián)合診斷檢測 英語試卷(含答案詳解)
- 2025年福建泉州文旅集團招聘24人高頻重點提升(共500題)附帶答案詳解
- 建筑行業(yè)砂石物資運輸方案
- 腫瘤全程管理
- 融資報告范文模板
- 桃李面包盈利能力探析案例11000字
- GB/Z 30966.71-2024風能發(fā)電系統(tǒng)風力發(fā)電場監(jiān)控系統(tǒng)通信第71部分:配置描述語言
- 污泥處置合作合同模板
- 腦梗死的護理查房
- 2025高考數(shù)學專項復習:概率與統(tǒng)計的綜合應用(十八大題型)含答案
- 2024-2030年中國紫蘇市場深度局勢分析及未來5發(fā)展趨勢報告
評論
0/150
提交評論