




已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
合肥師范學(xué)院2015屆本科生畢業(yè)論文(設(shè)計(jì))學(xué)號(hào):1111431040 本科畢業(yè)論文(設(shè)計(jì))(2015屆)基于Matlab的數(shù)據(jù)多元回歸分析的研究院 系 電子信息工程學(xué)院 專(zhuān) 業(yè) 電氣工程及其自動(dòng)化 姓 名 張婷婷 指導(dǎo)教師 尹靜 2015年5月摘 要多元線(xiàn)性回歸是利用MATLAB軟件研究一個(gè)變量與多個(gè)變量的定量關(guān)系,MATLAB(矩陣實(shí)驗(yàn)室,是MATrix LABoratory的縮寫(xiě))是一套高性能的數(shù)值運(yùn)算和可視化軟件,它集矩陣運(yùn)算、數(shù)值分析、信號(hào)處理和圖形顯示于一體,構(gòu)成了一個(gè)界面友好、使用方便的用戶(hù)環(huán)境,是實(shí)現(xiàn)數(shù)據(jù)分析與處理的有效工具,其中MATLAB統(tǒng)計(jì)工具箱更為人們提供了一個(gè)強(qiáng)有力的數(shù)據(jù)統(tǒng)計(jì)分析工具。利用MATLAB統(tǒng)計(jì)工具箱來(lái)進(jìn)行數(shù)據(jù)的多元回歸分析使得分析的樣本容量擴(kuò)大,增加了統(tǒng)計(jì)推斷的正確性,也促進(jìn)了包含大量計(jì)算的多元統(tǒng)計(jì)分析的發(fā)展和運(yùn)用。本課題研究了在MATLAB軟件平臺(tái)上實(shí)現(xiàn)數(shù)據(jù)的多元統(tǒng)計(jì)分析,具體包括一元線(xiàn)性回歸分析,非線(xiàn)性回歸分析,多元線(xiàn)性回歸分析,通過(guò)對(duì)基礎(chǔ)數(shù)據(jù)分析函數(shù)polyfit(一元回歸);regress(多元回歸);及nlinfit(非線(xiàn)性回歸)的學(xué)習(xí)。根據(jù)已得的實(shí)驗(yàn)結(jié)果以及以往的經(jīng)驗(yàn)來(lái)建立統(tǒng)計(jì)模型,并研究變量之間的相關(guān)關(guān)系,建立起變量之間關(guān)系的近似表達(dá)式,并由此對(duì)相應(yīng)的變量進(jìn)行預(yù)測(cè)和控制。根據(jù)所收集的數(shù)據(jù),通過(guò)本文的研究方法進(jìn)行一一分析,掌握它們的相關(guān)關(guān)系,可以找出數(shù)據(jù)中我們最需要的信息,從而進(jìn)一步對(duì)總體的特性進(jìn)行進(jìn)一步的判斷,把握規(guī)律,并將研究結(jié)果廣泛運(yùn)用于各種實(shí)際應(yīng)用的預(yù)測(cè)和判斷之中。關(guān)鍵詞:polyfit,regress,置信區(qū)間,最小二乘估計(jì)AbstractMultiple linear regression is a variable and multiple variables are studied by using MATLAB software quantitative relationship of MATLAB (MATrix LABoratory, is the abbreviation of MATrix LABoratory) is a high-performance numerical calculation and visualization software, it combines MATrix operations, numerical analysis, signal processing and graphic display at an organic whole, constitute a friendly interface, easy to use user environment, including the MATLAB statistic tool box more people provided a powerful data statistical analysis tools. Using MATLAB toolbox for data statistics makes analysis of the sample size of expansion, multiple regression analysis to increase the validity of the statistical inference, also promoted the contains a large amount of computing multivariate statistical analysis of the development and use.This topic is studied on MATLAB software platform to realize data of multivariate statistical analysis, including a yuan linear regression analysis, nonlinear regression analysis, multivariate linear regression analysis, based on basic data analysis function polyfit (unary regression); Regress (multiple regression); Learning and nlinfit (nonlinear regression), According to the experimental results have been and past experience to build a statistical model, and studies the correlation between variables, establish the approximate expressions of the relation between variables, and thus to predict and control the corresponding variables.Based on the collected data, through the research methods of this article analysis, grasp their relationship, can find what we need most in this data information, thus further further judgment, the characteristics of the overall grasp the rule. Will the results of the study is widely used in all kinds of practical application of prediction and judgment. Key words: polyfit,regress, confidence intervals, the least squares estimate目 錄摘 要- 1 -緒論- 5 -1.1研究的背景- 5 -1.2研究的主要內(nèi)容- 5 -1.3應(yīng)解決的關(guān)鍵問(wèn)題- 6 -2 MATLAB數(shù)據(jù)分析- 6 -2.1 MATLAB重點(diǎn)基礎(chǔ)預(yù)備- 6 -2.1.1 MATLAB界面掌握- 6 -2.1.2矩陣及其運(yùn)算- 6 -2.2數(shù)據(jù)分析- 8 -2.2.1樣本數(shù)據(jù)的基本統(tǒng)計(jì)量- 8 -3 一元回歸分析- 9 -3.1一元回歸模型- 9 -3.1.1一元線(xiàn)性回歸- 9 -3.1.2一元多項(xiàng)式回歸- 10 -3.2一元非線(xiàn)性回歸- 10 -3.2.1非線(xiàn)性曲線(xiàn)選擇- 10 -3.2.2非線(xiàn)性回歸命令的調(diào)用格式- 11 -3.3一元回歸建模實(shí)例- 13 -4 多元線(xiàn)性回歸模型- 15 -4.1多元線(xiàn)性回歸初級(jí)分析- 15 -4.1.1多元回歸基本概念- 15 -4.1.2建立多元線(xiàn)性回歸建模的基本步驟- 16 -4.2 MATLAB的回歸分析命令- 17 -4.2.1 多元回歸建模命令- 17 -4.2.2 多元回歸輔助圖形命令- 17 -4.3 一元回歸建模實(shí)例- 18 -5 GUI界面的設(shè)計(jì)- 25 -5.1 GUI界面的介紹- 25 -5.2 GUI的設(shè)計(jì)流程- 25 -5.2實(shí)例的GUI設(shè)計(jì)- 27 -結(jié) 論- 29 -參考文獻(xiàn)- 29 -附 錄- 30 -致謝- 33 -緒論1.1研究的背景MATLAB是一套集高性能的數(shù)值計(jì)算和可視化整理、計(jì)算、繪制圖表等于一身的數(shù)學(xué)工具。它集矩陣運(yùn)算、數(shù)值分析、信號(hào)處理和圖形顯示于一體,構(gòu)成了一個(gè)界面友好、使用方便的用戶(hù)環(huán)境,是實(shí)現(xiàn)數(shù)據(jù)可視化的軟件,該軟件是使用在數(shù)據(jù)整理和分析階段。在數(shù)據(jù)分析與處理中,起著重要的作用。其中MATLAB統(tǒng)計(jì)工具箱更為人們提供了一個(gè)強(qiáng)有力的統(tǒng)計(jì)分析工具。該軟件作為數(shù)據(jù)分析的工具提高了計(jì)算能力,使得樣本容量擴(kuò)大,增加了統(tǒng)計(jì)推斷的正確性,也促進(jìn)了包含大量計(jì)算的多元統(tǒng)計(jì)分析等方法的發(fā)展和運(yùn)用。軟件的使用還為數(shù)據(jù)分析過(guò)程節(jié)約了大量時(shí)間,提高了數(shù)據(jù)分析的效率。矩陣是MATLAB數(shù)據(jù)存儲(chǔ)的基本單元,而矩陣運(yùn)算是MATLAB語(yǔ)言的核心,在MATLAB語(yǔ)言系統(tǒng)中幾乎一切運(yùn)算均是以對(duì)矩陣的操作為基礎(chǔ)的。對(duì)于數(shù)據(jù)描述分析的過(guò)程,它是從樣本數(shù)據(jù)出發(fā),概括分析數(shù)據(jù)的集中位置、分散程度、相互關(guān)聯(lián)關(guān)系,以及數(shù)據(jù)分布的正態(tài)或偏態(tài)特征等。它是數(shù)據(jù)進(jìn)一步分析的基礎(chǔ),對(duì)不同類(lèi)型量綱的數(shù)據(jù)有時(shí)還要進(jìn)行變換,然后再作出合理分析。數(shù)據(jù)分布特征一般用偏度與峰度描述,偏度是用于衡量分布不對(duì)稱(chēng)程度的指標(biāo)。峰度是用來(lái)衡量數(shù)據(jù)尾部分散性的指標(biāo)。回歸分析是最常用的數(shù)據(jù)分析方法之一,它是根據(jù)已得的實(shí)驗(yàn)結(jié)果以及以往的經(jīng)驗(yàn)來(lái)建立統(tǒng)計(jì)模型,并研究變量之間的相關(guān)關(guān)系,建立起變量之間關(guān)系的近似表達(dá)式,并由此對(duì)相應(yīng)的變量進(jìn)行預(yù)測(cè)和控制。1.2研究的主要內(nèi)容本課題主要研究的是根據(jù)所得的樣本數(shù)據(jù),使用MATLAB軟件平臺(tái)分析它們的相關(guān)性,建立起變量的相關(guān)性 ,并由此對(duì)相應(yīng)的變量進(jìn)行預(yù)測(cè)和控制。主要分為一元回歸模型、多元回歸模型、非線(xiàn)性回歸模型,其中多元回歸是最重要的研究對(duì)象。比如對(duì)于一元回歸模型,首先對(duì)總體樣本(X,Y)進(jìn)行n次獨(dú)立觀(guān)測(cè),獲得n組數(shù)據(jù),再輸入語(yǔ)言和命令,然后根據(jù)直角坐標(biāo)系作散點(diǎn)圖,建立一元線(xiàn)性回歸模型,計(jì)算最佳參數(shù)運(yùn)行可得相應(yīng)的回歸模型。類(lèi)似的分析方法還有很多。像多維的變量組合,會(huì)有很多線(xiàn)性回歸方程,我們可以利用逐步回歸取得最終結(jié)果。1.3應(yīng)解決的關(guān)鍵問(wèn)題 在很多實(shí)際問(wèn)題中,與某個(gè)變量Y有關(guān)系的變量不止一個(gè),研究一個(gè)變量與多個(gè)變量之間的定量關(guān)系問(wèn)題就是研究多元回歸問(wèn)題,但是它和一元回歸模型的建立的方法類(lèi)似。這里我們重點(diǎn)研究的關(guān)鍵問(wèn)題是多元線(xiàn)性回歸怎樣建模。 在多元線(xiàn)性回歸中,要理解與多元回歸模型有關(guān)的命令,多元回歸建模命令,調(diào)用格式在不同情境下該如何靈活運(yùn)用。三種調(diào)用方式主要區(qū)別是什么,并要了解殘差圖命令及其調(diào)用格式。當(dāng)數(shù)據(jù)輸入后得到相應(yīng)的圖形出現(xiàn)異常點(diǎn),又該如何重新建模。2 MATLAB數(shù)據(jù)分析2.1 MATLAB重點(diǎn)基礎(chǔ)預(yù)備2.1.1 MATLAB界面掌握MATLAB大致包括菜單欄,工具欄,命令窗口,工作空間管理窗口,歷史命令記錄窗口,當(dāng)前目錄窗口。一般來(lái)說(shuō),MATLAB所有函數(shù)和命令都可以在命令窗口執(zhí)行,在命令窗口中輸入figure,可產(chǎn)生一個(gè)與命令窗口隔離的圖形窗口。但一般指令較多的情況下,我們可以調(diào)用M文件,在編輯器寫(xiě)下相應(yīng)程序,保存wlb_1(這是文件名),然后在命令窗口中執(zhí)行。MATLAB數(shù)據(jù)類(lèi)型主要包括字符串,數(shù)字,矩陣,單元型數(shù)據(jù)及結(jié)構(gòu)型數(shù)據(jù)等。而且提供了近20類(lèi)基本命令函數(shù),還提供了循環(huán)語(yǔ)句,兩種循環(huán)方式:forend循環(huán)和whileend循環(huán);條件控制語(yǔ)句,ifelseend語(yǔ)句;continue語(yǔ)句,break語(yǔ)句和return語(yǔ)句。2.1.2矩陣及其運(yùn)算矩陣是MATLAB數(shù)據(jù)存儲(chǔ)的基本單元,而矩陣的運(yùn)算則是MATLAB語(yǔ)言的核心,在MATLAB語(yǔ)言系統(tǒng)中幾乎一切運(yùn)算都是以對(duì)矩陣的操作為基礎(chǔ)的。操作符:m:n產(chǎn)生一個(gè)數(shù)組m,m+1,n;m:k:n產(chǎn)生一個(gè)數(shù)組m,m+k,n;A(:,j)取矩陣A的第j列;A(k,:)取矩陣A的第k行;在矩陣中表示一行的結(jié)束;在命令語(yǔ)句的結(jié)尾表示不顯示這行語(yǔ)句的執(zhí)行結(jié)果%在編程中引導(dǎo)注釋行,而系統(tǒng)解釋執(zhí)行程序,%后面的內(nèi)容不作處理運(yùn)算符關(guān)系運(yùn)算符,算術(shù)運(yùn)算符,邏輯運(yùn)算符矩陣的運(yùn)算(1)矩陣間的運(yùn)算,(2)矩陣的標(biāo)量運(yùn)算,一般為矩陣的每個(gè)元素與標(biāo)量間的運(yùn)算,(3)矩陣的基本函數(shù)運(yùn)算,矩陣中最實(shí)用的運(yùn)算(4)矩陣的數(shù)據(jù)處理,比如求最大值、求和、求均值等。det(A)求矩陣A的行列式min(A)求向量或矩陣列的最小值Inv(A)求方陣A的逆矩陣mean(A)求向量或矩陣列的平均值size(A)求矩陣A的階數(shù)sum(A)求向量或矩陣列的元素和eig(A)求A的特征值及特征向量var(A)求向量或矩陣列的方差rank(A)求矩陣A的秩cov(A)求向量或矩陣列的協(xié)方差矩陣max(a)求向量或矩陣列的最大值std(A)求向量或矩陣列的標(biāo)準(zhǔn)差數(shù)組的輸入與運(yùn)算,只有一行的矩陣也稱(chēng)為數(shù)組或向量,我們也要清楚的把握數(shù)組的輸入;數(shù)組元素的訪(fǎng)問(wèn),訪(fǎng)問(wèn)一個(gè)元素,訪(fǎng)問(wèn)一塊元素;標(biāo)量與數(shù)組的運(yùn)算,標(biāo)量與數(shù)組的加減乘除及乘方運(yùn)算是數(shù)組的每個(gè)元素與該標(biāo)量的運(yùn)算;數(shù)組與數(shù)組間的運(yùn)算,數(shù)組與數(shù)組的運(yùn)算要求維數(shù)是相同的,數(shù)組的乘除法是指兩個(gè)同維數(shù)組對(duì)應(yīng)元素之間的乘除法,它們的運(yùn)算符,只能是“*”、“/”。2.2數(shù)據(jù)分析2.2.1樣本數(shù)據(jù)的基本統(tǒng)計(jì)量描述樣本數(shù)據(jù)基本特性主要是集中位置和分散程度,那么均值、中位數(shù)、分位數(shù)及三均值亦可充分反映。1.均值命令mean,其調(diào)用格式為:m=mean(x);2.中位數(shù)命令median,其調(diào)用格式:MD=median(X);3.P分位數(shù)調(diào)用命令prctile,其調(diào)用格式為SM=prctile(X,P); 4.三均值: 5.方差:方差是描述數(shù)據(jù)取值分散性的一種度量,它是數(shù)據(jù)相對(duì)與均值的偏差平方的平均。 6.其算術(shù)平方根稱(chēng)為標(biāo)準(zhǔn)差或根方差,即 7.偏度或峰度:數(shù)據(jù)分布一般要用偏度或峰度描述。偏度用來(lái)描述衡量分布不對(duì)稱(chēng)程度或偏斜程度的指標(biāo),樣本數(shù)據(jù)的偏度為: 峰度用來(lái)衡量數(shù)據(jù)尾部分散性的指標(biāo),樣本數(shù)據(jù)的峰度定義為: 當(dāng)數(shù)據(jù)的總體分布為正態(tài)分布時(shí),峰度近似為0;當(dāng)峰度大于0時(shí),數(shù)據(jù)中含有較多遠(yuǎn)離均值的極端數(shù)值,稱(chēng)數(shù)據(jù)分布具有平峰后尾性,同樣與上述相比,當(dāng)峰度小于0時(shí),表示均值兩側(cè)的極端數(shù)值較少,則數(shù)據(jù)稱(chēng)為尖峰細(xì)尾性,且調(diào)用峰度的命令為kurtosis,其調(diào)用格式fd=kurtosis(x,flg),同樣對(duì)于偏度的調(diào)用格式為:Pd=skewness(x,flg),當(dāng)x為矩陣時(shí),輸出的Pd為數(shù)組,其中第i個(gè)元素是x的第i列數(shù)據(jù)的偏度。3 一元回歸分析3.1一元回歸模型 3.1.1一元線(xiàn)性回歸 回歸分析是最常用的數(shù)據(jù)方法之一,它是根據(jù)以往的經(jīng)驗(yàn)來(lái)建立的統(tǒng)計(jì)模型,并研究變量之間的相關(guān)關(guān)系,建立起變量之間關(guān)系的近似表達(dá)式,并由此對(duì)相應(yīng)的變量進(jìn)行預(yù)測(cè)和控制等。本章將介紹一元回歸模型、非線(xiàn)性回歸等內(nèi)容。設(shè)Y是一個(gè)可觀(guān)測(cè)的隨機(jī)變量,它受到一個(gè)非隨機(jī)變量因素x和隨機(jī)誤差的影響。若Y與x有如下關(guān)系: (3.1.1)且的均值E()=0,方差var()= (0),其中、是固定的未知參數(shù),稱(chēng)為回歸系數(shù),Y稱(chēng)為因變量,x稱(chēng)為自變量,則稱(chēng)式(3.1.1)為一元線(xiàn)性回歸模型。對(duì)于實(shí)際問(wèn)題,要建立回歸方程,首先要確定是否能建立線(xiàn)性回歸模型,其次確定如何對(duì)模型中未知參數(shù)、進(jìn)行估計(jì)。所以我們首先要對(duì)總體(x,Y)進(jìn)行n 次獨(dú)立觀(guān)測(cè),獲得 n組數(shù)據(jù),這些數(shù)據(jù)我們又稱(chēng)為樣本觀(guān)測(cè)值,(x1,y2),(x2,y2),(xn, yn),然后在直角坐標(biāo)系畫(huà)出數(shù)據(jù)點(diǎn),該圖形為數(shù)據(jù)的散點(diǎn)圖,那么如果這些點(diǎn)大致的位于同一條直線(xiàn)的附近,或者這個(gè)圖形呈線(xiàn)性形狀、則認(rèn)為Y與x之間的關(guān)系符合一元線(xiàn)型回歸模型。最后我們利用最小二乘法可以得到回歸模型參數(shù)、的最小二乘估計(jì) ,估計(jì)公式為: (3.1.2)其中: 于是我們就可以建立公式模型: 接下來(lái)我們可以對(duì)一元線(xiàn)性回歸分析總結(jié)為三點(diǎn),一是利用樣本觀(guān)測(cè)值對(duì)回歸系數(shù)、和做點(diǎn)估計(jì);二是對(duì)方程的線(xiàn)性關(guān)系做顯著性檢驗(yàn),三是在x=x0處對(duì)Y做預(yù)測(cè)等。3.1.2一元多項(xiàng)式回歸在一元線(xiàn)性回歸中,如果變量x與y關(guān)系是n次多項(xiàng)式,即(3.1.3)其中,是隨機(jī)誤差,服從正態(tài)分布N(0,),a0,a1,an為回歸系數(shù),則稱(chēng)公式(3.1.3)為一元多項(xiàng)式回歸模型。1. 多項(xiàng)式曲線(xiàn)擬合,其調(diào)用命令為,其相應(yīng)的調(diào)用格式有3種 p=polyfit(x,y,n)p,s=plyfit(x,y,n)p,s,mu=polyfit(x,y,n)當(dāng)輸入x,y分別為自變量和因變量的樣本參數(shù)估計(jì)向量;n是多項(xiàng)式的階數(shù),對(duì)于一元線(xiàn)性回歸,則取n為1,p是按照降冪排列的多項(xiàng)式的系數(shù)向量;S是一個(gè)矩陣,用于估計(jì)預(yù)測(cè)誤差;mu是一個(gè)向量給出自己變量的均值與標(biāo)準(zhǔn)差。2. 多項(xiàng)式回歸模型的預(yù)測(cè)及其置信區(qū)間在MATLAB統(tǒng)計(jì)工具箱中,有多項(xiàng)式曲線(xiàn)擬合預(yù)測(cè)的命令polyval,其相應(yīng)的調(diào)用格式有以下2種:Y=polyval(p,x0) Y,Delta=polyconf(p,x0,s,alpha)其中,p,S是多項(xiàng)式擬合命令p,S=polyfit(x,y,n)的輸出,x0是要預(yù)測(cè)的自變量的值;輸出Y是polyfit所得的回歸多項(xiàng)式在x處的預(yù)測(cè)值,如果輸入數(shù)據(jù)的誤差相互獨(dú)立,且方差為常數(shù),則YDelta至少包含的預(yù)測(cè)值,默認(rèn)值為0.05。3.2一元非線(xiàn)性回歸3.2.1非線(xiàn)性曲線(xiàn)選擇為了便于正確選擇合適的函數(shù)進(jìn)行回歸分析建模,通常有6種曲線(xiàn)可共參考,(1)雙曲線(xiàn) (2)冪函數(shù)曲線(xiàn)其中x0, a0(3)指數(shù)曲線(xiàn) , 其中參數(shù)a0(4)倒指數(shù)曲線(xiàn),其中a0(5)對(duì)數(shù)曲線(xiàn) (6)S型曲線(xiàn) ,其中ab0非線(xiàn)性回歸建模通常有兩種方法:一是通過(guò)適當(dāng)?shù)淖儞Q化為線(xiàn)性回歸型,例如 ,如果做變換,則有,此時(shí) 就是一階線(xiàn)性回歸模型;如果無(wú)法實(shí)現(xiàn)線(xiàn)性化,可以利用最小二乘法直接建立非線(xiàn)性回歸模型,可以求解最佳參數(shù)。3.2.2非線(xiàn)性回歸命令的調(diào)用格式MATLAB統(tǒng)計(jì)工具箱實(shí)現(xiàn)非線(xiàn)性回歸的命令有nlifit,nlpredci,nlparci,下面逐一介紹其格式:1) 非線(xiàn)性擬合命令為nlinfit,其調(diào)用格式如下:beat,r,J=nlinfit(x,y,model,beta0)其中x,y分別為n*mmodel是事先用M文件定義的非線(xiàn)性函數(shù),beat0()是回歸系數(shù)的初值,beat是估計(jì)出的最佳回歸系數(shù),r是殘差,J是雅克比矩陣。通??衫胕nline定義函數(shù)model,方法如下:fun=inline(f(x),參變量,x)2)非線(xiàn)性回歸預(yù)測(cè)命令為nlpredict,其調(diào)用格式如下: Yprd=nlpredict(FUN,inputs,beta,r,J)其中FUN是擬合函數(shù),inputs是預(yù)測(cè)的自變量,ypred是預(yù)測(cè)值。3)非線(xiàn)性回歸置信區(qū)間命令為nlparci,其調(diào)用格式如下: Ci=nlparci(beat,r,J,alpha)其中ci是一個(gè)矩陣,每一行分別為每個(gè)參數(shù)的(1-alpha)%的置信區(qū)間,alpha默認(rèn)值為0.05. 非線(xiàn)性回歸實(shí)例:x=2,3,4,5,6,7,8,9,10,11,12,13,14,15,16;y=6.42,8.2,9.58,9.5,9.7,10,9.93,9.99,10.49,10.59,10.6,10.8,10.6,10.9,10.76;現(xiàn)在我們根據(jù)描點(diǎn)作圖大概知道這組數(shù)據(jù)的曲線(xiàn)圖近似于曲線(xiàn)1/y=a+b/x,因此我們通過(guò)matlab程序建立非線(xiàn)性回歸的模型。x=2:16;y=6.42,8.2,9.58,9.5,9.7,10,9.93,9.99,10.49,10.59,10.6,10.8,10.6,10.9,10.76;b0=0.084,0.1436;fun=inline(x./(b(1)*x+b(2)),b,x);beta,r,J=nlinfit(x,y,fun,b0);betay1=x./(0.0845*x+0.1125);plot(x,y,*,x,y1,- or)legend(原始數(shù)據(jù),擬合曲線(xiàn))(其中b0的計(jì)算是根據(jù)已有的數(shù)據(jù)值帶入方程1/y=a+b/x所得的,我們選取點(diǎn)(2,6.42)和(16,10.76)我們可得a=0.084,b=0.1436,及b0=0.084,0.1436。曲線(xiàn)擬合圖如下所示:由此我們還可以預(yù)測(cè)當(dāng)x=17時(shí)y的值,只需要在上面的程序中輸入代碼:ypred=nlprdict(fun,17,beta,r,J)可以得到結(jié)果如圖所示:3.3一元回歸建模實(shí)例 以下來(lái)自網(wǎng)上的一組數(shù)據(jù)是關(guān)于雛鵝齡重(y)與體重(x)的相關(guān)關(guān)系,編號(hào)12345678910x858796941271029682124104y2380246027002480310026802610238032802900(1)作散點(diǎn)圖x=85 87 96 94 127 102 96 82 124 104;y=2380 2460 2700 2480 3100 2680 2610 2380 3280 2900;plot(x,y,*)xlabel(x)ylabel(y)由圖可見(jiàn),雛鵝的體重與齡重間存在線(xiàn)性關(guān)系,且齡重隨雛鵝的體重的增大而增大,因此我們可得出x與y呈一元線(xiàn)性回歸模型。(2)建立直線(xiàn)回歸方程在MATLAB中調(diào)用命令,從而求出參數(shù)的最小二乘估計(jì),繼而可在MATLAB窗口中繼續(xù)輸入:n=size(x,1)p,s=polyfit(x,y,1);yl=polyval(p,x);hold onplot(x,y1)p通過(guò)窗口可得輸出結(jié)果:即參數(shù)()的最小二乘估計(jì)為:所以雛鵝的體重與齡重的直線(xiàn)回歸方程(3)誤差估計(jì)與可覺(jué)系數(shù)TSS=sum(y-mean(y).2)RSS=sum(y1-mean(y).2)ESS=sum(y-y1).2)R2=RSS/TSS;則通過(guò)編輯器得到輸出結(jié)果:這樣可得可決系數(shù)R2=0.9234,接近于1,因此模擬的擬和效果較好。4 多元線(xiàn)性回歸模型4.1多元線(xiàn)性回歸初級(jí)分析4.1.1多元回歸基本概念設(shè)Y是一個(gè)可觀(guān)測(cè)的隨機(jī)變量,它受到p(p0)個(gè)非隨機(jī)變量因素,和隨機(jī)誤差的影響。若Y與,有如下線(xiàn)性關(guān)系:(4.1.1)其中是固定的未知參數(shù),稱(chēng)為回歸系數(shù);是均值為0、方差為(0)的隨機(jī)變量;Y為稱(chēng)解釋變量;,稱(chēng)為解釋變量。模型(4.1.1)稱(chēng)為多元線(xiàn)性回歸模型。由定義,在模型(4.1.1)中,自變量,是非隨機(jī)的且可精確觀(guān)測(cè),隨機(jī)誤差代表其他隨機(jī)因素對(duì)因變量Y產(chǎn)生的影響。對(duì)于總體(,;Y)的n組觀(guān)測(cè)值( )(i=1,2,,n; np),應(yīng)滿(mǎn)足式(4.1.1),即(4.2.2)其中相互獨(dú)立,且設(shè)N(0,)(i=1,2,,n),記 則模型(4.2.2)可用矩陣形式表示為:Y=X+其中Y為觀(guān)測(cè)向量;X為設(shè)計(jì)矩陣;為待估計(jì)向量;是不可觀(guān)測(cè)的維隨機(jī)變量,它的分量相互獨(dú)立,假定N(0, In)。4.1.2建立多元線(xiàn)性回歸建模的基本步驟(1)對(duì)問(wèn)題進(jìn)行直觀(guān)分析,選擇因變量與解釋變量,作出因變量與各解釋變量的散點(diǎn)圖,初步設(shè)定多元線(xiàn)性回歸模型的參數(shù)個(gè)數(shù)。(2)輸入因變量與自變量的觀(guān)測(cè)數(shù)據(jù)(y,X),調(diào)用命令為:b,bint,r,rint,s=regress(y,x,alpha) 計(jì)算參數(shù)的估計(jì)。(3)調(diào)用命令rcoplot(r,rint),分析數(shù)據(jù)的異常點(diǎn)情況。(4)作顯著性檢驗(yàn),若通過(guò),則對(duì)模型做預(yù)測(cè)。(5)對(duì)模型進(jìn)一步研究,如殘差的正態(tài)性檢驗(yàn),殘差的異方差檢驗(yàn),殘差的自相關(guān)性檢驗(yàn)等。4.2 MATLAB的回歸分析命令4.2.1 多元回歸建模命令在MATLAB工具箱中,與多元回歸模型有關(guān)的命令有多個(gè),比如(1) b=regress(Y,X)(2) b,bint,r,rint,stats=regress(Y,X)(3) b,bint,r,rint,stats=regress(Y,X,alpha)三種方式的主要區(qū)別是輸出項(xiàng)的參數(shù)的多少,第三種方式是全參數(shù)方式,第三種說(shuō)明regress命令的輸入與輸出參數(shù)的含義。輸入?yún)?shù):輸入量Y表示模型(3.1.1)中因變量的觀(guān)測(cè)向量 ;X是一個(gè)n*(p+1)的矩陣,其中第一列元全部是數(shù)“1”,第j列是自變量 的觀(guān)測(cè)向量 (j=1,2,p),即:對(duì)于一元線(xiàn)性回歸,取p=1即可;alpha為顯著性水平。輸出參數(shù):輸出向量b為回歸系數(shù)估計(jì)值,bint為回歸系數(shù)的置信區(qū)間;輸出向量r表示殘差列向量,即輸出量rint為模型的殘差的置信區(qū)間;輸出量stats是用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有4個(gè)分量值:第一個(gè)是R2,其中R是相關(guān)系數(shù);第二個(gè)是F統(tǒng)計(jì)值;第三個(gè)是與統(tǒng)計(jì)量F對(duì)應(yīng)的概率P,當(dāng)P A=74.6 29.4 20.9 1085.6 76.6 30.5 21.2 1130.8 79.4 33.2 22.7 1239.6 75.6 29.2 21.2 1010.4 79.3 32.1 21.3 1274.7 81.4 27.4 21.5 1010.8 98.3 24.8 21.4 1092.5 67.7 23.6 21.0 826.3 74.1 32.7 22.1 1000.1 142.9 26.7 23.2 1543.2 87.2 44.7 23.1 1189.1 101.4 42.4 23.9 1415.1 113.7 39.2 22.7 1396.8 123.6 44.2 28.5 1542.7 135.2 50.6 23.7 1569.2 174.2 62.8 26.6 2269.8 151.3 62.6 25.8 2021.5 169.2 61.4 24.9 2212.4;m,n=size(A);subplot(3,1,1),plot(A(:,1),A(:,4),+),xlabel(x1(庫(kù)存金額))ylabel(y(銷(xiāo)售額))subplot(3,1,2),plot(A(:,2),A(:,4),*),xlabel(x2(廣告投入))ylabel(y(銷(xiāo)售額))subplot(3,1,3),plot(A(:,3),A(:,4),x),xlabel(x3(員工工資))ylabel(y(銷(xiāo)售額))通過(guò)編輯器可得相關(guān)圖形所得圖形如上圖所示,可以直接看到銷(xiāo)售額y與資金額、廣告投入,員工資金具有線(xiàn)性關(guān)系,因此可建立三元線(xiàn)性回歸模型 接著調(diào)用命令regress,建立三元線(xiàn)性回歸模型x=ones(m,1),A(:,1),A(:,2),A(:,3);y=A(:,4)b,bint,r,rint,stats=regress(y,x);b,bint,stats,程序運(yùn)行結(jié)果可得:輸出結(jié)果可得,b就是模型中的參數(shù)因此可得多元線(xiàn)性回歸模型:bint的各行分別為參數(shù)的95%的置信區(qū)間,stats的第一列表示模型可決系數(shù),第二列為F統(tǒng)計(jì)量的觀(guān)測(cè)值,第三列得到概率p=0.0000,最后一列模型的殘差平方和為9.6891.由于可決系數(shù)R2=0.0010,p=0.00000.05,因此建立的回歸模型有意義。接著要檢驗(yàn),對(duì)所得圖形進(jìn)行改進(jìn),已知?dú)埐顖D形命令為rcoplot,其調(diào)用格式為:rcoplot(r,rint),其中,輸入?yún)?shù)r,rint是多元回歸建模命令regress輸出的結(jié)果,運(yùn)行該命令后展示了殘差與置信區(qū)間的圖形。該命令有助于對(duì)建立的模型進(jìn)行分析,如果出現(xiàn)紅色的點(diǎn),則可認(rèn)為是異常的點(diǎn),那么此時(shí)可刪除異常點(diǎn),重新建模,最終得到改進(jìn)的回歸模型。那么在上面的圖形加入rcoplot(r,rint)這樣的程序于編輯器中,就可得到如下圖形從圖中可以看出第五個(gè)點(diǎn)和第十五個(gè)點(diǎn)屬于異常點(diǎn),因此我們可以去掉這兩個(gè)點(diǎn),重新擬合得到更加符合散點(diǎn)圖的曲線(xiàn)。實(shí)例2某個(gè)大壩的發(fā)電耗水率的主要要影響為庫(kù)水位,出庫(kù)流量,現(xiàn)在從某一天的12時(shí)02分14時(shí)08分范圍內(nèi)的出庫(kù)流量、庫(kù)水位對(duì)應(yīng)的耗水率利用多元回歸建立耗水量與出庫(kù)流量、庫(kù)水位的模型。某一天的時(shí)間庫(kù)水位出庫(kù)流量機(jī)組發(fā)電耗水率12:0265.041560160.4312:0465.011552960.1312:0665.091539060.0312:0865.141537058.2712:1065.191531957.3912:1265.321546858.1412:1465.341551458.2112:1665.371551258.2312:1865.391549858.4912:2065.411539758.5114:0265.471547358.3614:0465.391541658.0714:0665.581633557.8314:0865.561468756.6914:1065.071437256.2714:1265.841419255.77首先編寫(xiě)程序,輸入原始數(shù)據(jù),如下:A=65.04 15601 60.4365.03 15529 60.1365.09 15390 60.0365.14 15370 58.2765.19 15319 57.3965.32 15468 58.14 65.34 15514 58.2165.37 15512 58.2365.39 15498 58.4965.41 15397 58.5165.47 15473 58.3665.39 15416 58.0765.58 16335 57.8365.56 14687 56.6965.67 14372 56.2765.84 14192 55.77subplot(1,2,1),plot(A(:,1),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 車(chē)主與司機(jī)智能駕駛培訓(xùn)合同
- 大型金屬礦產(chǎn)采礦權(quán)抵押擔(dān)保合同范本
- 星球美術(shù)教學(xué)課件
- 醫(yī)療專(zhuān)業(yè)常見(jiàn)病癥診斷與處理知識(shí)測(cè)試試卷
- 2024-2025學(xué)年安徽省江南十校高一下學(xué)期5月份聯(lián)考化學(xué)試題及答案(人教B卷)
- 保險(xiǎn)客戶(hù)關(guān)系管理培訓(xùn)體系構(gòu)建考核試卷
- 3D打印在助聽(tīng)器制造中的應(yīng)用考核試卷
- 原料配比對(duì)人造板抗變形性能的影響考核試卷
- 中草藥養(yǎng)生與四季養(yǎng)生搭配考核試卷
- 在職護(hù)士考試試題及答案
- 八年級(jí)暑假前家長(zhǎng)會(huì)課件
- 育嬰員考試題型及答案
- 2025屆廣東省惠州惠城區(qū)五校聯(lián)考英語(yǔ)八下期末檢測(cè)試題含答案
- 科室建立血糖管理制度
- 四川成都東方廣益投資有限公司下屬企業(yè)招聘筆試題庫(kù)2025
- 華為公司試用期管理制度
- 保險(xiǎn)合規(guī)知識(shí)課件
- 2025-2030中國(guó)云原生保護(hù)平臺(tái)組件行業(yè)前景趨勢(shì)與投資盈利預(yù)測(cè)報(bào)告
- 商業(yè)大廈機(jī)電系統(tǒng)調(diào)試
- 2025企業(yè)并購(gòu)合同協(xié)議模板
- 【恒順醋業(yè)公司基于杜邦分析的盈利能力淺析14000字論文】
評(píng)論
0/150
提交評(píng)論