相關(guān)及回歸分析.ppt_第1頁
相關(guān)及回歸分析.ppt_第2頁
相關(guān)及回歸分析.ppt_第3頁
相關(guān)及回歸分析.ppt_第4頁
相關(guān)及回歸分析.ppt_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

相關(guān)及回歸分析,方法論,Analyze 概要 DATA 收集計劃 Graph 分析 假設(shè)檢定概要 平均的檢定,分散的檢定 比率的檢定 相關(guān)及回歸分析,相關(guān)及回歸分析,學(xué)習(xí)目標(biāo) 理解相關(guān)、回歸分析的概念及用語。 理解相關(guān)、回歸分析的使用目的。 理解利用Minitab的相關(guān)分析方法。 理解利用Minitab的回歸分析方法。,定義,相關(guān)分析(Correlation Analysis) : 是把計量型輸出變量和計量型輸入變量之間相關(guān)程度, 利用相關(guān)常數(shù)(r)“數(shù)量化”的技法。 回歸分析(Regression Analysis) : 導(dǎo)出輸入變量X和輸出變量Y的函數(shù)關(guān)系,預(yù)測輸出變量的 統(tǒng)計性分析技法。 回歸式(Regression Equation) : 為預(yù)測對應(yīng)的輸出值,利用輸入值的預(yù)測方程式。,為什么使用這樣的工具?,不防礙工程進(jìn)行,對工程有意義的 DATA收集可能。 進(jìn)行DOE時跟加人為的變化比較 相關(guān)關(guān)系是提供Graph分析,輸入變量和輸出變量的相關(guān)性計量化而確認(rèn)。 回歸分析使用于為了管理輸入變量的預(yù)測式導(dǎo)出。 回歸分析能顯示輸入變量和輸出變量之間的因果關(guān)系,所以能決定潛在Xs是否為Vital Few Xs., 散點(diǎn)圖 (Scatter Diagram), 相關(guān)分析 (Correlation Analysis),在統(tǒng)計學(xué)中最有興趣的問題中的一個變量間相關(guān)性分析的方法 , 通過散點(diǎn)圖和相關(guān)常數(shù)能分析。,例) 智能指數(shù)和學(xué)業(yè)成績、吸咽量和肺癌的發(fā)生率、身高和體重、工程溫度和 制品強(qiáng)度、運(yùn)動量和肺活量間的關(guān)系、所得和消費(fèi)支出。,相關(guān)分析的第一階段,把相互對應(yīng)的資料 用作表平面上的點(diǎn)來表示的Graph, 能大概確認(rèn)兩個變量之間的關(guān)系。,相關(guān)分析, 相關(guān)常數(shù) (Correlation Coefficient),定量表示兩個變量之間線形關(guān)系的指標(biāo),并不表示函數(shù)關(guān)系。 一般用 表示,其范圍是 1 1. 一般不可知道的正確值, 因此使用從Sample中推定的值 r 。, 相關(guān)常數(shù) (Correlation Coefficient)的性質(zhì),r 值,(+) 時 陽的相關(guān)關(guān)系 () 時 陰的相關(guān)關(guān)系 接近于0時,沒有相關(guān)關(guān)系。 接近于-1 或1時有強(qiáng)的相關(guān)關(guān)系。,相關(guān)分析, 散點(diǎn)圖和相關(guān)關(guān)系,強(qiáng)的陽的相關(guān)關(guān)系,弱的陽的相關(guān)關(guān)系,中間程度的陽的相關(guān)關(guān)系,強(qiáng)的陰的相關(guān)關(guān)系,弱的陰的相關(guān)關(guān)系,中間程度的陰的相關(guān)關(guān)系,相關(guān)分析,相關(guān)常數(shù)的亂用和誤用,檢定兩個變量之間存在相關(guān)關(guān)系,并不是一個變量成為 另一個變量的原因。 可能會藏在對兩個變量都有影響的第三變量。 即,兩個變量之間存在相關(guān)關(guān)系的結(jié)論,并不是一個變量 成為另一個變量的原因。,相關(guān)關(guān)系并不一定意味著因果關(guān)系!,通過下例觀察散點(diǎn)圖和相關(guān)分析。,廣告費(fèi) (10萬) 銷售額 (100萬) 廣告費(fèi) (10萬) 銷售額 (100萬),4 9 12 23 8 20 6 18 9 22 10 25 8 15 6 10 7 17 9 20,下面是表示某公司的廣告費(fèi)用和銷售額之間關(guān)系的資料。 求這公司的廣告費(fèi)和銷售額的相關(guān)常數(shù)。,例題1,相關(guān)分析,Step 1,Work sheet 里輸入DATA,(Correlation.mtw),Step 2,Graph Plot,通過Plot 作成散點(diǎn)圖的結(jié)果, 預(yù)測是陽的相關(guān)關(guān)系。,( Y 欄里C2, X欄里 輸入C1),相關(guān)分析,Step 3,Stat Basic Statistics Correlation,Step 4,Session 結(jié)果確認(rèn),選擇兩個 變量列,相關(guān)常數(shù)是 0.853有陽的相關(guān)關(guān)系, p 值為 0.002小于 留意水準(zhǔn) 0.05,所以廣告費(fèi)和銷售額的相關(guān)關(guān)系是有影響的。,相關(guān)常數(shù),p 值,相關(guān)分析, 回歸分析 (Regression Analysis),為了查明變量之間函數(shù)的相關(guān)性而假定某數(shù)學(xué)Model,從已測定變量的Data中 推定其Model的統(tǒng)計性分析方法。根據(jù)這樣的函數(shù)Model,從一個變量的變化 能預(yù)測另一個變量的變化,例) 父親和兒子的身高關(guān)系 工程溫度影響的制品強(qiáng)度,輸出變量 : 欲預(yù)測的變量,受輸入變量影響的變量。 輸入變量 : 影響輸出變量的變量。, 輸入變量和輸出變量(反應(yīng)變量),父親的身高和工程溫度是獨(dú)立變量, 兒子的身高和制品的強(qiáng)度是從屬變量!,回歸分析,R-Sq值叫決定系數(shù)用 R2表示。 在0 R2 1范圍,總變動中被回歸線說明的變動所占的比率。 R2 值越接近1時,回歸線越高,判斷有意義。 合理的值是多少? 根據(jù)情況不同?;瘜W(xué)者要求的是 0.99程度的R2 值, 但根據(jù)工程和產(chǎn)業(yè)不同。一般值為0.7以上是可以認(rèn)為輸出變量和 輸入變量的關(guān)系大。 如果R2是0.679(67.9%) ,用回歸方程式能說明散布的67.9%, 剩下的 32.1%是別的原因造成的。,決定系數(shù)(Coefficient of Determination ),回歸分析,通過下例觀察回歸分析和決定系數(shù)。,例題2,為了知道機(jī)械的使用年度和 整備費(fèi)用之間有什么關(guān)系,得到了有關(guān)對相同機(jī)械 整備記錄的如下DATA。,3 1 5 8 1 4 2 6 9 3 5 7 2 6,39 24 115 105 50 86 67 90 140 112 70 186 43 126,使用年度(年) 整備費(fèi)用(千元),1) 對這個DATA求說明 x與 y之間關(guān)系的單純回歸方程式。 2) 使用年度為10年時,整備費(fèi)用是多少?,回歸分析,Step 1,Work sheet里 DATA 輸入,Step 2,Stat Regression Regression,選擇輸出變量列,選擇輸入變量列,(Regression.mtw),回歸分析,選擇顯示在殘差Graph的 殘差形態(tài),Regression - Graphs : 選擇為幫助最佳回歸模型分析的殘差 Plot 的形態(tài),Histogram of residuals : 殘差Histogram 作成 Normal plot of residuals : 為殘差的正規(guī)性檢定而作成Graph Residuals versus fits : 作成殘差和被適合值的圖 Residuals versus order : 作成殘差對觀測順序的圖 Residuals versus the variables : 作成殘差對指定變量的圖,回歸分析,Residual Plots,輸入所需的x 值,通過得出的回歸式 可以求 值和信賴區(qū)間。 輸入10,能計算出10年后的整備 費(fèi)用(預(yù)測值)。,Regression - Options : 可以選擇加重值列,預(yù)測新的觀測值確認(rèn)信賴區(qū)間。,回歸分析,Storage : 選擇從Work sheet 的輸入變量和輸出變量列的下一個列開始被Check的項(xiàng)目。,Results :調(diào)整對顯示在Window Section的回歸模型的分析結(jié)果范圍。,回歸分析,Step 3,Session結(jié)果確認(rèn),關(guān)于整備費(fèi)用和使用年度的回歸式是,決定系數(shù)R-Sq 值為61%,在全體變動中按回歸直線 說明的變動是61%.,使用年度10年的機(jī)械的整備費(fèi)用 期待值是165.48,對其的95% 信賴區(qū)間是(123.66, 207.29).,回歸分析,p 值為0.001小于留意水準(zhǔn)0.05, 所以認(rèn)為上面的回歸式有意。,R-Sq(adj)是在回歸式上每追加變量R-Sq 值就增加的調(diào)整值。 輸入變量兩個以上時,此值有意義, 所以一般分析 R-Sq(adj).,Step 1,Stat Regression Fitted Line Plot,選擇輸出變量列,選擇輸入變量列,回歸模型的類型決定 (1次, 2次, 3次),回歸分析,Fitted Line Plot : 欲用Graph分析時活用。,Step 2,Graph 結(jié)果確認(rèn),回歸分析, 殘差分析,從實(shí)際值中減掉被回歸模型適合的值叫殘差,通過殘差分析我們要確認(rèn)模型的適合性。,殘差分析,殘差越小,推定的回歸式越準(zhǔn)確 說明實(shí)際觀測結(jié)果。 殘差是誤差最好的推定值。 殘差按獨(dú)立變量的大小順序或者 資料的輸入順序排列時,確認(rèn)他 們對0對稱 ,不顯示特別的傾向。,殘差,實(shí)際值,回歸模型,殘差 :,例題3,為了知道機(jī)械的使用年度和整備費(fèi)用之間有什么關(guān)系,得到了對相同機(jī)械的 整備記錄有關(guān)的如下 Data。得出適合值和殘差后執(zhí)行殘差分析。,3 1 5 8 1 4 2 6 9 3 5 7 2 6,39 24 115 105 50 86 67 90 140 112 70 186 43 126,使用年度(年) 整備費(fèi)用(千元),殘差分析,Step 1,Work sheet 里輸入DATA,(Residuals.mtw),Step 2,Stat Regression Regression,選擇從屬變量列,選擇獨(dú)立變量列,殘差分析,Storage,Fits(適合值) Check,Residuals(殘差) Check,Step 3,Work sheet 結(jié)果確認(rèn),殘差和 適合值被儲存。,Step 4,Stat Regression Residual Plots,選擇適合值列,選擇殘差列,殘差分析,Step 5,確認(rèn)Graph,殘差分析, 結(jié)果分析,通過Normal Plot of Residuals 數(shù)據(jù)分布接近于對角線,所以可以說殘差的分布 接近于正態(tài)分布。 ( 通過Stat Basic Statistics Normality Test 更仔細(xì)地做到正規(guī)性檢定。) 在I Chart of Residuals中不離開管理限界線,因不具有任何Perform, 所以可以說殘差的分布是穩(wěn)定的。 Histogram of Residuals 是表示殘差形態(tài)的Graph。 Residuals vs. Fits 是殘差對適合值的Graph,在0近處任意地分布。 因此,可以說回歸模型是適合的。,殘差分析,實(shí)習(xí),按下面方法做紙飛機(jī)的實(shí)習(xí)。 1) 機(jī)翼長度為 6 14cm 2) 機(jī)翼長度按每次5mm差剪掉。 3) 測定2.5m高度的降落時間。 得到回歸方程式后,求降落時間成為2秒及2.5秒時的翅膀的長度。,90 分鐘,練習(xí)問題,1. 下表是檢查人的記憶力x 和判斷力 y 的 。,記憶力 x 11 10 14 18 10 6 12 8 15 16 判斷力 y 6 4 6 9 2 3 3 9 6 7,按以下順序分析。,1) 記述X變量和Y變量之間的關(guān)系。(例: X減少時,Y增加) 2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論