醫(yī)藥信息分析與決策回歸分析課件_第1頁
醫(yī)藥信息分析與決策回歸分析課件_第2頁
醫(yī)藥信息分析與決策回歸分析課件_第3頁
醫(yī)藥信息分析與決策回歸分析課件_第4頁
醫(yī)藥信息分析與決策回歸分析課件_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

醫(yī)藥信息分析與決策第二章回歸分析本章要點一、概述二、回歸分析三、時間序列分析四、MicrosoftSQLServer2005實踐回歸分析與時間序列分析2*一、概述現實生活中的許多現象之間存在著相互依賴、相互制約的關系,這些關系在量上主要有兩種類型:確定性關系非確定性關系3*二、回歸分析編號NO體重(kg)肺活量(ml)編號NO體重(kg)肺活量(ml)編號NO體重(kg)肺活量(ml)160.145081156.9541812155.114238260.3844691257.2240972253.244523359.7443981355.9640632360.14516458.0440681457.8743342460.54473559.6743391556.8743012559.044297659.4443931655.9741412659.014123758.743891756.0739052759.74216859.7543061855.2839432859.064077960.543951955.7941952959.1242871058.7244622054.5640393054.2142015體重與肺活量之間有何關系,這里面的人都正常嗎?如何處理?*回歸分析6*回歸分析7*二、回歸分析

一元線性回歸9*二、回歸分析

最小二乘法10最小二乘法*二、回歸分析

最小二乘法最小二乘法:擬合回歸模型的原則是尋求代表性最好的模型是一個隨機變量;的均值為零,即;在每一個時期中,的方差為常量,即各個相互獨立;與自變量無關。11*二、回歸分析

最小二乘法利用EXCEL計算:單擊菜單欄中“工具”→“加載宏”命令,選擇相應的“分析工具庫”和“分析工具庫–VBA函數”復選框,單擊“確定”按鈕,完成加載。13*二、回歸分析

最小二乘法利用EXCEL計算:單擊“工具”→“數據分析”命令,選中“回歸”選項,單擊“確定”按鈕。14Y=760.25+60.18x*15*二、回歸分析

假設檢驗回歸系數顯著性檢驗檢驗假設:檢驗統(tǒng)計量:檢驗規(guī)則:給定顯著性水平α,若,則回歸系數顯著。17*二、回歸分析

假設檢驗回歸模型的顯著性檢驗檢驗假設:回歸方程不顯著回歸方程顯著檢驗統(tǒng)計量:檢驗規(guī)則:給定顯著性水平,若,則回歸系數顯著。18*二、回歸分析

假設檢驗檢驗之間是否存在自相關關系當時,如果,認為存在正自相關;如果,認為無自相關;當時,如果,認為存在負自相關;如果,認為無自相關;如果,不能確定是否自相關;當D.W.值在2左右時,模型不存在一階自相關。19*二、回歸分析

非線性回歸分析非線性回歸分析*21三、時間序列分析TimeSeriesAtimeseriesisasequenceofdatavaluesforavariableY1,Y2,…,Ynthatareseparatedbyequaltimeintervals.Ytisthenotationforthevalueoftimeseriesattimet.回歸分析中,如果自變量是時間變量,則將按時間順序產生和排列的離散型觀測數據序列()(t=1,2,…,T)稱作時間序列,t通常用年、月、季或天來計量。根據時間序列,揭示相應系統(tǒng)的內在統(tǒng)計特性和發(fā)展規(guī)律的統(tǒng)計方法,就稱時間序列分析。*22三、時間序列分析Example:NumberofpeopleemployedatInternationalSystemsCorporationfor20quarters.QuarterFiveYearsAgoFourYearsAgoThreeYearsAgoTwoYearsAgoLastYear1st1501601751802002nd1751902002202503rd4504604804955204th140145160180190*23三、時間序列分析Example:NumberofpeopleemployedatInternationalSystemsCorporationfor20quarters.*25三、時間序列分析Example:thefollowingdataindicatethenumberofmergersthattookplaceinanindustryovera19-yearperiod.*26三、時間序列分析FourComponentsofTimeSeriesTrends(長期趨勢):Trendsintimeseriesarethelong-termmovementsoftheseriesthatcanbecharacterizedbysteadyoronlyslightlyvariableratesofchange.*29三、時間序列分析FourComponentsofTimeSeriesSeasonalvariations(季節(jié)變):Seasonalvariationsinatimeseriesarethosevariationsthatoccurratherpredictablyataparticulartimeeachyear.*30三、時間序列分析FourComponentsofTimeSeriesCyclicalvariations(周期變化):Cyclicalvariationsaremovementsinatimeseriesthatarerecurrentbutthatoccurincyclesoflongerthanayear.*31三、時間序列分析FourComponentsofTimeSeriesIrregularvariations(不規(guī)則變化):Irregularvariationsconstitutetheclassoftimeseriesmovementsthatdonotfitintotheotherthreecategories.*32三、時間序列分析ClassicalTimeSeriesModel(1)MultiplicativeTimeSeriesModel Y=T×S×C×I(2)AdditiveTimeSeriesModel Y=T+S+C+I(3)MixedTimeSeriesModel Y=T×S+C×I*331.趨勢外推法趨勢外推法(Trendextrapolation)是根據過去和現在的發(fā)展趨勢推斷未來的一類方法的總稱?;驹硎腔貧w分析,即以時間為自變量,以時間系列為因變量進行回歸分析。*342.移動平均法對于平穩(wěn)型時間數列可取最近n期數值的算術平均作為后期的預測值。其基本原理是:首先選擇一個固定的時間周期n,將最近n期的數據加以平均作為下一期的預測值。*352.移動平均法移動平均方法具有以下的特點:1.當時間序列的波動較大時,最近期的觀察值應該賦予最大的權數,較遠時期的觀察值賦予的權數應該依次遞減;當時間序列的波動不是很大時,對各期的觀察值應賦予近似相等的權數。只使用最近期的數據,在每次計算移動平均值時,移動的間隔都為固定的k;2.主要適合對較為平穩(wěn)的時間序列進行預測;3.移動間隔和權數的選擇是該方法的關鍵。*363.指數平滑法它是加權平均的一種特殊形式,觀察值距離預測時期越久遠,權數變得越小,且呈現指數下降趨勢,因此稱為指數平滑。指數平滑法根據平滑的次數包括一次指數平滑、二次指數平滑、三次指數平滑等.用的最多的是一次平滑法,下面對一次平滑進行介紹。*373.指數平滑法指數平滑法具有以下的特點:不同的會對預測結果產生不同的影響,阻尼系數也是如此;在實際應用中,當時間序列有較大的隨機波動時,宜選用較大的值(如0.9),以便能很快跟上近期的變化;當時間序列比較平穩(wěn)時,宜選用較小的;選擇平滑系數時,還應考慮預測誤差。確定時,可嘗試選擇幾個進行預測,然后找出預測誤差最小的那個作為最后的值。*38例:某市某一惡性疾病死亡率統(tǒng)計數據表年度死亡率年度死亡率年度死亡率199045.12199659.71200265.5199151.56199755.5200358.69199259.21199859.11200464.79199356.68199964.93200569.11199442.71200058.63200661.37199561.15200165.41200772.82*39某市某一惡性疾病死亡率*403.指數平滑法據此預測2008年該病的死亡率,以便做出相應的預防措施。

*414.隨機時間序列分析隨機時間序列分析是指僅用它的過去值及隨機擾動項所建立起來的模型進行分析,即描述序列{xt}某一時刻t和前p個時刻序列值之間的相互關系的分析方法,一般的p階自回歸過程AR(p)為:*424.隨機時間序列分析建立具體的時間序列模型時,需解決如下三個問題:1)模型的具體形式。2)時序變量的滯后期。3)隨機擾動項的結構。例如,取線性方程、一期滯后以及白噪聲隨機擾動項,模型將是一個1階自回歸過程:*434.隨機時間序列分析*44四、MicrosoftSQLServer2005實踐回歸分析與時間序列分析1.建立數據庫2.導入數據3.建立數據挖掘模型4.數據挖掘查看器45*北京市SARS傳播部分統(tǒng)計數據表日期已確診病例累計現有疑似病例死亡累計治愈出院累計日期已確診病例累計現有疑似病例死亡累計治愈出院累計4月20日33940218335月23日246511791605824月21日48261025435月24日249011341636674月22日58866628465月25日249911051677044月23日69378235555月26日250410691687474月24日77486339645月27日251210051728284月25日87795442735月28日25149411758664月26日988109348765月29日25178031769284月27日1114125556785月30日252076017710064月28日1199127559785月31日252174718110874月29日1347135866836月1日252273918111244月30日1440140875906月2日252273418111575月1日15531415821006月3日252272418111895月2日16361468911096月4日252271818112635月3日17411493961156月5日252271618113215月4日180315371001186月6日252271318314035月5日189715101031216月7日252366818314465月6日196015231071346月8日252255018415435月7日204915141101416月9日252245118416535月8日213614861121526月10日252235118617475月9日217714251141686月11日252325718618215月10日222713971161756月12日252315518718765月11日226514111201866月13日25227118719445月12日230413781292086月14日252241891994

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論