




已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
回歸分析的基本思想及其初步應(yīng)用本周題目:回歸分析的基本思想及其初步應(yīng)用本周重點:(1)通過對實際問題的分析,了解回歸分析的必要性與回歸分析的一般步驟;了解線性回歸模型與函數(shù)模型的區(qū)別;(2)嘗試做散點圖,求回歸直線方程;(3)能用所學(xué)的知識對實際問題進(jìn)行回歸分析,體會回歸分析的實際價值與基本思想;了解判斷刻畫回歸模型擬合好壞的方法相關(guān)指數(shù)和殘差分析。本周難點:(1)求回歸直線方程,會用所學(xué)的知識對實際問題進(jìn)行回歸分析. (2)掌握回歸分析的實際價值與基本思想. (3)能運(yùn)用自己所學(xué)的知識對具體案例進(jìn)行檢驗與說明. (4)殘差變量的解釋;(5)偏差平方和分解的思想;本周內(nèi)容: 一、基礎(chǔ)知識梳理回歸直線:如果散點圖中點的分布從整體上看大致在一條直線附近,我們就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫作回歸直線。求回歸直線方程的一般步驟:作出散點圖(由樣本點是否呈條狀分布來判斷兩個量是否具有線性相關(guān)關(guān)系),若存在線性相關(guān)關(guān)系求回歸系數(shù) 寫出回歸直線方程 ,并利用回歸直線方程進(jìn)行預(yù)測說明.2.回歸分析:對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法。建立回歸模型的基本步驟是:確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量;畫好確定好的解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(線性關(guān)系). 由經(jīng)驗確定回歸方程的類型. 按一定規(guī)則估計回歸方程中的參數(shù) (最小二乘法);得出結(jié)論后在分析殘差圖是否異常,若存在異常,則檢驗數(shù)據(jù)是否有誤,后模型是否合適等. 3.利用統(tǒng)計方法解決實際問題的基本步驟:(1)提出問題;(2)收集數(shù)據(jù);(3)分析整理數(shù)據(jù);(4)進(jìn)行預(yù)測或決策。4.殘差變量 的主要來源:(1)用線性回歸模型近似真實模型(真實模型是客觀存在的,通常我們并不知道真實模型到底是什么)所引起的誤差??赡艽嬖诜蔷€性的函數(shù)能夠更好地描述 與 之間的關(guān)系,但是現(xiàn)在卻用線性函數(shù)來表述這種關(guān)系,結(jié)果就會產(chǎn)生誤差。這種由于模型近似所引起的誤差包含在 中。(2)忽略了某些因素的影響。影響變量 的因素不只變量 一個,可能還包含其他許多因素(例如在描述身高和體重關(guān)系的模型中,體重不僅受身高的影響,還會受遺傳基因、飲食習(xí)慣、生長環(huán)境等其他因素的影響),但通常它們每一個因素的影響可能都是比較小的,它們的影響都體現(xiàn)在 中。(3)觀測誤差。由于測量工具等原因,得到的 的觀測值一般是有誤差的(比如一個人的體重是確定的數(shù),不同的秤可能會得到不同的觀測值,它們與真實值之間存在誤差),這樣的誤差也包含在 中。上面三項誤差越小,說明我們的回歸模型的擬合效果越好。二、例題選講例1:研究某灌溉渠道水的流速 與水深 之間的關(guān)系,測得一組數(shù)據(jù)如下:水深 1.401.501.601.701.801.902.002.10流速 1.701.791.881.952.032.102.162.21(1)求 對 的回歸直線方程;(2)預(yù)測水深為1.95 時水的流速是多少?分析:本題考查如何求回歸直線的方程,可先把有關(guān)數(shù)據(jù)用散點圖表示出來,若這些點大致分布在通過散點圖中心的一條直線附近,說明這兩個變量線性相關(guān),從而可利用我們學(xué)過的最小二乘估計思想及計算公式求得線性回歸直線方程。解:(1)由于問題中要求根據(jù)水深預(yù)報水的流速,因此選取水深為解釋變量,流速為預(yù)報變量,作散點圖:由圖容易看出, 與 之間有近似的線性關(guān)系,或者說,可以用一個回歸直線方程 來反映這種關(guān)系。由計算器求得 。 對 的回歸直線方程為 。(2)由(1)中求出的回歸直線方程,把 代入,易得 。計算結(jié)果表示,當(dāng)水深為 時可以預(yù)測渠水的流速為 。評注:建立回歸模型的一般步驟:(1)確定研究對象,明確兩個變量即解釋變量和預(yù)報變量;(2)畫出散點圖,觀察它們之間的關(guān)系;(3)由經(jīng)驗確定回歸方程類型(若呈線性關(guān)系,選用線性回歸方程);(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法);(5)得出結(jié)果后分析殘差圖是否有異常(個別數(shù)據(jù)對應(yīng)殘差過大,或殘差出現(xiàn)不隨機(jī)的規(guī)律性,等等),若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。例2:1993年到2002年中國的國內(nèi)生產(chǎn)總值(GDP)的數(shù)據(jù)如下:年份GDP199334634.4199446759.4199558478.1199667884.6199774462.6199878345.2199982067.5200089468.1200197314.82002104790.6(1)作GDP和年份的散點圖,根據(jù)該圖猜想它們之間的關(guān)系應(yīng)是什么。(2)建立年份為解釋變量,GDP為預(yù)報變量的回歸模型,并計算殘差。(3)根據(jù)你得到的模型,預(yù)報2003年的GDP,并查閱資料,看看你的預(yù)報與實際GDP的誤差是多少。(4)你認(rèn)為這個模型能較好地刻畫GDP和年份的關(guān)系嗎?請說明理由。解:(1)由表中數(shù)據(jù)制作的散點圖如下:從散點圖中可以看出GDP值與年份近線呈線性關(guān)系;(2)用yt表示GDP值,t表示年份,根據(jù)截距和斜率的最小二乘計算公式,得: 從而得線性回歸方程: 殘差計算結(jié)果見下表:GDP值與年份線性擬合殘差表年份19931994199519961997殘差-6422.269-1489.2383037.4935252.0244638.055年份19981999200020012002殘差1328.685-2140.984-1932.353-1277.622-993.791(3)2003年的GDP預(yù)報值為112976.360,根據(jù)國家統(tǒng)計局2004年統(tǒng)計,2003年實際GDP值為117251.9,所以預(yù)報與實際相-4275.540;(4)上面建立的回歸方程的R2=0.974,說明年份能夠解釋約97%的GDP值變化,因此所建立的模型能夠很好地刻畫GDP和年份的關(guān)系。說明: 關(guān)于2003年的GDP的值來源,不同的渠道可能會有所不同。例3:如下表所示,某地區(qū)一段時間內(nèi)觀察到的大于或等于某震級x的地震個數(shù)為N,試建立回歸方程表述二者之間的關(guān)系。震級33.23.43.63.844.24.44.64.85.0地震數(shù)28381203801479510695764155023842269819191356973震級5.25.45.65.866.26.46.66.87 地震數(shù)74660443527420614898574125 解:由表中數(shù)據(jù)得散點圖如下: 從散點圖中可以看出,震級x與大于該震級的地震次數(shù)N之間不呈線性相關(guān)關(guān)系,隨著x的減少,所考察的地震數(shù)N近似地以指數(shù)形式增長.做變換y=lgN,得到的數(shù)據(jù)如下表所示:x33.23.43.63.844.24.44.64.85y4.4534.3094.1704.0293.8833.7413.5853.4313.2833.1322.988x5.25.45.65.866.26.46.66.87 y2.8732.7812.6382.4382.3142.1701.9911.7561.6131.398 x和y的散點圖如下: 從這個散點圖中可以看出x和y之間有很強(qiáng)的線性相差性,因此可以用線性回歸模型擬合它們之間的關(guān)系。根據(jù)截距和斜率的最小二乘計算公式,得: 故線性回歸方程為: 相關(guān)指數(shù)R20.997,說明x可以解釋y的99.7%的變化。因此,可以用回歸方程 描述x和y之間的關(guān)系。例4:電容器充電后,電壓達(dá)到 ,然后開始放電,由經(jīng)驗知道,此后電壓 隨時間 變化的規(guī)律公式 表示,觀測得時間 時的電壓 如下表所示:012345678910100755540302015101055試求電壓 對時間 的回歸方程。分析:由于兩個變量不呈線性相關(guān)關(guān)系,所以不能直接利用線性回歸方程來建立兩個變量之間的關(guān)系,我們可通過對數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系,通過線性回歸模型來建立 與 之間的非線性回歸方程。解:對 兩邊取自然對數(shù)得 ,令 ,即 。由所給數(shù)據(jù)可得0123456789104.64.34.03.93.42.92.72.32.31.61.6其散點圖為:由散點圖可知 與 具有線性相關(guān)關(guān)系,可用 來表示。經(jīng)計算得: (最小二乘法), ,即 。所以, 。評注:一般地,有些非線性回歸模型通過變換可以轉(zhuǎn)化為線性回歸模型,即借助于線性回歸模型研究呈非線性回歸關(guān)系的兩個變量之間的關(guān)系:(1)如果散點圖中的點分布在一個直線狀帶形區(qū)域,可以選用線性回歸模型來建模;(2)如果散點圖中的點的分布在一個曲線狀帶形區(qū)域,要先對變量作適當(dāng)?shù)淖儞Q,再利用線性回歸模型來建模。 本周練習(xí):1.對具有相關(guān)關(guān)系的兩個變量統(tǒng)計分析的一種常用的方法是( )A回歸分析 B.相關(guān)系數(shù)分析 C.殘差分析 D.相關(guān)指數(shù)分析2.在畫兩個變量的散點圖時,下面敘述正確的是( )A預(yù)報變量在 軸上,解釋變量在 軸上 B.解釋變量在 軸上,預(yù)報變量在 軸上 C.可以選擇兩個變量中任意一個變量在 軸上D.可以選擇兩個變量中任意一個變量在 軸上3.兩個變量相關(guān)性越強(qiáng),相關(guān)系數(shù) ( )A越接近于0 B.越接近于1 C.越接近于1 D.絕對值越接近14.若散點圖中所有樣本點都在一條直線上,解釋變量與預(yù)報變量的相關(guān)系數(shù)為( )A0 B.1 C.1 D.1或15.一位母親記錄了她兒子3到9歲的身高,數(shù)據(jù)如下表:年齡(歲)3456789身高( 94.8104.2108.7117.8124.3130.8139.0由此她建立了身高與年齡的回歸模型 ,她用這個模型預(yù)測兒子10歲時的身高,則下面的敘述正確的是( )A.她兒子10歲時的身高一定是145.83 B.她兒子10歲時的身高在145.83 以上C.她兒子10歲時的身高在145.83 左右 D.她兒子10歲時的身高在145.83 以下6.兩個變量有線性相關(guān)關(guān)系且正相關(guān),則回歸直線方程中, 的系數(shù) ( )A. B. C. D. 7.兩個變量有線性相關(guān)關(guān)系且殘差的平方和等于0,則( )A.樣本點都在回歸直線上 B.樣本點都集中在回歸直線附近 C.樣本點比較分散 D.不存在規(guī)律8.在建立兩個變量 與 的回歸模型中,分別選擇了4個不同的模型,它們的相關(guān)指數(shù) 如下,其中擬合最好的模型是( )A.模型1的相關(guān)指數(shù) 為0.98 B.模型2的相關(guān)指數(shù) 為0.80C.模型3的相關(guān)指數(shù) 為0.50 D.模型4的相關(guān)指數(shù) 為0.25 9.相關(guān)指數(shù) 。10.某農(nóng)場對單位面積化肥用量 和水稻相應(yīng)產(chǎn)量 的關(guān)系作了統(tǒng)計,得到數(shù)據(jù)如下:15202530354045330345365405445450455如果 與 之間具有線性相關(guān)關(guān)系,求出回歸直線方程,并預(yù)測當(dāng)單位面積化肥用量為 時水稻的產(chǎn)量大約是多少?(精確到 )11.假設(shè)美國10家最大的工業(yè)公司提供了以下數(shù)據(jù):公司銷售總額經(jīng)x1/百萬美元利潤x2/百萬美元通用汽車 1269744224福特969333835埃克森866563510IBM634383758通用電氣552643939美孚509761809菲利普莫利斯390692946克萊斯勒36156359杜邦352092480德士古324162413(1)作銷售總額和利潤的散點圖,根據(jù)該圖猜想它們之間的關(guān)系應(yīng)是什么形式;(2)建立銷售總額為解釋變量,利潤為預(yù)報變量的回歸模型,并計算殘差;(3)你認(rèn)為這個模型能較好地刻畫銷售總額和利潤之間的關(guān)系嗎?請說明理由。參考答案:A B D B C A A A 9 10.由于問題中要求根據(jù)單位面積化肥用量預(yù)報水稻相應(yīng)的產(chǎn)量,因此選取單位面積的化肥用量為解釋變量,相應(yīng)水稻的產(chǎn)量為預(yù)報變量,作散點圖: 由圖容易看出, 與 之間有近似的線性關(guān)系,或者說,可以用一個回歸直線方程 來反映這種關(guān)系。由計算器求得 。 對 的回歸直線方程為 ( *)。由(*)中求出的回歸直線方程,把 代入,易得 。計算結(jié)果表示,當(dāng)單位面積化肥用量為 時水稻的產(chǎn)量大約是 .11(1)將銷售總額作為橫軸,利潤作為縱軸,根據(jù)表中數(shù)據(jù)繪制散點圖如下:由于散點圖中的樣本點基本上在一個帶形區(qū)域分布,猜想銷售總額與利潤之間呈現(xiàn)線性相關(guān)關(guān)系;(2)由最小二乘法的計算公式,得: 則線性回歸方程為: 其殘差值計算結(jié)果見下表:銷售總額12697496933866566343855264利潤422438353
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程經(jīng)濟(jì)實踐問題解答試題及答案
- 經(jīng)濟(jì)法概論學(xué)習(xí)技巧試題及答案交流
- 工程經(jīng)濟(jì)的標(biāo)準(zhǔn)化進(jìn)程試題及答案
- 遠(yuǎn)程辦公外包合同(2篇)
- 2024年漳州市華安縣招聘中小學(xué)教師真題
- 2025年工程經(jīng)濟(jì)國際比較分析試題及答案
- 行政管理的公共關(guān)系學(xué)職業(yè)發(fā)展試題及答案
- 公共關(guān)系學(xué)危機(jī)預(yù)防試題及答案
- 市政工程控制系統(tǒng)試題及答案
- 2025年經(jīng)濟(jì)法概論復(fù)習(xí)備考試題及答案
- 2024年秋江蘇開放大學(xué)文獻(xiàn)檢索與論文寫作參考范文一:行政管理專業(yè)
- 《電力市場概論》 課件 第五章 系統(tǒng)安全與輔助服務(wù)
- 《10000以內(nèi)數(shù)的讀、寫法》(教案)-二年級下冊數(shù)學(xué)人教版
- 2024年湖南省高考生物試卷真題(含答案解析)
- 秘書公文寫作范文
- 《民法典》2024年知識考試題庫(含答案)
- 《籃球原地雙手胸前傳接球》教案 (三篇)
- 旅游經(jīng)濟(jì)專業(yè)知識和實務(wù)經(jīng)濟(jì)師考試(中級)試卷及解答參考(2025年)
- 高中化學(xué)新課標(biāo)知識考試題庫大全(新版)
- 2024年江蘇南京金陵中學(xué)特長生選拔考試數(shù)學(xué)試題(含答案詳解)
- 《論語》全文帶拼音有注釋(完整版)
評論
0/150
提交評論