版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
市場(chǎng)信息采集與分析技術(shù)主講:劉勤俠
例1兩種不同水稻品種,分別在5個(gè)田塊上試種,其產(chǎn)量如下:甲品種乙品種田塊面積(畝)田塊面積(畝)產(chǎn)量(公斤)產(chǎn)量(公斤)1.21.11.00.90.86004954455404201.51.41.21.00.9840770540520450求:①分別計(jì)算兩品種的單位面積產(chǎn)量;②計(jì)算兩品種畝產(chǎn)量的標(biāo)準(zhǔn)差;③假定生產(chǎn)條件相同,則哪一品種穩(wěn)定性較好,宜推廣?2024/2/122分析:產(chǎn)量()=畝產(chǎn)()×面積()總產(chǎn)量=總面積=標(biāo)準(zhǔn)差公式:平均數(shù):按公式內(nèi)容設(shè)計(jì)表格:5004504456005251.21.11.00.90.86004954455404200
-50–5510025
275030259000500甲品種乙品種5605505204505001.51.41.01.20.98407705205404504030-70-20240012605880360合計(jì)5.0250015275合計(jì)6.0312099000
0
02024/2/123(1)(2)×100%=11.06%×100%=7.8%(3)因V乙<V甲,故乙品種具有較大穩(wěn)定性,宜于推廣。2024/2/1242024/2/1252024/2/1262024/2/1272024/2/1282024/2/1292024/2/12102024/2/12112024/2/12122024/2/12132024/2/12142024/2/12152024/2/1216模塊五
如何分析市場(chǎng)信息數(shù)據(jù)任務(wù)一如何進(jìn)行靜態(tài)分析任務(wù)二如何進(jìn)行動(dòng)態(tài)分析任務(wù)三如何進(jìn)行相關(guān)回歸分析2024/2/1217任務(wù)二
如何進(jìn)行動(dòng)態(tài)分析
案例任務(wù)要求任務(wù)分析任務(wù)學(xué)習(xí)任務(wù)實(shí)施任務(wù)評(píng)價(jià)2024/2/1218
靜態(tài)分析是在相同時(shí)間內(nèi)對(duì)現(xiàn)象之間的相互關(guān)系進(jìn)行比較分析的方法。但是,任何社會(huì)經(jīng)濟(jì)現(xiàn)象都有一個(gè)產(chǎn)生和發(fā)展變化的過程,因此,僅有靜態(tài)分析是不夠的,還必須從動(dòng)態(tài)的角度對(duì)事物的發(fā)展?fàn)顟B(tài)進(jìn)行分析。本次任務(wù)就是要求各項(xiàng)目小組用動(dòng)態(tài)分析方法分析數(shù)據(jù)。例如要做徐州易初蓮花超市自有品牌滿意度調(diào)查研究,本次的任務(wù)就是用動(dòng)態(tài)分析方法分析徐州易初蓮花超市自有品牌滿意度相關(guān)數(shù)據(jù)。任務(wù)要求2024/2/1219
本次任務(wù)就是要求用動(dòng)態(tài)分析方法分析數(shù)據(jù)。大家想一想怎樣進(jìn)行動(dòng)態(tài)分析呢?動(dòng)態(tài)分析有哪些方法呢?各小組該怎樣完成本次的任務(wù)呢?這就必須進(jìn)入下一個(gè)環(huán)節(jié)先進(jìn)行學(xué)習(xí)。任務(wù)分析2024/2/1220任務(wù)學(xué)習(xí)一、時(shí)間數(shù)列的含義二、動(dòng)態(tài)分析指標(biāo)(一)發(fā)展水平(二)發(fā)展速度(三)增長速度三、長期趨勢(shì)的分析與測(cè)定四、季節(jié)變動(dòng)的分析與測(cè)定返回2024/2/12211、時(shí)間數(shù)列的概念時(shí)間數(shù)列是指將同類指標(biāo)在不同時(shí)間上的數(shù)值按時(shí)間先后順序排列起來所形成的統(tǒng)計(jì)數(shù)列,也叫時(shí)間序列或動(dòng)態(tài)數(shù)列。
表1998~2002年我國電話用戶總數(shù)
2024/2/1222動(dòng)態(tài)分析指標(biāo)(一)發(fā)展水平
時(shí)間數(shù)列中各時(shí)間上對(duì)應(yīng)的指標(biāo)數(shù)值稱為發(fā)展水平。發(fā)展水平通常用來表示,各期發(fā)展水平可以分別用來表示。其中為最初水平,為中間水平,排在最后的為最末水平,其它各期水平為中間水平。
2024/2/1223動(dòng)態(tài)分析指標(biāo)(一)發(fā)展速度
發(fā)展速度是兩個(gè)不同時(shí)期發(fā)展水平的比值,表明現(xiàn)象發(fā)展變化的相對(duì)程度,即報(bào)告期水平是基期水平的百分之幾或若干倍,常用百分?jǐn)?shù)或倍數(shù)表示,計(jì)算公式為:發(fā)展速度=2024/2/1224發(fā)展速度1、定基發(fā)展速度時(shí)間數(shù)列中報(bào)告期水平與某一固定時(shí)期水平(通常為最初水平)的比值,即它是報(bào)告期相對(duì)于基期的現(xiàn)象總發(fā)展速度。2、環(huán)比發(fā)展速度環(huán)比發(fā)展速度是時(shí)間數(shù)列中報(bào)告期水平與前一期水平的比值,它表明現(xiàn)象在相鄰兩個(gè)時(shí)期的逐期發(fā)展變化情況。2024/2/1225動(dòng)態(tài)分析指標(biāo)(二)增長速度增長速度是報(bào)告期增長量與基期水平的比值,它表明現(xiàn)象的報(bào)告期水平比基期增長了百分之幾或若干倍。增長速度
2024/2/1226增長速度1、定基增長速度
定基增長速度是指報(bào)告期累計(jì)增長量與某一固定基期水平的比值,它表明社會(huì)經(jīng)濟(jì)現(xiàn)象在較長時(shí)間內(nèi)總的增長程度。
2、環(huán)比增長速度環(huán)比增長速度是指報(bào)告期的逐期增長量與前一期水平的比值,表明了某種社會(huì)經(jīng)濟(jì)現(xiàn)象逐期的增長程度。2024/2/1227常用的動(dòng)態(tài)指標(biāo)水平動(dòng)態(tài)指標(biāo) 1·增長量計(jì)算公式逐期增長量。說明水平法適用于多期增長量平穩(wěn)變化的數(shù)列總和法適用于各期增長變化較大的數(shù)列。累計(jì)增長量2·平均增長量2024/2/1228常用的動(dòng)態(tài)指標(biāo)速度動(dòng)態(tài)指標(biāo)1·發(fā)展速度計(jì)算公式環(huán)比發(fā)展速度。說明水平法-各環(huán)比發(fā)展速度的幾何平均數(shù)。定基發(fā)展速度2·平均發(fā)展速度方程法可查《平均發(fā)展速度查對(duì)表》。3·(平均)增長速度=(平均)發(fā)展速度-100%2024/2/1229時(shí)間數(shù)列的分解和測(cè)定一、時(shí)間數(shù)列的構(gòu)成與分解1.社會(huì)經(jīng)濟(jì)指標(biāo)的時(shí)間數(shù)列包含以下四種變動(dòng)因素:(1)長期趨勢(shì)(T)(2)季節(jié)變動(dòng)(S)(3)循環(huán)變動(dòng)(C)(4)隨機(jī)變動(dòng)(I)可解釋的變動(dòng)——不規(guī)則的不可解釋的變動(dòng)2.時(shí)間數(shù)列的經(jīng)典模式:(1)加法模型:Y=T+S+C+I計(jì)量單位相同的總量指標(biāo)是對(duì)長期趨勢(shì)所產(chǎn)生的偏差,(+)或(-)(2)乘法模型:Y=T·S·C·I計(jì)量單位相同的總量指標(biāo)是對(duì)原數(shù)列指標(biāo)增加或減少的百分比2024/2/12303.變動(dòng)因素的分解:(1)加法模型用減法。例:T=Y-(S+C+I)(2)乘法模型用除法。例:T=Y/(S·C·I)二、長期趨勢(shì)(T)的測(cè)定(一)修勻法: 1、時(shí)距擴(kuò)大法2、移動(dòng)平均法例例奇數(shù)偶數(shù)例移動(dòng)項(xiàng)數(shù)新數(shù)列項(xiàng)數(shù)=原數(shù)列項(xiàng)數(shù)-移動(dòng)項(xiàng)數(shù)+1(二)長期趨勢(shì)的數(shù)學(xué)模型(以時(shí)間t為自變量構(gòu)造回歸模型)例t-時(shí)期數(shù)按序隨意編制例例2024/2/1231返回原數(shù)列新數(shù)列y1y4y2y3y5y6原數(shù)列新數(shù)列y1y4y2y3y5y6時(shí)間時(shí)期數(shù)數(shù)列t1t2t3t4t5t6t71234567y1y2y3y4y5y6y7時(shí)間時(shí)期數(shù)數(shù)列t1t2t3t4t5t6t7-3-2-10123y1y2y3y4y5y6y7時(shí)間時(shí)期數(shù)數(shù)列t1t2t3t4t5t6-5-3-1135y1y2y3y4y5y62024/2/1232某企業(yè)1992年~2003年產(chǎn)量的長期趨勢(shì)計(jì)算表年份(年)產(chǎn)量(萬噸)(1)時(shí)距時(shí)距擴(kuò)大的后的指標(biāo)(萬噸)(2)移動(dòng)平均數(shù)N=5(3)N=4一次移動(dòng)(4)二次移動(dòng)(5)1992199319941995199619971998199920002001200220035357635665756967777679831992~19941995~19971998~20002001~200317319621323858.863.265.666.470.672.873.674.657.2560.2564.7566.25697272.2574.7578.7558.7562.565.567.6370.572.1373.576.752024/2/1233
2024/2/1234產(chǎn)品銷售收入的長期趨勢(shì)計(jì)算銷售收入年分時(shí)間值t銷售收入(萬元)逐期增長量(萬元)199419951996199719981999200020012002合計(jì)-4-3-2-10123401501962402863303784244725182994
46444644484648461694101491660-600-588-480-28603788481416207227602024/2/1235步驟:選擇趨勢(shì)模型求解模型參數(shù)對(duì)模型進(jìn)行檢驗(yàn)用自相關(guān)系數(shù)檢驗(yàn)誤差項(xiàng)的隨機(jī)性。圖形判斷、差分法判斷、經(jīng)驗(yàn)判斷、自相關(guān)系數(shù)數(shù)列判斷等。例差分法:時(shí)間數(shù)列相繼數(shù)值的差異。如:一級(jí)差分(逐期增長量)的結(jié)果大致相同。則配模型如:二級(jí)差分的結(jié)果大致相同。則配模型如:相繼兩期水平(環(huán)比發(fā)展速度)的比值相同。則配模型最小平方法,求參數(shù)。計(jì)算估計(jì)標(biāo)準(zhǔn)誤求置信區(qū)間m為模型中的參數(shù)小樣本大樣本2024/2/1236三、季節(jié)變動(dòng)的測(cè)定(S)(一)按月(或按季)平均法(二)移動(dòng)平均趨勢(shì)剔除法例例四、循環(huán)變動(dòng)的測(cè)定方法:殘余法。從數(shù)列中消除(T)Y/T=S·C·I從余值中消除(S)S·C·I/S=C·I從余值中消除(I)即移動(dòng)平均,得到C五、不規(guī)則變動(dòng)的測(cè)定:從CI中消除(C)CI/C=I2024/2/1237按月(或按季)平均法季度年份第一年第二年第三年三年合計(jì)同季平均數(shù)季節(jié)指數(shù)%全年12個(gè)季度合計(jì)12個(gè)季度平均100%一二四三2024/2/1238年度一季度二季度三季度四季度合計(jì)2000200120022003合計(jì)季平均季節(jié)比率56812317.750.5439810121848120.8421131418226716.751.1754161822268220.51.43864248607822814.254
2000年~2003年某商場(chǎng)羊毛衫(千件)的季節(jié)比率計(jì)算表
2024/2/1239某地區(qū)2000年~2003年各季的旅游人數(shù)(千人)年份第1季度第2季度第3季度第4季度2000200120022003738287934657636567768389546567702024/2/1240季節(jié)順序旅游人數(shù)a四季移動(dòng)平均數(shù)長期趨勢(shì)值(T)新數(shù)列(a/T)12345678910111213141516734667548257766587638367936589706062.256567.257071.2572.7574.57576.57778.579.2561.12563.62566.12568.62570.6257273.62574.7575.7576.7577.7578.8751.09610.84871.24010.83061.07610.90281.18170.84281.09570.87301.19610.82412024/2/1241年度一季度二季度三季度四季度合計(jì)2000200120022003季平均季節(jié)比率1.24011.18171.19611.20601.20520.83060.84280.82410.83250.83201.09611.07611.09571.08931.08860.84870.90280.87300.87480.87424.0026調(diào)整系數(shù)=4/4.0026調(diào)整后的季節(jié)比率=調(diào)整前的季節(jié)比率*調(diào)整系數(shù)2024/2/1242任務(wù)實(shí)施
各小組在本周內(nèi)完成自己的任務(wù)。時(shí)間截止到12月20號(hào)2024/2/1243任務(wù)評(píng)價(jià)
各組完成任務(wù)的評(píng)價(jià)從以下方面考慮:是否及時(shí)完成任務(wù)、完成任務(wù)的質(zhì)量、小組個(gè)人表現(xiàn)以及表現(xiàn)為依據(jù)。分?jǐn)?shù)組別及時(shí)性完成質(zhì)量個(gè)人表現(xiàn)團(tuán)對(duì)表現(xiàn)第一組第二組第三組第四組2024/2/1244任務(wù)三
如何進(jìn)行相關(guān)回歸分析
案例任務(wù)要求任務(wù)分析任務(wù)學(xué)習(xí)任務(wù)實(shí)施任務(wù)評(píng)價(jià)2024/2/1245學(xué)習(xí)目標(biāo)1. 相關(guān)關(guān)系的分析方法一元線性回歸的基本原理和參數(shù)的最小二乘估計(jì)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)用Excel
進(jìn)行回歸2024/2/1246函數(shù)關(guān)系是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x,當(dāng)變量x取某個(gè)數(shù)值時(shí),
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測(cè)點(diǎn)落在一條線上
xy變量之間的關(guān)系2024/2/1247函數(shù)關(guān)系
(幾個(gè)例子)某種商品的銷售額y與銷售量x之間的關(guān)系可表示為y=px
(p為單價(jià))圓的面積S與半徑R之間的關(guān)系可表示為S=
R2
企業(yè)的原材料消耗額y與產(chǎn)量x1
、單位產(chǎn)量消耗x2
、原材料價(jià)格x3之間的關(guān)系可表示為
y=x1x2x3
2024/2/1248相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布在直線周圍
xy2024/2/1249相關(guān)關(guān)系
(幾個(gè)例子)父親身高y與子女身高x之間的關(guān)系收入水平y(tǒng)與受教育程度x之間的關(guān)系糧食單位面積產(chǎn)量y與施肥量x1
、降雨量x2
、溫度x3之間的關(guān)系商品的消費(fèi)量y與居民收入x之間的關(guān)系商品銷售額y與廣告費(fèi)支出x之間的關(guān)系2024/2/1250相關(guān)關(guān)系
(類型)2024/2/1251相關(guān)分析及其假定相關(guān)分析要解決的問題變量之間是否存在關(guān)系?如果存在關(guān)系,它們之間是什么樣的關(guān)系?變量之間的關(guān)系強(qiáng)度如何?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?為解決這些問題,在進(jìn)行相關(guān)分析時(shí),對(duì)總體有以下兩個(gè)主要假定兩個(gè)變量之間是線性關(guān)系兩個(gè)變量都是隨機(jī)變量2024/2/1252散點(diǎn)圖
(scatterdiagram)
不相關(guān)
負(fù)線性相關(guān)
正線性相關(guān)
非線性相關(guān)
完全負(fù)線性相關(guān)完全正線性相關(guān)
2024/2/1253散點(diǎn)圖
(例題分析)【例】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的增長,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,管理者希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)2024/2/1254散點(diǎn)圖
(例題分析)2024/2/1255散點(diǎn)圖
(不良貸款對(duì)其他變量的散點(diǎn)圖)2024/2/1256相關(guān)系數(shù)
(correlationcoefficient)度量變量之間關(guān)系強(qiáng)度的一個(gè)統(tǒng)計(jì)量對(duì)兩個(gè)變量之間線性相關(guān)強(qiáng)度的度量稱為簡單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為
若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),簡稱為相關(guān)系數(shù),記為r也稱為線性相關(guān)系數(shù)(linearcorrelationcoefficient)或稱為Pearson相關(guān)系數(shù)
(Pearson’scorrelationcoefficient)
2024/2/1257相關(guān)系數(shù)
(計(jì)算公式)
樣本相關(guān)系數(shù)的計(jì)算公式或化簡為2024/2/1258相關(guān)系數(shù)的性質(zhì)性質(zhì)1:r
的取值范圍是[-1,1]|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)
r=0,不存在線性相關(guān)關(guān)系
-1
r<0,為負(fù)相關(guān)0<r
1,為正相關(guān)|r|越趨于1表示關(guān)系越強(qiáng);|r|越趨于0表示關(guān)系越弱2024/2/1259相關(guān)系數(shù)的性質(zhì)性質(zhì)2:r具有對(duì)稱性。即x與y之間的相關(guān)系數(shù)和y與x之間的相關(guān)系數(shù)相等,即rxy=ryx性質(zhì)3:r數(shù)值大小與x和y原點(diǎn)及尺度無關(guān),即改變x和y的數(shù)據(jù)原點(diǎn)及計(jì)量尺度,并不改變r(jià)數(shù)值大小性質(zhì)4:僅僅是x與y之間線性關(guān)系的一個(gè)度量,它不能用于描述非線性關(guān)系。這意為著,r=0只表示兩個(gè)變量之間不存在線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系性質(zhì)5:r雖然是兩個(gè)變量之間線性關(guān)系的一個(gè)度量,卻不一定意味著x與y一定有因果關(guān)系2024/2/1260相關(guān)系數(shù)的經(jīng)驗(yàn)解釋
|r|
0.8時(shí),可視為兩個(gè)變量之間高度相關(guān)0.5
|r|<0.8時(shí),可視為中度相關(guān)0.3
|r|<0.5時(shí),視為低度相關(guān)|r|<0.3時(shí),說明兩個(gè)變量之間的相關(guān)程度極弱,可視為不相關(guān)上述解釋必須建立在對(duì)相關(guān)系數(shù)的顯著性進(jìn)行檢驗(yàn)的基礎(chǔ)之上2024/2/1261相關(guān)系數(shù)
(例題分析)
用Excel計(jì)算相關(guān)系數(shù)2024/2/1262相關(guān)系數(shù)的顯著性檢驗(yàn)
(檢驗(yàn)的步驟)1. 檢驗(yàn)兩個(gè)變量之間是否存在線性相關(guān)關(guān)系等價(jià)于對(duì)回歸系數(shù)b1的檢驗(yàn)采用R.A.Fisher提出的t檢驗(yàn)檢驗(yàn)的步驟為提出假設(shè):H0:
;H1:
0
計(jì)算檢驗(yàn)的統(tǒng)計(jì)量:
確定顯著性水平,并作出決策若t>t
,拒絕H0
若t<t
,不拒絕H02024/2/1263相關(guān)系數(shù)的顯著性檢驗(yàn)
(例題分析)
對(duì)不良貸款與貸款余額之間的相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)(
0.05)提出假設(shè):H0:
;H1:
0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量3.根據(jù)顯著性水平
=0.05,查t分布表得t
(n-2)=2.069由于t=7.5344>t
(25-2)=2.069,拒絕H0,不良貸款與貸款余額之間存在著顯著的正線性相關(guān)關(guān)系2024/2/1264相關(guān)系數(shù)的顯著性檢驗(yàn)
(例題分析)各相關(guān)系數(shù)檢驗(yàn)的統(tǒng)計(jì)量2024/2/1265什么是回歸分析?
(Regression)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確程度2024/2/1266回歸模型的類型2024/2/1267一元線性回歸涉及一個(gè)自變量的回歸因變量y與自變量x之間為線性關(guān)系被預(yù)測(cè)或被解釋的變量稱為因變量(dependentvariable),用y表示用來預(yù)測(cè)或用來解釋因變量的一個(gè)或多個(gè)變量稱為自變量(independentvariable),用x表示因變量與自變量之間的關(guān)系用一個(gè)線性方程來表示2024/2/1268回歸模型
(regressionmodel)回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1個(gè)數(shù)值型因變量(響應(yīng)變量)被預(yù)測(cè)的變量1個(gè)或多個(gè)數(shù)值型或分類型自變量(解釋變量)用于預(yù)測(cè)的變量3. 主要用于預(yù)測(cè)和估計(jì)2024/2/1269一元線性回歸模型描述因變量y如何依賴于自變量x和誤差項(xiàng)
的方程稱為回歸模型一元線性回歸模型可表示為
y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化誤差項(xiàng)
是隨機(jī)變量反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對(duì)y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性
0和
1稱為模型的參數(shù)2024/2/1270一元線性回歸模型
(基本假定)因變量x與自變量y之間具有線性關(guān)系在重復(fù)抽樣中,自變量x的取值是固定的,即假定x是非隨機(jī)的誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E(ε)=0。對(duì)于一個(gè)給定的x值,y的期望值為E(y)=
0+
1x對(duì)于所有的x值,ε的方差σ2都相同誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即ε~N(0,σ2)獨(dú)立性意味著對(duì)于一個(gè)特定的x值,它所對(duì)應(yīng)的ε與其他x值所對(duì)應(yīng)的ε不相關(guān)對(duì)于一個(gè)特定的x值,它所對(duì)應(yīng)的y值與其他x所對(duì)應(yīng)的y值也不相關(guān)2024/2/1271一元線性回歸模型
(基本假定)x=x3時(shí)的E(y)x=x2時(shí)y的分布x=x1時(shí)y的分布x=x2時(shí)的E(y)x3x2x1x=x1時(shí)的E(y)
0xyx=x3時(shí)y的分布
0+1x2024/2/1272回歸方程
(regressionequation)描述y的平均值或期望值如何依賴于x的方程稱為回歸方程一元線性回歸方程的形式如下
E(y)=
0+
1x方程的圖示是一條直線,也稱為直線回歸方程
0是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值
1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值2024/2/1273估計(jì)的回歸方程
(estimatedregressionequation)一元線性回歸中估計(jì)的回歸方程為用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程總體回歸參數(shù)和
是未知的,必須利用樣本數(shù)據(jù)去估計(jì)其中:是估計(jì)的回歸直線在y
軸上的截距,是直線的斜率,它表示對(duì)于一個(gè)給定的x
的值,是y
的估計(jì)值,也表示x
每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值
2024/2/1274最小二乘估計(jì)
(methodofleastsquares)德國科學(xué)家KarlGauss(1777—1855)提出用最小化圖中垂直方向的誤差平方和來估計(jì)參數(shù)
使因變量的觀察值與估計(jì)值之間的誤差平方和達(dá)到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小2024/2/1275估計(jì)方程的求法
(例題分析)【例】求不良貸款對(duì)貸款余額的回歸方程回歸方程為:y=-0.8295
+0.037895
x回歸系數(shù)=0.037895表示,貸款余額每增加1億元,不良貸款平均增加0.037895億元
^2024/2/1276估計(jì)方程的求法
(例題分析)不良貸款對(duì)貸款余額回歸方程的圖示2024/2/1277用Excel進(jìn)行回歸分析第1步:選擇【工具】下拉菜單第2步:選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在分析工具中選擇【回歸】,選擇【確定】第4步:當(dāng)對(duì)話框出現(xiàn)時(shí)
在【Y值輸入?yún)^(qū)域】設(shè)置框內(nèi)鍵入Y的數(shù)據(jù)區(qū)域
在【X值輸入?yún)^(qū)域】設(shè)置框內(nèi)鍵入X的數(shù)據(jù)區(qū)域
在【置信度】選項(xiàng)中給出所需的數(shù)值在【輸出選項(xiàng)】中選擇輸出區(qū)域在【殘差】分析選項(xiàng)中選擇所需的選項(xiàng)2024/2/1278變差因變量
y的取值是不同的,y取值的這種波動(dòng)稱為變差。變差來源于兩個(gè)方面由于自變量x的取值不同造成的除x以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響對(duì)一個(gè)具體的觀測(cè)值來說,變差的大小可以通過該實(shí)際觀測(cè)值與其均值之差來表示2024/2/1279誤差的分解
(圖示)xyy
2024/2/1280誤差平方和的分解
(三個(gè)平方和的關(guān)系)SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{2024/2/1281誤差平方和的分解
(三個(gè)平方和的意義)總平方和(SST—totalsumofsquares)反映因變量的n個(gè)觀察值與其均值的總誤差回歸平方和(SSR—sumofsquaresofregression)反映自變量x的變化對(duì)因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE—sumofsquaresoferror)反映除x以外的其他因素對(duì)y取值的影響,也稱為不可解釋的平方和或剩余平方和2024/2/1282判定系數(shù)R2
(coefficientofdetermination)回歸平方和占總誤差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間
R2
1,說明回歸方程擬合的越好;R2
0,說明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=r22024/2/1283判定系數(shù)
(例題分析)【例】計(jì)算不良貸款對(duì)貸款余額回歸的判定系數(shù),并解釋其意義
判定系數(shù)的實(shí)際意義是:在不良貸款取值的變差中,有71.16%可以由不良貸款與貸款余額之間的線性關(guān)系來解釋,或者說,在不良貸款取值的變動(dòng)中,有71.16%是由貸款余額所決定的。也就是說,不良貸款取值的差異有2/3以上是由貸款余額決定的??梢姴涣假J款與貸款余額之間有較強(qiáng)的線性關(guān)系2024/2/1284估計(jì)標(biāo)準(zhǔn)誤差
(standarderrorofestimate)實(shí)際觀察值與回歸估計(jì)值誤差平方和的均方根反映實(shí)際觀察值在回歸直線周圍的分散狀況對(duì)誤差項(xiàng)
的標(biāo)準(zhǔn)差
的估計(jì),是在排除了x對(duì)y的線性影響后,y隨機(jī)波動(dòng)大小的一個(gè)估計(jì)量反映用估計(jì)的回歸方程預(yù)測(cè)y時(shí)預(yù)測(cè)誤差的大小
計(jì)算公式為注:例題的計(jì)算結(jié)果為1.97992024/2/1285線性關(guān)系的檢驗(yàn)檢驗(yàn)自變量與因變量之間的線性關(guān)系是否顯著將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著回歸均方:回歸平方和SSR除以相應(yīng)的自由度(自變量的個(gè)數(shù)k)殘差均方:殘差平方和SSE除以相應(yīng)的自由度(n-k-1)2024/2/1286線性關(guān)系的檢驗(yàn)
(檢驗(yàn)的步驟)提出假設(shè)H0:
1=0線性關(guān)系不顯著2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平
,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F
作出決策:若F>F
,拒絕H0;若F<F
,不拒絕H02024/2/1287線性關(guān)系的檢驗(yàn)
(例題分析)提出假設(shè)H0:
1=0不良貸款與貸款余額之間的線性關(guān)系不顯著計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平
=0.05,并根據(jù)分子自由度1和分母自由度25-2找出臨界值F
=4.28作出決策:若F>F
,拒絕H0,線性關(guān)系顯著2024/2/1288線性關(guān)系的檢驗(yàn)
(方差分析表)Excel輸出的方差分析表2024/2/1289回歸系數(shù)的檢驗(yàn)在一元線性回歸中,等價(jià)于線性關(guān)系的顯著性檢驗(yàn)采用t檢驗(yàn)檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說,檢驗(yàn)自變量x對(duì)因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)
的抽樣分布2024/2/1290回歸系數(shù)的檢驗(yàn)
(檢驗(yàn)步驟)提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b1
0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量確定顯著性水平
,并進(jìn)行決策
t>t
,拒絕H0;t<t
,不拒絕H02024/2/1291回歸系數(shù)的檢驗(yàn)
(例題分析)
對(duì)例題的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(
=0.05)提出假設(shè)H0:b1=0H1:b1
0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量
t=7.533515>t
=2.201,拒絕H0,表明不良貸款與貸款余額之間有顯著的線性關(guān)系2024/2/1292回歸系數(shù)的檢驗(yàn)
(例題分析)
P值的應(yīng)用P=0.000000<
=0.05,拒絕原假設(shè),不良貸款與貸款余額之間有顯著的線性關(guān)系2024/2/1293回歸分析結(jié)果的評(píng)價(jià)建立的模型是否合適?或者說,這個(gè)擬合的模型有多“好”?要回答這些問題,可以從以下幾個(gè)方面入手所估計(jì)的回歸系數(shù)
的符號(hào)是否與理論或事先預(yù)期相一致在不良貸款與貸款余額的回歸中,可以預(yù)期貸款余額越多,不良貸款也可能會(huì)越多,也就是說,回歸系數(shù)的值應(yīng)該是正的,在上面建立的回歸方程中,我們得到的回歸系數(shù)為正值,如果理論上認(rèn)為x與y之間的關(guān)系不僅是正的,而且是統(tǒng)計(jì)上顯著的,那么所建立的回歸方程也應(yīng)該如此在不良貸款與貸款余額的回歸中,二者之間為正的線性關(guān)系,而且,對(duì)回歸系數(shù)的t檢驗(yàn)結(jié)果表明而這之間的線性關(guān)系是統(tǒng)計(jì)上顯著的2024/2/1294回歸模型在多大程度上解釋了因變量y取值的差異?可以用判定系數(shù)R2來回答這一問題在不良貸款與貸款余額的回歸中,得到的R2=71.16%,解釋了不良貸款變差的2/3以上,說明擬合的效果還算不錯(cuò)考察關(guān)于誤差項(xiàng)
的正態(tài)性假定是否成立。因?yàn)槲覀冊(cè)趯?duì)線性關(guān)系進(jìn)行F檢驗(yàn)和回歸系數(shù)進(jìn)行t檢驗(yàn)時(shí),都要求誤差項(xiàng)
服從正態(tài)分布,否則,我們所用的檢驗(yàn)程序?qū)⑹菬o效的。
正態(tài)性的簡單方法是畫出殘差的直方圖或正態(tài)概率圖回歸分析結(jié)果的評(píng)價(jià)2024/2/1295Excel輸出的部分回歸結(jié)果名稱計(jì)算公式AdjustedRSquareIntercept的抽樣標(biāo)準(zhǔn)誤差I(lǐng)ntercept95%的置信區(qū)間斜率95%的置信區(qū)間2024/2/129611.3利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)11.3.1點(diǎn)估計(jì)11.3.2區(qū)間估計(jì)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)根據(jù)自變量x
的取值估計(jì)或預(yù)測(cè)因變量y的取值估計(jì)或預(yù)測(cè)的類型點(diǎn)估計(jì)y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)區(qū)間估計(jì)y的平均值的置信區(qū)間估計(jì)y的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì)2024/2/1298點(diǎn)估計(jì)點(diǎn)估計(jì)2.點(diǎn)估計(jì)值有y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同對(duì)于自變量x的一個(gè)給定值x0
,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)值2024/2/12100
y的平均值的點(diǎn)估計(jì)
利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量
y
的平均值的一個(gè)估計(jì)值E(y0),就是平均值的點(diǎn)估計(jì)在前面的例子中,假如我們要估計(jì)貸款余額為100億元時(shí),所有分行不良貸款的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得2024/2/12101y的個(gè)別值的點(diǎn)估計(jì)
利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y
的一個(gè)個(gè)別值的估計(jì)值,就是個(gè)別值的點(diǎn)估計(jì)例如,如果我們只是想知道貸款余額為72.8億元的那個(gè)分行(這里是編號(hào)為10的那個(gè)分行)的不良貸款是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得2024/2/12102區(qū)間估計(jì)區(qū)間估計(jì)點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對(duì)于自變量
x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)區(qū)間區(qū)間估計(jì)有兩種類型置信區(qū)間估計(jì)(confidenceintervalestimate)預(yù)測(cè)區(qū)間估計(jì)(predictionintervalestimate)2024/2/12104置信區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y
的平均值的估計(jì)區(qū)間
,這一估計(jì)區(qū)間稱為置信區(qū)間(confidenceinterval)
E(y0)
在1-
置信水平下的置信區(qū)間為式中:se為估計(jì)標(biāo)準(zhǔn)誤差2024/2/12105置信區(qū)間估計(jì)
(例題分析)
【例】求出貸款余額為100億元時(shí),不良貸款95%置信水平下的置信區(qū)間
解:根據(jù)前面的計(jì)算結(jié)果,已知n=25,
se=1.9799,t
(25-2)=2.069
置信區(qū)間為當(dāng)貸款余額為100億元時(shí),不良貸款的平均值在2.1141億元到3.8059億元之間2024/2/12106預(yù)測(cè)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0
,求出因變量y
的一個(gè)個(gè)別值的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測(cè)區(qū)間(predictioninterval)
y0在1-
置信水平下的預(yù)測(cè)區(qū)間為注意!2024/2/12107預(yù)測(cè)區(qū)間估計(jì)
(例題分析)【例】求出貸款余額為72.8億元的那個(gè)分行,不良貸款95%的預(yù)測(cè)區(qū)間
解:根據(jù)前面的計(jì)算結(jié)果,已知n=25,
se=1.9799,t
(25-2)=2.069
預(yù)測(cè)區(qū)間為貸款余額為72.8億元的那個(gè)分行,其不良貸款的預(yù)測(cè)區(qū)間在-2.2766億元到6.1366億元之間2024/2/12108置信區(qū)間和預(yù)測(cè)區(qū)間
(例題分析)2024/2/12109置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程xpyx
x預(yù)測(cè)上限置信上限預(yù)測(cè)下限置信下限2024/2/1211
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- DB3715T 73-2025沙土地變竹栽培養(yǎng)護(hù)技術(shù)規(guī)程
- 親子收養(yǎng)合同協(xié)議書1
- 個(gè)人電子產(chǎn)品購銷合同范本
- 上海市飼料添加劑購銷合同標(biāo)準(zhǔn)模板
- 中小企業(yè)融資合同及相關(guān)附件
- 中小企業(yè)短期借款合同范本
- 中保人壽保險(xiǎn)有限公司度團(tuán)體福利保險(xiǎn)合同全文
- 中保人壽保險(xiǎn)有限公司團(tuán)體福利保險(xiǎn)合同條款解析
- 中央空調(diào)系統(tǒng)工程合同范本
- 人力資源合同管理(四):就業(yè)穩(wěn)定與成長
- 五年級(jí)數(shù)學(xué)(小數(shù)乘除法)計(jì)算題專項(xiàng)練習(xí)及答案匯編
- 2024年蘇州農(nóng)業(yè)職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫含答案解析
- 2025年北京生命科技研究院招聘筆試參考題庫含答案解析
- 銀行金融機(jī)構(gòu)銀行金融服務(wù)協(xié)議
- GB/T 27697-2024立式油壓千斤頂
- 《消防機(jī)器人相關(guān)技術(shù)研究》
- 游泳館安全隱患排查
- 《媒介社會(huì)學(xué)》課件
- 成人手術(shù)后疼痛評(píng)估與護(hù)理團(tuán)體標(biāo)準(zhǔn)
- zemax-優(yōu)化函數(shù)說明書
- 2021年《民法典擔(dān)保制度司法解釋》適用解讀之擔(dān)保解釋的歷程
評(píng)論
0/150
提交評(píng)論