版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
...wd......wd......wd...第一章導(dǎo)論1.1.1〔1〕數(shù)值型變量?!?〕分類變量?!?〕離散型變量?!?〕順序變量?!?〕分類變量。1.2〔1〕總體是該市所有職工家庭的集合;樣本是抽中的2000個職工家庭的集合?!?〕參數(shù)是該市所有職工家庭的年人均收入;統(tǒng)計量是抽中的2000個職工家庭的年人均收入。1.3〔1〕總體是所有IT從業(yè)者的集合。〔2〕數(shù)值型變量?!?〕分類變量?!?〕截面數(shù)據(jù)。1.4〔1〕總體是所有在網(wǎng)上購物的消費者的集合。〔2〕分類變量。〔3〕參數(shù)是所有在網(wǎng)上購物者的月平均花費?!?〕參數(shù)〔5〕推斷統(tǒng)計方法。第二章數(shù)據(jù)的搜集1.什么是二手資料使用二手資料需要注意些什么與研究內(nèi)容有關(guān)的原始信息已經(jīng)存在,是由別人調(diào)查和實驗得來的,并會被我們利用的資料稱為“二手資料〞。使用二手資料時需要注意:資料的原始搜集人、搜集資料的目的、搜集資料的途徑、搜集資料的時間,要注意數(shù)據(jù)的定義、含義、計算口徑和計算方法,防止錯用、誤用、濫用。在引用二手資料時,要注明數(shù)據(jù)來源。2.比較概率抽樣和非概率抽樣的特點,舉例說明什么情況下適合采用概率抽樣,什么情況下適合采用非概率抽樣。概率抽樣是指抽樣時按一定概率以隨機原那么抽取樣本。每個單位被抽中的概率或可以計算,當用樣本對總體目標量進展估計時,要考慮到每個單位樣本被抽中的概率,概率抽樣的技術(shù)含量和成本都比較高。如果調(diào)查的目的在于掌握和研究總體的數(shù)量特征,得到總體參數(shù)的置信區(qū)間,就使用概率抽樣。非概率抽樣是指抽取樣本時不是依據(jù)隨機原那么,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出局部單位對其實施調(diào)查。非概率抽樣操作簡單、實效快、成本低,而且對于抽樣中的專業(yè)技術(shù)要求不是很高。它適合探索性的研究,調(diào)查結(jié)果用于發(fā)現(xiàn)問題,為更深入的數(shù)量分析提供準備。非概率抽樣也適合市場調(diào)查中的概念測試。3.調(diào)查中搜集數(shù)據(jù)的方法主要有自填式、面方式、式,除此之外,還有那些搜集數(shù)據(jù)的方法實驗式、觀察式等。4.自填式、面方式、式調(diào)查個有什么利弊自填式優(yōu)點:調(diào)查組織者管理容易,成本低,可以進展較大規(guī)模調(diào)查,對被調(diào)查者可以刻選擇方便時間答卷,減少答復(fù)敏感問題的壓力。缺點:返回率低,調(diào)查時間長,在數(shù)據(jù)搜集過程中遇到問題不能及時調(diào)整。面談式優(yōu)點:答復(fù)率高,數(shù)據(jù)質(zhì)量高,在數(shù)據(jù)搜集過程中遇到問題可以及時調(diào)整可以充分發(fā)揮調(diào)查員的作用。缺點:成本比較高,對調(diào)查過程的質(zhì)量控制有一定難度。對于敏感問題,被訪者會有壓力。式優(yōu)點:速度快,對調(diào)查員比較安全,對訪問過程的控制比較容易,缺點:實施地區(qū)有限,調(diào)查時間不宜過長,問卷要簡單,被訪者不愿答復(fù)時,不宜勸服。5.請舉出〔或設(shè)計〕幾個實驗數(shù)據(jù)的例子。不同飼料對牲畜增重有無影響,新舊技術(shù)的機器對組裝同一產(chǎn)品所需時間的影響。6.你認為應(yīng)當如何控制調(diào)查中的答復(fù)誤差對于理解誤差,要注意表述中的措辭,學(xué)習(xí)一定的心里學(xué)知識。對于記憶誤差,盡量縮短所涉及問題的時間范圍。對于有意識誤差,調(diào)查人員要想法消除被調(diào)查者得思想顧慮,調(diào)查人員要遵守職業(yè)道德,為被調(diào)查者保密,盡量防止敏感問題。7.怎樣減少無答復(fù)請通過一個例子,說明你所考慮到的減少無答復(fù)的具體措施。對于隨機誤差,可以通過增加樣本容量來控制。對于系統(tǒng)誤差,做好預(yù)防,在調(diào)查前做好各方面的準備工作,盡量把無答復(fù)率降到最低程度。無答復(fù)出現(xiàn)后,分析武答復(fù)產(chǎn)生的原因,采取補救措施。比方要收回一百份,就要做好一百二十份或一百三十份問卷的準備,當被調(diào)查者不愿意答復(fù)時,可以通過一定的方法勸服被訪者,還可以通過饋贈小禮品等的方式提高回收率。第三章數(shù)據(jù)的圖表搜集一、思考題3.1數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容答:審核、篩選、排序等。3.2分類數(shù)據(jù)和順序數(shù)據(jù)的整理和顯示方法各有哪些答:分類數(shù)據(jù)在整理時候先列出所分的類別,計算各組的頻數(shù)、頻率,得到頻數(shù)分布表,如果是兩個或兩個以上變量可以制作穿插表。對于分類數(shù)據(jù)可以繪制條形圖、帕累托圖、餅圖、環(huán)形圖等。根據(jù)不同的資料或者目的選擇不同的圖。對于順序數(shù)據(jù),可以計算各種的頻數(shù)、頻率,以及累計頻數(shù)、累計頻率??筛鶕?jù)需要繪制條形圖、餅圖、環(huán)形圖等。3.3數(shù)值型數(shù)據(jù)的分組方法有哪些簡述組距分組的步驟。答:單變量值分組和組距分組。其中組距分組:第一步,確定組數(shù),組數(shù)多少由數(shù)據(jù)的多少和特點等決定,一般5~15組;第二步,確定各組組距,宜取5或10的倍數(shù);第三步,根據(jù)分組整理出頻數(shù)分布表,注意遵循“不重不漏〞和“上限不在內(nèi)〞的原那么。3.4直方圖和條形圖有何區(qū)別答:1,條形圖使用圖形的長度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻率,寬度表示組距,高度與寬度都有意義;2直方圖各矩形連續(xù)排列,條形圖分開排列;3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。3.5繪制線圖應(yīng)注意問題答:時間在橫軸,觀測值繪在縱軸。一般是長寬比例10:7的長方形,縱軸下端一般從0開場,數(shù)據(jù)與0距離過大的話用折斷符號折斷。3.6餅圖和環(huán)形圖的不同答:餅圖只能顯示一個樣本或總體各局部所占比例,環(huán)形圖可以同時繪制多個樣本或總體的數(shù)據(jù)系列,其圖形中間有個“空洞〞,每個樣本或總體的數(shù)據(jù)系類為一個環(huán)。3.7莖葉圖比直方圖的優(yōu)勢,他們各自的應(yīng)用場合答:莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出每一個原始數(shù)據(jù),即保存了原始數(shù)據(jù)的信息。在應(yīng)用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。3.8鑒別圖標優(yōu)劣的準那么答:P65明確有答案,我就不寫了。3.9制作統(tǒng)計表應(yīng)注意的問題答:1,合理安排統(tǒng)計表構(gòu)造;2表頭一般包括表號,總標題和表中數(shù)據(jù)的單位等內(nèi)容;3表中的上下兩條橫線一般用粗線,中間的其他用細線,兩端開口,數(shù)字右對齊,不要有空白格;4在使用統(tǒng)計表時,必要時可在下方加注釋,注明數(shù)據(jù)來源。二、練習(xí)題3.1答:〔1〕表中數(shù)據(jù)屬于順序數(shù)據(jù)。(2)用Excel制作一張頻數(shù)分布表。服務(wù)等級家庭數(shù)目〔個〕好14較好21一般32較差18差15(3)繪制一張條形圖,反映評價等級的分布。(4)繪制評價等級的帕累托圖。3.2某行業(yè)管理局所屬40個企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根據(jù)上面的數(shù)據(jù)進展適當?shù)姆纸M,編制頻數(shù)分布表,并計算出累積頻數(shù)和累積頻率。1、確定組數(shù):,取k=62、確定組距:組距=(最大值-最小值)÷組數(shù)=〔152-87〕÷6=10.83,取103、分組頻數(shù)表銷售收入頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%80–90252590–10037.5512.5100-110922.51435110–12012302665120–130717.53382.5130–1404103792.5140–15025.03997.5150以上12.540100合計40100.0——(2)按規(guī)定,銷售收入在125萬元以上為先進企業(yè),115~125萬元為良好企業(yè),105~115萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進展分組。頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%先進企業(yè)10251025良好企業(yè)12302255一般企業(yè)922.53177.5落后企業(yè)922.540100合計40100——3.3某百貨公司連續(xù)40天的商品銷售額如下:單位:萬元41252947383430384340463645373736454333443528463430374426384442363737493942323635要求:根據(jù)上面的數(shù)據(jù)進展適當?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖。答:1、確定組數(shù):,取k=62、確定組距:組距=(最大值-最小值)÷組數(shù)=〔49-25〕÷6=4,取53、分組頻數(shù)表〔根據(jù)實際資料,調(diào)整成分5個組〕銷售收入〔萬元〕頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%30以下41041030-35615102535-401537.52562.540-45922.5348545以上61540100合計40100.0——4、直方圖3.4利用下面的數(shù)據(jù)構(gòu)建莖葉圖和箱線圖。572929363123472328283551391846182650293321464152282143194220答:莖葉圖FrequencyStem&Leaf3.001.8895.002.011337.002.68889992.003.133.003.5693.004.1233.004.6673.005.0121.005.7箱線圖3.5答:頻數(shù)分布表燈泡壽命頻率向上累積頻率〔%〕660以下22%660-67057%670-680613%680-6901427%690-7002653%700-7101871%710-7201384%720-7301094%730-740397%740以上3100%合計100—直方圖從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.6答:頻數(shù)分布表,取k=72、確定組距:組距=(最大值-最小值)÷組數(shù)=〔61-40〕÷7=3,取33、分組頻數(shù)表〔根據(jù)實際資料,調(diào)整成分5個組〕食品重量〔g〕頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%43以下334343-4699121246-492424363649-521919555552-552424797955-581414939358以上77100100合計100100.0——從直方圖看,數(shù)據(jù)的分布呈雙峰分布。3.7頻數(shù)分布表重量誤差〔g〕頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%19-2951051029-39714122439-49816204049-591326336659-69918428469-79612489679-892450100合計50100——獲取完整版答案,請翻開微信掃一掃下方二維碼,關(guān)注微信公眾號:幫幫ING如果無法掃碼關(guān)注,請按照下方提示操作:從直方圖看,數(shù)據(jù)的分布呈左偏分布3.8〔1〕數(shù)值型數(shù)據(jù)〔2〕頻數(shù)分布表,取k=72、確定組距:組距=(最大值-最小值)÷組數(shù)=〔9+25〕÷7=4.86,取5氣溫〔℃〕頻數(shù)頻率%向上累計頻數(shù)向上累計頻率%〔-25,-20〕610.00610.00〔-20,-15〕813.331423.33〔-15,-10〕1016.672440.00〔-10.-5〕1321.673761.67〔-5.0〕1220.004981.67〔0,5〕46.675388.33〔5,10〕711.6760100.00合計60100——從直方圖看,數(shù)據(jù)的分布呈左偏分布。3.9自學(xué)考試人員年齡分布集中在20-24之間,分布圖呈右偏。3.103.113.12〔1〕復(fù)式條形圖〔2〕甲班成績分布圖近似正態(tài)分布,分布較均衡;乙班成績分布圖右偏?!?〕根據(jù)雷達圖,兩班成績分布不相似。3.133.14第四章習(xí)題答案4.1數(shù)據(jù)排列:2,4,7,10,10,10,12,12,14,15〔1〕眾數(shù):10;中位數(shù):10平均數(shù):9.6〔2〕四分位數(shù):Q位置==2.5.所以Q==5.5Q位置==7.5,所以Q==13〔3〕標準差:4.17〔4〕峰度—0.25,偏度—0.694.2〔1〕眾數(shù):19;23中位數(shù):23平均數(shù):24〔2〕四分位數(shù):Q位置==6.25.所以Q=19+0.25^0=19Q位置==18.75,所以Q=25+2^0.75=26.5〔3〕標準差:6.65〔4〕峰度0.77,偏度1.084.3(1)莖葉圖略(2)平均數(shù):7,標準差0.71〔3〕第一種方式的離散系數(shù)==0.28第二種方式的離散系數(shù)==0.10所以,第二種排隊方式等待時間更集中。〔4〕選擇第二種,因為平均等待的時間短,而且等待時間的集中程度高4.4〔1〕平均數(shù):274.1,中位數(shù):272.5〔2〕Q位置==7.5.所以Q=258+0.25^3=258.75Q位置==22.5,所以Q=284+7^0.75=289.25〔3〕日銷售額的標準差:21.174.5.產(chǎn)品名稱單位成本〔元〕總成本/元產(chǎn)量甲企業(yè)乙企業(yè)甲企業(yè)乙企業(yè)A1521003255140217B203000150015075C30150015005050合計——66006255340342甲企業(yè)總平均成本==19.41〔元〕乙企業(yè)總平均成本=所以甲企業(yè)的總平均成本比乙企業(yè)的高,原因是甲企業(yè)高成本的產(chǎn)品B生產(chǎn)的產(chǎn)量比乙企業(yè)多,所以把總平均成本提高了。4.6計算數(shù)據(jù)如表:按利潤額分組〔萬元〕組中值企業(yè)數(shù)〔個〕利潤額200~300250194750593033300~4003503010500176349400~500450421890022860500~600550189900273785600以上650117150548639合計-120512001614666利潤總額的平均數(shù)=利潤總額標準差=峰態(tài)系數(shù)偏態(tài)系數(shù)=4.7〔1〕不同。1000名的平均身高較高;〔2〕不同。100名的樣本容量的標準差更大;〔3〕不同,調(diào)查1000名的樣本容量得到最高和最低者的時機較大。4.8對于不同的總體的差異程度的比較采用標準差系數(shù),計算如下:;〔1〕女生的體重差異大,因為離散系數(shù)大;〔2〕以磅為單位,男生的平均體重為132.6磅,標準差為11.05磅;女生的平均體重為110.5磅,標準差為11.05磅〔3〕,所以大約有68%的人體重在55kg~65kg之間;〔4〕,所以大約有95%的女生體重在40kg~60kg之間。4.9;;由此可以判斷第二項測試更理想。4.10時間周一周二周三周四周五周六周日產(chǎn)量3850367036903720361035903700z值30.60.20.41.82.20可以看出,周一和周六兩天生產(chǎn)線失去了控制。4.11〔1〕采用離散系數(shù),因為如果比較身高差異,兒童和成年人屬于不同的總體;〔2〕,所以,兒童的身高差異更大。4.12〔1〕對集中程度和離散程度分別評價,選擇集中趨勢數(shù)值大的,而且離散程度數(shù)值小的方式〔2〕選擇方法A,因為A方法下,工人的平均組裝數(shù)量為165.6,而且該方法下,工人組裝數(shù)量的離散系數(shù)只有0.012,所以選擇A方法。4.13〔1〕用離散系數(shù)〔2〕商業(yè)類〔3〕高科技第六章統(tǒng)計量與抽樣分布由樣本構(gòu)建具體的統(tǒng)計量,實際上是對樣本所含的總體信息按某種要求進展加工處理,把分散在樣本中的信息集中到統(tǒng)計量的取值上,不同的統(tǒng)計推斷問題要求構(gòu)造不同的統(tǒng)計量。構(gòu)造統(tǒng)計量的主要目的就是對總體的未知參數(shù)進展推斷,如果統(tǒng)計量中含有總體的未知參數(shù)就沒方法再對參數(shù)進展統(tǒng)計推斷。2、是統(tǒng)計量,在不是統(tǒng)計量。4、假假設(shè)一個統(tǒng)計量能把含在樣本中有關(guān)總體的信息一點都不損失地提取出來,這樣的統(tǒng)計量稱充分統(tǒng)計量。5、統(tǒng)計學(xué)上的自由度指當以樣本的統(tǒng)計量來估計總體的參數(shù)時,樣本中獨立或能自由變化的資料的個數(shù)。6、7、在重復(fù)選取容量為n的樣本時,由樣本統(tǒng)計量的所有取值形成的相對頻數(shù)分布為統(tǒng)計量的抽樣分布。二、練習(xí)1、易知由這臺機器灌裝的9個瓶子形成的樣本,其平均灌裝量服從正態(tài)分布,均值為標準差為,故2、假設(shè),那么,即,又知,故。3、易知服從自由度為6的卡方分布,得〔左側(cè)分位數(shù)〕4、因為服從分布,我們,故服從9〕分布,,我們假設(shè)取,那么可以得到,,故。〔題中均為左側(cè)分位數(shù)〕第七章參數(shù)估計7.1〔1〕〔2〕由于1-α=95%α=5%所以估計誤差7.2〔1〕〔2〕因為所以〔3〕μ的置信區(qū)間為7.3由于n=100所以μ的95%置信區(qū)間為7.4〔1〕μ的90%置信區(qū)間為〔2〕μ的95%置信區(qū)間為〔3〕μ的99%置信區(qū)間為7.5〔1〕〔2〕〔3〕7.6〔1〕〔2〕〔3〕〔4〕7.790%置信區(qū)間為95%置信區(qū)間為99%置信區(qū)間為7.8所以95%置信區(qū)間為7.9由于所以95%置信區(qū)間為7.10〔1〕〔2〕中心極限定理7.11〔1〕〔2〕由于所以合格率的95%置信區(qū)間為7.12由于所以99%置信區(qū)間為7.13所以90%置信區(qū)間為7.14〔1〕〔2〕〔3〕7.15〔1〕90%置信區(qū)間為〔2〕95%置信區(qū)間為7.16所以n為1667.17〔1〕所以n為254〔2〕所以n為151〔3〕所以n為2687.18〔1〕〔2〕所以n為627.19〔1〕所以〔2〕〔3〕7.20〔1〕〔2〕7.21=〔1〕的90%置信區(qū)間為:==〔2〕的95%置信區(qū)間為:==〔3〕的99%置信區(qū)間為:=7.22〔1〕==〔2〕==18==〔3〕=17.78==〔4〕=18.714==〔5〕=20.05==7.23〔1〕==〔2〕=7.24,的置信區(qū)間為:==7.25〔1〕==〔2〕==7.26==2.464=0.405767.27==47.06所以n=487.28==138.30所以n=139第8章假設(shè)檢驗二、練習(xí)題〔說明:為了便于查找書后正態(tài)分布表,本答案中,正態(tài)分布的分位點均采用了下側(cè)分位點。其他分位點也可。為了便于查找書后t分布表方便,本答案中,正態(tài)分布的分位點均采用了上側(cè)分位點?!?.1解:根據(jù)題意,這是雙側(cè)檢驗問題。:總體方差當,查表得。拒絕域W={}因為,所以不能拒絕H0,認為現(xiàn)在生產(chǎn)的鐵水平均含碳量為4.55?!沧ⅲ簽檎龖B(tài)分布的1-α/2下側(cè)分位點〕8.2解:根據(jù)題意,這是左單側(cè)檢驗問題。:總體方差當,查表得。拒絕域W={}因為,所以拒絕H0,認為該元件的使用壽命低于700小時?!沧ⅲ簽檎龖B(tài)分布的1-α下側(cè)分位點〕8.3解:根據(jù)題意,這是右單側(cè)檢驗問題。:總體方差當,查表得。拒絕域W={}因為,所以拒絕H0,認為這種化肥能使小麥明顯增產(chǎn)。〔注:為正態(tài)分布的1-α下側(cè)分位點〕8.4解:根據(jù)題意,這是雙側(cè)檢驗問題。方差未知。:總體根據(jù)樣本計算得:當,查表得。拒絕域W={}因為,所以不能拒絕H0,認為該日打包機工作正常。〔注:為t分布的α/2上側(cè)分位點〕8.5解:根據(jù)題意,這是右單側(cè)檢驗問題。:當,查表得。拒絕域W={}因為,所以拒絕H0,認為不符合標準的比例超過5%,該批食品不能出廠。〔注:為正態(tài)分布的1-α下側(cè)分位點〕8.6解:根據(jù)題意,這是右單側(cè)檢驗問題。:當,查表得。拒絕域W={}因為,所以不能拒絕H0,認為該廠家的廣告不真實?!沧ⅲ簽閠分布的α上側(cè)分位點〕8.7解:根據(jù)題意,這是右單側(cè)檢驗問題。:當,查表得。拒絕域W={}因為,所以不能拒絕H0,認為元件的平均壽命不大于225小時?!沧ⅲ簽閠分布的α上側(cè)分位點〕8.8解:根據(jù)題意,這是右側(cè)檢驗問題。:當,查表得。拒絕域W={}因為,所以拒絕H0,認為成立?!沧ⅲ簽?分布的α上側(cè)分位點〕8.9解:根據(jù)題意,這是雙側(cè)檢驗問題。:總體方差當,查表得。拒絕域W={}因為,所以拒絕H0,可以認為A,B兩廠生產(chǎn)的材料平均抗壓強度不一樣。〔注:為正態(tài)分布的1-α/2下側(cè)分位點〕8.10解:根據(jù)題意,這是雙側(cè)檢驗問題。:總體方差,但未知2.3579當,查表得。拒絕域W={}因為,所以拒絕H0,認為兩種方法的裝配時間有顯著差異。〔注:為t分布的α上側(cè)分位點〕8.11解:根據(jù)題意,這是雙側(cè)檢驗問題。:在大樣本條件下當,查表得。拒絕域W={}因為,所以拒絕H0,認為調(diào)查數(shù)據(jù)支持“吸煙者容易患慢性氣管炎〞這種觀點?!沧ⅲ簽檎龖B(tài)分布的1-α/2下側(cè)分位點〕8.12解:根據(jù)題意,這是右單側(cè)檢驗問題。〔1〕等同于〔2〕:在n=144情況下,〔2〕中的H0成立時,t近似服從標準正態(tài)分布。因此P=P(t>2.16)=1-0.9846=0.0154。所以在α=0.01的顯著水平,不能拒絕H0,認為貸款的平均規(guī)模沒有明顯超過60萬元。8.13解:根據(jù)題意,這是左單側(cè)檢驗問題。:在大樣本條件下當,查表得。拒絕域W={}因為,所以拒絕H0,認為阿司匹林可以降低心臟病發(fā)生率?!沧ⅲ簽檎龖B(tài)分布的1-α下側(cè)分位點〕8.14解:〔1〕根據(jù)題意,這是雙側(cè)檢驗問題。:當,利用EXCEL提供的統(tǒng)計函數(shù)“CHIINV〞,得。拒絕域W={}因為,所以不能拒絕H0,認為成立。〔注:為-分布的α上側(cè)分位點〕〔2〕根據(jù)題意,這是雙側(cè)檢驗問題。:總體方差當,查表得。拒絕域W={}因為,所以不能拒絕H0,認為螺栓口徑為7.0cm?!沧ⅲ簽檎龖B(tài)分布的1-α/2下側(cè)分位點〕因此,由〔1〕和〔2〕可得:這批螺栓到達了規(guī)定的要求。8.15〔1〕根據(jù)題意,這是雙側(cè)檢驗問題。:當,利用EXCEL提供的統(tǒng)計函數(shù)“FINV〞,得。拒絕域W={}因為,所以不能拒絕H0,認為成立?!沧ⅲ簽镕-分布的α/2上側(cè)分位點〕〔2〕根據(jù)題意,這是右單側(cè)檢驗問題。由〔1〕的分析可知:總體方差,但未知當,查表得。拒絕域W={}因為,所以拒絕H0,認為有顯著大學(xué)中男生學(xué)習(xí)成績比女生好。〔注:為t分布的α上側(cè)分位點〕第十章方差分析一、思考題10.1什么是方差分析它研究的是什么答:方差分析就是通過檢驗各總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。它所研究的是分類型自變量對數(shù)值型因變量的影響。10.2要檢驗多個總體均值是否相等時,為什么不作兩兩比較,而用方差分析方法答:做兩兩比較十分繁瑣,進展檢驗的次數(shù)較多,會使得犯第I類錯誤的概率相應(yīng)增加,而且隨著增加個體顯著性檢驗的次數(shù),偶然因素導(dǎo)致差異的可能性也會增加。而方差分析方法是同時考慮所有的樣本,因此排除了錯誤累積的概率,從而防止一個真實的原假設(shè)。10.3方差分析包括哪些類型它們有何區(qū)別答:方差分析可分為單因素方差分析和雙因素方差分析。區(qū)別:單因素方差分析研究的是一個分類自變量對一個數(shù)值型因變量的影響,而雙因素涉及兩個分類型自變量。10.4方差分析中有哪些基本假定答:〔1〕每個總體都應(yīng)服從正態(tài)分布〔2〕各個總體的方差σ2〔3〕觀測值是獨立的10.5簡述方差分析的基本思想答:它是通過對數(shù)據(jù)誤差來源的分析來判斷不同總體的均值是否相等,進而分析自變量對因變量是否有顯著影響。10.6解釋因子和處理的含義答:在方差分析中,所要檢驗的對象稱為因素或因子,因素的不同表現(xiàn)稱為水平或處理。10.7解釋組內(nèi)誤差和組間誤差的含義答:組內(nèi)平均值誤差的誤差〔SSE〕是指每個水平或組的各個樣本數(shù)據(jù)與其組平均值誤差平方和,反映了每個樣本個觀測值的離散狀況;組間誤差〔SSA〕是指各組平均值與總平均值的誤差平方和,反映了各樣本均值之間的差異程度。10.8解釋組內(nèi)方差和組間方差的含義答:組內(nèi)方差指因素的同一個水平下樣本數(shù)據(jù)的方差;組間方差指因素的不同水平下各個樣本之間的方差。10.9簡述方差分析的基本步驟答:〔1〕提出假設(shè)〔2〕構(gòu)造檢驗統(tǒng)計量〔3〕統(tǒng)計決策10.10方差分析中多重比較的作用是什么答:通過對總體均值之間的配比照擬來進一步檢驗?zāi)男┚抵g存在差異。二、練習(xí)題10.1解:方差分析差異源SSdfMSFP-value組間618.91672309.45834.65740.04087724組內(nèi)598966.44444總計1216.91711一樣10.2解:方差分析差異源SSdfMSFP-value組間93.76812423.4420315.823371.02431E-05組內(nèi)26.66667181.481481總計120.434822不一樣10.3解:ANOVA每桶容量〔L〕平方和df均方F顯著性組間0.00730.0028.7210.001組內(nèi)0.004150.000總數(shù)0.01118不一樣。10.4解:方差分析差異源SSdfMSFP-value組間29.60952214.8047611.755730.000849組內(nèi)18.89048151.259365總計48.517有顯著性差異。10.5解:方差分析差異源SSdfMSFP-value組間615.62307.817.068390.00031組內(nèi)216.41218.03333總計83214有顯著差異。LSD檢驗:計算得,,,有因為,那么決策:〔1〕,所以A生產(chǎn)企業(yè)生產(chǎn)的電池與B生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異;〔2〕,所以不能認為A生產(chǎn)企業(yè)生產(chǎn)的電池與C生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異;〔3〕,所以B生產(chǎn)企業(yè)生產(chǎn)的電池與C生產(chǎn)企業(yè)生產(chǎn)的電池平均壽命有顯著差異。10.6解:方差分析差異源SSdfMSFP-value組間5.34915622.6745788.2745180.001962組內(nèi)7.434306230.323231總計12.7834625有顯著性差異10.7〔1〕方差分析表差異源SSDfMSFP-valueFcrit組間42022101.478102190.2459463.354131組內(nèi)383627142.0740741———總計425629————〔2〕假設(shè)顯著性水平a=0.05,檢驗三種方法組裝的產(chǎn)品數(shù)量之間是否有顯著差異?P=0.025>a=0.05,沒有顯著差異。10.8解:方差分析差異源SSdfMSFP-valueFcrit行1.54933340.38733321.719630.0002367.006077列3.48421.74297.682242.39E-068.649111誤差0.14266780.017833總計5.17614〔1〕或p=0.000236<,所以不同車速對磨損程度有顯著性差異;〔2〕或p=2.39E-06<,所以不同供應(yīng)商生產(chǎn)的輪胎的磨損程度有顯著性差異。10.9解:方差分析差異源SSdfMSFP-valueFcrit行19.06744.766757.2397160.0033153.259167列18.181536.06059.2046580.0019493.490295誤差7.901120.658417總計45.149519結(jié)果說明施肥方法和品種都對收獲量有顯著影響。10.10解:方差分析差異源SSdfMSFP-valueFcrit行22.22222211.111110.0727270.9310566.944272列955.55562477.77783.1272730.1521556.944272誤差611.11114152.7778總計1588.8898〔1〕或p=0.931056>,所以不同銷售地區(qū)對食品的銷售量無顯著性差異;〔2〕或p=0.152>,所以不同包裝對食品的銷售量無顯著性差異。10.11解:方差分析差異源SSdfMSFP-valueFcrit樣本1752287648.666675.49E-086.012905列798239922.166671.4E-056.012905交互182.6667445.666672.5370370.0759024.579036內(nèi)部3241818總計3056.66726競爭者的數(shù)量對銷售額有顯著影響超市位置對銷售額有顯著影響無交互作用10.12解:方差分析差異源SSdfMSFP-valueFcrit樣本344217210.750.0103865.143253列4814830.1339755.987378交互562281.750.2519325.143253內(nèi)部96616總計54411廣告方案對銷售量有顯著影響廣告媒體形式對銷售量無顯著影響無交互作用第11章一元線性回歸一、思考題11.1.變量之間存在的互相依存的不確定的數(shù)量關(guān)系,稱為相關(guān)關(guān)系。相關(guān)關(guān)系的特點:⑴變量之間確實存在著數(shù)量上的依存關(guān)系;⑵變量之間數(shù)量上的關(guān)系是不確定、不嚴格的依存關(guān)系。11.2.相關(guān)分析通過對兩個變量之間的線性關(guān)系的描述與度量,主要解決的問題包括:⑴變量之間是否存在關(guān)系⑵如果存在關(guān)系,它們之間是什么樣的關(guān)系⑶變量之間的關(guān)系強度如何⑷樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系11.3.在進展相關(guān)分析時,對總體主要有以下兩個假定:⑴兩個變量之間是線性關(guān)系;⑵兩個變量都是隨機變量。11.4.相關(guān)系數(shù)的性質(zhì):⑴r的取值范圍是[-1,1],r為正表示正相關(guān),r為負表示負相關(guān),r絕對值的大小表示相關(guān)程度的上下;⑵對稱性:X與Y的相關(guān)系數(shù)和Y與X之間的相關(guān)系數(shù)相等;⑶相關(guān)系數(shù)與原點和尺度無關(guān);⑷相關(guān)系數(shù)是線性關(guān)聯(lián)或線性相依的一個度量,它不能用于描述非線性關(guān)系;⑸相關(guān)系數(shù)只是兩個變量之間線性關(guān)聯(lián)的一個度量,卻不一定意味兩個變量之間有因果關(guān)系;⑹假設(shè)X與Y統(tǒng)計上獨立,那么它們之間的相關(guān)系數(shù)為零;但r=0不等于說兩個變量是獨立的。即零相關(guān)并不一定意味著獨立性。11.5.在實際的客觀現(xiàn)象分析研究中,相關(guān)系數(shù)一般都是利用樣本數(shù)據(jù)計算的,因而帶有一定的隨機性。樣本容量越小,其可信程度就越差,抽取的樣本不同,r的取值也會不同,因此r是一個隨機變量。能否用樣本相關(guān)系數(shù)來反映總體的相關(guān)程度,需要考察樣本相關(guān)系數(shù)的可靠性,因此要進展顯著性檢驗。11.6.相關(guān)系數(shù)顯著性檢驗的步驟:⑴提出假設(shè);⑵計算檢驗統(tǒng)計量t值;⑶在給定的顯著性水平和自由度,查t分布表中相應(yīng)的臨界值,作出決策。11.7.回歸模型是對統(tǒng)計關(guān)系進展定量描述的一種數(shù)學(xué)模型,例如:對于具有線性關(guān)系的兩個變量,可以有一元線性方程來描述它們之間的關(guān)系,描述因變量y如何依賴自變量x和誤差項的方程稱為回歸模型?;貧w方程是對變量之間統(tǒng)計關(guān)系進展定量描述的一種數(shù)學(xué)表達式。指具有相關(guān)的隨機變量和固定變量之間關(guān)系的方程。當總體回歸系數(shù)未知時,必須用樣本數(shù)據(jù)去估計,用樣本統(tǒng)計量代替回歸方程中的未知參數(shù),就得到了估計的回歸方程。11.8.一元線性回歸模型通常有以下幾條基本的假定:⑴變量之間存在線性關(guān)系;⑵在重復(fù)抽樣中,自變量x的取值是固定的;⑶誤差項ε是一個期望為零的隨機變量;⑷)對于所有的x值,誤差項的方差都一樣;⑸誤差項是一個服從正態(tài)分布的隨機變量,且相互獨立。即。11.9.參數(shù)最小二乘法的基本原理是:因變量的觀測值與估計值之間的離差平方和最小。11.10.總平方和指n次觀測值的的離差平方和,衡量的是被解釋變量y波動的程度或不確定性的程度?;貧w平方和反映y的總變差中由于x與y之間的線性關(guān)系引起的y的變化局部,這是可以由回歸直線來解釋的局部,衡量的是被解釋變量y不確定性程度中能被解釋變量x解釋的局部。殘差平方和是除了x對y的線性影響之外的其他因素引起的y的變化局部,是不能由回歸直線來解釋的局部。它們之間的關(guān)系是:總平方和=回歸平方和+殘差平方和。11.11.回歸平方和占總平方和的比例稱為判定系數(shù)。判定系數(shù)測量了回歸直線對觀測數(shù)據(jù)的擬合程度。11.12.在回歸分析中,F(xiàn)檢驗是為檢驗自變量和因變量之間的線性關(guān)系是否顯著,通過均方回歸與均方殘差之比,構(gòu)造F檢驗統(tǒng)計量,提出假設(shè),根據(jù)顯著性水平,作出判斷。t檢驗是回歸系數(shù)的顯著性檢驗,要檢驗自變量對因變量的影響是否顯著,通過構(gòu)造t檢驗統(tǒng)計量,提出假設(shè),根據(jù)顯著性水平,作出判斷。11.13.線性關(guān)系檢驗的步驟:⑴提出假設(shè);;⑵構(gòu)造F檢驗統(tǒng)計量;;⑶根據(jù)顯著性水平,作出判斷?;貧w系數(shù)檢驗的步驟:⑴提出假設(shè);;⑵構(gòu)造t檢驗統(tǒng)計量;;⑶根據(jù)顯著性水平,作出判斷。11.14.回歸分析結(jié)果的評價可以從以下幾個方面:⑴回歸系數(shù)的符號是否與理論或事先預(yù)期相一致;⑵自變量與因變量之間的線性關(guān)系,在統(tǒng)計上是否顯著;⑶根據(jù)判定系數(shù)的大小,判斷回歸模型解釋因變量取值差異的程度;⑷誤差項的正態(tài)假定是否成立。11.15.置信區(qū)間估計是對x的一個給定值,求出y的平均值的區(qū)間估計。預(yù)測區(qū)間估計是對x的一個給定值,求出y的一個個別值的區(qū)間估計。二者的區(qū)別是:置信區(qū)間估計的區(qū)間長度通常較短,而預(yù)測區(qū)間估計的區(qū)間長度要長,也就是說,估計y的平均值比預(yù)測y的一個特定值或個別值更準確。11.16.殘差分析在回歸分析中的作用:回歸分析是確定兩種或兩種以上變量間的定量關(guān)系的一種統(tǒng)計分析方法.判斷回歸模型的擬合效果是回歸分析的重要內(nèi)容,在回歸分析中,通常用殘差分析來判斷回歸模型的擬合效果,并判定關(guān)于誤差項的正態(tài)假設(shè)是否成立。二、練習(xí)題11.1.〔1〕散點圖如下:從散點圖可以看出,產(chǎn)量與生產(chǎn)費用之間為正的線性相關(guān)關(guān)系。〔2〕利用Excel的“CORREL〞函數(shù)計算的相關(guān)系數(shù)為。〔3〕首先提出如下假設(shè):,。計算檢驗的統(tǒng)計量當時,。由于檢驗統(tǒng)計量,拒絕原假設(shè)。說明產(chǎn)量與生產(chǎn)費用之間的線性關(guān)系顯著。11.2〔1〕散點圖如下:從散點圖可以看出,復(fù)習(xí)時間與考試分數(shù)之間為正的線性相關(guān)關(guān)系?!?〕利用Excel的“CORREL〞函數(shù)計算的相關(guān)系數(shù)為。相關(guān)系數(shù),說明復(fù)習(xí)時間與考試分數(shù)之間有較強的正線性相關(guān)關(guān)系。11.3.(1)表示當時的期望值為10?!?〕表示每增加一個單位,平均下降0.5個單位?!?〕時,。1.4.〔1〕表示,在因變量取值的變差中,有90%可以由與之間的線性關(guān)系來解釋?!?〕表示,當用來預(yù)測時,平均的預(yù)測誤差為0.5。11.5.〔1〕散點圖如下:從散點圖可以看出,運送距離與運送時間之間為正的線性相關(guān)關(guān)系?!?〕利用Excel的“CORREL〞函數(shù)計算的相關(guān)系數(shù)為。相關(guān)系數(shù),說明運送距離與運送時間之間有較強的正線性相關(guān)關(guān)系。〔3〕由Excel輸出的回歸結(jié)果如下表:回歸統(tǒng)計MultipleR0.948943RSquare0.900492AdjustedRSquare0.888054標準誤差0.480023觀測值10方差dfSSMSFSignificanceF回歸分析116.6816216.6816272.395852.79E-05殘差81.8433790.230422總計918.525Coefficients標準誤差tStatP-valueIntercept0.1181290.3551480.332620.74797XVariable10.0035850.0004218.5085752.79E-050.002613得到的回歸方程為:回歸系數(shù)表示運送距離每增加1公里,運送時間平均增加0.003585天。11.6.〔1〕散點圖如下:從散點圖可以看出,人均GDP與人均消費水平為正的線性相關(guān)關(guān)系?!?〕利用Excel的“CORREL〞函數(shù)計算的相關(guān)系數(shù)為。相關(guān)系數(shù)接近于1,說明人均GDP與人均消費水平之間有非常強的正線性相關(guān)關(guān)系?!?〕Excel輸出的回歸結(jié)果如下表:回歸統(tǒng)計MultipleR0.998128RSquare0.996259AdjustedRSquare0.995511標準誤差247.3035觀測值7方差分析dfSSMSFSignificanceF回歸181444969814449691331.6922.91E-07殘差530579561159.01總計681750764Coefficients標準誤差tStatP-valueIntercept734.6928139.54035.2650940.003285XVariable10.3086830.00845936.492362.91E-07得到的回歸方程為:。回歸系數(shù)表示人均GDP每增加1元,人均消費水平平均增加0.308683元。〔4〕判定系數(shù)。說明在人均消費水平的變差中,有99.6259%是由人均GDP決定的?!?〕首先提出如下假設(shè):,由于SignificanceF<,拒絕原假設(shè),說明人均GDP與人均消費水平之間的線性關(guān)系顯著。〔6〕〔元〕?!?〕當時,,。置信區(qū)間為:即〔1990.7,2565.5〕。預(yù)測區(qū)間為:即〔1580.3,2975.9〕11.7.〔1〕散點圖如下:從散點圖可以看出,航班正點率與被投訴次數(shù)之間為負的線性相關(guān)關(guān)系?!?〕由Excel輸出的回歸結(jié)果如下表:回歸統(tǒng)計MultipleR0.868643RSquare0.75454AdjustedRSquare0.723858標準誤差18.88722觀測值10方差分析dfSSMSFSignificanceF回歸分析18772.5848772.58424.591870.001108殘差82853.816356.727總計911626.4Coefficients標準誤差tStatP-valueIntercept430.189272.154835.9620290.000337XVariable1-4.700620.947894-4.959020.001108得到的回歸方程為:?;貧w系數(shù)表示航班正點率每增加1%,顧客投訴次數(shù)平均下降4.7次?!?〕回歸系數(shù)檢驗的P-Value=0.001108<〕,拒絕原假設(shè),回歸系數(shù)顯著?!?〕〔次〕〔5〕當時,,置信區(qū)間為:即〔37.7,70.7〕預(yù)測區(qū)間為:即〔7.6,100.8〕11.8.Excel輸出的回歸結(jié)果如下:MultipleR0.7951RSquare0.6322AdjustedRSquare0.6117標準誤差2.6858觀測值20方差分析dfSSMSFSignificanceF回歸1223.1403223.140330.93322.79889E-05殘差18129.84527.2136總計19352.9855Coefficients標準誤差tStatP-valueIntercept49.31773.805012.96120.0000XVariable10.24920.04485.56180.0000由上表結(jié)果可知,出租率與月租金之間的線性回歸方程為:?;貧w系數(shù)表示:月租金每增加1元,出租率平均增加0.2492%。,說明在出租率的變差中被出租率與租金之間的線性關(guān)系所解釋的比例為63.22%,回歸方程的擬合程度一般。估計標準誤差表示,當用月租金來預(yù)測出租率時,平均的預(yù)測誤差為2.6858%,說明預(yù)測誤差并不大。由方差分析表可知,SignificanceF=2.79889E-05<回歸方程的線性關(guān)系顯著。回歸系數(shù)檢驗的P-value=0.0000<,說明回歸系數(shù)顯著,即月租金是影響出租率的顯著性因素。11.9.〔1〕方差分析表中所缺的數(shù)值如下方差分析表如下:變差來源dfSSMSFSignificanceF回歸11422708.61422708.6354.2772.17E-09殘差1040158.074015.807——總計111642866.67———〔2〕根據(jù)方差分析表計算的判定系數(shù)說明汽車銷售量的變差中有86.60%是由于廣告費用的變動引起的?!?〕相關(guān)系數(shù)可由判定系數(shù)的平方根求得:〔4〕回歸方程為:?;貧w系數(shù)表示廣告費用每增加一個單位,銷售量平均增加1.420xx1個單位。〔5〕由于SignificanceF=2.17E-09<,說明廣告費用與銷售量之間的線性關(guān)系顯著。11.10.Excel輸出的回歸結(jié)果如下:回歸統(tǒng)計MultipleR0.968167RSquare0.937348AdjustedRSquare0.916463標準誤差3.809241觀測值5方差分析dfSSMSFSignificanceF回歸分析1651.2691651.269144.883180.006785殘差343.5309414.51031總計4694.8Coefficients標準誤差tStatP-valueIntercept13.625414.3994283.0970860.053417XVariable12.3029320.3437476.6994910.006785由上述結(jié)果可知:回歸方程為,回歸系數(shù)說明,每增加一個單位平均增加2.3029個單位;判定系數(shù),說明回歸方程的擬合程度較高;估計標準誤差,說明用來預(yù)測時平均的預(yù)測誤差為3.8092。11.11.〔1〕檢驗統(tǒng)計量:〔2〕〔3〕由于,所以拒絕原假設(shè)〔4〕根據(jù)相關(guān)系數(shù)與判定系數(shù)之間的關(guān)系可知,〔5〕提出假設(shè):,由于,拒絕,線性關(guān)系顯著。11.12.〔1〕當時,。當,。的平均值的95%的置信區(qū)間為:即〔15.95,18.05〕〔2〕預(yù)測區(qū)間為:即〔14.65,19.35〕11.13.Excel輸出的回歸結(jié)果如下:回歸統(tǒng)計MultipleR0.947663RSquare0.898064AdjustedRSquare0.881075標準誤差108.7575觀測值8方差分析dfSSMSFSignificanceF回歸分析1625246.3625246.352.860650.000344殘差670969.211828.2總計7696215.5Coefficients標準誤差tStatP-valueIntercept-46.291864.89096-0.713380.502402XVariable115.239772.0961017.2705330.000344得到的線性回歸方程為:當時,。當,?!?〕銷售收入95%的置信區(qū)間為:即〔270.65,685.04〕。。11.14.回歸1殘差圖:回歸2殘差圖:結(jié)論:回歸1的殘差基本上位于一條水平帶中間,說明變量之間的線性假設(shè)以及對誤差項正態(tài)假設(shè)是成立,用一元線性回歸方程描述變量間的關(guān)系是適宜的?;貧w2的殘差表示,變量之間用一元線性回歸模型不合理,應(yīng)考慮曲線回歸或多元回歸。11.15.〔1〕估計的回歸方程為:〔2〕由于SignificanceF=0.020<,說明廣告費支出與銷售額之間的線性關(guān)系顯著?!?〕殘差圖從圖上看,關(guān)于誤差項的假定不滿足?!?〕廣告費支出x與銷售額y關(guān)系的散點圖:從廣告費支出x與銷售額y關(guān)系的散點圖上看,用二次函數(shù)或其它曲線模型會更好。第十二章多元線性回歸解釋多元回歸模型、多元回歸方程、估計的多元回歸方程的含義。答:設(shè)因變量為,個自變量分別為,,…,,描述因變量如何依賴于自變量,,…,和誤差項的方程稱為多元回歸模型。其中,,,…,是模型的參數(shù);為誤差項。在多元回歸模型的基本假定下,因變量的期望,該式被稱為多元回歸方程?;貧w方程中的參數(shù),,…,是未知的,需要利用樣本數(shù)據(jù)去估計它們。當用樣本統(tǒng)計量,,…,去估計回歸方程中的未知參數(shù),,…,時,就得到了估計的多元回歸方程。12.2多元線性回歸模型中有哪些基本假定答:〔1〕誤差項是一個期望值為0的隨機變量,即。〔2〕對于自變量,,…,的所有值,的方差都一樣?!?〕誤差項是一個服從正態(tài)分布的隨機變量,且相互獨立,即。12.3解釋多重判定系數(shù)和調(diào)整的多重判定系數(shù)的含義和作用。答:多重判定系數(shù)是多元回歸中的回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個統(tǒng)計量,反映了在因變量的變差中被估計的回歸方程所解釋的比例。為防止增加自變量而高估,統(tǒng)計學(xué)家提出用樣本量和自變量的個數(shù)去調(diào)整,計算出調(diào)整的多重判定系數(shù),其意義與類似,表示在用樣本量和模型中自變量的個數(shù)進展調(diào)整后,在因變量的變差中被估計的回歸方程所解釋的比例。12.4解釋多重共線性的含義。答:當回歸模型中兩個或兩個以上的自變量彼此相關(guān)時,那么稱回歸模型中存在多重共線性。12.5多重共線性對回歸分析有哪些影響答:首先,變量之間高度相關(guān)時,可能會使回歸的結(jié)果混亂,甚至?xí)逊治鲆肫缤?;其次,多重共線性可能對參數(shù)估計值的正負號產(chǎn)生影響,特別是的正負號有可能同預(yù)期的正負號相反。12.6多重共線性的判別方法主要有哪些答:〔1〕模型中各對自變量之間顯著相關(guān)?!?〕當模型的線性關(guān)系檢驗〔F檢驗〕顯著時,幾乎所有回歸系數(shù)的檢驗卻不顯著。〔3〕回歸系數(shù)的正負號與預(yù)期的相反?!?〕容忍度越小,也即方差擴大因子VIF越大,多重共線性越嚴重。通常容忍度小于0.1,也即VIF大于10時,存在嚴重的多重共線性。12.7多重共線性的處理方法有哪些答:〔1〕將一個或多個相關(guān)的自變量從模型中剔除,使保存的自變量盡可能不相關(guān)?!?〕如果要在模型中保存所有的自變量,那就應(yīng)該:防止根據(jù)統(tǒng)計量對單個參數(shù)進展檢驗;對因變量值的推斷〔估計或預(yù)測〕限定在自變量樣本值的范圍內(nèi)。12.8在多元線性回歸中,選擇自變量的方法有哪些答:向前選擇、向后剔除、逐步回歸、最優(yōu)子集等。二、練習(xí)題12.1表示,在不變的條件下,每增加1個單位,會使平均減少0.049714個單位;表示,在不變的條件下,每增加1個單位,會使平均增加1.928169個單位。多重判定系數(shù)和調(diào)整的多重判定系數(shù)顯示:該多元回歸方程的擬合效果較差,在因變量的變差中,能被估計的回歸方程所解釋的比例很少。檢驗說明,與、之間的線性關(guān)系不顯著。檢驗說明,自變量、對因變量的影響均不顯著。12.2模型中涉及3個自變量,15個觀測值。多重判定系數(shù)和調(diào)整的多重判定系數(shù)顯示:該多元回歸方程的擬合效果較好,在用樣本量和模型中自變量的個數(shù)進展調(diào)整后,在因變量的變差中,能被估計的回歸方程所解釋的比例為63.0463%。檢驗說明,與、、之間的線性關(guān)系顯著。檢驗說明,自變量、對因變量的影響均顯著,但對因變量的影響不顯著。12.3(1)故與、、之間的線性關(guān)系顯著?!?〕,故顯著。〔3〕,故顯著。12.4〔1〕〔2〕〔3〕上述〔1〕和〔2〕所建設(shè)的估計的回歸方程,電視廣告費用的系數(shù)符號一樣但數(shù)值大小不同。其中,〔1〕中表示,電視廣告費用每增加1萬元,會使月銷售收入平均增加1.603865萬元;〔2〕中表示,在報紙廣告費用不變的條件下,電視廣告費用每增加1萬元,會使月銷售收入平均增加2.290184萬元?!?〕根據(jù)問題〔2〕所建設(shè)的估計的回歸方程,在月銷售收入的總變差中,被估計的回歸方程所解釋的比例是88.6650%?!?〕根據(jù)問題〔2〕所建設(shè)的估計的回歸方程,,故顯著。,故顯著。12.5〔1〕〔2〕表示,春季降雨量每增加1mm,會使早稻收獲量平均增加22.386461kg/hm2;表示,春季溫度每增加1。C,會使早稻收獲量平均增加327.671713kg/hm2?!?〕可能存在。因為自變量春季降雨量與春季溫度的簡單線性相關(guān)系數(shù)為0.965067。且模型的線性關(guān)系檢驗〔F檢驗〕顯著,但回歸系數(shù)的t檢驗不顯著。12.6〔1〕〔2〕在銷售價格的總變差中,被估計的回歸方程所解釋的比例是87.83%?!?〕故回歸方程的線性關(guān)系顯著。〔4〕,故回歸系數(shù)不顯著。,故回歸系數(shù)顯著。,故回歸系數(shù)不顯著。12.7〔1〕,故二元回歸模型的線性關(guān)系顯著?!?〕,故顯著,不應(yīng)從模型中剔除。〔3〕,故顯著,不應(yīng)從模型中剔除。。12.8〔1〕故無證據(jù)說明二者之間存在線性關(guān)系?!?〕,,故無證據(jù)說明二者之間存在線性關(guān)系?!?〕對預(yù)測無用?!?〕檢驗說明,與、之間的線性關(guān)系顯著。檢驗說明,自變量、對因變量的影響均顯著。這與〔3〕所得結(jié)論不一樣?!?〕,說明模型存在多重共線性。12.9〔1〕,,故無證據(jù)說明銷售價格與購進價格之間存在線性關(guān)系。,,故無證據(jù)說明銷售價格與銷售費用之間存在線性關(guān)系?!?〕根據(jù)〔1〕中結(jié)果,用購進價格和銷售費用來預(yù)測銷售價格無用?!?〕檢驗說明,與、之間的線性關(guān)系不顯著。檢驗說明,自變量、對因變量的影響均顯著?!?〕調(diào)整的多重判定系數(shù)顯示:在用樣本量和模型中自變量的個數(shù)進展調(diào)整后,在因變量的變差中,能被估計的回歸方程所解釋的比例僅為24.4537%。這與〔2〕中的判斷是一致的?!?〕,說明模型存在多重共線性。〔6〕模型中存在多重共線性。第十四章統(tǒng)計指數(shù)1.某企業(yè)生產(chǎn)甲、乙兩種產(chǎn)品,資料如下:產(chǎn)品名稱計量產(chǎn)量單位成本〔元〕單位基期報告期基期報告期甲乙臺噸2000500022006000126.212.56要求:〔1〕計算產(chǎn)量與單位成本個體指數(shù)?!?〕計算兩種產(chǎn)品產(chǎn)量總指數(shù)以及由于產(chǎn)量增加而增加的生產(chǎn)費用?!?〕計算兩種產(chǎn)品單位成本總指數(shù)以及由于成本降低而節(jié)約的生產(chǎn)費用。解:產(chǎn)品名稱計量產(chǎn)量單位成本〔元〕指數(shù)〔%〕單位q0q1z0z1產(chǎn)量單位成本甲乙臺噸2000500022006000126.212.56110120104.296.8〔2〕產(chǎn)量指數(shù):〔3〕單位成本指數(shù):2.某商場銷售的三種商品資料如下:商品名稱計量單位銷售數(shù)量單價〔元〕基期報告期基期報告期甲乙丙千克臺件10020030011522031510050201005525要求:〔1〕計算三種商品的銷售額總指數(shù)?!?〕分析銷售量和價格變動對銷售額影響的絕對值和相對值。解:商品名稱銷售量單價〔元〕銷售額〔元〕q0q1p0p1p0q0p1q1p0q1甲乙丙100200300115220315100502010055251000010000600011500121007875115
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆江西省新余第四中學(xué)高三英語第一學(xué)期期末統(tǒng)考試題含解析
- 2025屆黑龍江哈爾濱市第十九中學(xué)數(shù)學(xué)高三第一學(xué)期期末達標檢測試題含解析
- 2025屆河南省商丘名校高一生物第一學(xué)期期末達標測試試題含解析
- 吳忠市重點中學(xué)2025屆數(shù)學(xué)高二上期末監(jiān)測試題含解析
- 2025屆黑龍江省哈爾濱第九中學(xué)高一數(shù)學(xué)第一學(xué)期期末教學(xué)質(zhì)量檢測試題含解析
- 地理信息技術(shù)應(yīng)用課件
- 新高考英語二輪復(fù)習(xí)講練測專題03 非書信類應(yīng)用文寫作(講義)(原卷版)
- 建設(shè)項目運輸服務(wù)合同(2篇)
- 2025年中考數(shù)學(xué)二輪復(fù)習(xí)《方程實際問題》專題鞏固練習(xí)(三)(含答案)
- 社區(qū)醫(yī)療中心裝修合同樣本
- 《老年社會工作》課件-老年社會生活相關(guān)理論及應(yīng)用
- 微型德育課《對垃圾食品說不》
- 冶金煤氣安全生產(chǎn)培訓(xùn)課件
- 旅游業(yè)中的智能旅游定制平臺
- 拼音四線三格A4打印版
- 2016-2023年湖南鐵路科技職業(yè)技術(shù)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 當代世界經(jīng)濟與政治教案
- 化學(xué)品的爆炸性與防護措施
- 初中班主任班級管理方法
- 解一元一次方程-合并同類項
- 炊事知識講座
評論
0/150
提交評論