版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第一章1.什么是統(tǒng)計學?統(tǒng)計學是一門收集、整理和分析統(tǒng)計數(shù)據(jù)的方法科學,其目的是探索數(shù)據(jù)的內(nèi)在數(shù)量規(guī)律性,以達到對客觀事物的科學認識。2.數(shù)據(jù)分為哪幾種類型?各自的用途是什么?根據(jù)計量方法的不同,可將數(shù)據(jù)分為分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)三種。分類數(shù)據(jù)用來研究事物的構成狀況。順序數(shù)據(jù)既可用來研究事物的構成狀況,也可用來研究事物構成的等級順序特點。根據(jù)數(shù)據(jù)的收集方法的不同將數(shù)據(jù)分為觀測數(shù)據(jù)和試驗數(shù)據(jù)兩種。社會經(jīng)濟現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是觀測數(shù)據(jù)。自然科學領域的數(shù)據(jù)大多數(shù)都為試驗數(shù)據(jù)。根據(jù)時間狀況的不同可將數(shù)據(jù)分為截面數(shù)據(jù)、時間序列數(shù)據(jù)和面板數(shù)據(jù)。截面數(shù)據(jù)往往用來描述某一時刻不同單位、不同地區(qū)等的差異情況。時間序列數(shù)據(jù)往往用來描述現(xiàn)象隨時間變化的趨勢和規(guī)律特點。3.舉例說明總體和個體、標志和變量等概念??傮w是同類事物的集合。如人口普查中的全國人口就是一個統(tǒng)計總體??傮w中的個別事物為個體或稱為總體單位。如人口總體中的每一個人就是一個個體。標志是說明個體某種特征的概念。某個個體在某特征上的具體表現(xiàn)稱為標志表現(xiàn)。例如對于人口總體,性別、年齡、職業(yè)、文化程度等都是標志。變量可以看作是取不同數(shù)值的量。比如年齡、性別、產(chǎn)值等都可看作是變量。4.描述統(tǒng)計和推斷統(tǒng)計的區(qū)別和聯(lián)系描述統(tǒng)計學研究如何取得反映客觀現(xiàn)象的數(shù)據(jù),并通過圖表的形式對所收集的數(shù)據(jù)進行加工處理和顯示,進而通過綜合、概括與分析得出反映客觀現(xiàn)象的規(guī)律性數(shù)量特征。其內(nèi)容包括統(tǒng)計數(shù)據(jù)的收集方法、數(shù)據(jù)的加工處理方法、數(shù)據(jù)的顯示方法、數(shù)據(jù)的分布特征與分析方法等。推斷統(tǒng)計學則是研究如何根據(jù)樣本數(shù)據(jù)去推斷總體數(shù)量特征的方法,他是在對樣本數(shù)據(jù)進行描述的基礎上,對統(tǒng)計總體的未知數(shù)量特征做出以概率形式表述的推斷。描述統(tǒng)計學和推斷統(tǒng)計學的劃分,一方面反映了統(tǒng)計方法發(fā)展的前后兩個階段,同時也反映了應用統(tǒng)計方法探索客觀事物數(shù)量規(guī)律性的不同過程。描述統(tǒng)計是整個統(tǒng)計學的基礎,推斷統(tǒng)計學則是描述統(tǒng)計的進一步深入。5.某研究部門準備在某市300萬個家庭中抽取1000個家庭,推斷該城市所有的職工家庭的人均居住面積,這項研究的總體是(
B
),樣本是(A
)。A.1000個家庭B.300萬個家庭C.1000個家庭的人均居住面積D.300萬個家庭的人均居住面積6.指出下面的變量哪一個屬于分類變量(D
)A.年齡B.工資C.汽車產(chǎn)量D.購買商品時的支付方式(現(xiàn)金.信用卡.支付寶)7.某公司從某大學抽取200個大學生推斷該校大學生的月平均消費水平?;卮鹨韵聠栴}:指出并描述總體和樣本??傮w是該校全部大學生,樣本是200個大學生這里涉及到的統(tǒng)計指標是什么?200名大學生的月平均消費水平8.某研究機構從某單位隨機抽取了50名員工作為樣本進行調(diào)查,其中60%的員工對自己的辦公環(huán)境表示滿意,70%的員工回答他們的月收入在5000元左右,生活壓力大?;卮鹨韵聠栴}:(1)這一研究的總體是什么?總體是該單位的所有員工月收入是分類變量、順序變量還是數(shù)值型變量?月收入是數(shù)值型變量對辦公環(huán)境的滿意程度是什么變量?對辦公環(huán)境的滿意程度是順序型變量第二章1、什么是統(tǒng)計分組,其作用如何?形式有哪些?統(tǒng)計分組是根據(jù)統(tǒng)計分析的目的和要求,按一定的標志將總體劃分為若干個不同的組成部分。通過統(tǒng)計分組可揭示事物的內(nèi)在規(guī)律,其作用有二:(1)區(qū)分社會經(jīng)濟現(xiàn)象的類型。(2)反映和研究總體的內(nèi)部構成。(3)分析研究現(xiàn)象之間的依存關系。有單項式分組和組距式分組兩種形式。2、統(tǒng)計分組過程中應注意哪些問題?離散型變量與連續(xù)性變量的分組有無區(qū)別?在分組時,為遵循統(tǒng)計分組的完備性和互斥性原則,應注意以下幾點:(1)第一組的下限應不高于最小的變量值,最后一組的上限應不低于最大的變量值。(2)若分組變量為連續(xù)性變量,相鄰兩個組的組限應采用重疊的變量值,同時為遵循互斥性原則,在按組歸類整理時,遵循“上限不在內(nèi)原則”。(3)若分組變量為離散型變量,相鄰兩組的組限可以重合也可以不重合,若重合仍然采用“上限不在內(nèi)”的原則進行歸類整理。3、統(tǒng)計調(diào)查有哪些方式?其特點和適用范圍如何?統(tǒng)計調(diào)查的方式主要包括普查、統(tǒng)計報表、抽樣調(diào)查、重點調(diào)查和典型調(diào)查。(1)普查是一種專門組織的一次性全面調(diào)查。重點了解重要的國情國力的一種調(diào)查方式。(2)統(tǒng)計報表是按照國家有關的規(guī)定,自上而下同一布置,自下而上逐級提供統(tǒng)計資料的調(diào)查組織方式。(3)抽樣調(diào)查是取得數(shù)據(jù)資料的最主要的一種方式,它是按照隨機原則從總體中抽取部分單位組成樣本,對樣本指標進行測定,根據(jù)樣本指標推斷總體指標的一種非全面調(diào)查。抽樣調(diào)查有三個特點:第一,從總體中隨機抽取樣本。提高了樣本的代表性。第二、利用樣本指標可推斷總體指標的數(shù)值。第三、抽樣誤差可以準確計算并事先加以控制。抽樣調(diào)查有簡單隨機抽樣、分層抽樣、等距抽樣和整群抽樣四種組織形式。(4)重點調(diào)查是為了了解總體的基本情況,在總體中選擇個別重點單位進行調(diào)查。重點單位是指其標志總量占全部單位標志總量的絕大比重的單位。(5)典型調(diào)查是對總體單位有初步了解的基礎上,有意識的選擇部分有代表性的單位進行調(diào)查。代表性單位是指那些最充分、最集中地體現(xiàn)總體某些共性的單位。4、什么是分布數(shù)列?如何編制分布數(shù)列?把總體中的各個組與其對應的個體數(shù)目一一對應排列,形成反映全部數(shù)據(jù)按其分組標志在各組內(nèi)的分布狀況的數(shù)列稱為頻數(shù)分布或次數(shù)分布數(shù)列,簡稱分布數(shù)列。編制分布數(shù)列的步驟:(1)按斯特格斯(H.A.Sturges)提出的經(jīng)驗公式確定組數(shù)K:。(2)確定各組的組距。(3)組限的確定。(4)各組次數(shù)或頻率的計算。5、在某份問卷中,設置了如下問題:請問您的年齡是:(1)18歲以下,(2)18~25歲,(3)26~35歲,(4)35歲以上現(xiàn)獲得了100名被調(diào)查者的回答數(shù)據(jù)。在以下統(tǒng)計圖.統(tǒng)計表中,最不適宜描述這組數(shù)據(jù)的是(D)A.頻數(shù)分布表
B.柱形圖C.餅圖D.箱線圖6、在抽樣之前先將總體的元素劃分為若干類,然后從各個類中隨機的抽取一定量的元素組成一個樣本,這樣的抽樣方式稱為(
B)A.簡單隨機抽樣B.分層抽樣C.系統(tǒng)抽樣D.整群抽樣7、某公司48名工人某年月平均生活費支出(元)如下,試根據(jù)此資料編制組距式分布數(shù)列。并繪制直方圖。352、312、336、257、408、321、234、268、204、358、270、466、328、347、369、349、397、386、318、382、430、300、484、289、523、476、315、377、294、458、326、365、492、209、446、446、302、277、548、334、400、424、282、308、371、363、337、302解:統(tǒng)計分組(1)組數(shù)(2)(3)確定組限dK?R=350?344=6最小組的下限從最小值204向下延伸4個單位確定為200,最高組的上限從最大值548向上延伸2個單位確定為550.(4)計算各組次數(shù)或頻率形成分布數(shù)列組別次數(shù)200—2503250—3007300—35015350—40010400—4506450—5005500—5502直方圖略8、試根據(jù)如下資料繪制莖葉圖。72、75、60、52、65、90、95、85、76、8692、63、75、53、87、77、69、85、86、6463、66、71、78、84、98、79、62、57、76莖葉523760233456971255667898455667902589、某生產(chǎn)車間50名工人加工零件個數(shù)117、122、124、129、139、107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121對數(shù)據(jù)進行排序107108108110112112113114115117117117118118118119120120121122122122122123123123123124124124125125126126127127127128128129130131133133134134135137139139計算全距R=139-107=32確定組數(shù)K=1+確定各組組距d=(5)根據(jù)分組整理成頻數(shù)表加工零件個數(shù)工人數(shù)比重(%)105~11036110~115510115~120816120~1251428125~1301020130~135612135~14048合計5010010、公司內(nèi)A、B兩部門各有40名員工,年終考核的等級分布如下,考核等級人數(shù)A部門B部門優(yōu)36良615中189及格98不及格42根據(jù)上面的數(shù)據(jù),畫出兩個班考試成績的直方圖和環(huán)形圖比較兩個班考試成績分布的特點。根據(jù)直方圖和環(huán)形圖可以看出,A部門的成績分布為正態(tài)型,居于“中”等級的人數(shù)最多。B部門的成績分布有偏左的趨勢,居于“良”等級的人數(shù)最多(3)畫出雷達圖,比較兩個班考試成績的分布是否相似。根據(jù)雷達圖可以看出兩個部門的成績分布并不相似,A部門成績更多分布在“中”等級,B部門成績更多分布在“量”等級,“優(yōu)”和“不及格”兩個等級分布人數(shù)均較少。11、某行業(yè)所屬40個企業(yè)的年銷售收入數(shù)據(jù)如下:9785121115119138112150113126106119114113881031181421351231561241291161021009295124104119108105110107137117136117108根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并計算出累積頻數(shù)和累積頻率。K=1+R=156-85=71d=RK收入企業(yè)數(shù)頻率(%)累計頻數(shù)累計頻率(%)向上向下向上向下85~9537.53407.5100961593722.592.5101127.520315077.5115~12123032208050122534885201341038695151412.539297.55112.54011002.5合計40100按規(guī)定,銷售收入在125萬元以上為優(yōu)秀企業(yè),115萬元~125萬元為良好企業(yè),105萬元~115萬元為普通企業(yè),105萬元以下為落后企業(yè),按優(yōu)秀企業(yè)、良好企業(yè)、普通企業(yè)、落后企業(yè)進行分組。企業(yè)等級數(shù)量比重(%)優(yōu)秀企業(yè)922.5良好企業(yè)1230普通企業(yè)1025落后企業(yè)922.5合計40100第三章1、簡述算術平均數(shù)、中位數(shù)和眾數(shù)的特點及其應用場合。算術平均數(shù)是描述集中趨勢最常用的指標,等于總體總量除以總體單位數(shù)。易受極端數(shù)值的影響。它具有優(yōu)良的數(shù)學性質(zhì),是實際中應用最廣泛的集中趨勢測度值。當數(shù)據(jù)呈對稱分布或接近對稱分布時,三個均值相等或接近相等,這時應選擇均值作為集中趨勢的代表值。但均值的主要缺點是易受數(shù)據(jù)極端值的影響,對于偏態(tài)分布的數(shù)據(jù),均值的代表性較差。中位數(shù)是將變量值按大小順序排列,處于中點位置的變量值。主要適合于作為定序數(shù)據(jù)、數(shù)值型數(shù)據(jù)的集中趨勢測度值,不受數(shù)據(jù)極端值的影響,對數(shù)據(jù)中的誤差不敏感,當調(diào)查數(shù)均眾存在個別極端數(shù)值時,用中位數(shù)代表其一般水平比算術平均數(shù)好。眾數(shù)是變量數(shù)列中出現(xiàn)次數(shù)最多或密度最大的變量值,從分布的角度看,它能夠鮮明地反映隨機變量分布的集中趨勢,因此,眾數(shù)也是分布密度曲線的高峰位置對應的變量值,是反映分布中心的指標。眾數(shù)可用于定類數(shù)據(jù)、數(shù)值型數(shù)據(jù)的集中趨勢測度值,其特點是不受數(shù)據(jù)極端值的影響2、為什么要計算離散系數(shù)?極差、平均差、方差和標準差等都是反映數(shù)據(jù)分散程度的絕對值,都具有一定的量綱,其數(shù)值的大小除了與變量的離散程度有關外,還受兩個方面的影響:(1)與原變量值本身水平高低有關,也就是說各變異指標與變量的均值大小有關,變量值絕對水平高的,離散程度的測度值自然也就大,絕對水平小的,離散程度的測度值自然也就??;(2)它們與原變量值的計量單位有關,采用不同計量單位計量的變量值,其離散程度的測度值也就不同。因此,對于平均水平不同或計量單位不同的變量數(shù)列,是不能用上述測定離散程度的指標直接比較其離散程度的。為消除變量值水平高低和計量單位不同對離散絕對指標的影響,需要計算具有可比性相對變異指標。3、什么是偏度和峰度,如何測定?偏斜程度是指分布密度曲線的非對稱性的大小,通常用偏態(tài)系數(shù)絕對值的大小來衡量。偏斜狀態(tài)的則定方法有經(jīng)驗則定法、矩法則定兩種。峰度是隨機變量分布密度曲線的峰尖程度。通常與正態(tài)分布相比較,若分布的形狀比正態(tài)分布更瘦更高,則為尖峰分布;若比正態(tài)分布更矮更胖,則為平峰分布。4、算術平均數(shù)、中位數(shù)和眾數(shù)三者之間有何關系?(1)如果數(shù)據(jù)的分布是對稱的,則眾數(shù)、中位數(shù)、和均值完全相等(2)如果數(shù)據(jù)是左偏分布(3)如果數(shù)據(jù)是右偏分布(4)當數(shù)據(jù)分布的偏斜程度不是很大時,算術平均數(shù)到眾數(shù)的距離是算術平均數(shù)到中位數(shù)距離的3倍。即:5、選擇題(1)不同數(shù)列的標準差不能簡單進行對比,這是因為不同數(shù)列的(A,D)A平均數(shù)不同B標準差不同C個體數(shù)不同D計量單位不同(2)某居民區(qū)家庭人口數(shù)的分布資料如下:家庭人口數(shù)(人)1234567戶數(shù)(戶)10508060302010該居民區(qū)家庭人口數(shù)的中位數(shù)是:(C)A130戶B130.5戶C3人D4人(3)變量數(shù)列中出現(xiàn)次數(shù)最多的值是(D)A算術平均數(shù)B調(diào)和平均數(shù)C中位數(shù)D眾數(shù)(4)對于左偏分布,平均數(shù)、中位數(shù)和眾數(shù)之間的關系為(A)A.平均數(shù)<中位數(shù)<眾數(shù)B.中位數(shù)<眾數(shù)<平均數(shù)C.眾數(shù)<中位數(shù)<平均數(shù)
D.眾數(shù)<平均數(shù)<中位數(shù)
(5)在常用的集中趨勢測量指標中,不易受極端值影響的(A)A.眾數(shù)和中位數(shù)B.算術平均數(shù)
C.加權平均數(shù)D.算術平均數(shù)和加權平均數(shù)(6)兩組數(shù)據(jù)的平均數(shù)不等,但標準差相等,則(A)A.平均數(shù)小的,離散程度大B.平均數(shù)大的,離散程度大C.平均數(shù)小的,離散程度小D.兩組數(shù)據(jù)的離散程度相同(7)測度數(shù)據(jù)離散程度的相對統(tǒng)計量是(D)A.極差B.平均差C.標準差D.離散系數(shù)6、為了了解大學生每月生活費用支出情況,某省在全省高校中隨機抽取了250名學生進行調(diào)查,調(diào)查得樣本資料如下:試計算:(1)250名學生的平均生活費用月支出額;(2)月生活費用的中位數(shù)和眾數(shù);(3)月生活費用的標準差。按月生活費支出分組(元)人數(shù)(人)xXf150以下150—200200—250250—300300—350350以上10201109015512517522527532537512503500247502475048751875合計25061000解:(1)x=244(2)中位數(shù)所在組200—250(3)7、某信息傳呼臺兩名接線員5天中每天接呼次數(shù)資料如下:A接線員12010876184165B接線員94681135599從日均次數(shù)的代表性和接線次數(shù)和日分布的均衡性角度作簡要評價和分析。解:x1=130.6σx2=85.8σB接線員日均次數(shù)的代表性較好8、某投資銀行的年利率按復利計算,10年的年利率分別是有一年為7%,有3年為8%,有四年為10%,有兩年為11%,試求平均年利率。解:平均年利率為9.29%9、某系200名學生統(tǒng)計學考試成績分組資料如下表所示:按考試成績分組(分)人數(shù)(人)各組人數(shù)占總人數(shù)比重(%)50以下6350-6012660-70502570-80804080-90402090-100126合計200100試計算:(1)200名學生考試成績的平均分數(shù),中位數(shù)、眾數(shù)、標準差。(2)對其分布狀態(tài)作簡要評述。10、對某校10名考研同學的數(shù)學和英語成績進行調(diào)查,結果如下:數(shù)學13612912213710011010214498103英語68696870717372737475求:(1)如果比較數(shù)學成績和英語成績的差異,你會采取什么樣的統(tǒng)計量、為什么?(2)比較分析哪一門課的分數(shù)差異大?解:我會采用離散系數(shù)統(tǒng)計量進行分析,因為離散系數(shù)是用于平均水平不同或計量單位不同的數(shù)列之間離散程度的比較,且離散系數(shù)越小,差異越小。XσVXσVV數(shù)>V英因此,數(shù)學課的分數(shù)差異大第四章1、選擇題(1)要求估計量的數(shù)學期望等于被估計的總體指標的真值,稱為(C)A一致性B有效性C無偏性D充分性(2)在不放回抽樣下,樣本均值得方差等于(c)ABS2CD(3)置信區(qū)間的長度越短,估計的精度則(a)。A.越高B.越低C.與長短無關D.無法判定(4)若和均為總體指標的無偏估計量,下列哪種情況表示比更有效(c)ABVar()>Var()CVar()<Var()DMSE()<MSE()(5)為了研究城市居民家庭的構成和生活情況,現(xiàn)從某市抽取了一個人36戶家庭的簡單隨機樣本,調(diào)查得樣本資料如下:家庭人口數(shù)(人) 1 2 3 4 5 6 7戶數(shù)(戶) 1 5 14 10 4 1 1試估計該市平均每戶家庭的人口數(shù),并在95%的置信概率下計算該市平均每戶人口數(shù)的置信區(qū)間(A)(注:總體方差未知)A.(3.1,3.9)B.(2.1,2.9)C.(3.1,4.9)D.(2.1,3.9)2、影響樣本容量的因素有哪些?(1)總體中個體之間的差異程度。即總體方差??傮w方差越大,所需的樣本容量越大;反之,總體方差越小,所需的樣本容量越小。(2)允許誤差的大小。允許誤差越小,估計的精確度越高,則所需的樣本容量越大;反之,允許誤差越大,估計的精確度越低,則所需的樣本容量越小。(3)估計的可靠性高低。估計的可靠性越高,所需的樣本容量越大;反之,估計的可靠性越低,所需的樣本容量越小。(4)抽樣方式。在其他條件相同的情況下,采用重置抽樣方式比采用不重置抽樣方式所需的樣本容。3、如果總體方差未知,在確定樣本容量時,應如何?在實踐中,估計樣本量時若未知,可根據(jù)以下方法來確定:第一,根據(jù)歷史資料已有的方差代替;第二,在正式抽樣調(diào)查之前,開展一次試驗性調(diào)查,根據(jù)試驗性調(diào)查所得資料加以估計;第三,如果有多次實驗結果或多個歷史方差,則根據(jù)最大的方差來代替總體方差計算樣本量。4、解:s2=1.4575、解:=2.12S==0.2239 =t因此總體均值95%的置信區(qū)間為(1.96,2.28)6、某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復抽樣從中隨機抽取100人調(diào)查他們的當日產(chǎn)量,樣本人均產(chǎn)量為35件,產(chǎn)量的樣本標準差為4.5件,試以95.45%的置信度估計平均產(chǎn)量的抽樣極限誤差和置信區(qū)間。s=4.5 =z×(1?nN)=總體均值95%的置信區(qū)間為(34.146,35.854)7、(1)解:測試成績(分)60以下60~7070~8080~9090以上X5565758595學生數(shù)(人)F102022408XF5501300165034007607660xS=11.3772 =z=76.62×11.377210該校學生英語測試的平均成績的置信區(qū)間為(73.32,78.87)(2)p=48%大樣本情形下總體比例的置信區(qū)間為:(0.48?2×0.48×0.52平均成績在80分以上的學生所占的比重為(0.38,0.58)8、一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對食品質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標準差10g。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%。112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3解:已知總體服從正態(tài)分布,且標準差為σ=10,n=25,置信水平為1-α=95%,查標準正態(tài)分布表得:Zα/2=1.96根據(jù)樣本計算均值,得x=105.36g于是有:x±Zα/2σn=105.36±3.92=(101.44,109.28)即該批食品平均重量95%的置信區(qū)間為101.44—109.28g9、某地區(qū)教育管理部門想估計兩所中學的學生高考時的英語平均分數(shù),為此在兩所中學獨立抽取兩個隨機樣本,有關數(shù)據(jù)如下表。是分別估計兩所中學高考英語平均分95%的置信區(qū)間。中學1中學2解:中學1:x±Zα2Sn中學2:x±Zα2S中學1高考英語平均分95%的置信區(qū)間為(84.3239,87.6761)中學2高考英語平均分95%的置信區(qū)間為(75.5434,80.4566)10、根據(jù)以往的生產(chǎn)統(tǒng)計,某種產(chǎn)品的合格率約為90%,現(xiàn)要求估計誤差為5%,再求95%的置信區(qū)間時,應抽取多少個產(chǎn)品作為樣本?已知P=90%,α=0.05,Zα/2=1.96,d=5%應抽取的樣本容量為n應該抽取139個產(chǎn)品作為樣本第五章1.簡述假設檢驗的基本思想和程序。假設檢驗的基本思想是小概率原理。小概率原理是指小概率事件在一次試驗中幾乎不可能發(fā)生。一般來說,假設檢驗過程通常包含以下幾個步驟:(1)提出原假設和備擇假設(2)構造檢驗統(tǒng)計量(3)確定拒絕域(4)計算檢驗統(tǒng)計量的值,做出判斷2.均值比較的T檢驗分幾種類型?獨立樣本均值的T檢驗和配對樣本均值的T檢驗3.選擇題(1)單個正態(tài)總體均值的檢驗時若總體方差已知,(C)A.設計的檢驗統(tǒng)計量服從F分布B.設計的檢驗統(tǒng)計量服從卡方分布C.設計的檢驗統(tǒng)計量服從標準正態(tài)分布D.設計的檢驗統(tǒng)計量服從t分布(2)列聯(lián)分析是利用列聯(lián)表來研究(A)A.兩個分類變量的關系B.兩個數(shù)值型變量的關系C.一個分類變量和一個數(shù)值型變量的關系D.兩個數(shù)值型變量的分布(3)設R為列聯(lián)表的行數(shù),C為列聯(lián)表的列數(shù),則分布的自由度為(D)A.RB.CC.R*CD.(R-1)*(C-1)4.解:H0:p=50%,H1:p≠50%樣本比例p=檢驗統(tǒng)計量Z=Z<Z0.0255.略6.解:從兩種工藝條件下生產(chǎn)的產(chǎn)品中各抽取100個樣本屬于獨立樣本。H0:1=2,H1:1≠2Z<Z0.0257.解已知:小樣本,正態(tài)分布,方差相等,1=20.12=19.812=0.1722=0.14。,n1=8,n2=6H0:1=2,H1:1≠2=0.4282對于給定的顯著性水平=0.05,查分布表可得0.025(12)=2.1788,由于||=1.2973<2.1788=0.025(12),所以應接受原假設。認為甲、乙兩臺機器加工的產(chǎn)品平均直徑無顯著差異。8.某企業(yè)生產(chǎn)三種不同口味的點心,為了分析不同性別的消費者的口味偏好,隨機抽取了110名消費者進行調(diào)查,在品嘗三種不同口味的點心后陳述其偏好,結果如下表所示:偏好水果味巧克力味肉味合計性別男15153565女2515545合計403040110在顯著性水平0.05下,檢驗性別是對口味的偏好是否有顯著差異?解:根據(jù)公式可計算得在原假設成立的條件下的期望分布表如下:偏好水果味巧克力味肉味合計性別男23.617.723.665女16.412.316.445合計403040110當顯著性水平為0.05時,,檢驗結果表明性別與口味相關,性別是對口味的偏好是有顯著影響。9.某切割機在正常工作時,切割每段金屬棒的平均長度為10.5cm,標準差為0.15cm,今從一批產(chǎn)品中隨機抽取15段進行測量,其結果如下:10.410.610.110.410.510.310.310.210.910.610.810.510.710.210.7假定切割長度x服從正態(tài)分布,且標準差沒有變化,試問該機器工作是否正常?(α=0.1)解:檢驗假設H0:μ=10.5,H1:μ≠10.5,n=15,x=10.48,α=0.1則x?μ0σ/查表得Z0.05=1.645,于是x?μ0σ/故接受H0,認為該機器工作正常。10.一項統(tǒng)計結果聲稱某市老年人口(年齡在65歲以上)的比重為14.7%,該市老年人口研究會為了檢驗該項統(tǒng)計是否可靠,隨機抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上。調(diào)查結果是否支持該市老年人口比重為14.7%的看法?(顯著性水平為0.05)解:H0:P=14.7%,H1:P≠14.7%α=0.05,n=400,x=10.48,檢驗統(tǒng)計量:Z=0.1425?0.1470.147?Za/2=1.96決策:在α=0.05的水平上沒理由拒絕H0結論:該市老年人口比重為14.7%。11.據(jù)以往的調(diào)查,某產(chǎn)品的消費者50%是中學生,為了了解這一比例是否發(fā)生了變化,該企業(yè)從眾多的消費者中隨機抽取了400名進行調(diào)查,結果有210名消費者為中學生,在0.05顯著性水平下檢驗“50%的消費者是中學生”這一假設。有理由拒絕原假設嗎?解:p=210/400=0.525n=400設:H0:P=50%H1:P≠50%Z=p?PP?(1?P)n=α=0.05Za/2=1.96∵Z<Za/2=1.96∴沒理由原假設H0,購買該產(chǎn)品的顧客中50%的消費者是中學生。第六章1.方差分析的基本原理是什么?總偏差平方和可分解為組間方差與組內(nèi)方差。組間方差即水平間的方差,該方差既有由于水平均值不同而引起的系統(tǒng)性誤差,又有隨機誤差存在。如果H0成立,水平間的方差就只包含隨機誤差,沒有由于均值的不同而導致的系統(tǒng)性差異,此時,組間方差與組內(nèi)方差均是隨機誤差,他們的取值就應該接近,比值應該接近于1;相反若H0不成立,水平間的方差既包含隨機誤差,又有系統(tǒng)性誤差,組間方差大于組內(nèi)方差,二者的比值也顯著的大于1,當大到超過某一臨界值時,就可認為水平均值之間存在差異。2.說明單因素方差分析中SST、SSE、SSA的含義及三者之間的關系。SST總離差平方和,是全部試驗的每一觀察值Xij對其總平均數(shù)的離差平方總和。SST=,為各行觀察值對各該行平均數(shù)(組平均數(shù))的離差平方和的總和,反映的是水平內(nèi)部,或組內(nèi)觀察值的離散狀況,稱其為組內(nèi)平方和或組內(nèi)方差,反映了由于隨機誤差的作用而在數(shù)據(jù)Xij中引起的波動。為組平均數(shù)對總平均數(shù)的離差平方和,反映的是組間差異,其中既包括隨機因素,也包括系統(tǒng)因素,稱其為組間平方和或水平項離差平方和。3.單選題(1)單因素方差分析是指只涉及(A)A.一個分類型自變量B.一個數(shù)值型自變量C.兩個分類型自變量D.兩個數(shù)值型因變量(2)在方差分析中,檢驗統(tǒng)計量F是(B).A.組間平方和除以組內(nèi)平方和B.組間均方除以組內(nèi)均方C.組間平方除以總平方和D.組間均方除以總均方(3)在方差分析中,所提出的原假設是H0:μA.H1:μ1≠μC.H1D.H1:(4)單因子方差分析中,若SST=312.8,n-1=19;SSA=212.8,r-1=4,則F值為(C).A.0.125B.2.128C.7.98D.0.474.設μH0:μ1=方差分析表為方差來源平方和自由度均方F顯著性SSA610.9503203.6508.114.002SSE401.6001625.100SST1012.55019P=0.002<0.05,拒絕原假設,所以不同方式推銷商品的效果有顯著差異5設μH0:μ1=方差分析表為方差來源平方和自由度均方F顯著性SSA175420.222287710.11113.391.000SSE216149.667336549.990SST391569.88935所以不同銷售渠道對銷售額有顯著差異6設μ1、H0:μ1=方差分析表為方差來源平方和自由度均方F顯著性SSA516.0002258.0009.000.003SSE430.0001528.667SST946.00017所以不同培訓材料的培訓效果存在顯著差異7設μ1、H0:μ1=方差分析表為方差來源平方和自由度均方F顯著性SSA1582.3783527.4594.869.014SSE1733.28016108.330SST3315.65819所以不同操作方法對優(yōu)等品率有影響8設μ1、H0:μ1=設a1、H0:a1=方差分析表為方差來源平方和自由度均方F顯著性SSA3.48421.74297.682.000SSB1.54940.38721.720.000SSE0.14380.018SST5.17614溫度和產(chǎn)地均對水果保鮮程度有顯著影響9設μ1、H0:μ1=設a1、H0:a1=方差分析表為方差來源平方和自由度均方F顯著性SSA92.450192.45023.405.000SSB174.0501174.05044.063.000SSAB0.05010.0500.0130.912SSE63.200163.950SST329.75019所以路段、時段對行車時間有顯著影響,路段和時段的交互作用不顯著10(1)方差分析表SSdfMSF組間6.2223.112.22組內(nèi)9.8371.40——總計16.059————(2)設μ1、H0:μ1=因為臨界值4.74>2.22,所以三總體之間沒有顯著性差異第七章1.什么是相關關系?當一個或幾個相互聯(lián)系的變量取一定數(shù)值時,與之相對應的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定范圍內(nèi)變化,變量間的這種具有不確定性的相互關系,稱為相關關系。2.相關分析與回歸分析有何聯(lián)系與區(qū)別?相關分析與回歸分析有著密切的聯(lián)系。相關分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相關的具體形式,而回歸分析則需要依靠相關分析來表明現(xiàn)象數(shù)量變化的相關程度,只有當變量之間存在著高度相關時,進行回歸分析尋求其相關的具體形式才有意義。可以這樣說,相關分析是回歸分析的基礎和前提,回歸分析是相關分析的深入和繼續(xù)。區(qū)別:(1)相關分析中,變量x變量y處于平等的地位;回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預測因變量的變化(2)相關分析中所涉及的變量x和y都是隨機變量;回歸分析中,因變量y是隨機變量,自變量x可以是隨機變量,也可以是非隨機的確定變量(3)相關分析主要是描述兩個變量之間線性關系的密切程度;回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進行預測和控制。3.什么是總體回歸函數(shù)?什么是樣本回歸函數(shù)?它們之間有什么聯(lián)系和區(qū)別?若用Y表示因變量,其主要受自變量X的影響,則Y和X之間的總體回歸函數(shù)可表示為:和為未知參數(shù),也叫回歸系數(shù),為隨機誤差項。在實際應用中,由于無法取得Y和X的全部數(shù)值,一般需要用樣本資料來估計兩變量數(shù)量關系,根據(jù)樣本資料擬合的回歸模型稱為樣本回歸模型,一元線性樣本回歸模型可表示為:和分別是總體回歸系數(shù)和的估計值,為參差,是隨機誤差的估計值,是實際值與估計值之間的差額。4.如何識別多重共線性?在遇到下列情況之一時往往表明多重共線性存在。(1)回歸模型的F檢驗通過,而有的回歸系數(shù)的t檢驗未通過。(2)模型中增加或刪除一個自變量,回歸系數(shù)的估計值有較大的變化。(3)回歸系數(shù)估計值的符號與實際經(jīng)濟判斷的相反。(4)簡單相關系數(shù)矩陣中,兩個自變量之間的相關系數(shù)值較大。通常,簡單相關系數(shù)r>0.7時,應考慮有多重共線性存在。5.選擇題(1)在回歸分析中,被預測或被解釋的變量稱為(B).A.自變量B.因變量C.隨機變量D.非隨機變量(2)在回歸模型中,反映的是(C).A.由于x的變化引起的y的線性變化的部分B.由于y的變化引起的x的線性變化的部分C.除x和y的線性關系之外的隨機因素對y的影響D.x和y的線性關系對y的影響(3)對于有線性關系的兩變量建立的直線回歸方程y=α+βx中,回歸系數(shù)A.可能為0B.可能小于0C.只能是正數(shù)D.只能是負數(shù)(4)由最小二乘法得到的回歸直線,要求滿足因變量的(D).A.平均值與其估計值的離差平方和最小B.實際值與其平均值的離差平方和最小C.實際值與其估計值的離差和為0D.實際值與其估計值的離差平方和最小6.設銷售收入X為自變量,銷售成本Y為因變量?,F(xiàn)已根據(jù)某百貨公司12個月的有關資料計算出以下數(shù)據(jù):(單位:萬元)解(1)y銷售收入每增加1元,銷售成本即增加0.79元。(2)R回歸估計的標準誤σ=S(3)H0:β=0H1:β≠0st=拒絕原假設(4)假定明年1月銷售收入為800萬元,利用擬合的回歸方程預測相應的銷售成本,并給出置信度為95%的預測區(qū)間。Y因此95%的置信區(qū)間為627.37±5.457.根據(jù)表7-7的數(shù)據(jù)建立回歸方程,計算殘差、判定系數(shù)、估計標準誤差,并分析回歸方程的擬合程度。表7-7x15819125y4736564421y殘差:
SSE估計標準誤差se:
s判定R^2:
SST=SSR=R本題判定系數(shù)R^2=0.937348,可以看出擬合程度好。8.為研究銷售收入與廣告費用支出之間的關系,某醫(yī)藥管理部門隨機抽取20家藥品生產(chǎn)企業(yè),得到它們的年銷售收入和廣告費用支出(萬元)的數(shù)據(jù)見表7-8。繪制散點圖描述銷售收入與廣告費用之間的關系,并構建回歸模型。表7-8企業(yè)編號銷售收入廣告費用企業(yè)編號銷售收入廣告費用1618451153140231954301216911753167524013258051047531601493105194239015192506101980161339340790650173627580867313018902809239541019190736010126720020967160銷售收入與廣告費用呈正相關分析由表(1)可得模型檢驗F值為116.3958,P值非常小,即模型是顯著的;由表(2)可得模型的決定系數(shù)R2=0.866067,接近于1,說明模型擬合效果較好由表(3)可得回歸方程的系數(shù)β0=274.5502,β1=5.1308,且參數(shù)β1檢驗的P值較小,則回歸方程為y=274.5502+5.1308x根據(jù)得到的回歸方程可進行因變量y的估計和預測。9.略10.根據(jù)軟件輸出的回歸結果(見表7-10,7-11,7-12),說明模型中涉及多少個自變量、多少個觀察值?寫出回歸方程,并根據(jù)F,R2及調(diào)整的R2表7-10回歸統(tǒng)計值RR調(diào)整的R標準誤差觀測值0.8424070.7096500.630463109.42959615表7-11方差分析表自由度平方和均方F回歸3321946.8018107315.6006殘差11131723.198211974.848.9618總計14453670表7-12回歸分析表系數(shù)標準誤差t截距XXX657.055.7103?0.4169?3.4715167.45951.79180.32221.44293.92363.1868?1.2940?2.4058由表可知,該模型有3個自變量x1、x回歸方程為:y=657.05+5.7103xF值為8.9618,比F的臨界值F(3,11)=3.59大,所以回歸模型整體顯著,R為0.842407,R^2為0.709650,可以看出擬合程度較好,調(diào)整的R^2為0.630463,消除自變量的個數(shù)的影響之后,擬合程度一般。11.某汽車生產(chǎn)廠商欲了解廣告費用(x)對銷售量(y)的影響,收集了過去12年的有關數(shù)據(jù)。通過計算得到了表7-13、表7-14的有關結果:表7-13變差來源dfSSMSFSignificanceF回歸2.17E-09殘差40158.07——總計111642866.67———表7-14參數(shù)估計表Coefficients標準誤差tStatPvalueIntercept363.689162.455295.8231910.000168XVariable1.4202110.07109119.977492.17E-09要求:完成上面的方差分析表。變差來源dfSSMSFSignificanceF回歸11422708.61422708.6354.2772.17E-09殘差1040158.074015.807——總計111642866.67———汽車銷售量的變差中有多少是由廣告費用的變動引起的?R2=SSR銷售量與廣告費用之間的相關系數(shù)是多少?r=寫出估計的回歸方程并解釋回歸系數(shù)的實際意義。y=363.6891+142021x,回歸系數(shù)為1420211,表示廣告費用每變動一個單位,銷售量平均變動(5)檢驗線性關系的顯著性(α=0.05)。SignificanceF=2.17E-09<0.05,回歸模型顯著第八章1.什么是時間數(shù)列?其基本要素及作用是什么?時間數(shù)列,也稱為時間序列或動態(tài)數(shù)列,是將社會經(jīng)濟指標的數(shù)值按照時間順序加以排列而形成的數(shù)列。時間數(shù)列由兩大要素所構成,一個是統(tǒng)計指示所屬的時間,另一個是統(tǒng)計指標在不同時間上的觀測值。進行時間數(shù)列分析的作用主要有:1.描述事物的發(fā)展現(xiàn)狀和結果。2.研究事物的發(fā)展趨勢和發(fā)展快慢的程度。3.探索事物發(fā)展變化的特點和規(guī)律性。4.對事物發(fā)展的未來狀況進行科學的預測。2.環(huán)比發(fā)展速度和定基發(fā)展速度有何關系?環(huán)比發(fā)展速度是報告期水平與其前一期水平之比,定基發(fā)展速度是報告期水平與某一固定基期水平之比。各期環(huán)比發(fā)展速度的連乘積等于定基發(fā)展速度。3.平均發(fā)展速度的計算有哪兩種方法?各有什么特點?如何正確使用?平均發(fā)展速度是時間數(shù)列中各期環(huán)比發(fā)展速度的平均數(shù),表明事物在一定時期內(nèi)逐期平均發(fā)展變化的程度。平均發(fā)展速度的計算方法有幾何平均法和方程法兩種。幾何平均法又稱為水平法。這是因為用這種方法計算平均發(fā)展速度的出發(fā)點是要求在期初水平()的基礎上,按平均發(fā)展速度發(fā)展所達到的理論期末水平()與同期按各年實際發(fā)展速度發(fā)展所達到的實際期末水平()保持一致,即必須滿足關系式:由此可見,幾何平均法(即水平法)的特點是側重于考察最末一期的發(fā)展水平,可以直接用期末水平比期初水平計算方程法又稱為累計法。這是因為用方程法計算平均發(fā)展速度,側重于考察時間數(shù)列各期發(fā)展水平的累計總量,用方程法平均發(fā)展速度推算出的各期理論水平之和等于各期的實際水平之和。因此,方程法適宜于基建投資總額、植樹造林總面積等側重于觀察全期累計總量指標平均發(fā)展速度的計算4.什么是長期趨勢?如何測定?長期趨勢是指由于制約客觀事物發(fā)展的各種持續(xù)增大或減少的因素作用,而使得所考察的指標所表現(xiàn)出的具有一定方向性的增長或減少趨勢。測定長期趨勢的方法很多,常用的方法由移動平均法和數(shù)學模型法兩種。5.常用趨勢模型有哪幾種?如何正確選擇使用?a直線趨勢模型:b指數(shù)曲線趨勢模型:c二次曲線趨勢模型:d修正指數(shù)曲線趨勢模型:e龔珀茨曲線趨勢模型:f邏輯曲線趨勢模型:首先,根據(jù)觀察數(shù)據(jù)繪制散點圖,從而發(fā)現(xiàn)其數(shù)量變化規(guī)律,根據(jù)圖形的變化特點確定適當?shù)内厔菽P?。其次,可根?jù)時間數(shù)列本身的變動特點,通過計算相應的指標來確定趨勢模型。對于時間數(shù)列,若其觀測值的逐期增長量大致相同,可采用直線趨勢模型;若其二級增長量即逐期增長量的逐期增長量大致相同,可采用二次曲線趨勢模型;若其環(huán)比發(fā)展速度大致相同,可采用指數(shù)曲線趨勢模型;若其對數(shù)的逐期增長量的環(huán)比發(fā)展速度大致相同,可采用龔珀茨曲線模型;若其倒數(shù)的逐期增長量的環(huán)比發(fā)展速度大致相同,可采用邏輯曲線模型。6.什么是季節(jié)變動?如何測定?季節(jié)變動是客觀事物隨著天氣的變化和四季的更替而表現(xiàn)出的一種規(guī)律性的變動。有同期直接平均法和長期趨勢剔除法兩種測定方法7.時間數(shù)列的構成因素有哪些?長期趨勢、季節(jié)變動、循環(huán)變動和不規(guī)則變動8.某企業(yè)9月份職工人數(shù)資料如下:日期1日9日16日25日30日職工人數(shù)(人)220250260274268試求該企業(yè)9月份的平均職工人數(shù)。9.解:時間4月5月6月7月商品銷售額(萬元)160210240月初庫存額(萬元)55655560平均商品庫存額606057.5商品流轉次數(shù)2.673.54.17第二季度平均商品庫存額第二季度商品流轉次數(shù)=160+210+24010.解:年份200620072008200920102011職工平均工資(元)250027002950310033003500逐期增長量200250150200200累積增長量2004506008001000環(huán)比發(fā)展速度%108109.26105.08106.45106.06環(huán)比增長速度89.265.086.456.06定基發(fā)展速度108118124132140平均增長量=1000/5=200平均發(fā)展速度=5平均增長速度=6.96%11.y=215.28+153.83t(2001年為原點2012年t=11,代入方程得2012年產(chǎn)值=215.28+153.83×11=1907.4112.某地1996-2000年的糧食產(chǎn)量資料如下:年份199619971998199920002001糧食產(chǎn)量(萬噸)320332340356380400試用最小二乘法擬合直線趨勢方程,并據(jù)以預測2002、2003、2004年的糧食產(chǎn)量。解:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45060-2024黑斑側褶蛙
- 二零二五年抖音短視頻內(nèi)容版權代理與維權合同3篇
- 二零二五版影視作品制作定金合同附屬協(xié)議書3篇
- 2025年度設計公司技術秘密保護合同3篇
- 二零二五版反擔保證券交易合同3篇
- 2024年通信基站租賃協(xié)議標準格式版
- 2024版醫(yī)院勞動聘用合同范本
- 2025年抖音美妝品牌合作協(xié)議2篇
- 2024版竹制品買賣合同范本
- 二零二五年度白酒企業(yè)供應鏈優(yōu)化與風險控制合同3篇
- 冬春季呼吸道傳染病防控
- 中介費合同范本(2025年)
- 《kdigo專家共識:補體系統(tǒng)在腎臟疾病的作用》解讀
- 生產(chǎn)調(diào)度員崗位面試題及答案(經(jīng)典版)
- 【物 理】2024-2025學年八年級上冊物理寒假作業(yè)人教版
- 交通運輸安全生產(chǎn)管理規(guī)范
- 電力行業(yè) 電力施工組織設計(施工方案)
- 《法制宣傳之盜竊罪》課件
- 通信工程單位勞動合同
- 查對制度 課件
- 2024-2030年中國豬肉市場銷售規(guī)模及競爭前景預測報告~
評論
0/150
提交評論