應(yīng)用統(tǒng)計專業(yè)統(tǒng)計學習題及真題解析學生講義_第1頁
應(yīng)用統(tǒng)計專業(yè)統(tǒng)計學習題及真題解析學生講義_第2頁
應(yīng)用統(tǒng)計專業(yè)統(tǒng)計學習題及真題解析學生講義_第3頁
應(yīng)用統(tǒng)計專業(yè)統(tǒng)計學習題及真題解析學生講義_第4頁
應(yīng)用統(tǒng)計專業(yè)統(tǒng)計學習題及真題解析學生講義_第5頁
已閱讀5頁,還剩139頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第—章緒論 (第二章統(tǒng)計數(shù)據(jù)的收 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!(第三章數(shù)據(jù)的圖表展 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!(第四章數(shù)據(jù)概括性的度 (第五章參數(shù)估計 (第六章假設(shè)檢驗 (第七章方差分析 (第八章相關(guān)與回歸分 (第九章多元線性回 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!(第十章時間序列分 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!(統(tǒng)計學習題及解第一 ~、本章重統(tǒng)計學常用的幾個基本概念、統(tǒng)計學的數(shù)據(jù)類型二、本章知識點回1.統(tǒng)計學?怎樣理解統(tǒng)計學與統(tǒng)計數(shù)據(jù)的關(guān)系答:統(tǒng)計學是關(guān)于數(shù)據(jù)的一門學科;它所提供的是一套有關(guān)數(shù)據(jù)的收集、處理、分析和解釋并從數(shù)據(jù)中得出結(jié)論的方法方法可分為描述性統(tǒng)計方法和推斷性統(tǒng)計方法。統(tǒng)計學是研究數(shù)據(jù)的科學,所以,統(tǒng)計學離不開統(tǒng)計數(shù)據(jù),兩者是“巧婦”與“米”的關(guān)系;沒有統(tǒng)計數(shù)據(jù),再好的方法也是脫離實際的空談;而沒有好的統(tǒng)計方法,再豐富的統(tǒng)計數(shù)據(jù)也很難發(fā)揮應(yīng)有的作用。2.解釋描述統(tǒng)計和推斷統(tǒng)計答:描述統(tǒng)計研究的是數(shù)據(jù)收集理總表描述括與分析等統(tǒng)計方法。推斷統(tǒng)計是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法。3.統(tǒng)計數(shù)據(jù)有哪些類型?不同類型特點是什么答:(1)統(tǒng)計數(shù)據(jù)按所采用的計量尺度不同分為分類數(shù)據(jù)序數(shù)據(jù)和數(shù)值型數(shù)據(jù)分類數(shù)據(jù)于定性數(shù)據(jù)能歸于某一類別的非數(shù)字型數(shù)據(jù)是對事物進行分類的結(jié)果據(jù)表現(xiàn)為類別文字來表述;順序數(shù)據(jù)于定性數(shù)據(jù)能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。它也是有類別的,但這些類別是有序的。數(shù)值型數(shù)據(jù)于定量數(shù)據(jù)按數(shù)字尺度測量的觀察值結(jié)果表現(xiàn)為具體的數(shù)值同時具備分類數(shù)據(jù)和順序數(shù)據(jù)的定性和排序的功能,(2)統(tǒng)計數(shù)據(jù)按收集方法分為觀測數(shù)據(jù)和實驗數(shù)據(jù)觀測數(shù)據(jù):是通過或觀測而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒有對事物人為控制的條件下得到的。實驗數(shù)據(jù)實驗中控制實驗對象而收集到的數(shù)據(jù)(3)統(tǒng)計數(shù)據(jù)按被描述的現(xiàn)象與時間的關(guān)系分為截面數(shù)據(jù)和時間序列數(shù)據(jù)1考試點(www.kaoshidian.com)名師精品課 :4006885365截面數(shù)據(jù)在相同或相似的時間點收集到的數(shù)據(jù)叫靜態(tài)數(shù)據(jù)時間序列數(shù)據(jù)按時間順序收集到的于描述現(xiàn)象隨時間變化的情況叫動態(tài)數(shù)據(jù)4.舉例說明總體,樣本,參數(shù),統(tǒng)計量,變量這幾個概念答:例如,對1000個燈泡進行測試,那么這1000個燈泡就是總體,從中抽?。保埃皞€進行檢測,這100個燈泡的集合就是樣本,這一千個燈泡的的平均值和標準差還有等描述特征的數(shù)值就是參數(shù),這一百個燈泡的的平均值和標準差還有等描述特征的數(shù)值就是統(tǒng)計量,變量就是說明現(xiàn)象某種特征的概念,比如說燈泡的。三、本章習題解答及典型題型解1.一家大型油漆零售商收到了客戶關(guān)于油漆罐分量不足的許多抱怨。因此,他們開始檢查供貨商的集裝箱,有問題的將其退回。最近的一個集裝箱裝的是2440加侖的油漆罐。這家零售商了50罐油漆,每一罐的質(zhì)量精確到4位小數(shù)。裝滿的油漆罐應(yīng)為4.536kg。要求:(1)描述總體(2)描述研究變量(3)描述樣本(4)描述推斷答:(1)總體近的一個集裝箱內(nèi)的全部油漆(2)研究變量滿的油漆罐的質(zhì)量(平均重量(3)樣本近的一個集裝箱內(nèi)的50罐油漆(4)推斷50罐油漆的質(zhì)量應(yīng)為4.536×50=226.8kg推斷該集裝箱質(zhì)量2.“可樂戰(zhàn)”是描述市場上“可口可樂”與“百事可樂”激烈競爭的一個流行術(shù)語。這場戰(zhàn)役因影視、運動員的參與以及消費者對品嘗試驗優(yōu)先權(quán)的抱怨而頗具特色。假定作為百事可樂戰(zhàn)役的一部分,選擇了1000名消費者進行性質(zhì)的品嘗試驗(即在品嘗試驗中,兩個品牌不做外觀標記),請每一名被測試者說出A品牌或B品牌中哪個口味更好。要求:(1)描述總體(2)描述研究變量(3)描述樣本(4)描述推斷答:(1)總體:市場上的“可口可樂”與“百事可樂(2)研究變量好口味的品牌名稱(比率(3)樣本1000名消費者品嘗的兩個品牌可(4)推斷1000名消費者品嘗的品牌口味更好所占比率大小斷總體中哪個品牌口味更好2統(tǒng)計學習題及解四、解1.分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值數(shù)據(jù)的區(qū)別。[首經(jīng)貿(mào)2007研答:按照所采用的計量尺度不同以將統(tǒng)計數(shù)據(jù)分為分類數(shù)據(jù)序數(shù)據(jù)和數(shù)值型數(shù)據(jù)分類數(shù)據(jù)是只能歸于某一類別的非數(shù)字型數(shù)據(jù),它是對事物進行分類的結(jié)果,數(shù)值表現(xiàn)為類別,是用文字來表述的。順序數(shù)據(jù)是只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。順序數(shù)據(jù)雖然也是類別,但這些類別是有序的。數(shù)值型數(shù)據(jù)是按數(shù)字尺度測量的觀察值。其結(jié)果表現(xiàn)為具體的數(shù)值?,F(xiàn)實中所處理的大多數(shù)都是數(shù)值型數(shù)據(jù)。分類數(shù)據(jù)和順序數(shù)據(jù)說明的是事物的品質(zhì)特征,通常是用文字來表述的,其結(jié)果均表現(xiàn)為類別,因而也可統(tǒng)稱為定性數(shù)據(jù)或稱品質(zhì)數(shù)據(jù);數(shù)值型數(shù)據(jù)說明的是現(xiàn)象的數(shù)量特征,通常是用數(shù)值來表現(xiàn)的此也可稱為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。2.什么叫變異、變量和變量值,試舉例說明。[西安交大2006研答:標志在同一總體不同總體單位之間的差別稱為變異。例如:人的標志表現(xiàn)為男、女;標志表現(xiàn)為20歲30歲等。變異標志又稱為變量說明現(xiàn)象某種特征的概念特點是從一次觀察到下一次觀察結(jié)果會呈現(xiàn)出差別或變化。變量的具體取值稱之為變量值。具體包括:(1)分類變量,如“”就是分類變量,其變量值為“男”或“女”(2)順序變量“產(chǎn)品等級”就是順序變量,其變量值可以為“一等品”、“二等品”、“三等品”、“次品”等;(3)數(shù)值型變量,如“”是連續(xù)數(shù)值型變量,變量值為非負數(shù);“企業(yè)數(shù)”是離散數(shù)值型變量,變量值為12……。3.試述統(tǒng)計總體及其特征。[大學2000研答:總體是包含所研究的全部(數(shù)據(jù))的集合,它通常由所研究的一些組成,如由多個企業(yè)構(gòu)成的集合,多個居民戶構(gòu)成的集合,多個人構(gòu)成的集合,等等??傮w根據(jù)其所包含的單位數(shù)目是否可數(shù)可以分為有限總體和無限總體。有限總體是指總體的范圍能夠明確確定,而且元素的數(shù)目是有限可數(shù)的。通常情況下計上的總體是一組觀測數(shù)據(jù)不是一群人或一些物品的集合。總體具有的特征包括(1)同質(zhì)性,即總體單位必須具有某一共同的品質(zhì)標志屬性或數(shù)量標志數(shù)值。它是構(gòu)成總體的條件;(2)大量性構(gòu)成總體的總體單位數(shù)目要足夠多(3)差異性總體單位必須具有一個或若干個品質(zhì)變異標志或數(shù)量變異標志3考試點(www.kaoshidian.com)名師精品課 :4006885365第二 統(tǒng)計數(shù)據(jù)的收~、本章重統(tǒng)計數(shù)據(jù)的來源、方法概率抽樣和非概率抽樣二、本章知識點回1.從使用者的角度,數(shù)據(jù)主要來源于哪里答:數(shù)據(jù)主要來源于兩種:一是來源于直接的和實驗,稱之為第一手數(shù)據(jù)或直接來源數(shù)據(jù);二是來源于別人或?qū)嶒灥臄?shù)據(jù),稱之為第二手數(shù)據(jù)或間接來源數(shù)據(jù)。2.比較概率抽樣和非概率抽樣的特點,分別適應(yīng)哪些情況?答:概率抽樣的特點是:(1)按隨機原則抽樣,每個單位被抽中的概率已知或可以計算,并且不受研究的意愿的影響;(2)技術(shù)含量和成本較高(3)適用于推斷總體參數(shù)或總體參數(shù)的置信區(qū)間般的抽樣推斷都是采用概率抽樣(4)常用的概率抽樣的方法有單隨機抽樣層抽樣統(tǒng)抽樣和整群抽樣;非概率抽樣的特點:(1)研究有意識的選取樣本單位,樣本單位的抽取不是隨機的(2)操作簡單效快本低且對于抽樣中的統(tǒng)計學專業(yè)技術(shù)要求不是很高(3)它適合探索性的研究,結(jié)果用于發(fā)現(xiàn)問題,為更深入的數(shù)量分析提供準備。也可以適用于市場中的概念測試(不需要結(jié)果投影到總體的情況)。三、本章習題解答及典型題型解單項選擇題1.二手數(shù)據(jù)的特點是 A.搜集方便、快、成本低 B.數(shù)據(jù)的成本低,搜集比較C.數(shù)據(jù)可靠性較好 D.數(shù)據(jù)的相關(guān)性較好4統(tǒng)計學習題及解2.研究根據(jù)對研究對象的了解有目的選擇一些單位作為樣本,這種方式是( A.自愿抽樣 B.抽樣C.方便抽 D.判斷抽3.下列選項中,抽樣的結(jié)果不能用于對總體有關(guān)參數(shù)進行估計的是( A.分層抽樣 B.判斷抽樣C.整群抽 D.系統(tǒng)抽4.與概率抽樣相比,非概率抽樣的優(yōu)點是( A.樣本統(tǒng)計量的分布是確定的B.可以利用樣本的結(jié)果對總體相應(yīng)的參數(shù)進行判斷C.操作簡便、時效快、成本低D.技術(shù)含量更5.某所大學需要了解學生每天的時間分配情況,改善學校的上自習問題。將問卷發(fā)給上自習者,填寫后再收上來。此種收集數(shù)據(jù)的方法屬于( A.面訪式問卷 B.自填式問卷C.實驗 D.觀察式6.為了了解某廠生產(chǎn)的電燈泡,在收集數(shù)據(jù)時,最有可能采用的數(shù)據(jù)收集方法是( A.普查 B.公開的資料C.隨機抽 D.實驗7.下列關(guān)于抽樣誤差的說法,正確的是 A.抽樣誤差是針對某個具體樣本的檢測結(jié)果與總體真實結(jié)果的差異而言的B.樣本量越大,抽樣誤差就越?。茫闃幼兂善詹闀r,抽樣誤差大于零D.總體的變異性越大,抽樣誤差也就越8.如果一個樣本因人過意而,這種誤差屬于( A.抽樣誤差 B.實驗誤差C.設(shè)計誤 D.非抽樣誤9.某餐廳為了了解顧客對餐廳的意見和看法,管理隨即抽取了50名顧客,上門通過問卷進行。這種數(shù)據(jù)的收集方法稱為( A.觀察式 B.實驗C.面訪式問卷 D.自填式問卷10.某居民小區(qū)為了解住戶對物業(yè)服務(wù)的看法,準備采取抽樣方式搜集。物業(yè)管理部門利用起初的居民戶登記進行抽樣。但現(xiàn)在的小區(qū)中,原有的一些居民戶已經(jīng)搬走,同時有些是新入住的居民戶。這種產(chǎn)生的誤差屬于 5考考試點(www.kaoshidian.com)名師精品課: 6885A.隨機誤差C.回答誤

B.抽樣框誤差D.無回答誤11.某居民小區(qū)的物業(yè)管理者為了解住戶每月情況,采取抽樣方式對部分居民戶進行,發(fā)現(xiàn)有些居民戶有虛報或情況。這種產(chǎn)生的誤差屬于( A,回答誤 B.抽樣框誤C.有意識誤 D.無回答誤12.下列關(guān)于誤差的敘述,錯誤的是 A.抽樣誤差是可以避免 B.抽樣誤差是可以控制C.抽樣誤差是不可避免 D.非抽樣誤差控制起來比較四、解單項選擇題1.某地為推廣先進企業(yè)的生產(chǎn)經(jīng)營管理經(jīng)驗,對效益最好的幾個企業(yè),此種屬 )[首經(jīng)貿(mào)2007研A.重點 B.典型C.普 D.抽樣2.抽樣誤差的大小 )[首經(jīng)貿(mào)2007研A.既可以避免,也可以控 B.無法避免,但可以控C.無法避免,也無法控制 D.可以避免,但無法控制多項選擇題:1.在造成抽樣數(shù)據(jù)的誤差中,以下那些屬于非抽樣誤差( )[西安交大2008研]A.被人回答誤差 B.員誤差C.抽樣樣本沒有遵循隨機原則 D.樣本容量太少而不具備代表性E.被人無回答誤差2.下面抽樣方式中,屬于非概率抽樣的有( )[西安交大2007研]A.方便抽樣 B.滾雪球抽樣C.抽 D.多階段抽E.自愿抽樣簡答題:1.統(tǒng)計數(shù)據(jù)質(zhì)量的基本標準是什么?[湖南大學2007研答:(1)準確數(shù)字語言來反應(yīng)客觀實際;(2)快速:統(tǒng)計信息服務(wù)必須具有時效性和緊迫性(3)完整:單位沒有遺漏,項目沒有缺陷,資料數(shù)據(jù)齊全;(4)精煉:統(tǒng)計信息具有針對性、有效性、精確性。6統(tǒng)計學習題及解2.抽樣誤差影響因素分析。[西安交大2003研]答:影響抽樣誤差的因素主要有:(1)樣本單位數(shù)目。在其他條件不變的情況下樣數(shù)目越多樣誤差越小樣數(shù)目越少,抽樣誤差越大。當n=N時,就是全面,抽樣誤差此時為零;(2)總體標志變動程度。其他條件不變的情況下體標志變異程度越大樣誤差越大體變異程度越小樣誤差越??;(3)抽樣方法。一般講重復(fù)抽樣的抽樣誤差小于重復(fù)抽樣的抽樣誤差。當n相對N非常小時種抽樣方法的抽樣誤差相差很小忽略不計;(4)抽樣組織方式。采用不同的抽樣組織方式會有不同的抽樣誤差。一般講分層抽樣的抽樣誤差較小整群抽樣的抽樣誤差較大。7考試點(www.kaoshidian.com)名師精品課 :4006885365第三 數(shù)據(jù)的圖表展~、本章重數(shù)據(jù)的預(yù)處理、用圖表展示定性數(shù)據(jù)、用圖表展示定量數(shù)二、本章知識點回1.數(shù)據(jù)的預(yù)處理?包括哪些內(nèi)容答:數(shù)據(jù)的預(yù)處理是數(shù)據(jù)整理和分析的先前步驟,它是在對數(shù)據(jù)分類或分組之前所做的必要處理;其內(nèi)容包括有數(shù)據(jù)的審核(審核數(shù)據(jù)的完整性、準確性、適用性和實效性),數(shù)據(jù)的篩選和數(shù)據(jù)的排序。2.分類數(shù)據(jù)和順序數(shù)據(jù)的整理和圖示方法各有哪些答:分類數(shù)據(jù)制作頻數(shù)分布表,可用百分比,比率等進行描述性分析;用條形圖,帕累托圖(柱形圖)和餅圖進行圖示分析。順序數(shù)據(jù)制作頻數(shù)分布表,用百分比、比率,累計頻數(shù)和累計頻率等進行描述性分析;可用條形圖累托圖和餅圖計頻數(shù)分布圖和環(huán)形圖進行圖示分析。3.簡要回答數(shù)據(jù)型數(shù)據(jù)的分組方法和步答:分組方法有單項式分組和組距式分組距分組又分為等距分組和異距分組;分組步驟:(1)確定組(2)確定各組組(3)根據(jù)分組整理成頻數(shù)分布4.直方圖和條形圖有哪些區(qū)答:(1)條形圖使用圖形的長度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù)形的高度表示每一組的頻數(shù)或頻率度表示組距;(2)直方圖各矩形連續(xù)排列形圖分開排列(3)條形圖主要展示分類數(shù)據(jù)方圖主要展示數(shù)值型數(shù)據(jù)5.餅圖和環(huán)形圖的不答:餅圖只能顯示一個樣本或總體各部分所占比例形圖可以同時繪制多個樣本或總體的數(shù)8統(tǒng)計學習題及解系列圖形中間有個“空洞”個樣本或總體的數(shù)據(jù)系類為一個環(huán)6.莖葉圖比直方圖的優(yōu)勢,他們各自的應(yīng)用場合答:莖葉圖既能給出數(shù)據(jù)的分布情況能給出每一個原始數(shù)據(jù)保留了原始數(shù)據(jù)的信息。在應(yīng)用方面方圖通常適用于大批量數(shù)據(jù)葉圖適用于小批量數(shù)據(jù)。三、本章習題解答及典型題型解1.為評價家電行業(yè)的質(zhì)量,隨機抽取了由100家庭構(gòu)成的一個樣本。服務(wù)質(zhì)量的等級分別表示為:A.好;B.較好;C.一般;D.差;E.較差。結(jié)果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(1)上面的數(shù)據(jù)屬于什么類型(2)用Excel制作一張頻數(shù)分布表(3)繪制一張條形圖,反映評價等級的分布解:(1)由于上表中的數(shù)據(jù)為服務(wù)質(zhì)量的等級,可以進行優(yōu)劣等級比較不能計算差異大小,屬于順序數(shù)據(jù)。(2)頻數(shù)分布表如下服務(wù)質(zhì)量等級評價的頻數(shù)分服務(wù)質(zhì)量級家庭數(shù)(數(shù))頻率ABCDE合9考試點(www.kaoshidian.com)名師精品課 :4006885365(3)條形圖的制作:將上表(包含總標題,去掉合計欄)到Excel表中,點擊:圖表向?qū)А鷹l形圖→選擇子圖表類型→完成(見Excel練習題2.1)。即得到如下的條形圖:2.某百貨公司連續(xù)40天的商品銷售額如下(單位:萬元)根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖解:全部數(shù)據(jù)中大的為49小的為25數(shù)據(jù)全距為49-25=為便于計算和分析定將數(shù)據(jù)分為5組組組距為5限以整5的倍數(shù)劃分為使數(shù)據(jù)的分布滿足窮盡和互斥的要求意到上面的分組方式小值25已落在最小組之中大值49已落在最大組之中將各組均設(shè)計成閉口形式;按照“上限不包括原則”,用劃記法或用Excel統(tǒng)計各組內(nèi)數(shù)據(jù)的個數(shù) 天數(shù),并填入表內(nèi),得到頻數(shù)分布表如下表中的左兩列;將各組天數(shù)除以總天數(shù)40到各組頻率入表中第三列;得到頻數(shù)分布表如下:某百貨公司日商品銷售額分組按銷售額分組(萬元頻數(shù)(天頻率(%25~410.30~615.35~37.40~922.45~615.合100.統(tǒng)計學習題及解直方圖:將上表(包含總標題,去掉合計欄)到Excel表中,點擊:圖表向?qū)А螆D→選擇子圖表類型→系列產(chǎn)生在(行)→完成。即得到如下的直方圖:3.下面是某考試對2002年參加成人的12000名學生的分組數(shù)據(jù)18~20~22~25~30~35~40~45~%1.34.34.17.6.2.1.1.(1)對這個分布作直方圖(2)從直方圖分析成人分布的特點解:(1)制作直方圖:將上表到Excel表中,點擊:圖表向?qū)А螆D→選擇子圖表類→完成。即得到如下的直方圖(2)分布的特點:的分布為右偏,即參考的大部分在18歲以上30歲以下的年輕人,所占為87.9%,接近九成4.下面是A、B兩個班學生的數(shù)學考試成績數(shù)據(jù)考試點(www.kaoshidian.com)名師精品課 :4006885365A班B班(1)將兩個班的考試成績用一個公共的莖制成莖葉圖(2)比較兩個班考試成績分布的特點解:(1)將樹莖放置中間,A班樹葉向左生長,B班樹葉向右生長,得莖葉圖如下A樹B數(shù)據(jù)個樹樹數(shù)據(jù)個032144425697878669603(2)比較可知A班考試成績的分布比較集中平均分數(shù)較高;B班考試成績的分布比A班分散平均成績較A班低。5.1997年我國幾個主要城市各月份的平均相對濕度數(shù)據(jù)如下表,試繪制箱線圖,并分析各城市平均相對濕度的分布特征。統(tǒng)計學習題及解月長春鄭廣蘭西123456789解:箱線圖如下從圖中可以看出,長春濕度差異最大,差異最小的是;平均濕度最高的是廣州,平均濕度最低的是蘭州。6.對于下面的數(shù)據(jù)繪制散點圖x234187y考試點(www.kaoshidian.com)名師精品課 :4006885365解從圖中看出兩者是線性的負相關(guān)關(guān)7.甲乙兩個班各有40名學生,期末統(tǒng)計學考試成績的分布如下考試成人甲乙及格不及184要求(1)根據(jù)上面的數(shù)據(jù),畫出兩個班考試成績的對比條形圖和環(huán)形圖(2)比較兩個班考試成績分布的特點答:甲班成績中的人數(shù)較多分和低分人數(shù)比乙班多班學習成績較甲班好,高分較多低分較少。(3)畫出圖,比較兩個班考試成績的分布是否相似統(tǒng)計學習題及解答:分布不相似四、解單項選擇題1.某外商投資企業(yè)按工資水平分為四組:1000元以下,10001500元;15002000元;2000元以上。第一組和第四組的組中值分別為( A.750和 B.800和C.800和 D.750和2.某組距式分組,起始組是開口組,上限為100,又知相鄰組的組距為50,起始實組的組距可以視為( A. B.C. D.3.按人記錄的100名工人的日產(chǎn)量資料顯示,最高日產(chǎn)量為38件,最低日產(chǎn)量為19件,若要對著100名工人按日產(chǎn)量進行等距分組,組數(shù)為5,則組距應(yīng)為( A.3 B.4C.8 D.104.統(tǒng)計分組的問題是 A.選擇分組方 B.確定組C.選擇分組標 D.確定組中5.上限是指 A.每個組的最小 B.每個組的最大C.每個組的中點數(shù)值 D.每個組的起點數(shù)值多項選擇題:1.在進行統(tǒng)計分析時,需要對獲取的數(shù)據(jù)進行審核,請問以下哪些是需要審核的內(nèi)容( A.數(shù)據(jù)的完整性 B.數(shù)據(jù)的準確性C.數(shù)據(jù)的適用 D.數(shù)據(jù)的時效E.數(shù)據(jù)的隨機考試點(www.kaoshidian.com)名師精品課 :40068853652.在組距數(shù)列中,組距大小與 A.全距的大小成正 B.全距的大小成反C.只與全距大小有關(guān) D.組數(shù)多少成正比E.組數(shù)多少成反比3.從形式上看,統(tǒng)計表由 )組成A.表 B.行標C.列標 D.數(shù)字資E.賓簡答題1.何謂統(tǒng)計分組?統(tǒng)計分組有哪些作用答:根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內(nèi)在特點某個標志(或幾個標志)把被研究的總體劃分為若干個不同性質(zhì)的組為統(tǒng)計分組。統(tǒng)計分組的作用有(1)發(fā)現(xiàn)社會經(jīng)濟現(xiàn)象的特點與規(guī)律(2)將復(fù)雜的社會經(jīng)濟現(xiàn)象劃分為性質(zhì)不同的各種類型(3)反應(yīng)總體結(jié)構(gòu)(4)解釋現(xiàn)象之間的依存關(guān)系2.簡述統(tǒng)計分組的原則答:采用組距分組是,需要遵循不重不漏的原則。不重是指一項數(shù)據(jù)只能分在其中的某一組,不能在其他組中重復(fù)出現(xiàn);不漏是指組別能夠窮盡。即在所分的全部組別中每項數(shù)據(jù)都能分在其中的某一組能遺漏。為解決不重的問題,統(tǒng)計分組時上規(guī)定“上組限不在內(nèi)”。即當相鄰兩組的上下限時,恰好等于某一組上限的變量值不算在本組內(nèi),而計算在下一組內(nèi)。而對于連續(xù)變量,可以采取相鄰兩組組限的方法,根據(jù)“上組限不在內(nèi)”的規(guī)定解決不重的問題,也可以對一個組的上限值采用小數(shù)點的形式數(shù)點的位數(shù)根據(jù)所要求的精度具體確定。3.統(tǒng)計分組標志選擇的原則答:在進行統(tǒng)計分組標志選擇時要遵循三個原則(1)應(yīng)根據(jù)研究目的與任務(wù)選擇分組標志。同一研究總體,研究的目的不同,可選用的分組標志也不同。(2)要選用能反映視為本質(zhì)或主要特征的標志。一般情況下,社會經(jīng)濟現(xiàn)象有多重特征,在選擇分組標志時,可以使用這種標志時,可以使用這種標志,也可以選擇另一種標志,這就需要根據(jù)被研究對象的特征擇主要的抓住事物本質(zhì)的標志進行分組。(3)要根據(jù)現(xiàn)象所處的歷史條件及經(jīng)濟條件來選擇標志。由于社會是不斷發(fā)展的不同的歷統(tǒng)計學習題及解條件與經(jīng)濟條件下?lián)竦姆纸M標志也不一樣根據(jù)情況的變化而變化4.說明條形圖和直方圖的區(qū)別和聯(lián)系。答:(1)條形圖與直方圖的區(qū)別:①條形圖是用條形的長度表示各類別頻數(shù)的多少,其寬度則是固定的;直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的聘書或頻率,寬度則表示各組的組距,因此其高度與寬度均有意義。②由于分組數(shù)據(jù)具有連續(xù)性方圖的各矩形通常是連續(xù)排列條形圖則是分開排列③條形圖主要用于展示分類數(shù)據(jù)直方圖則主要用于展示數(shù)值型數(shù)(2)聯(lián)兩者都是用矩形表示數(shù)據(jù)分布情況;當矩形的寬度相等時,都是用矩形的高度來表示數(shù)據(jù)的分布情況。計算題1.某位職員每天上班有兩種方法:公共交通和自己開車。每種方法所需的時間記錄的樣本數(shù)據(jù)如表3所示。時間以分鐘為單位。表3公共交自己開(1)哪種方法更好?試解釋之(2)畫出每種方法的箱圖。兩個箱圖的比較結(jié)果是否支持你的結(jié)論?解:(1)公共交通所需時間的平均數(shù)與標準差分別為:nx=i2

28+29+…+34

=32(分鐘n∑

–s i n-28-322+29-322+…+41-= 10-194=4.6428(分鐘槡自己開車所需時間的平均數(shù)與標準差分別為nx=i1

29+31+…+33

=32(分鐘n∑

–s i n-考試點(www.kaoshidian.com)名師精品課 :40068853652929-322+31-322+…+35-322+33- 10- =9=1.8257(分鐘 兩種上班方式所需時間的平均數(shù)想等。但是自己開車所需時間的標準差比公共交通所需時間標準差小自己開車比公共交通所需時間的離散程度較小。所以選擇自己開車上班比較合理(2)將公共交通所需時間從小道打進行排序:25,28,29,29,32,32,33,34,37,41,則最大值為41;最小值為25位數(shù)=(32+32)/2=32;下四分位數(shù)的位置=(10+1)/4=2.75,故下四分位數(shù)=280.25+290.75=28.75四分位數(shù)的位置=3(10+1)=8.25上四分位數(shù)=340.75+370.25=34.75。同理可得,自己開車所需時間的最大值為35,最小值為29,中位數(shù)為32,下四分衛(wèi)書為30.75,上四分位數(shù)為33.25.則兩種上班方式所需時間的箱圖如圖3所示。兩個箱圖的比較結(jié)果也說明上班時自己開車的方法更好有箱圖可以看出,上班是采取公共交通和自己開車所需的平均時間是相同的,從其離散程度來看,自己開車上班所需時間比較集中(箱子較短),而采取公共交通的上班時間則比較分散。從分布形狀上看己開車上班所需的時間大體上為對稱分布(中位數(shù)在箱子的中間位置)。統(tǒng)計學習題及解第四 數(shù)據(jù)概括性的度(數(shù)據(jù)集中趨勢度量與離中趨勢度量~、本章重用統(tǒng)計量描述數(shù)據(jù)的集中趨勢水平和數(shù)據(jù)的離散程度(均值、中位數(shù)、分位數(shù)和眾數(shù);極差、標準差和樣本方差二、本章知識點回1.一組數(shù)據(jù)的分布特征可以從哪幾個方面進度答:數(shù)據(jù)分布特征可以從三個方面進度和描述:一是分布的集中趨勢,反映各數(shù)據(jù)向其中心值靠攏或集中的程度;二是分布的離散程度,反映各數(shù)據(jù)遠離其中心值的趨勢;三是分布的形狀,反映數(shù)據(jù)分布的偏態(tài)和峰態(tài)。2.怎樣理解均值在統(tǒng)計學中的地位答:均值又稱為算術(shù)平均數(shù),簡稱平均數(shù)。在統(tǒng)計學中具有重要的地位,是集中趨勢的最主要的測度,它是進行統(tǒng)計分析和統(tǒng)計推斷的基礎(chǔ);主要適用于數(shù)值型數(shù)據(jù),而不適用于分類數(shù)據(jù)和順序數(shù)據(jù);它是一組數(shù)據(jù)的重心所在,利用平均數(shù)作為其代表值,則可以使誤差相互抵消,反映出事物必然性的數(shù)量特征。3.簡述四分位數(shù)的計算方法答:四分位數(shù)是一組數(shù)據(jù)排序后處于25%和75%位置上的值。根據(jù)未分組數(shù)據(jù)計算四分位數(shù)時先對數(shù)據(jù)進行排序后確定四分位數(shù)所在的位置位置上的數(shù)值就是四分位數(shù)。4.對于比率數(shù)據(jù)的平均為什么采用幾何平均數(shù)答:因為幾何平均數(shù)被稱為一種特殊的平均數(shù)于比率數(shù)據(jù)的平均采用幾何平均要比算術(shù)平n更合理、更準確。在實際應(yīng)用中,幾何平均數(shù)主要用于計算現(xiàn)象的平均增長率;從公式(1+G)n=i(1+Gi)中也可看出G就是平均增長率。當然,幾何平均數(shù)的對數(shù)是各變量值對數(shù)的算術(shù)平均,可見何平均數(shù)也是算術(shù)平均數(shù)的一種變形。5.簡述眾數(shù)、中位數(shù)和均值的特點和應(yīng)用場合答:眾數(shù)是一組數(shù)據(jù)分布的峰值,不受值的影響,缺點是具有不唯一性。眾數(shù)只有在數(shù)據(jù)考試點(www.kaoshidian.com)名師精品課程:4006885較多時才有意義據(jù)量較少時不宜使用。主要適合作為分類數(shù)據(jù)的集中趨勢測度值中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受值的影響。當數(shù)據(jù)的分布偏斜較大時,使用中位數(shù)也許不錯。主要適合作為順序數(shù)據(jù)的集中趨勢測度值。均值是對數(shù)值型數(shù)據(jù)計算的,而且利用了全部數(shù)據(jù)信息,在實際應(yīng)用中最廣泛。當數(shù)據(jù)呈對稱分布或近似對稱分布時,值相等或相近,此時應(yīng)選擇算術(shù)平均數(shù)。但平均數(shù)易受值的影響于偏態(tài)分布的數(shù)據(jù)均數(shù)的代表性較差時應(yīng)考慮中位數(shù)或眾數(shù)。6.簡述異眾比率、四分位差、方差或標準差的適用場答:對于分類數(shù)據(jù),主要用異眾比率來測量其離散程度;對于順序數(shù)據(jù),雖然也可以計算異眾比率,但主要使用四分位差來測量其離散程度;對于數(shù)值型數(shù)據(jù),雖然可以計算異眾比率和四分位差,但主要使用方差或標準差來測量其離散程度。7.標準分數(shù)有哪些用途答:標準分數(shù)給出了一組數(shù)據(jù)中各數(shù)值的相對位置。在對多個具有不同量綱的變量進行處理時,常需要對各變量進行標準化處理。它還可以用來判斷一組數(shù)據(jù)是否有離群數(shù)據(jù)。8.為什么要計算離散系數(shù)答:方差和標準差是反映數(shù)據(jù)分散程度的絕對值,一方面其數(shù)值大小受原變量值本身水平高低的影響,也就是與變量的平均數(shù)大小有關(guān);另一方面,它們與原變量的計量單位相同,采用不同計量單位的變量值,其離散程度的測度值也就不同。因此,為消除變量值水平高低和計量單位不同對離散程度測度值的影響要計算離散系數(shù)。9.測度數(shù)據(jù)分布形狀的統(tǒng)計量有哪些答:對分布形狀的測度有偏態(tài)和峰態(tài),測度偏態(tài)的統(tǒng)計量是偏態(tài)系數(shù)(SK),測度峰態(tài)的統(tǒng)計量是峰態(tài)系數(shù)(K)。三、本章習題解答及典型題型解1.某百貨公司6月份各天的銷售額數(shù)據(jù)如下(單位:萬元)(1)計算該百貨公司日銷售額的均值、中位數(shù)和四分位數(shù)(2)計算日銷售額的標準差解:(1)將全部30個數(shù)據(jù)輸入Excel表中同列,點擊列標,得到30個數(shù)據(jù)的總和為8223,于是得該百貨公司日銷售額的均值:x=∑=8223=274.1(萬元 統(tǒng)計學習題及解或點選單元格后擊“自動求和”→平均值”函數(shù)EVERAGE()的空格中輸入“A1:A30”,回車到均值也為274.1。在Excel表中將30個數(shù)據(jù)重新排序中位數(shù)位于30個數(shù)據(jù)的中間位置靠中的第1516兩個數(shù)272和273的平均數(shù):M=272+273=272.5(萬元 根據(jù)四分位數(shù)位置公式位置=(n+1)/4=7.75位置=3(n+1)/4=23.25所以前四分位數(shù)位于第7個數(shù)據(jù)與第8位數(shù)據(jù)的下四分之一的位置上排序后的Excel表中7位數(shù)據(jù)是2588位是261QL=258+(261-258)×0.75=260.25(萬元同理四分位數(shù)位于第23位數(shù)據(jù)與第24位數(shù)據(jù)的靠上四分之一的位置上排序后的表中第23位是29124位是292而=291+(292-291)×0.25=291.25(萬元(2)未分組數(shù)據(jù)的標準差計算公式為s

∑xi–x)i n-利用上公式代入數(shù)據(jù)計算是個較為復(fù)雜的工作。手工計算時計算30個數(shù)據(jù)的離差平方將其求和代入公式計算其結(jié)果s=21.可以利用Excel表直接計算標準差:點選數(shù)據(jù)列(A列)的最末空格,再點擊菜單欄中“∑符號右邊的角“",選擇“其它函數(shù)→選擇函數(shù)“STDEV”→確定”,在出現(xiàn)的函數(shù)參數(shù)窗口中的Number1右邊的空欄中輸入:A1:A30,→“確定”,即在A列最末空格中出現(xiàn)數(shù)值:21.17412,即為這30個數(shù)據(jù)的標準差。于是:s=21.17(萬元)2.甲乙兩個企業(yè)生產(chǎn)三種產(chǎn)品的單位成本和總成本資料如下產(chǎn)品名單位成本()總成本()甲企乙企1520比較哪個企業(yè)的總平均成本高?并分析其原因解:設(shè)產(chǎn)品單位成本為x量為f總成本為由于均成本=總成總產(chǎn)

x=∑f而已知數(shù)據(jù)中缺產(chǎn)量f的數(shù)據(jù)考試點(www.kaoshidian.com)名師精品課 :4006885365又因個別產(chǎn)品產(chǎn)量f 該產(chǎn)品成 =該產(chǎn)品單位成 從而x=∑是得∑x甲企業(yè)平均成本=∑=2100+3000+1500=19.41(元)∑xf2100+3000+1500 乙企業(yè)平均成本=∑f=3255+1500+1500=18.29(元∑xf3255+1500+1500 對比可見企業(yè)的總平均成本較高原因:盡管兩個企業(yè)的單位成本相同,但單位成本較低的產(chǎn)品在乙企業(yè)的產(chǎn)量中所占較大,因此拉低了總平均成本。3.在某地區(qū)抽取的120家企業(yè)按利潤額進行分組,結(jié)果如下按利潤額分組(萬元企業(yè)數(shù)(個200~300~400~500~600以合計算120家企業(yè)利潤額的均值和標準差解各組平均利潤為x業(yè)數(shù)為f組總利潤為由于數(shù)據(jù)按組距式分組計算組中值作為各組平均利潤表計算得按利潤額分組(元)組中企業(yè)數(shù)()總利潤xf200~500~600以合統(tǒng)計學習題及解于是,120家企業(yè)平均利潤為x=∑=51200=426.67(萬元 分組數(shù)據(jù)的標準差計算公式為s=∑xi–x)2槡∑f組中企業(yè)數(shù)()(x-426.2xf手工計算須列表計算各組數(shù)據(jù)離差平方和(x67)f,求和代組中企業(yè)數(shù)()(x-426.2xf593033.176348.22860.273785.548639.合1614666.于是得標準差s=

∑x-x)2 1614666.=i=∑f 槡120

=48(萬元)(也可利用計算機操作4.為研究少年兒童的成長發(fā)育狀況,某的一位在某城市抽?。保埃懊贰保窔q少年兒童作為樣本,另一位則抽取了1000名7~17歲的少年兒童作為樣本。請回答下面的問題,并解釋其原因。(1)哪一位研究在其所抽取的樣本中得到的少年兒童的平均身高較大?或者這兩組樣本的平均身高相同?(2)哪一位研究在其所抽取的樣本中得到的少年兒童身高的標準差較大?或者這兩組樣本的標準差相同?(3)哪一位研究有可能得到這1100名少年兒童的最高者或最低者?或者對兩位研究來說,這種機會是相同的?解:(1)不一定相同法判斷哪一個更高可以判斷本量大的更接近于總體平均身高(2)不一定相同本量少的標準差大的可能性大(3)機會不相同本量大的得到最高者和最低者的身高的機會大5.一項關(guān)于大學生體重狀況的研究發(fā)現(xiàn),男生的平均體重為60公斤,標準差為5公斤;的考試點(www.kaoshidian.com)名師精品課 :4006885365均體重為50公斤,標準差為5公斤。請回答下面的問題(1)是男生的體重差異大還是的體重差異大?為什么(2)以磅為單位(1公斤=2.2磅),求體重的平均數(shù)和標準差(3)粗略地估計一下,男生中有百分之幾的重在55公斤到65公斤之間(4)粗略地估計一下,中有百分之幾的重在40公斤到60公斤之間解:(1)由于兩組的平均體重不相等通過比較離散系數(shù)確定體重差異較大的組因 的離散系數(shù)為:V=x男生體重的離散系數(shù)為V=x

=5=0.08=8%6因為:10%#8%,對比可知的體重差異較大(2)男生:x=60公斤×2.2磅=132(磅),s=5公斤×2.2磅=11(磅);x=50公斤2磅=110(磅)s=5公斤2磅=(磅);(3)68%;(65-60/5=(4)95%6.對10(60-50成年人5=10名兒的身(厘米進行樣,結(jié)果如:成年幼兒(1)要比成年組幼兒組的身高差異,你采用么樣的指標測值?為么(2)比較分析哪一組的身高差異大解:(1)應(yīng)采用離散系數(shù),因為成年人和幼兒的平均身高處于不同的水平,采用標準差比較不合適。離散系數(shù)消除了不同組數(shù)據(jù)水平高低的影響用離散系數(shù)就較為合理。(2)利用Excel進行計算成年組身高的平均數(shù)為172.1準差為4.202而成年組身高的離散系數(shù)vs

s=4.2 172.

=0.024=2.4%又得幼兒組身高的平均數(shù)為71.3準差為2.497而得幼兒組身高的離散系數(shù)

=2.497=0.035=3.5%;71.3由于3.5%>2.4%幼兒組身高的離散系數(shù)大于成年組身高的離散系數(shù)明幼兒組身高的離散程度相對較大。7.一種產(chǎn)品需要人工組裝,現(xiàn)有三種可供選擇的組裝方法。為檢驗?zāi)姆N方法更好,隨機抽?。保祩€工人,讓他們分別用三種方法組裝。下面是15個工人分別用三種方法在相同的時間內(nèi)組裝的產(chǎn)品數(shù)量(單位:個)統(tǒng)統(tǒng)計學習題解方法 方法 方法 (1)你準備采用什么方法來評價組裝方法的優(yōu)劣(2)如果讓你選擇法,你會作出怎樣的選擇?試說明理由。解:(1)下表給計算出這三種組裝方法的一些主要描述統(tǒng)計量:方法A方法B方法C平最最均數(shù)差1651平均128.平125.中數(shù)中位眾數(shù)眾最最差1.75712極差最大2.77評價優(yōu)劣應(yīng)根據(jù)離散系數(shù)上得方法A的離散系數(shù)

=2.13=0.0129,165.6方法B的離散系數(shù)

=1. 128.

=0.考試點(www.kaoshidian.com)名師精品課 :4006885365方法C的離散系數(shù)

=2.77125.

=0.對比可見法A的離散系數(shù)最低明方法A最優(yōu)(2)應(yīng)選擇方法A,因為方法A的平均產(chǎn)量最高而離散系數(shù)最低,說明方法A的產(chǎn)量高且穩(wěn)定,有推廣意義。8.一家公司在招收職員時,首先要通過兩項能力測試。在A項測試中,其平均分數(shù)是100分,標準差是15分;在B項測試中,其平均分數(shù)是400分,標準差是50分。一位應(yīng)試者在A項測試中得了115分,在B項測試中得了425分。與平均分數(shù)相比,該應(yīng)試者哪一項測試更為理想?解用標準分數(shù)來考慮問題該應(yīng)試者標準分數(shù)高的測試理想Z=x-x=115-100=1;Z=x-x=425-400=0. 因此,A項理想9.在金融領(lǐng)域,一項投資的預(yù)期收益率的變化通常用該項投資的風險來衡量。預(yù)期收益率的變化越小,投資風險越低,預(yù)期收益率的變化越大,投資風險就越高。下面的兩個直方圖,分別反映了200種商業(yè)類和200種高科技類的收益率分布。在市場上,高收益率往往伴隨著高風險。但投資于哪類,往往與投資者的類型有一定關(guān)系。(1)你認為該用什么樣的統(tǒng)計測度值來反映投資的風險(2)如果選擇風險小的進行投資,應(yīng)該選擇商業(yè)類還是高科技類(3)如果你進行投資,你會選擇商業(yè)類還是高科技類解:(1)標準差或離散系數(shù)(2)選擇離散系數(shù)小的,則選擇商業(yè)類(3)考慮高收益,則選擇高科技;考慮風險,則選擇商業(yè)四、本章解單項選擇題1.平均數(shù)反映了總體 A.分布的集中趨勢 B.分布的離中趨勢統(tǒng)計學習題及解C.分布的變動趨 D.分布的可比程2.某企業(yè)職工占80%,月平均工資為450元,女性職工占20%,月平均工資為400元,該企業(yè)全部職工的平均工資為( A.425 B.C. D.3.數(shù)列中,當某一組的變量值比較小而權(quán)數(shù)較大時,計算出來的平均數(shù)( A.接近于變量值較大的一組 B.接近于變量值較小的一組C.接近于大小適中的變量 D.不受權(quán)數(shù)影4.一位教授計算了全班20個同學考試成績的均值、中數(shù)和眾數(shù),發(fā)現(xiàn)大部分同學的考試成績集中于高分段,下面哪句話不可能是正確的?( A.全班65%的同學的考試成績高于均值 B.全班65%的同學的考試成績高于眾數(shù)C.全班65%的同學的考試成績高于中數(shù) D.全班同學的考試成績是負偏態(tài)分布5.比較兩個不同平均數(shù)的同類現(xiàn)象或兩個性質(zhì)不同的不同類現(xiàn)象平均數(shù)的代表性大小時,采 )A.全 B.平均C.標準 D.標準差系6.有下列甲、乙兩組工人工資據(jù):甲組工人工資,400,450,250,300.乙組工人工資300,475,350,275.若要比較這兩組工人平均工資差異程度大小,應(yīng)選用的方法是( )。A.全距 B.標準差C.離散系數(shù) D.平均數(shù)7.平均差數(shù)值越小,則 )A.反映變量值越分散,平均數(shù)代表性越小 B.反映變量值越集中,平均數(shù)代表性越大C.反映變量值越分散,平均數(shù)代表性越大 D.反映變量值越集中,平均數(shù)代表性越小多項選擇題1.偏態(tài)系數(shù)是對數(shù)據(jù)分布偏斜程度的測度,下面描述正確的是( A.偏態(tài)系數(shù)=0為對稱分布B.偏態(tài)系數(shù)>0為右偏分布C.偏態(tài)系數(shù)為右偏分D.偏態(tài)系數(shù)或偏態(tài)系數(shù)<為高度偏態(tài)分布E.偏態(tài)系數(shù)或偏態(tài)系數(shù)<為高度偏態(tài)分2.甲班同學的平均身高為x1,標準差為σ1,乙班同學的平均身高為x2,標準差為σ2,那么( A.x1>x2,σ1>σ2,則甲班身高均值的代表性低B.x1<xσ1>σ甲班身高均值的代表性考試點(www.kaoshidian.com)名師精品課程:4006885簡答題:1.集中趨勢和離散趨勢?它們常用的指標有哪些答:集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的程度,它反映了一組數(shù)據(jù)中心點的位置所在。常用的反映集中趨勢的指標有平均數(shù)位數(shù)和眾數(shù)。數(shù)據(jù)的離散趨勢是數(shù)據(jù)分布的另一個重要特征,它反映的是各變量值遠離其中心值的程度。數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差;離散程度越小,其代表性就越好。描述數(shù)據(jù)離散程度采用的測度值,根據(jù)所依據(jù)數(shù)據(jù)類型的不同主要有異眾比率、四分位差、方差和標準差。此外有極差均差以及測度相對離散程度的離散系數(shù)等。2.簡述均值、眾數(shù)和中位數(shù)三者之間的關(guān)系及其在實際中的應(yīng)用。答:(1)眾數(shù)位數(shù)和平均數(shù)的關(guān)系從分布的角度看,眾數(shù)始終是一組數(shù)據(jù)分布的最值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值平均數(shù)則是全部數(shù)據(jù)的算數(shù)平均。①對于具有單峰分布的大多數(shù)數(shù)據(jù)而言數(shù)位數(shù)和平均數(shù)如果數(shù)據(jù)的分布是對稱的()位數(shù)(Me)和平均數(shù)(x)必定相等MO=Me=②如果數(shù)據(jù)式偏左分布,說明數(shù)據(jù)存在極小值,必然拉動平均數(shù)想向極小值一方靠,而眾數(shù)和中位數(shù)由于是位置代表值受極值的影響此三者之間的關(guān)系變現(xiàn)為x<Me<MO③如果數(shù)據(jù)式右偏分布明數(shù)據(jù)存在極大值然拉動平均數(shù)向極大值一方靠MO<Me<(2)眾數(shù)位數(shù)和平均數(shù)在實際中的應(yīng)①眾數(shù)是一組數(shù)據(jù)分布的峰值,不受值的影響。其缺點是具有不唯一性,一組數(shù)據(jù)可能有一個眾數(shù),也可能有兩個或多個眾數(shù),也可能沒有眾數(shù)。眾數(shù)只有在數(shù)據(jù)量較多時才有意義,當數(shù)據(jù)量較少時宜使用眾數(shù)。眾數(shù)主要適合作為分類數(shù)據(jù)的集中趨勢測度值。②中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受數(shù)據(jù)值的影響。中位數(shù)主要適合作為順序數(shù)據(jù)的集中趨勢測試度。③平均數(shù)是對數(shù)值型數(shù)據(jù)計算的,而且利用了全部數(shù)據(jù)信息,它是實際中應(yīng)用最廣泛的集中趨勢測度值。當數(shù)據(jù)呈對稱分布或接近對稱分布時,3值相等或接近相等,這時則應(yīng)原則平局數(shù)作為集中趨勢的代表值。但平均數(shù)的主要缺點是易受數(shù)據(jù)值的影響,對于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差。因此數(shù)據(jù)為偏態(tài)分布別是當偏斜程度較大時以考慮選擇眾數(shù)或中位數(shù)。3.簡述標準化值的意義及計算公式答:變量值與其平均數(shù)的離差除以標準差后的值稱為標準分數(shù)稱標準化值或z分數(shù)。其計公式為

xi-=

為變量

的標準化值x是該組數(shù)據(jù)均值s為該組數(shù)據(jù)的標準差 s,式中 統(tǒng)計學習題及解標準分數(shù)可以測量每個數(shù)據(jù)在該組數(shù)據(jù)中的相對位置,并可以用它來判斷一組數(shù)據(jù)是否有離群數(shù)據(jù)。比如,如果某個數(shù)值的標準數(shù)為-1.5,就知道該數(shù)據(jù)值低于平均數(shù)1.5倍的標準差。在對多個具有不同量綱的變量進行處理時,常常需要對各變量進行標準化處理。實際上,z分數(shù)只是將原始數(shù)據(jù)進行了線性變換,它并沒有改變一個數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒有改變該組數(shù)據(jù)分布的狀況只是將該組數(shù)據(jù)變?yōu)槠骄鶖?shù)為0準差為1。4.簡述計算離散系數(shù)的意義答:方差和標準差是反應(yīng)數(shù)據(jù)分散程度的絕對值,其數(shù)值的大小一方面受原變量值本身水平高低的影響,也就是與變量的平均數(shù)大小有關(guān),變量值絕對水平高的,離散程度的測度值自然也就大,絕對水平小的離散程度的測度值自然也就??;另一方面,他們與元變量值的計量單位相同。采用不同計量單位計量的變量值,是不能用標準差直接比較器離散程度的。為消除變量值水平高低和計量單位不同對離散程度測度值的影響要計算離散系數(shù)。計算題1.一種產(chǎn)品需要人工組裝,現(xiàn)在三種可供選擇的組裝方法。為檢驗?zāi)欠N方法更好,隨機抽?。保祩€工人,讓他們分別用三種方法組裝。表4-1是15個工人分別用三種方法在相同的時間內(nèi)組裝的產(chǎn)品數(shù)量(單位:個)表4方法方法方法考試點(www.kaoshidian.com)名師精品課 :4006885365(1)你準備采用什么方法來評價組裝方法的優(yōu)劣(2)如果讓你選擇法,你會做出怎樣的選擇?是說明理由解:(1)應(yīng)該從平均數(shù)和標準差兩個方面進行評價。在對各種方法的離散程度進行比較時,應(yīng)該采用離散系數(shù)。(1)表4-2給出了用Excel計算一些主要描述統(tǒng)計量表4方法A方法B方法C平均數(shù)165.最準差最準差中位數(shù)眾數(shù)標準差2.極差8最小值最大值。離散程度來看種方法的離散系數(shù)分別為:v=sA=2.13=0. 165.v=sB=1.75=0. 128.v=sC=2.77=0. 125.方法A的離散系數(shù)最小離散程度最小此應(yīng)選擇方法A2.隨機抽?。玻祩€網(wǎng)絡(luò)用戶,得到他們的數(shù)據(jù)如表4-3所示表4- 單位:周 要求(1)計算眾數(shù)、中位數(shù)(2)計算平均數(shù)和標準差統(tǒng)計學習題及解(3)計算偏態(tài)系數(shù)和峰態(tài)系數(shù)(4)對網(wǎng)民的分布特征進行綜合分析。解:(1)對表中數(shù)據(jù)按從小到大順序排列:1516171819191920202122232323242425272930313438由排序數(shù)據(jù)可知,出現(xiàn)次數(shù)最多的是19和23,都出現(xiàn)3次,所以有兩個眾數(shù),即M0=19M0=由于中位數(shù)位置=n=25+1=13以

=23n(2)平均數(shù)x=i1n

19+15+…+23

=由平均數(shù)x=24可得 is i

19-24+25-24+…+17-24+23-

=65(歲 n-(3)偏態(tài)系數(shù)

25-n∑x– 25∑x–SK =1.n-1n- 25-125-26.峰態(tài)系數(shù)nn+1∑x-x4-3∑x-x22n-1K= n-1n-2n-2525+1∑x-244-3∑x-242225- =0.25-125-225-36.(4)對網(wǎng)民的分布特征進行綜合分析的結(jié)果如下:從眾數(shù)、中位數(shù)和平均數(shù)來看,網(wǎng)民在布為右偏。并且偏態(tài)系數(shù)大于1以片斜程度很大。峰態(tài)系數(shù)為正值以為尖峰分布。3.某地區(qū)家庭按人數(shù)收入水平分組資料如表4所示表4按月收入水平分組40060060080080010001000以家庭)合計考試點(www.kaoshidian.com)名師精品課 :4006885365計算(1)眾數(shù)和中位數(shù)(2)平均差系數(shù)(3)標準差系數(shù)解:(1)由表中數(shù)據(jù)可知,眾數(shù)及中位數(shù)在 800這一組內(nèi)。則由計算眾數(shù)的公式可得M≈ i=600 45- ×200=711.0Δ1+ 45-20+45-0由計算中位數(shù)的公式可得∑f-Me≈+ m-1×i=600+100/2-20×200=733.3 (2)根據(jù)表4-4可得表4-5按月收入水平分組組中值家庭數(shù)x-(x-x)(x-x)2400~600600~800800~100以–總計由表4可得x=∑=75000=平均差

=∑x

f=250×20+50×45+150×25+350×10=145平均差系數(shù)=145×100%=19.(3)標準差為∑∑x-x)2s= =槡 =177.所以標準差系數(shù)為vs

s=177.48=0.24 4.下面試CAILY大學田徑隊記錄的1英里和1英里賽跑每次所用時間的數(shù)據(jù)(以分鐘計)。1/4英里的時間:0.920.981.040.900.991英里的時間:4. 4.354.604.704.根據(jù)這些數(shù)據(jù),一個評論說,1/4英里所用的時間已經(jīng)趨于一致了,1英里所用時間差別較大。請用適當?shù)闹笜藖砀爬〝?shù)據(jù)的特性并說明該的說法是否合理?統(tǒng)計學習題及解解:根據(jù)已知數(shù)據(jù)以分別計算出1/4英里所用的時間的樣本平均值和標準差1/4英里所用時間的樣本均值為x=0.92+0.98+1.04+0.90+0.99=0.5樣本標準差為in(x–x)i

(0.92-0.966)2+(0.98-0.966)2+…+(0.99-0.966)s =0.056(分 n-1 1英里所用時間的樣本平均值為:x=4.52+4.35+4.60+4.70+4.50=4.534(分 樣本標準差為2 2∑xi–xs i

(4.52-4.

2+(4.35-4.534)2+…+(4.50-4.534)2=0. n- 5-由上面的計算結(jié)果可知個樣本的均值不相同此不能簡單地用標準差比較這兩個樣本的散程度。這兩個樣本的離散系數(shù)分別為1/4英里所用時間的離散系數(shù)v=s1=0.056=0. 0. 1英里所用時間的離散系數(shù)v

4.因為v1>v以可知1/4英里所用時間的離散程度大于1英里所用時間的離散程度。由此可見判斷該的說法不合理。5.下面是A、B兩個班學生的數(shù)學考試成績數(shù)據(jù)A班B班(1)將兩個班的考試成績用一個公共的莖制成莖葉圖,比較兩個班考試成績分布的特點(2)兩個班考試成績的描述統(tǒng)計量如表4所示。試進行比較分析考試點(www.kaoshidian.com)名師精品課 :4006885365表4AB平平眾數(shù)標準偏差樣本方差峰值極差最大10.44眾數(shù)標準偏差樣本方差峰值極差最大–0.76(1)要判斷考試成績是否有離群點,可使用哪些方法(2)要判斷考試成績是否服從正態(tài)分布,可使用那些描述性方法?解:(1)構(gòu)建兩個班考試成績的莖葉圖圖4所示。A樹B數(shù)據(jù)個樹樹數(shù)據(jù)個032從莖葉圖可以看出A班考試成績的分布比較集中平均分數(shù)較高B班考試成績的分布比班分散平均成績較A班低(2)從平均數(shù)數(shù)與中位數(shù)可以看出A班成績明顯好于B班A班成績的方差小于B班明班成績相對于B班比較集中個班成績的偏斜度較低績分布比較對稱極差可以看出B班統(tǒng)計學習題及解成績差異大于A班(3)A班學生的數(shù)學成績?nèi)吭凇溃硞€標準差之內(nèi),即75±3×10.44=(43.68106.32),所以班學生的成績中沒有離群點B班學生的數(shù)學成績?nèi)吭凇溃硞€標準差之內(nèi)68±3×17.64=(15.08120.92),所以B班學生的成績中沒有離群點。(4)由于A于A班的偏度系數(shù)SK=11度系數(shù)K=35明A班學生成績的分布為右偏分布與正太分布相比略有一些扁平。B班的偏度系數(shù)SK=0.11度系數(shù)K=76明B班學生成績的分布為右偏分布與正太分布相比略有一些扁平。6.某銀行為縮短顧客到銀行辦理業(yè)務(wù)等待的時間,準備采用兩種排隊方式進行試驗:一種是所有顧客都進入一個等待隊列;另一種是顧客在三個業(yè)務(wù)窗口處列隊三排等待。為比較哪種排隊方式使顧客等待的時間更短,兩種排隊方式個隨機抽取的9名顧客,得到第一種排隊方式的平均等待時間為7.2分鐘,標準差為1.97分鐘,第二種排隊方式的等待時間(單位:分鐘)如下:5.56.66.76.87.17.37.47.87.(1)畫出第二種排隊方式等待時間的莖葉圖(2)比較兩種排隊方式等待時間的離散程度(3)如果讓你選擇一種排隊方式,你會選擇哪一種?試說明理由。解:(1)第二種排隊方式等待時間的莖葉圖如圖4所示。葉單位=0.556667713788圖4- 第二種排隊方式等待時間的莖葉(2)第二種排隊方式等待時間的均值為x=∑=5.5+6.6+…+7.8= 標準差為∑x–x) (5.5-7)2+(6.6-7)2+…+(7.8-7) s2

n-

=槡0.

=0.第一種排隊方式的均值

=7.2分鐘,標準差為

=1.97分鐘,則離散系數(shù)

=1.97=0.7.274。第二種排隊方式的離散系數(shù)v=s2=0.71=0.101。由于v> 考試點(www.kaoshidian.com)名師精品課 :4006885365因此第二種排隊方式的離散程度較小(3)由于第二種排隊方式的平均等待時間小于第一種排隊方式,并且離散程度較小,所以會選擇第二種排隊方式。7.一家網(wǎng)吧想了解上網(wǎng)的分布狀況,隨機抽?。玻等耍玫阶屗麄兊臄?shù)據(jù)如表4-7所示。表4(1)畫出該組數(shù)據(jù)的莖葉圖(2)畫出該組數(shù)據(jù)的箱線圖(3)根據(jù)莖葉圖和箱線圖說明上網(wǎng)者的特征。解:(1)該組數(shù)據(jù)額的莖葉圖如4所示。141(2)右表中數(shù)據(jù)可得圖4- 上的分布的莖葉最大值=41小值=中位數(shù)的位置=n=25+1=13以中位數(shù)= 下四分位數(shù)

的位置=4

=25=6.25,即Q

在第6個數(shù)值(19)和第7個數(shù)值(19)之間0.25位置上此QL=190.75+190.25=19上四分位數(shù)Q的位置=3n=325=18.75,即 在第18個數(shù)值(25)和第19個數(shù)值(27)之間 75的位置上此QU=25×0.25+27×0.75=26.5統(tǒng)計學習題及解由以上數(shù)據(jù)可得箱線圖圖4-7所示(3)由莖葉圖和箱線圖可以看出,上網(wǎng)者為右偏分布考試點(www.kaoshidian.com)名師精品課 :4006885365第五 參數(shù)估~、本章重參數(shù)估計的基本原理、總體的區(qū)間估計和樣本量的確二、本章知識點回注重掌握如何用樣本統(tǒng)計量來估計一個總體、兩個總體參數(shù)的置信區(qū)間,其步驟、種類(均值、比率、方差)、估計方法和計算公式。1.解釋估計量和估計值答:估計量:用于估計總體參數(shù)的統(tǒng)計量的名稱。估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值。2.簡價估計量好壞的標準。答:評價估計量的標準無偏性計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù)有效性同一總體參數(shù)的兩個無偏點估計量更小標準差的估計量更有效;一致性著樣本容量的增大計量的值越來越接近被估計的總體參數(shù)。3.解釋置信水平的含義。答:如果將構(gòu)造置信區(qū)間的步驟重復(fù)多次,置信區(qū)間中包含總體參數(shù)真值的次數(shù)所占的比率,為置信水平稱為置信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論