版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數據的收集、整理1.理解數據的來源,理解五種統(tǒng)計調查方式,掌握五種概率抽樣方法的定義,理解五種統(tǒng)計調查方法.理解抽樣誤差的定義,了解非抽樣誤差. 會撰寫統(tǒng)計調查方案。2.了解統(tǒng)計整理的概念;了解統(tǒng)計分組的定義、作用,理解統(tǒng)計分組的原則、種類;掌握組距數列的編制步驟;掌握洛倫茲曲線和基尼系數的含義與用途.3.準確應用統(tǒng)計圖和統(tǒng)計表顯示統(tǒng)計數據的數量特征.學習目標內容安排一、 數據的收集二、 數據的整理三、 統(tǒng)計表與統(tǒng)計圖數據的收集 統(tǒng)計資料收集是根據統(tǒng)計研究的目的要求,采用一定組織形式與科學方法,進行采集與研究問題有關的各類信息資料的工作過程。 1.數據的來源(1)第一手數據 (2)第二手數據第
2、一手數據是反映被調查對象原始狀況的資料,如原始記錄、統(tǒng)計臺賬、調查問卷答案、實驗結果等.統(tǒng)計調查或進行實驗是數據的直接來源.原始數據是統(tǒng)計數據的最基本的來源.第二手數據是已經存在的經他人整理分析過的資料.數據的間接來源常用的有以下一些:公開出版的統(tǒng)計數據,主要來自官方的統(tǒng)計部門和政府、組織、學校和科研機構. 尚未公開發(fā)表的數據,如各企業(yè)的經營報表數據.使用第二手數據需要注意的問題 應注意數據的含義、計算口徑和計算方法,避免誤用或濫用; 注意第二手數據的時間性,不能用過時的數據; 應充分搞清這些數據的來源和可靠程度; 應注明數據的出處,以尊重他人的勞動成果. 2.統(tǒng)計調查(1)統(tǒng)計調查方案設計
3、(2)統(tǒng)計調查方法 (3)統(tǒng)計調查的組織方式確定調查目的與任務確定調查對象和調查單位確定調查項目和調查表確定調查時間和調查期限制定調查工作的組織實施計劃統(tǒng)計調查方案統(tǒng)計調查方法現場觀察法報告法問卷法訪談法實驗采集法統(tǒng)計調查組織方式統(tǒng)計報表普查抽樣調查重點調查典型調查統(tǒng)計報表 統(tǒng)計報表(Statistical Report Forms)是指依照國家統(tǒng)計局或國家各行政管理部門的規(guī)定,自上而下地統(tǒng)一布置,以一定的原始記錄為依據,按照統(tǒng)一的表式,統(tǒng)一的指標項目,統(tǒng)一的報送時間與報送程序,自下而上地逐級定期提供基本統(tǒng)計資料的一種調查方式。普查 普查(Census)是對調查對象的全部調查單位逐一進行的調查
4、。其特點:是一次性調查,是專門組織的全面調查,即普查主要用來調查屬于一定時點上的現象總量。關鍵詞:全面調查、一次性、時點資料 美國普查局 / 美國普查局抽樣調查 抽樣調查(Sampling Survey)是一種非全面調查,它是在全部調查單位中抽取一部分單位作為樣本進行調查,再根據調查結果推斷總體的一種調查方法。概率抽樣和非概率抽樣 根據抽選樣本的方法,抽樣調查可以分為:概率抽樣:也稱隨機抽樣,是按照隨機原則抽選樣本的抽樣方式,抽樣時每個樣本單位被選中的概率是已知.概率抽樣中可以對抽樣誤差進行控制.在我國,習慣上將概率抽樣稱為抽樣調查.不滿足概率抽樣要求的抽樣都被歸為非概率抽樣.非概率抽樣單個單
5、位被選中的概率是不可知的,不能從概率意義上控制抽樣誤差.隨機原則:在抽選樣本時排除主觀因素的影響(不是有意識的抽選某些單位),使每個單位都有一定的機會被抽中.等概率抽樣:抽樣時每個單位被選中的概率都相等.不等概率抽樣:抽樣時不是每個單位被選中的概率都相等.抽樣調查非概率抽樣概率抽樣不等概率抽樣等概率抽樣概率抽樣中的隨機原則是實際中應用最廣泛的一種調查方式.1992年我國的國家調查系統(tǒng)將抽樣調查列為統(tǒng)計調查的主體.與全面調查相比,它具有以下明顯的特點:經濟性.普查需要花費大量人力、財力,而采用抽樣調查則可取得事半功倍的效果.時效性強 .可以迅速及時地獲得信息.適應面廣 .對于某些不可能進行普查的
6、現象,只能通過抽樣調查獲取這些現象的部分數據.有可能獲得比普查更高的數據質量.普查中工作量大、環(huán)節(jié)多,登記性誤差往往很大. 抽樣調查的特點抽樣調查方法的分類在抽樣調查中可以把總體分成若干個互不重疊又窮盡的有限個部分,每個部分稱為一個抽樣單位(抽樣單元,Sampling unit).抽樣單位可以是一個總體單位,也可以包含多個個體.所有抽樣單位的名單稱為抽樣框(Sampling Frame). 抽樣框應盡可能與目標總體相一致. 抽樣框有以下形式: 名單抽樣框,即以名冊或清單形式列出總體所有單位例如,學生名冊、企業(yè)名錄、職工名單、住戶名單、村莊名單、社區(qū)名單等等.抽樣單元和抽樣框區(qū)域抽樣框,按自然地
7、域劃分并排列出總體所有單位.例如,一片土地劃分為若干地塊并編號、一片森林劃分為若干林區(qū)并編號等.時間表抽樣框,按時間順序排列總體單位.例如,流水線生產的產品質量檢驗,把一天劃分為若干時段并按順序排列.抽樣框的編制是抽樣調查的前提條件,要求不重不漏來保證樣本對總體的代表性.概率抽樣調查的方式主要有以下五種:()簡單隨機抽樣(Simple Random Sampling)也稱純隨機抽樣.直接從總體單位中抽選樣本單位,每個個體被選入樣本的概率都相等.可分為有放回和無放回兩種方式.是最基本的抽樣方法,許多抽樣方法都是在它的基礎上發(fā)展起來的.其數學性質簡單,理論也最為成熟.有放回抽樣和無放回抽樣有放回抽
8、樣:也稱為重復抽樣,在一個單位被選入樣本后,記錄其編號,然后又將其放回總體中繼續(xù)參與隨后的抽樣過程.無放回抽樣:也稱為不重復抽樣,在一個單位被選入樣本后,不再放回總體參與隨后的抽樣過程.重復抽樣的誤差也比不重復抽樣略大.實際應用中一般采用不重復抽樣.從N個總體單位中抽選n個單位組成樣本,可以先將N個單位編號,若抽到某個號則對應的單位入樣.通常有抽簽法和隨機數法兩種抽選方法.抽簽法:用均勻同質的材料制作N個簽并充分混合,然后一次抽取n個簽,或一次抽取一個簽但不放回,直至抽滿n個簽為止.隨機數法: 隨機數表隨機數骰子計算機產生的偽隨機數抽選樣本單位的方法39 65 76 45 45 19 90 6
9、9 64 61 20 26 36 31 62 73 71 23 70 90 65 97 60 12 11 98 40 07 17 66 72 20 47 33 84 51 67 47 97 19 98 40 07 17 66 75 17 25 69 17 17 95 21 78 58 24 33 45 77 48 37 48 79 88 74 63 52 06 34 30 01 31 60 10 27 02 89 08 16 94 85 53 83 29 95 56 27 09 24 43 隨機數表舉例當總體內樣本單位不多,且有完備名冊,可用于編號時對研究的目的而言,總體內樣本單位間的差異不大
10、時.無法充分獲得總體信息時由于編制抽樣框及抽取的樣本可能過于分散等原因在實際實施中有一定困難,加之沒有利用其他輔助信息提高估計的效率,所以大規(guī)模調查中很少直接采用.簡單隨機抽樣最適用的場合系統(tǒng)抽樣(也稱機械抽樣):將總體N個單位按某種順序排列,在規(guī)定的范圍內隨機抽取起始單元,然后按一套規(guī)則確定其他樣本單元的一種抽樣方法.最簡單的系統(tǒng)抽樣是等距抽樣.下面介紹直線等距抽樣:將總體分成n個組,每組有 k =N/n個單位.在第一組隨機選擇一個單位,之后每隔k個選擇一個.N = 64n = 8k = 8第一組()系統(tǒng)抽樣 (Systematic Sampling)總體單位的順序可能影響抽樣結果:各單元的
11、排隊順序與所研究的內容無關;各單元的排隊順序與所研究的內容有內在聯系.優(yōu)點:抽取樣本簡便易行,易于監(jiān)控.主要適用場合:總體內的樣本單位,對有興趣的指標而言是隨機的或按大小排列的.總體內單位數過多,而抽取的樣本又較多時.總體內的單位數不能確定時(例如抽取學號最后一位為8的學生進行調查).系統(tǒng)抽樣的特點也稱類型抽樣.即先將總體所有單位按某種標志劃分為若干層,然后從各層中隨機抽取一定數目的單位構成樣本,根據各層樣本匯總對總體指標作出估計的一種抽樣方式.男生女生樣本()分層抽樣 (Stratified Sampling)可以提高樣本的代表性,提高估計的精度.抽樣誤差只受層內方差的影響,分層時應使層間方
12、差大、層內方差小.最適用的場合:當總體內樣本單位的差異較大時;分層后能達到層間差異大,層內差異小的原則時.分層抽樣的特點按比例分層抽樣:按各層單元數占總體單元數的比例進行分配.在有些情況下為了降低抽樣誤差或者對各層的參數進行較好的估計,需要采用不按比例分層抽樣.在不按比例的分層抽樣中如果要用樣本資料推斷總體,需要對各層的數據資料進行加權處理.按比例分層抽樣和不按比例分層抽樣 假設要從1000畝農田中抽取100畝調查小麥的平均畝產.1000畝耕地中有600畝為平原,400畝為丘陵;平原地區(qū)的畝產量相差不大(方差很小),而丘陵地區(qū)畝產量的差別很大(方差大).按比例抽樣:平原和丘陵各抽60畝和40畝
13、.不按比例抽樣:為了更準確地估計丘陵地區(qū)的平均畝產,在丘陵地區(qū)多抽一些農田(例如70畝),從平原地區(qū)抽取30畝.這時總體平均畝產的估計值為不按比例分層抽樣(不等概率抽樣)的例子先將總體分為R個群(即次級單位或子總體),每個群包含若干總體單位.按某種方式從中隨機抽取r個群,然后對抽中的群的所有單位都進行調查的抽樣方式.總體分成4個群隨機選擇2個群構成樣本 () 整群抽樣 (Cluster Sampling)不需要所有總體單位的抽樣框.由于樣本單位不能均勻的分布在總體中,所以樣本的代表性要差一些(對策:增大樣本容量).抽樣誤差受群間方差的影響,不受群內方差的影響.分群時應使群間方差小.最適用的場合
14、:總體名單不易獲得時為節(jié)省調查成本時群內差異大,而群間的變異小時整群抽樣的特點先從總體中隨機地抽取若干初級單位,再從初級單位中抽取若干二級單位, ,如此下去直至抽取所要調查的基本單位的抽樣方法.例如: 統(tǒng)計年鑒2004指出 2003年人口變動情況抽樣調查是以全國為總體,各省、自治區(qū)、直轄市為次總體,采用分層、等距、整群概率比例抽樣方法,在全國31個省、自治區(qū)、直轄市抽取了990個縣(市、區(qū))、3734個鄉(xiāng)(鎮(zhèn)、街道)、6544個調查小區(qū)的126萬人.() 多階段抽樣(muti-stage Sampling)適用于總體分布很廣,不可能從總體中直接抽取樣本單位的情況.不需要全部低級單位的抽樣框,節(jié)
15、省了調查費用.方法靈活多樣.抽樣調查的組織方式完全取決于調查研究的目的要求、調查對象的特點和客觀的條件.凡是能夠最經濟、最省時而又能夠滿足預期精確度和可靠性的組織方式,便是一種好的組織方式,這也是抽樣設計的最根本的原則.多階段抽樣的特點非概率抽樣方便抽樣判斷抽樣配額抽樣雪球抽樣 不滿足概率抽樣要求的抽樣都被歸為非概率抽樣.非概率抽樣中單個單位被選中的概率是不可知的,無法根據樣本計算抽樣誤差.非概率抽樣純粹以方便為基本著眼點的抽樣方法,事先不預定樣本,碰到即問或被調查者主動回答問題.也譯為便利抽樣、偶遇抽樣.例如:在街頭的攔截式訪問.登在報刊、網上的問卷.方便抽樣(Convenience sam
16、pling)調查者根據主觀經驗和判斷從總體中選取有代表性的單位構成樣本.精度取決于抽樣者的經驗.不能獲得估計值的精度.適用于總體單位極不相同而樣本容量又很小的情況 判斷抽樣 (Judgment Sampling)是非隨機抽樣方法中最常用的一種抽樣方法.分為兩個步驟:根據研究人員認為較重要的一些變量把總體單位分類,指定每一類中的定額;然后在每一類中使用方便抽樣或判斷抽樣的方法抽選指定數量的樣本單位.配額抽樣 (Quota sampling)也譯為滾雪球抽樣 .其原理是先找到最初的樣本單位,然后根據他們提供的信息去獲得新的樣本單位;這種過程不斷繼續(xù),直到完成規(guī)定的樣本容量為止.主要用于對稀少群體的
17、調查.例如某研究部門在調查保姆問題時,先訪問了7名保姆,然后再請她們提供其他保姆名單,逐步擴大到近百人.雪球抽樣 (Snowball Sampling)重點調查 重點調查(Key-point Survey)是指在調查對象中,選擇一部分重點調查單位收集統(tǒng)計資料的一種非全面調查。關鍵詞:重點調查單位,是指這些被調查的總體單位中數目不多,所占比重不大,但其調查的標志值卻在總量中占有很大比重,在總體中具有舉足輕重的作用。 典型調查 典型調查(Model Survey)是指根據調查目的,在對所研究現象全面分析的基礎上,有意識地選擇有代表性的典型單位進行深入細致地調查,以便認識事物的本質與發(fā)展變化規(guī)律的一
18、種非全面調查方法。關鍵詞:典型單位,是指那些能充分、集中地體現調查對象總體某些方面共性特征的最有代表性的單位。抽樣調查中的誤差抽樣誤差抽樣框誤差無回答誤差計量誤差非抽樣誤差抽樣調查中的誤差數據的質量誤差與抽樣誤差誤差是指估計值與真實值之間的差異.抽樣誤差(Sampling error):由于抽選樣本的隨機性造成的誤差,也稱為代表性誤差.樣本只是總體的一部分,它對總體的代表性存在局限性,從而會造成誤差.在抽樣調查中,抽樣誤差就不可避免.在概率抽樣中抽樣誤差是能夠計量且可以得到控制的.影響抽樣誤差的主要因素包括:總體內部的差異程度;樣本容量的大小;抽樣的方式方法等.非抽樣誤差:除抽樣誤差以外的所有
19、誤差.通常認為是由于調查程序執(zhí)行中的錯誤與不足引起的.主要包括抽樣框誤差、無回答誤差和計量誤差.國內也稱為“工作誤差” 或“調查誤差” .非抽樣誤差(Nonsampling error)數據的整理(統(tǒng)計整理) 統(tǒng)計整理是統(tǒng)計工作的中間環(huán)節(jié),學習本部分內容的目的在于掌握統(tǒng)計分組的方法,認識分布數列是統(tǒng)計整理的重要表現形式,會編制變量數列,并且會用統(tǒng)計表表現統(tǒng)計資料。 數據的整理統(tǒng)計整理的基本概念與步驟統(tǒng)計分組分布數列統(tǒng)計圖表 數據的整理,是根據統(tǒng)計研究的目的,將統(tǒng)計調查所得到的原始資料進行加工,為統(tǒng)計分析準備系統(tǒng)化、調理化的綜合資料的工作過程。 1、數據的整理例如,某班50名學生,調查其考分資料
20、如下:77 65 83 56 68 70 99 65 73 72 88 66 74 63 71 84 62 52 80 78 84 79 81 64 58 82 76 62 73 75 89 79 61 65 54 92 86 73 68 51 69 64 78 63 76 68 72 77 81 76. . 按考分分組(分)學生人數(人) 60以下60 7070 8080 9090 100 5 15 18 10 2合 計 50 由表2-1可見,整理后的學生考分資料,較整理前的考分資料明顯要條理、系統(tǒng)。表2-1 統(tǒng)計整理是統(tǒng)計調查的繼續(xù),是統(tǒng)計分析的前提,它實現了從個別單位的標志表現(標志值)
21、向總體綜合指標的過渡,在統(tǒng)計研究中起著承前啟后重要的作用。數據整理從廣義上講,包括兩種整理.第一是對統(tǒng)計調查所收集到的各種數據進行分類和匯總,稱為匯總性整理.第二種是對現成的綜合統(tǒng)計資料進行整理. . 統(tǒng)計整理的程序: 1.制定整理方案 即根據研究任務的要求選擇應整理的指標并根據分析任務的需要,確定具體的分組。 2.審核統(tǒng)計數據 審核方法有邏輯檢查和技術檢查。見例 3.對數據進行編碼和錄入4.統(tǒng)計分組和匯總5.編制統(tǒng)計表,繪制統(tǒng)計圖,顯示整理結果。 6.統(tǒng)計資料的積累和開發(fā)例:一次農村調查中某村干部在反映總體情況時:該村總勞力為776人在后面反映勞力的分布狀況時:全村在鄉(xiāng)鎮(zhèn)企業(yè)當職工的:187
22、人在村辦企業(yè)當職工的:200人其余是種田的:95人482人武漢市居民生活質量調查問卷結果實例(節(jié)選)區(qū)漢陽1武昌 2漢陽 3江漢 4江岸5青山 6硚口 7洪山2編號03870387A1性別1.男 2.女2A2年齡39歲39A3文化程度1.小學及以下 2.初中 3.高中及中專 4.大專及以上3A4職業(yè)1.生產、運輸工人和有關人員2.商業(yè)人員 3.黨政企事業(yè)單位負責人4.服務人員 5.黨政企事業(yè)單位工作人員6.個體經營者 7.各類專業(yè)技術人員8.離退休人員 9.其他(請寫明) 。2 2. 統(tǒng)計分組的定義、作用、原則、種類統(tǒng)計分組是根據統(tǒng)計研究的目的,選擇某一標志作為分組的依據,將總體分成若干個不同
23、的組.舉例從分組的性質來看,分組兼有分和合雙重含義.對總體而言是“分”,即將總體分為性質相異的若干組成部分;對個體而言是“合”,即將性質相同的個體組合起來.例如,企業(yè)按經濟類型分組:國有企業(yè) 集體企業(yè) 個體企業(yè) 其它企業(yè)學生按考分分組:60分以下 (不及格)6070分 (及格)7080分 (中等)8090分 (良好)90100分(優(yōu)秀)分組的作用:劃分現象的類型;揭示現象內部結構;分析現象之間的依存關系.分組的原則:窮盡原則:使總體中的每一個單位都應有組可歸.互斥原則:在特定的分組標志下,總體中的任何一個單位的只能歸屬于某一組,而不能同時或可能歸屬于幾個組.1)按分組標志的多少簡單分組:就是對
24、研究現象按一個標志進行分組. 復合分組:用兩個或兩個以上標志分組,即先按一個標志分組,在此基礎上再按第二個標志分小組,又再層疊地按第三個標志分成更小的組,這稱為復合分組.2)按分組標志的性質不同品質分組:按品質(或屬性)標志進行分組.品質分組所形成的數列稱為品質數列.變量分組:按數量標志分組,數量標志的變異性體現在它不斷變動自身的數量上,故也稱為變量分組.變量分組所形成的數列稱為變量數列. 分組的種類2)按任務與作用的不同類型分組:總體按主要的品質標志分組,多屬于類型分組.結構分組:總體按主要的數量標志分組,多屬于結構分組分析分組:按照研究對象總體諸標志依存關系。分組標志的選取與分組體系 統(tǒng)計
25、分組的關鍵在于分組標志的選擇。 必須根據現象所處的具體歷史條件(經濟條件),按照統(tǒng)計研究的目的,選擇具有本質性的標志作為分組標志。根據統(tǒng)計研究的目的選擇分組標志。選擇能夠反映現象本質的分組標志。結合現象所處的具體歷史條件(經濟條件)選擇分組標志。- 簡單分組:按單個標志進行分組。- 復合分組:按兩個或兩個以上標志進行分組。 - 分組體系:對社會經濟現象需要從各方面進行觀察和分析研究,需要采用一系列相互聯系、相互補充的標志對現象進行多種分組,這些分組結合起來構成一個體系,叫做分組體系。 分組標志的選取與分組體系分組體系對現象進行多種分組、再排列起來的結果平行分組體系:按多個標志進行簡單分組,再排
26、列層疊復合分組體系:先進行多種復合分組,再排列分組體系對現象的認識更加全面、深刻分組方法品質分組法數量分組法. . 品質分組(按品質標志分組)國民經濟按產業(yè)分組: 第一產業(yè) 第二產業(yè) 第三產業(yè)人口按性別分組: 男性 女性 用文字來表示各組性質上的差別 . . 數量分組(按數量標志分組)單項式分組組距式分組用數量來表示各組性質上的差別 . . (即一個組只有一個變量值)單項式分組 單項式分組適用于:變量值變化范圍不大、不同變量值個數較少的離散變量。居民家庭按子女數分組:0 1 2 3 (離散變量)例如:. . 將相鄰幾個變量值并為一組(形成一個區(qū)間),即一個組有一個變量值的變動范圍。例如:企業(yè)按
27、人數分組 499及以下 500 999 1000 2999 3000及以上 工人按工資分組 600 700 700 800 800 1200 1200 1500 組距式分組適用于:變量值變化范圍較大、不同變量值個數較多的離散變量及連續(xù)變量。(離散變量)(連續(xù)變量) 注意:連續(xù)型變量的數值不能一一列舉,故其只能采用組距式分組。 組距式分組(應注意). . 組限及劃分方法 組距與組數 組中值 . . 組距與組數組距=本組上限前組上限(通用公式)組距=本組上限本組下限(重疊組限)全距=最大變量值最小變量值 組距與組數一般是用整數表示。學生按考分分組(分) 50 60 60 70 70 80 80 9
28、0 90 100等距分組異距分組. . 即各組組距相同的分組。等距分組:(在變量值分布比較均勻時采用)異距分組:即各組組距不都相等的分組。(在變量值分布很不均勻時采用) 根據事物性質變化的數量界限來確定組距。如人口按年齡分組,要注意不同年齡生理變化的特點,可分為: 1歲以下; 16 歲; 712 歲; 1318 歲; 1959 歲; 60 歲以上。 499及以下 500 999 1000 2999 3000及以上 600 700 700 800 800 1200 1200 1500 . . 組限及劃分方法工人按工資分組:企業(yè)按人數分組:重疊組限不重疊組限組限的劃分(只適用于離散變量) 500及
29、以下 500 1000 1000 3000 3000及以上 當某單位的變量值剛好等于相鄰兩組的上下限時,一般把此值歸到作為下限的那一組中,即遵循“上限不在內” 原則。. . 組中值指各組上限和下限之間的中點數值。(假定組內標志值均勻分布)(考分:52 54 57 58 59) 按考分分組 50 60 60 70 70 80 80 90 90 100 55 75 658595(考分:51 52 53 54 55)不均勻分布50 55 60 均勻分布 50 55 60 組中值封口組開口組. . 若第一組出現“以下”或最末組出現“以上”字樣的組叫做開口組。首組組中值=首組上限相鄰組組距的一半=末組下
30、限+相鄰組組距的一半末組組中值50 102100 + 102其組中值的確定:.首組:末組:按考分分組 組中值 50 60 55 60 70 65 70 80 75 80 90 85 90 100 9550以下45. . 統(tǒng)計分組的種類(一)按照分組標志 的個數不同 .(二)按照分組標志的性質不同 .簡單分組-平行分組體系 復合分組復合分組體系 品質分組數量分組-變量數列單項式分組 組距式分組 離散變量 連續(xù)變量等距分組-異距分組開口組-閉口組組限、組距、組中值組距式分組(重疊組限)簡單分組 復合分組 品質數列 分組聯圖 3. 次數分布次數分布:在統(tǒng)計分組的基礎上,將總體的所有單位按組歸類整理,
31、并按一定順序排列,形成總體中各個單位在各組間的分布.頻數(次數):落在各組中的數據個數.頻率:次數與總次數的比值.把各組的頻數或頻率按一定的順序排列而成的數列,稱為次數分布數列,簡稱分布數列.按考分 分 組 人數(人)頻率()5060 6070 7080 8090 9010051518102103036204合 計50100次數(頻數)頻率總體的分組標志次數分布頻率分布注:正確理解比例與比率這兩個概念.比例(Proportion):也稱構成比,它是一個樣本(或總體)中各個部分的數據與全部數據之比,通常用于反映樣本(或總體)的構成或結構.比例100=百分比(Percentage),用%表示.顯然
32、比例的取值范圍是:0,1比率(Ratio)是樣本(或總體)中不同類別數據之間的比值.由于比率不是部分與整體之間的對比關系,因而比值可能大于1.綜上:頻率實際上是比例. 分布數列的種類(按分組標志不同)品質數列:按品質標志分組形成,有各組名稱和次數組成.變量數列:按數量標志分組形成,可分為單項式和組距式 兩種.例 為研究廣告市場的狀況,一家廣告公司在某城市隨機抽取200人就廣告問題做了郵寄問卷調查,其中一個問題是:“您比較關心下列哪一類廣告?”(1)商品廣告;(2)服務廣告;(3)金融廣告;(4)房地產廣告;(5)招生招聘廣告;(6)其他廣告.某城市居民關注廣告類型的頻數分布單項數列:總體按單項
33、式分組而形成的變量數列,每一組由一個變量值來表示.適用于組數不多和組值變動幅度不大.組距數列:將全部變量值依次劃分為若干區(qū)間,每組有一個區(qū)間表示.適用于變量個數較多、變動幅度較大. 變量數列的編制 確定變量數列的形式(1)若變量是連續(xù)型變量,只能采用組距數列表示.(2)若變量是離散型變量 (a)在變量值不多的情況下,可編制單項數列; (b)若變量值個數較多,編制組距數列. 組距數列的編制步驟 排序并求出全距(最大值-最小值); 確定組數和組距; 確定組限和組中值; 歸組并計算出各組的次數; 顯示或打印出次數分布表.組數: 一組數據所分成組的個數.斯特杰斯經驗公式計算結果只要有小數,就把小數舍去
34、,并在整數位上加1,不采用四舍五入.組限:在組距式分組中,一個組的最小值稱為下限,最大值稱為上限.組距:每個組上限和下限之間的距離. 等距分組:各組的組距相等(變量值變動均勻). 異距分組:各組的組距不相等(現象變動很不均衡,變量值 變動幅度較大,宜采用).確定組限對于連續(xù)型變量,通常以一個數值作為相鄰兩組的上限和下限;遵循“上限不在內原則”對于離散型變量,上下限可以重疊,也可以不重疊.注:最小組的下限低于或等于最小變量值,最大組的上限高于或等于最大變量值.閉口組:組距的上限、下限都齊全.開口組:在組距分組中,為避免出現空白組或個別極端值被漏掉,第一組和最后一組采取“以下”及“以上”的開口組.
35、例2在一批燈泡中隨機抽取100只進行測試,測得燈泡的使用壽命(單位:小時)數據如下,要求編制次數分布表. 4. 洛倫茲曲線和基尼系數 洛倫茲曲線1. 20世紀初美國經濟學家、統(tǒng)計學家洛倫茲(M.E. Lorentz)根據意大利經濟學家帕累托(V. Pareto)提出的“二八原理” 和收入分配公式繪制而成.2. 描述收入和財富分配性質的曲線.橫軸表示累積的人口百分比,縱軸表示累積的收入或財富百分比.3.45度直線是絕對平均線,表明收入分配絕對平均;橫軸與圖中最右邊的縱軸構成絕對不平均線,表明收入分配絕對不平均.根據實際資料所作的反映實際收入分配狀況的曲線位于絕對平均線和絕對不平均線之間,稱為洛倫
36、茲曲線. 洛倫茲曲線與絕對平均線越接近,表示收入分配越平均,而 洛倫茲曲線向下彎曲越大,與絕對不平均線越接近,表示收 入分配越不平均.基尼系數 20世紀初意大利經濟學家基尼(G. Gini)根據洛倫茲曲線給出了衡量收入分配平均程度的指標,即基尼系數,用公式表示為:式中: A表示實際收入曲線與絕對平均線之間的面積;B表示實際收入曲線與絕對不平均線之間的面積.如果A=0,則基尼系數=0,表示收入分配絕對平均.如果B=0,則基尼系數=1,表示收入分配絕對不平均.基尼系數在0 和1之間取值. 一般認為,基尼系數若小于0.2,表明分配平均但缺乏效率;基尼系數在0.2至0.4之間是比較適當的,即一個社會既有效率又沒有造成極大的分配不公;基尼系數在0.4時被認為是收入分配不公平的警戒線.超過了0.6,則表示可能由于收入分配不公導致社會不穩(wěn)定.統(tǒng)計表統(tǒng)計表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 雙十一設計引領消費
- 2024年遠程教育講師合同模板
- 外墻燈安裝合同(2篇)
- 大宗商品資產管理合同
- 2024年裝飾裝修工程監(jiān)理合同3篇
- 2024版?zhèn)}單質權貸款合同3篇
- 凈水器租賃合同書
- 民間房屋買賣合同
- 15 女媧補天 說課稿 -2024-2025學年語文四年級上冊統(tǒng)編版
- 2025年度人工智能技術研發(fā)合同范本6篇
- 2025辦公室租賃合同范本電子版
- 2025版路燈維護保養(yǎng)及應急搶修服務合同示例3篇
- 2025初級會計職稱《初級會計實務》全真考題及精準答案解析(3套)
- ISO 56001-2024《創(chuàng)新管理體系-要求》專業(yè)解讀與應用實踐指導材料之6:“4組織環(huán)境-4.4創(chuàng)新管理體系”(雷澤佳編制-2025B0)
- 2024年市教育局直屬事業(yè)單位公開選調工作人員考試題及答案
- 2024屆九省聯考英語試題(含答案解析、MP3及錄音稿)
- 人臉識別項目施工方案方案
- 倉庫消防知識安全培訓
- 從事專業(yè)與所學專業(yè)不一致專業(yè)技術人員申報職稱崗位任職合格證明附件6
- 15《八角樓上》說課稿-2024-2025學年語文二年級上冊(統(tǒng)編版)
- 我國房屋建筑模板技術的研究綜述
評論
0/150
提交評論