版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
推薦書目/網(wǎng)站統(tǒng)計學(xué)(第5版)龐皓西南財經(jīng)大學(xué)出版社2009年9月中國統(tǒng)計熱點問題解讀(第1版)國家統(tǒng)計局中國統(tǒng)計出版社2011年9月1日概率論與數(shù)理統(tǒng)計(第4版)盛驟高等教育出版社2008年6月第4版國家統(tǒng)計局中國統(tǒng)計信息網(wǎng)精選典型案例和統(tǒng)計改革舉措,對GDP、CPI、房價、居民收入與支出等統(tǒng)計熱點問題,從理論和實踐相結(jié)合的角度做深入淺出的解答,文字生動、事例鮮活,圖文并茂、通俗易懂,是公眾學(xué)習(xí)統(tǒng)計知識、把握統(tǒng)計原理的重要輔助材料21:131第一頁,共69頁。本課件依托教材統(tǒng)計學(xué):思想、方法與應(yīng)用袁衛(wèi)劉超中國人民大學(xué)出版社第1版(2011年9月1日)21:132第二頁,共69頁。作者簡介
袁衛(wèi),中國人民大學(xué)統(tǒng)計學(xué)教授。我國首批經(jīng)濟統(tǒng)計學(xué)博士,獲國家有突出貢獻的中青年專家、全國優(yōu)秀教師、首都五一勞動獎?wù)?,享受政府特殊津貼,入選教育部首批跨世紀優(yōu)秀人才培養(yǎng)計劃
劉超,中國人民大學(xué)經(jīng)濟學(xué)博士,清華大學(xué)經(jīng)管學(xué)院博士后,現(xiàn)為北京航空航天大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院講師、碩士生導(dǎo)師。研究方向為數(shù)理統(tǒng)計、數(shù)據(jù)挖掘、風(fēng)險管理與保險等21:133第三頁,共69頁。目錄第1章統(tǒng)計學(xué)導(dǎo)論第2章概率第3章分類數(shù)據(jù)的描述分析第4章定量數(shù)據(jù)的描述方法第5章
參數(shù)估計第6章假設(shè)檢驗第7章方差分析第8章相關(guān)與回歸分析第9章時間序列與指數(shù)第10章國民經(jīng)濟統(tǒng)計初步基本概念/發(fā)展史和數(shù)學(xué)、統(tǒng)計軟件的關(guān)系等數(shù)據(jù)的預(yù)處理頻數(shù)表統(tǒng)計圖等分布的集中位置,離散程度分布形態(tài)的度量誤用描述方法扭曲事實概率的計算離散、連續(xù)隨機變量的分布使用概率來檢驗假設(shè)樣本統(tǒng)計量和總體參數(shù)點估計抽樣分布與中心極限定理區(qū)間估計、合適樣本量的確定怎樣回答零假設(shè)所提出的問題顯著性水平正態(tài)總體均值的假設(shè)檢驗總體比例的假設(shè)檢驗假設(shè)檢驗和置信區(qū)間單因素方差分析方差分析回顧雙因素方差分析兩個變量間關(guān)系、強度回歸分析總體中的關(guān)系多元回歸分析虛擬變量時間序列的成分平滑技術(shù)趨勢分析指數(shù)國內(nèi)生產(chǎn)總值(GDP)國民收入指標價格指數(shù)和總體價格水平失業(yè)率國際收支21:134第四頁,共69頁。課前思考1,同學(xué)們?nèi)绾卫斫饨y(tǒng)計這個課程/專業(yè)2,統(tǒng)計學(xué)理論與現(xiàn)實的差異21:135第五頁,共69頁。第1章什么是統(tǒng)計學(xué)?如何運用統(tǒng)計學(xué)?統(tǒng)計學(xué)的基本概念數(shù)據(jù)的收集數(shù)據(jù)陣/數(shù)據(jù)文件統(tǒng)計學(xué)和數(shù)學(xué)、統(tǒng)計軟件的關(guān)系21:136第六頁,共69頁。學(xué)習(xí)目標1.理解統(tǒng)計學(xué)的含義2. 理解描述統(tǒng)計和推斷統(tǒng)計3.了解統(tǒng)計學(xué)的應(yīng)用領(lǐng)域/發(fā)展史4.了解數(shù)據(jù)的類型5.理解統(tǒng)計中的幾個基本概念21:137第七頁,共69頁。
統(tǒng)計數(shù)據(jù)與統(tǒng)計學(xué)
2011全年GDP471564億元,按可比價格計算,比上年增長9.2%。居民消費價格比上年上漲5.9%全班統(tǒng)計學(xué)平均成績77.5分上面陳述中的“數(shù)據(jù)事實”(numericalfacts)被稱為統(tǒng)計數(shù)據(jù)/統(tǒng)計資料,它們是在統(tǒng)計學(xué)理論指導(dǎo)下,通過統(tǒng)計工作完成的。21:138第八頁,共69頁。1.1什么是統(tǒng)計學(xué)統(tǒng)計學(xué)是研究收集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù)以及由數(shù)據(jù)分析得出結(jié)論的方法,簡稱為“數(shù)據(jù)的科學(xué)”。
比較:統(tǒng)計數(shù)據(jù)與統(tǒng)計學(xué)一般規(guī)律21:139第九頁,共69頁。大量數(shù)據(jù)如果不去分析它,那也僅僅是一堆數(shù)據(jù)而已,沒有什么用處。因為有用的信息恰恰藏在數(shù)據(jù)的里面統(tǒng)計可以在多方面幫助你分析數(shù)據(jù)利用統(tǒng)計簡化繁雜的數(shù)據(jù)用圖表重新展示數(shù)據(jù),進行比較分析建立數(shù)據(jù)模型進行預(yù)測1.1什么是統(tǒng)計學(xué)21:1310第十頁,共69頁??荚嚦煽?nèi)藬?shù)甲班乙班優(yōu)36良615中189及格98不及格4221:1311第十一頁,共69頁。2010年6月3日,第64屆聯(lián)合國大會第90次會議通過決議,確定每年10月20日為“世界統(tǒng)計日”。2011年初,國務(wù)院學(xué)位委員會在新的研究生專業(yè)目錄中將統(tǒng)計學(xué)上升為一級學(xué)科,為統(tǒng)計學(xué)科和統(tǒng)計教育的發(fā)展提供了更廣闊的平臺,也顯示出統(tǒng)計對科學(xué)研究、經(jīng)濟增長和社會發(fā)展的重要性。1.1什么是統(tǒng)計學(xué)21:1312第十二頁,共69頁。統(tǒng)計學(xué)的產(chǎn)生與發(fā)展
一、統(tǒng)計實踐活動的產(chǎn)生與發(fā)展
統(tǒng)計實踐活動產(chǎn)生于奴隸社會,當(dāng)時的統(tǒng)治階級為了對內(nèi)統(tǒng)治和對外戰(zhàn)爭,需要征兵征稅,開始了人口、土地和財產(chǎn)的統(tǒng)計。
封建社會末期,特別是進入資本主義社會以后,社會生產(chǎn)力迅速發(fā)展,統(tǒng)計逐步成為社會分工中的一個獨立的部門和專業(yè)。同時歐洲出現(xiàn)了一些統(tǒng)計理論著作,標志著統(tǒng)計學(xué)的產(chǎn)生。統(tǒng)計學(xué)產(chǎn)生后形成了不同的學(xué)派。21:1313第十三頁,共69頁。二、古典統(tǒng)計學(xué)時期(十七世紀至十八世紀)1、政治算術(shù)學(xué)〈1〉創(chuàng)始人:威廉·配第
〈2〉產(chǎn)生的背景:當(dāng)時的英國統(tǒng)治階級為了管理國家、發(fā)展經(jīng)濟、爭奪世界霸權(quán),需要了解國內(nèi)外的社會經(jīng)濟狀況,于是在英國產(chǎn)生了政治算術(shù)學(xué)派?!?〉研究方法:從數(shù)量方面研究社會經(jīng)濟現(xiàn)象21:1314英國古典政治經(jīng)濟學(xué)創(chuàng)始人,統(tǒng)計學(xué)家。主要有《賦稅論》(1662),《獻給英明人士》(1664),《政治算術(shù)》(1672),《愛爾蘭政治剖析》(1674),《貨幣略論》等第十四頁,共69頁。二、古典統(tǒng)計學(xué)時期(十七世紀至十八世紀)2、
國勢學(xué)派〈1〉創(chuàng)始人:海爾門·康令
〈2〉產(chǎn)生的背景:當(dāng)時的德國正處于封建制度解體的時期,統(tǒng)治者要了解國內(nèi)外的政治經(jīng)濟情況,決定國策,在當(dāng)時封建制的德國產(chǎn)生了國勢學(xué)派。
〈3〉研究方法:對國家重要事項的記述,幾乎完全偏重于品質(zhì)方面而忽視了量的分析。21:1315第十五頁,共69頁。三、近代統(tǒng)計學(xué)時期(十八世紀末至十九世紀末)
1、數(shù)理統(tǒng)計學(xué)派〈1〉創(chuàng)始人:阿道夫·凱特勒〈2〉產(chǎn)生的背景:當(dāng)時資本主義國家的自然科學(xué)有了很大發(fā)展,促使英美統(tǒng)計學(xué)界嘗試用研究自然的方法研究社會經(jīng)濟現(xiàn)象,并引入概率論,產(chǎn)生了數(shù)理統(tǒng)計學(xué)派.〈3〉研究方法:用大數(shù)定律從社會經(jīng)濟現(xiàn)象復(fù)雜不定的偶然性中尋找其規(guī)律性。21:1316第十六頁,共69頁。2、社會統(tǒng)計學(xué)派(1)創(chuàng)始人:德國的克尼斯(2)產(chǎn)生的背景:實現(xiàn)了統(tǒng)一的德國,為了發(fā)展資本主義、爭奪殖民地和海外市場,迫切需要掌握國內(nèi)外大量的國民經(jīng)濟統(tǒng)計資料,以揭示社會經(jīng)濟現(xiàn)象的規(guī)律性,于是在德國形成了社會統(tǒng)計學(xué)派。
(3)研究方法:在對統(tǒng)計資料進行搜集、整理、分析的基礎(chǔ)上,明確現(xiàn)象內(nèi)部的聯(lián)系和規(guī)律性三、近代統(tǒng)計學(xué)時期(十八世紀末至十九世紀末)
21:1317第十七頁,共69頁。四、現(xiàn)代統(tǒng)計學(xué)時期(二十世紀初至今)1、數(shù)理統(tǒng)計學(xué)
這一時期的數(shù)理統(tǒng)計學(xué),在深度和廣度上都有了迅速的發(fā)展,出現(xiàn)了新的分支和邊緣科學(xué),成為現(xiàn)代統(tǒng)計學(xué)的主流學(xué)派。2、社會統(tǒng)計學(xué)
這一時期的社會統(tǒng)計學(xué)也有所發(fā)展,其基本趨勢是由實質(zhì)性科學(xué)向方法論科學(xué)的轉(zhuǎn)變,但相對緩慢。指這類科學(xué)的內(nèi)容及任務(wù)在于揭示客觀事物發(fā)展變化的規(guī)律,以指導(dǎo)人們按照客觀規(guī)律的要求去改造世界,如經(jīng)濟學(xué)、人口學(xué)、財政學(xué)、市場營銷學(xué)等,都屬實質(zhì)性科學(xué)人們認識世界、改造世界的一般方法,是人們用什么樣的方式、方法來觀察事物和處理問題。概括地說,世界觀主要解決世界“是什么”的問題,方法論主要解決“怎么辦”的問題21:1318第十八頁,共69頁。3、
社會經(jīng)濟統(tǒng)計學(xué)
在德國社會統(tǒng)計學(xué)的影響下,以前蘇聯(lián)為首的社會主義國家逐步建立和發(fā)展了社會經(jīng)濟統(tǒng)計學(xué),曾成功地應(yīng)用于社會主義的計劃經(jīng)濟分析。由于當(dāng)時國際意識形態(tài)的對立,這些國家用武斷的方法解決學(xué)術(shù)上的爭議,使得統(tǒng)計科學(xué)沒有按照科學(xué)自身的規(guī)律不斷進步,因此發(fā)展緩慢。4、中國的統(tǒng)計學(xué)
新中國成立后,輸入了蘇聯(lián)的社會經(jīng)濟統(tǒng)計學(xué),雖然曾經(jīng)發(fā)揮了重要作用,但同樣進步遲緩。八十年代以后,統(tǒng)計進入了全面改革的新時期,統(tǒng)計方法更加豐富、應(yīng)用更加廣泛,統(tǒng)計學(xué)得到了很大的發(fā)展。四、現(xiàn)代統(tǒng)計學(xué)時期(二十世紀初至今)21:1319第十九頁,共69頁。理解統(tǒng)計對大眾的必要性在外出旅游時,需要關(guān)心一段時間內(nèi)的詳細天氣預(yù)報在投資股票時,需要了解股票市場價格的信息,了解某只特定股票的有關(guān)財務(wù)信息理解統(tǒng)計對管理者更重要一個統(tǒng)計辦公室的主管也是一個行政事務(wù)官,一次與一些統(tǒng)計學(xué)者開會,統(tǒng)計學(xué)者抱怨從其他部門收到的一些估計值沒有給出標準誤差(估計時的誤差大小,表示估計的精度),這個主管馬上問道:“對誤差也有標準嗎?”健康大臣對一個統(tǒng)計學(xué)者的報告中提到的去年由于某種疾病,平均1000中死亡人數(shù)為3.2這個數(shù)字發(fā)生了興趣。他問他的私人秘書,3.2個人是如何死法?他的秘書說:“先生,當(dāng)一個統(tǒng)計學(xué)家說死了3.2個人時,意味著3個人已經(jīng)死了,兩個人正要死?!?.2如何運用統(tǒng)計學(xué)
21:1320第二十頁,共69頁。統(tǒng)計應(yīng)用
用簡單的描述量得到一個重要發(fā)現(xiàn)
費舍在1952年的一篇文章中舉了一個例子,說明如何由基本的描述統(tǒng)計量知識引出一個重要的發(fā)現(xiàn)。20世紀早期,哥本哈根卡爾堡實驗室的施密特發(fā)現(xiàn)不同地區(qū)所捕獲的同種魚類的脊椎骨和鰓線的數(shù)量有很大不同;甚至在同一海灣內(nèi)不同地點所捕獲的同種魚類,也發(fā)現(xiàn)這樣的傾向。然而,鰻魚的脊椎骨的數(shù)量變化不大。施密特從歐洲各地、冰島、亞速爾群島以及尼羅河等幾乎分離的海域里所捕獲的鰻魚的樣本中,計算發(fā)現(xiàn)了幾乎一樣的均值和標準偏差值施密特由此斷定所有各個不同海域內(nèi)的鰻魚是由海洋中某公共場所繁殖的。后來名為“戴納(Dana)”的科學(xué)考察船在一次遠征中發(fā)現(xiàn)了這個場所21:1321第二十一頁,共69頁。讓你說出哪些領(lǐng)域不使用統(tǒng)計,這很困難,因為幾乎找不到一個不用統(tǒng)計的領(lǐng)域;讓你說出哪些領(lǐng)域應(yīng)用統(tǒng)計,同樣也很困難,因為幾乎所有的領(lǐng)域都應(yīng)用統(tǒng)計舉出一個統(tǒng)計沒有用途的領(lǐng)域名稱比舉出一個統(tǒng)計作為其組成部分的領(lǐng)域名稱要困難得多(RobertJohnson)幾乎所有的領(lǐng)域都要用統(tǒng)計21:1322第二十二頁,共69頁。統(tǒng)計的應(yīng)用領(lǐng)域actuarialwork(精算)agriculture(農(nóng)業(yè))animalscience(動物學(xué))anthropology(人類學(xué))archaeology(考古學(xué))auditing(審計學(xué))crystallography(晶體學(xué))demography(人口統(tǒng)計學(xué))dentistry(牙醫(yī)學(xué))ecology(生態(tài)學(xué))econometrics(經(jīng)濟計量學(xué))education(教育學(xué))electionforecastingandprojection(選舉預(yù)測和策劃)engineering(工程)epidemiology(流行病學(xué))finance(金融)fisheriesresearch(水產(chǎn)漁業(yè)研究)gambling(賭博)genetics(遺傳學(xué))geography(地理學(xué))geology(地質(zhì)學(xué))historicalresearch(歷史研究)humangenetics(人類遺傳學(xué))21:1323第二十三頁,共69頁。統(tǒng)計的應(yīng)用領(lǐng)域hydrology(水文學(xué))industry(工業(yè))linguistics(語言學(xué))literature(文學(xué))manpowerplanning(勞動力計劃)managementscience(管理科學(xué))marketing(市場營銷學(xué))medicaldiagnosis(醫(yī)學(xué)診斷)meteorology(氣象學(xué))militaryscience(軍事科學(xué))nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科學(xué))pharmaceutics(制藥學(xué))physics(物理學(xué))politicalscience(政治學(xué))psychology(心理學(xué))psychophysics(心理物理學(xué))qualitycontrol(質(zhì)量控制)religiousstudies(宗教研究)sociology(社會學(xué))surveysampling(調(diào)查抽樣)taxonomy(分類學(xué))weathermodification(氣象改善)中國國民黨中央執(zhí)行委員會調(diào)查統(tǒng)計局國民政府軍事委員會調(diào)查統(tǒng)計局21:1324第二十四頁,共69頁。理論統(tǒng)計學(xué)應(yīng)用統(tǒng)計學(xué)描述統(tǒng)計學(xué)推斷統(tǒng)計學(xué)國民經(jīng)濟統(tǒng)計學(xué)社會統(tǒng)計學(xué)人口統(tǒng)計學(xué)研究的內(nèi)容是運用于某一特定領(lǐng)域的統(tǒng)計問題統(tǒng)計學(xué)的分科研究的內(nèi)容是統(tǒng)計的一般理論和方法21:1325第二十五頁,共69頁。描述統(tǒng)計
(descriptivestatistics)是用圖形、表格和概括性的數(shù)字對數(shù)據(jù)進行描述的統(tǒng)計方法。內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律一項調(diào)查表明,消費者每月在網(wǎng)上購物的平均花費是200元,他們選擇在網(wǎng)上購物的主要原因是“價格便宜”21:1326第二十六頁,共69頁。推斷統(tǒng)計
(inferentialstatistics)是利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學(xué)方法內(nèi)容參數(shù)估計假設(shè)檢驗?zāi)康膶傮w特征作出推斷樣本總體為了解某高寒地區(qū)小學(xué)生血紅蛋白含量的平均水平,某人于2012年6月隨機抽取了該地小學(xué)生708名,算得其血紅蛋白均數(shù)為103.5g/L,標準差為1.59g/L。試求該地小學(xué)生血紅蛋白均數(shù)的95%可信區(qū)間21:1327第二十七頁,共69頁。描述統(tǒng)計和推斷統(tǒng)計的關(guān)系21:1328第二十八頁,共69頁。1.3統(tǒng)計學(xué)的基本概念1.3.1
隨機性和規(guī)律性當(dāng)不能預(yù)測一件事情的結(jié)果時,這件事就和隨機性聯(lián)系起來了。例如,擲硬幣,參加統(tǒng)計考試是否會達到預(yù)期的分數(shù)當(dāng)把大量隨機事件放在一起時,就表現(xiàn)出一定的規(guī)律性例【1】:擲硬幣例【2】:新生嬰兒的性別比例表面看:某些家庭的新生嬰兒性別沒有一定規(guī)律大量觀察:男女嬰比:107:100。(再如人的壽命)上述比例由人類自然發(fā)展的內(nèi)在規(guī)律所決定。(男性死亡率略高于女性)
統(tǒng)計可以看做是一項對隨機性中的規(guī)律性的研究。
請注意:規(guī)律也表現(xiàn)為某種隨機性隨機性與規(guī)律性:你中有我,我中有你。21:1329第二十九頁,共69頁。1.3.2
概率概率(probability)
:某一事件發(fā)生的機會有多大。概率為統(tǒng)計學(xué)的第三個方面——如何從數(shù)據(jù)中得出結(jié)論——奠定了基石。我們可能永遠不能確定兩個數(shù)字的差異是否超出了隨機性本身所預(yù)期的范圍,但是我們可以確定,這種差異發(fā)生的概率是大還是小。根據(jù)這個基本思想,在很多情況下,我們可以得出關(guān)于我們所處的這個世界的重要結(jié)論。21:1330第三十頁,共69頁。1.3.3變量(variable)
指一個可以取兩個或更多個可能值的特征、特質(zhì)或?qū)傩?。如商品銷售額、受教育程度、產(chǎn)品的質(zhì)量等級等變量的具體表現(xiàn)稱為變量值。變量可以分為分類變量(categoricalvariable):說明事物類別的名稱.如性別(男,女)。特點是:平行排列順序變量(rankvariable):說明事物有序類別的名稱。如產(chǎn)品等級。特點是:可排序,比較大小數(shù)值型變量(metricvariable):說明事物數(shù)字特征的名稱。如:成績、年齡、產(chǎn)量離散變量:取有限個值連續(xù)變量:可以取無窮多個值與變量對應(yīng)的是常數(shù)21:1331第三十一頁,共69頁。1.3.3變量(variable)
21:1332第三十二頁,共69頁。1.4數(shù)據(jù)的收集1.4.1定義變量數(shù)據(jù)收集的第一個準則是要清楚測量的是什么。換句話說,變量必須有一個明確的適合研究目的的定義這有時是說起來容易做起來難。如果我們對問題考慮得不全面,那么就沒理由指望回答問題的人(一般稱為響應(yīng)者)能按照我們期望的回答問題。在我們做研究之前,對變量必須要有一個清晰、詳盡的定義。如,"在您的家庭中有多少個孩子?"如果一個家庭中包含大于18歲的親生子女、前妻或前夫的孩子、養(yǎng)子或養(yǎng)女、過繼子女或者其他年輕的親戚,那該怎么辦呢?對于不和親生父母生活在一起的孩子怎么算呢?對于父母離了婚而共同撫養(yǎng)的孩子怎么算呢?21:1333第三十三頁,共69頁。1.4.2收集數(shù)據(jù)的方法觀測訪問問卷調(diào)查實驗觀測:是指僅通過對世界的觀察(而沒有操縱或控制它),并記錄觀測的結(jié)果。訪問:是通過座談會、走訪等方式取得數(shù)據(jù)。問卷:是通過發(fā)放問卷的方式取得到數(shù)據(jù)。實驗:是在實驗中控制一個或多個變量并測量操縱的結(jié)果。(目的:尋找原因)。區(qū)別:觀測數(shù)據(jù)的研究者盡量不干涉研究對象的行為模式,但不能對因史數(shù)據(jù)進行觀測。訪問在一定程度上對被訪問者心理造成干擾,則收集到的數(shù)據(jù)會有誤差;問卷常會產(chǎn)生未響應(yīng)誤差;實驗時需要其控制它變量的影響。
如,為了解碘鹽對人體的影響,在某地區(qū)進行實驗,一個區(qū)域的人吃碘鹽,另一個不吃,一定時期后觀察樣本人群的某些指標值21:1334第三十四頁,共69頁??傮w和樣本總體(population)所研究的全部個體(數(shù)據(jù))的集合,其中的每一個個體也稱為元素分為有限總體和無限總體有限總體的范圍能夠明確確定,且元素的數(shù)目是有限的無限總體所包括的元素是無限的,不可數(shù)的樣本(sample)從總體中抽取的一部分元素的集合構(gòu)成樣本的元素的數(shù)目稱為樣本容量或樣本量(samplesize)人口普查,總體有限空氣質(zhì)量,則總體無限21:1335第三十五頁,共69頁。樣本的選擇統(tǒng)計研究者所面臨的一個關(guān)鍵問題是如何選擇樣本。我們希望基于樣本得出的結(jié)論能夠適用于總體,這依賴于獲得一個"好"的樣本,否則這是不可能實現(xiàn)的。當(dāng)我們品嘗一勺我們做的湯時,我們關(guān)心的不是這勺湯怎樣,而是整個鍋里的湯味道如何。如果鍋里的湯被充分攪拌了,我們只需品嘗一勺即可知道整鍋湯的味道。這正如我們從總體中選擇一個樣本,從某種意義上來說,需要選擇一個來自"攪拌均勻"的總體的樣本。如果總體能被攪拌均勻,那么一個包含1000個個體的樣本,不管它是以整個國家為總體,還是以一個城市為總體,都可以告訴我們同樣多的內(nèi)容。21:1336第三十六頁,共69頁。讀者文摘的總統(tǒng)選舉調(diào)查
這個故事有關(guān)一次著名的失敗的統(tǒng)計調(diào)查。
1936年美國總統(tǒng)選舉前,一份名為讀者文摘的雜志曾進行了一次民意調(diào)查。調(diào)查的焦點是誰將成為下一屆總統(tǒng)——是挑戰(zhàn)者,堪薩斯州州長阿爾夫·蘭登,還是現(xiàn)任總統(tǒng)富蘭克林·德拉諾·羅斯福。
為了了解選民意向,民意調(diào)查專家們根據(jù)電話簿和車輛登記簿上的名單給一大批人發(fā)了簡單的調(diào)查表。盡管發(fā)出的調(diào)查表大約有一千萬張,但收回的比例并不高。在收回的調(diào)查表中,蘭登非常受歡迎。于是,該雜志預(yù)測蘭登將贏得選舉。21:1337第三十七頁,共69頁。樣本的選擇目的:推斷總體隨機樣本:按照隨機原則從總體中抽取的用以代表總體的樣本。如,從一個紙箱子中抽簽對學(xué)生點名回答問題。方便樣本:能夠很容易、很經(jīng)濟地得到的樣本稱為方便樣本。研究者們經(jīng)常習(xí)慣于研究手頭方便的總體中的個體。例如,醫(yī)學(xué)研究者經(jīng)常對他們自己的病人做研究。從方便樣本中得出的結(jié)果有時候很難推廣到整個總體。21:1338第三十八頁,共69頁。抽樣方式21:1339第三十九頁,共69頁。概率抽樣概率抽樣:也稱隨機抽樣,按一定的概率以隨機原則抽取樣本特點抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當(dāng)用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率21:1340第四十頁,共69頁。是最簡單、最基本、最符合隨機原則,但同時也是抽樣誤差最大的抽樣組織形式簡單隨機抽樣(純隨機抽樣)21:13方法:在抽樣框中的每個單位都具有相同的被抽中的機會,每個容量相同的樣本被抽中的機會也是相同的。
抽取樣本的方法:有放回抽樣和無放回抽樣。適合:總體內(nèi)部差異不是很大,規(guī)模也不大的情況。41第四十一頁,共69頁。簡單隨機抽樣
案例應(yīng)用21:13要對一批小包裝餅干進行衛(wèi)生達標檢查,只能從中抽取一定數(shù)量的餅干作為檢驗的樣本,用樣本的衛(wèi)生情況來估計這批餅干的衛(wèi)生情況.如果對這批餅干全部檢驗,費時費力,等檢查完了,這批餅干可能就超過保質(zhì)期了,再就是會破壞這批餅干的質(zhì)量,導(dǎo)致無法出售.獲取樣本的方法是:將這批小包裝餅干,放入一個不透明的袋子中,攪拌均勻,然后不放回地摸取,這樣就可以得到一個樣本.通過檢驗樣本來估計這批餅干的衛(wèi)生情況.42第四十二頁,共69頁。簡單隨機抽樣
練習(xí)21:13為了檢驗?zāi)撤N產(chǎn)品的質(zhì)量,決定從100件產(chǎn)品中抽取10件進行檢查,如何用簡單隨機抽樣抽取樣本?43第四十三頁,共69頁。簡單隨機抽樣
練習(xí)21:13①將這100件產(chǎn)品編號為1,2,…,100;②做好大小、形狀相同的號簽,分別寫上這100個號碼;③將這些號簽放在一個不透明的容器內(nèi),攪拌均勻;④連續(xù)抽取10個號簽;⑤然后對這10個號簽對應(yīng)的產(chǎn)品檢驗另一種:利用電腦產(chǎn)生隨機數(shù)44第四十四頁,共69頁。分層抽樣——將總體全部單位分類,形成若干個類型組,然后從各類型中分別抽取樣本單位組成樣本??傮wN樣本n等額等比例······能使樣本結(jié)構(gòu)更接近于總體結(jié)構(gòu),提高樣本的代表性;能同時推斷總體指標和各子總體的指標21:13最優(yōu)45第四十五頁,共69頁。分層抽樣
實例應(yīng)用21:13一個單位職工有500人,其中不到35歲有125人,35至49歲有280人,50歲以上有95人。為了了解這個單位職工與身體狀況有關(guān)的某項指標,要從中抽取一個容量為100的樣本。
由于職工年齡與該指標有關(guān),決定采用分層抽樣方法進行抽取。因為樣本容量與總體的個數(shù)的比為1:5,所以在各年齡段抽取的個數(shù)依次為125/5、280/5、95/5,即25、56、19。46第四十六頁,共69頁。分層抽樣
練習(xí)21:13某高中共有900人,其中高一年級300人,高二年級200人,高三年級400人,現(xiàn)采用分層抽樣抽取容量為45的樣本,那么高一、高二、高三各年級抽取的人數(shù)分別為A.15,5,25B.15,15,15C.10,5,30D.15,10,2047第四十七頁,共69頁。系統(tǒng)抽樣(機械抽樣或等距抽樣)——將總體單位按某一標志排序,而后按一定的間隔抽取樣本單位。隨機起點半距起點對稱起點(總體單位按某一標志排序)按無關(guān)標志排隊,其抽樣效果相當(dāng)于簡單隨機抽樣;按有關(guān)標志排隊,其抽樣效果相當(dāng)于類型抽樣。21:1348第四十八頁,共69頁。系統(tǒng)抽樣(機械抽樣或等距抽樣)案例應(yīng)用21:13某企業(yè)有職工5000名,現(xiàn)要隨機抽取100人進行家庭收入水平調(diào)查。抽取方法:按與研究目的無直接關(guān)系的姓名筆劃對總體進行排列,把總體劃分為100個人數(shù)為(K=5000/100)50人相等的間隔,在第1至第50人中隨機抽取一名,如抽到第10名,后面間隔依次抽取第60,110,160,210,…直到4960為止,總共抽取100名職工組成一個樣本。49第四十九頁,共69頁。系統(tǒng)抽樣(機械抽樣或等距抽樣)練習(xí)21:13為了了解某大學(xué)一年級新生英語學(xué)習(xí)的情況,擬從503名大學(xué)一年級學(xué)生中抽取50名作為樣本,如何采用系統(tǒng)抽樣方法完成這一抽樣?50第五十頁,共69頁。系統(tǒng)抽樣(機械抽樣或等距抽樣)練習(xí)21:13
分析:總體個數(shù)503,樣本容量50,不能整除,采用隨機抽樣的方法從總體中剔除3個個體,然后采用系統(tǒng)抽樣方法。
1,將學(xué)生隨機編號為1,2,3,…,503。
2,用抽簽法或隨機數(shù)表法,剔除3個個體,對剩下的500名學(xué)生重新編號,或采用補齊號碼的方式。
3,確定分段間隔k,將總體分為50個部分,每一部分包括10個個體。
4,第1部分簡單隨機抽樣確定起始的個體編號,例如是5。
5,依次在第2部分,第3部分,…,第50部分,取出號碼為15,25,…,495這樣得到一個容量為50的樣本。
點評:總體中的每個個體,都必須等可能地入樣,為了實現(xiàn)“等距”入樣且又等可能。因此,應(yīng)先剔除,再“分段”,后定起始位。51第五十一頁,共69頁。整群抽樣(集團抽樣)——將總體全部單位分為若干“群”,然后隨機抽取一部分“群”,被抽中群體的所有單位構(gòu)成樣本例:總體群數(shù)R=16樣本群數(shù)r=4ABCDEFGHIJKLMNOPLHPD樣本容量簡單、方便,能節(jié)省人力、物力、財力和時間,但其樣本代表性可能較差21:1352第五十二頁,共69頁。整群抽樣(集團抽樣)案例應(yīng)用21:13上級部門想了解某學(xué)院學(xué)分制情況,從該學(xué)院500個寢室(每室住6人),隨機無放回的抽取10個宿舍,詢問每個學(xué)生這學(xué)期副課的選修門數(shù),試問全院人均選修副課的門數(shù),并給出95%下的置信區(qū)間,以及群內(nèi)相關(guān)系數(shù)與設(shè)計效應(yīng)53第五十三頁,共69頁。非概率抽樣抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查
有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式21:1354第五十四頁,共69頁。非概率抽樣:方便樣本:能夠很容易、很經(jīng)濟的得到的樣本判斷樣本:指根據(jù)調(diào)查人員的主觀經(jīng)驗從總體樣本中選擇那些被判斷為最能代表總體的單位作樣本的抽樣方法配額樣本:是指調(diào)查人員將調(diào)查總體樣本按一定變量分類或分層,確定各類(層)單位的樣本數(shù)額,在配額內(nèi)任意抽選樣本的抽樣方式自愿樣本:被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息滾雪球樣本:以若干個具有所需特征的人為最初的調(diào)查對象,然后依靠他們提供認識的合格的調(diào)查對象,再由這些人提供第三批調(diào)查對象……依次類推,樣本如同滾雪球般由小變大21:1355第五十五頁,共69頁。誤差:指收集來的數(shù)據(jù)資料與真實情況間的差異1.4.3收集觀測數(shù)據(jù)時的錯誤和誤差—數(shù)據(jù)的質(zhì)量數(shù)據(jù)誤差抽樣誤差非抽樣誤差調(diào)查員誤差響應(yīng)誤差未響應(yīng)誤差研究調(diào)查誤差的主要目的是找出導(dǎo)致誤差產(chǎn)生的原因,進而采取對策避免、減少誤差或控制誤差水平21:1356第五十六頁,共69頁。從全部學(xué)生中隨機抽取20人組成樣本并計算平均體重:樣本一:52.35樣本二:50.26樣本三:53.19…真值:51.18抽樣誤差21:1357第五十七頁,共69頁。抽樣誤差:并非錯誤的"誤差"調(diào)查中的有些誤差純粹是統(tǒng)計上的,即抽樣誤差這并不是某件事出錯造成的誤差,而是指這樣的一個事實:如果研究被再做一遍,結(jié)果未必會和上次一模一樣。例如,前面提到過的第二個100次擲硬幣中,也許就有49次正面朝上,不同于第一個的52次。又如,在下一次的抽樣中,也許并不是60%的人贊同政府開征的房地產(chǎn)稅,而是57%或63%或其它相近比例的人贊同。但是,即便不同的樣本會產(chǎn)生不同的答案,大部分答案仍都位于總體中的真正比例的某一變化范圍內(nèi)。例如,通過每次大約1000個響應(yīng)者的多次抽樣,大部分樣本(95%)得出的比例和實際的比例至多相差3個百分點。也就是說,抽樣誤差等于加或減三個百分點(±3%)。21:1358第五十八頁,共69頁。未響應(yīng)誤差另一種誤差是未響應(yīng)誤差,是指由于一部分人未回答調(diào)查而造成的誤差。這可能是電話未通,或通后卻拒絕回答。郵寄調(diào)查通常比電話調(diào)查有更多的未響應(yīng)誤差。有時,一次好的電話調(diào)查,通常會有85%至90%的響應(yīng)率;而一次郵寄調(diào)查的響應(yīng)率很少有到達50%的.對研究者來說,高拒絕率是一個很大的問題,因為他們對于被選中但未參與調(diào)查的人了解很少。于是出現(xiàn)許多無法回答的問題:是什么使得人們有了不響應(yīng)和響應(yīng)的區(qū)別?相對響應(yīng)者來說,未響應(yīng)者是富有還是貧窮?保守還是自由?有影響力還是缺乏影響力?如果他們響應(yīng),他們的回答會怎樣影響研究結(jié)果?21:1359第五十九頁,共69頁。未響應(yīng)誤差假定計劃調(diào)查1200個人,卻只有1000人接受了調(diào)查,這意味著缺了200人的數(shù)據(jù)。在1000個響應(yīng)者中,600人(或60%)贊成某事物而其余人反對。如果假定另外200人也贊成,那么在1200人中就有800人贊成,比例為67%。但另一方面,如果假定那200人反對,那么1200人中只有600人贊成,比例為50%。因此,僅僅由于未響應(yīng)誤差,觀測樣本中60%的贊成比例有可能實際只是50%和67%之間的一個隨機數(shù)。這就可能給結(jié)論帶來很大的差別。一些經(jīng)驗表明,大部分情況下,未響應(yīng)者和響應(yīng)者并無多大差別。如果我們開始時有一個高的響應(yīng)率,那么可假定未響應(yīng)者也依同樣的比例作出回答。但是如果響應(yīng)率很低,例如不超過50%,那么不響應(yīng)的影響可能會很大。21:1360第六十頁,共69頁。
響應(yīng)誤差如果研究者小心一點的話,是有可能避免響應(yīng)誤差的。
響應(yīng)誤差是在調(diào)查過程中,由于問題的提問方式、問題所處的位置或訪員的影響而使得響應(yīng)者在回答問題時產(chǎn)生的偏差。即使所有的問題都有了回答,我們所知道的也僅僅是調(diào)查時人們告訴訪員的,而未必是他們實際上做的、感覺的或想的。
當(dāng)我們在報紙上讀到,在最近的一次調(diào)查中有55%的人認為他們的生活很幸福,那么我們應(yīng)該知道這句話其實是這個意思:被調(diào)查并回答了問題的人在當(dāng)時有55%對訪員說他們認為生活很幸福。21:1361第六十一頁,共69頁。1.5
數(shù)據(jù)陣/數(shù)據(jù)文件數(shù)據(jù)表通常叫做數(shù)據(jù)陣或數(shù)據(jù)文件表1.2一次抽樣調(diào)查的原始數(shù)據(jù)序號年齡性別態(tài)度120男反對223男贊成317女反對438女中立525女贊成643男贊成738男中立851女贊成935男贊成1039女反對21:1362第六十二頁,共69頁。1.5
數(shù)據(jù)陣/數(shù)據(jù)文件表1.3適合計算機處理的一次抽樣調(diào)查的數(shù)據(jù)序號年齡性別態(tài)度12011223133170143802525036431373812851039351310390121:1363第六十三頁,共69頁。1.6統(tǒng)計學(xué)和數(shù)學(xué)、統(tǒng)計軟件的關(guān)系統(tǒng)計學(xué)基礎(chǔ)是數(shù)學(xué),統(tǒng)計推斷牢牢地建立于數(shù)學(xué)基礎(chǔ)之上
沒有數(shù)學(xué)知識也有可能學(xué)會統(tǒng)計,這是本書的講述方式要學(xué)會基本的統(tǒng)計思想——某些專業(yè)術(shù)語,數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度農(nóng)產(chǎn)品電商平臺合作協(xié)議范本4篇
- 2025年度女方離婚協(xié)議書范本與執(zhí)行效力分析4篇
- 二零二五年度公務(wù)員借調(diào)期間心理健康輔導(dǎo)服務(wù)合同4篇
- 二零二四全新足浴店員工培訓(xùn)進修及教育資助合同3篇
- 2025年度個人教育培訓(xùn)服務(wù)合同范本15篇
- 健康知識普及與傳播-深度研究
- 2025年度個人貨物運輸代理及車輛維護合同4篇
- 二零二五年度油氣田鉆井安全作業(yè)合同范本4篇
- 2025年度新型木門研發(fā)合作采購合同4篇
- 二零二五年度美容院客戶關(guān)系管理與維護合同2篇
- 2025年上半年江蘇連云港灌云縣招聘“鄉(xiāng)村振興專干”16人易考易錯模擬試題(共500題)試卷后附參考答案
- DB3301T 0382-2022 公共資源交易開評標數(shù)字見證服務(wù)規(guī)范
- 人教版2024-2025學(xué)年八年級上學(xué)期數(shù)學(xué)期末壓軸題練習(xí)
- 江蘇省無錫市2023-2024學(xué)年八年級上學(xué)期期末數(shù)學(xué)試題(原卷版)
- 俄語版:中國文化概論之中國的傳統(tǒng)節(jié)日
- 2022年湖南省公務(wù)員錄用考試《申論》真題(縣鄉(xiāng)卷)及答案解析
- 婦科一病一品護理匯報
- 哪吒之魔童降世
- 2022年上海市各區(qū)中考一模語文試卷及答案
- 2024年全國統(tǒng)一高考數(shù)學(xué)試卷(新高考Ⅱ)含答案
- 地震工程學(xué)概論課件
評論
0/150
提交評論