統(tǒng)計研究的程序與數(shù)據(jù)搜集方法_第1頁
統(tǒng)計研究的程序與數(shù)據(jù)搜集方法_第2頁
統(tǒng)計研究的程序與數(shù)據(jù)搜集方法_第3頁
統(tǒng)計研究的程序與數(shù)據(jù)搜集方法_第4頁
統(tǒng)計研究的程序與數(shù)據(jù)搜集方法_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計研究的程序統(tǒng)計列表、圖示、數(shù)據(jù)搜集方法A、為什么要搜集數(shù)據(jù):數(shù)據(jù)是統(tǒng)計分析的基礎(chǔ)日什么是數(shù)據(jù)搜集:根據(jù)統(tǒng)計研究的目的和要求,有組織、有計劃地向調(diào)查對象搜集原始資料和次級資料。C數(shù)據(jù)來源數(shù)據(jù)來源直接來源間接來源實驗問卷調(diào)查觀察各類出版物(一)原始數(shù)據(jù)的搜集方法1、全面調(diào)查(1)定期統(tǒng)計報表制度:嚴格的報告制度指按照國家統(tǒng)一規(guī)定的各項要求,自下而上地定期向國家和主管部門報送基本統(tǒng)計資料的一種報告制度優(yōu)點:能保證統(tǒng)計資料的全面性和連續(xù)性能保證統(tǒng)計資料的統(tǒng)一性和及時性能滿足各級部門對統(tǒng)計資料的需要缺點:統(tǒng)計報表過多會增加基層負擔(dān)有可能由于虛報瞞報而影響統(tǒng)計資料質(zhì)量(2)普查:指國家為詳盡了解某項重

2、要的國情國力而專門組織的一次性全面調(diào)查由于需要大量的人力、物力和財力,不宜經(jīng)常進行最近的一次普查:2004年第一次全國經(jīng)濟普查我國人口普查:1953年1964年1982年1990年2000年2010年2、隨機抽樣調(diào)查:根據(jù)隨機原則推算總體特征,又稱概率抽樣抽樣調(diào)查是一種非全面調(diào)查,抽樣推斷的理論基礎(chǔ)是概率論。特點:(1)按隨機原則選樣,即樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機會(2)能夠保證樣本對總體的代表性,即樣本單位和總體具有相同的概率分布(3)調(diào)查目的是從數(shù)量上推算總體數(shù)量特征和數(shù)量表現(xiàn),它可以到全面調(diào)查的作用(4)抽樣誤差可以事先計算并控制優(yōu)點

3、:(1)能用較少的人力、物力和時間達到全面調(diào)查的目的(2)調(diào)查資料的準確性較高、受人為干擾的可能性較小方式:(1)簡單隨機抽樣,每個個體被抽中的機會相等;選擇一個受試對象對其他元素沒有影響;使用隨機數(shù)表,抽簽等方式??梢詰?yīng)用Excel中的隨機函數(shù)rand()根據(jù)樣本框安排隨機樣本*樣本框:抽樣過程中抽取樣本的所有抽樣單位的名單。如,從全體學(xué)生中,直接抽取200名學(xué)生作為樣本,那么,全體學(xué)生的名單(花名冊)就是這次抽樣的樣本框。例:在編號為1-100的學(xué)生中隨機抽取隨機編號=int(rand()*100)+1學(xué)會查看Excel的幫助文件( 2)等距抽樣,又稱機械抽樣或系統(tǒng)抽樣,常用于電話調(diào)查。例

4、如:從一個學(xué)生人數(shù)為200人的總體中抽取容量為20的樣本,將學(xué)生的學(xué)號排序,假定隨機選取學(xué)號起點4,然后從總體中選取樣點的學(xué)號為第4,第14,第24,( 3)類型抽樣,又稱分層抽樣,把總體某種分類標準分為若干群組,這些群組滿足互斥性、完備性、和相似性要求,然后在組中按照同樣的比例隨機選取樣本。特點:代表性高,抽樣誤差低。例如:調(diào)查對象按收入分為高、中、低三個層次,然后從每個階層中或隨機抽取( 4)整群抽樣,又稱聚類抽樣。先對總體分類,然后用簡單隨機抽樣選類,最后對選中的類作普查或簡單隨機抽樣調(diào)查。較為有效。例如:按照家庭、宿舍樓或街區(qū)來抽取調(diào)查對象,對抽到的家庭、宿舍樓或街區(qū)再作全面或隨機調(diào)查

5、。3、非概率抽樣:不按照概率均等的原則,而是根據(jù)人們的主觀經(jīng)驗或其它條件來抽取樣本。缺點:( 1)由于調(diào)查者的主觀決策影響抽樣的整個過程,因而不能保證樣本是否重現(xiàn)了總體的分布結(jié)構(gòu),樣本的代表性往往較小,用這樣的樣本推論總體是極不可靠的。( 2)誤差有時相當大,而且這種誤差又無法估計。優(yōu)點:( 1)很多情況下,嚴格的隨機抽樣幾乎無法進行,例如調(diào)查對象的總體邊界不清而無法制作或提供抽樣框。( 2)有些研究為了符合研究的目的,不得不按照需要從總體中抽取少數(shù)有代表性的個體作為樣本。( 3)隨機抽樣的操作過程要求嚴格,實施起來比較麻煩,費時費力,因此如果調(diào)查的目的僅是對問題的初步探索,獲得研究的線索和提

6、出假設(shè),而不是由樣本推論總體,采用隨機抽樣就不一定是必須的。綜上:操作方便、省錢省力,統(tǒng)計上也遠較概率抽樣簡單,而且若能對調(diào)查總體和調(diào)查對象有較好的了解,抽樣也可獲得相當?shù)某晒Α7绞剑海?1)典型調(diào)查在對調(diào)查對象有一定了解的基礎(chǔ)上,有意識地選擇個別或少數(shù)有代表性的單位進行調(diào)查的一種非全面調(diào)查典型單位指在數(shù)量表現(xiàn)上具有普遍意義和代表性的總體單位,可以用來推斷總體的數(shù)量( 2)重點調(diào)查一種非全面調(diào)查,它是在被調(diào)查總體中選出一部分重點單位進行調(diào)查。這些單位數(shù)目不多,但其標志值在總體標志總量中占有較大比重,能反映總體的基本情況能以較少的投入和較快的速度取得總體基本情況及變動趨勢的資料,但只適用于客觀存

7、在著重點單位的情況例如:對大型鋼鐵企業(yè)的調(diào)查可以了解全國鋼鐵的生產(chǎn)情況對35個大中型城市的物價調(diào)查可以了解全國的物價狀況( 3)就近抽樣(偶遇抽樣、方便抽樣、自然抽樣)定義:是指研究者根據(jù)現(xiàn)實情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對象,或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對象。舉例:為了調(diào)查某市的交通情況,研究者到離他們最近的公共汽車站,把當時正在那里等車其他類似的偶遇抽樣還有:在街口攔住過往行人進行調(diào)查;在圖書館閱覽室對當時正在閱讀的讀者進行調(diào)查;在商店門口、展覽大廳、電影院等公眾場所向進出往來的顧客、觀眾進行的調(diào)查;利用報刊雜志向讀者進行調(diào)查;老師以他所教的班級的學(xué)生

8、作為調(diào)查樣本的調(diào)查等等。( 4)目標式和判斷式抽樣(主觀抽樣、立意抽樣):定義:調(diào)查者根據(jù)研究的目標和自己主觀的分析,來選擇和確定調(diào)查對象的方法。研究者依據(jù)主觀判斷選取可以代表總體的個體作為樣本。樣本的代表性取決于研究者對總體的了解程度和判斷能力。例如:在編制物價指數(shù)時,有關(guān)產(chǎn)品項目的選擇和樣本地區(qū)的決定等,常采用判斷抽樣。( 5)滾雪球抽樣:定義:當我們無法了解總體情況時,可以從總體中的少數(shù)成員入手,對他們進行調(diào)查,向他們詢問還知道哪些符合條件的人;再去找那些人并詢問他們知道的人。如同滾雪球一樣,我們可以找到越來越多具有相同性質(zhì)的群體成員。例如,要研究退休老人的生活,可以清晨到公園去結(jié)識幾位

9、散步老人,再通過他們結(jié)識其朋友。但是這種方法偏誤也很大,那些不好活動、不愛去公園、不愛和別人交往、喜歡一個人在家里活動的老人,你就很難把雪球滾到他們那里去,而他們卻代表著另外一種退休后的生活方式。滾雪球抽樣是在特定總體的成員難以找的時最適合的一種抽樣方法。譬如對獲得無家可歸者、流動勞工及非法移民等的樣本就十分適用。( 6)配額抽樣(定額抽樣):它與分層抽樣中的比例抽樣相似,也是按調(diào)查對象的某種屬性或特征將總體中所有個體分成若干類或?qū)?,然后在各層中抽樣,樣本中各層(類)所占比例與他們在總體中所占比例一樣。進行定額抽樣時,研究者要盡可能的依據(jù)那些有可能影響研究變量的各種因素來對總體分層,并找出具有

10、各種不同特征的成員在總體中所占的比例。然后依據(jù)這種劃分以及各類成員的比例去選擇調(diào)查對象,使樣本中的成員在上述各種因素、各種特征方面的構(gòu)成和在樣本的比例盡量接近總體情形。例:假設(shè)某高校有2000名學(xué)生,其中男生占60,女生占40;文科學(xué)生和理科學(xué)生各占50;一年級學(xué)生占40,二年級、三年級、四年級學(xué)生分別占30、20和10?,F(xiàn)要用定額抽樣方法依上述三個變量抽取一個規(guī)模為100人的樣本。依據(jù)總體的構(gòu)成和樣本規(guī)模,我們可得到下列定額表:男生(60)女生(40)文科(30)理科(30)文科(20)理科(20)年級一二三四一二三四一二三四一二三四人數(shù)129631296386428642配額抽樣和分層抽樣

11、的區(qū)別:A分層抽樣總體進行分層時,通常依據(jù)的一種特征或指標,分層的目的是為了照顧到某些比例小的層次,使得所抽樣本的代表性進一步提高,誤差進一步減?。欢漕~抽樣則是依據(jù)多個特征,分層的目的是為了模擬出一個總體B分層抽樣在每層進行抽樣時,按照一定的比例進行隨機抽樣;而配額抽樣則是根據(jù)每一層中分配的數(shù)額進行抽樣C分層抽樣完全根據(jù)概率原則,排除主觀因素,客觀地、等概率地到各層中進行抽樣;而配額抽樣則是“按事先規(guī)定地條件,有目的地尋找”樣本單位,在分層和抽樣的過程中有很多的人為因素影響(二)次級資料搜集統(tǒng)計資料匯編刊物:各種統(tǒng)計年鑒、調(diào)查報告、統(tǒng)計摘要、網(wǎng)上電子資源有用的統(tǒng)計信息網(wǎng)站:中華人民共和國國家

12、統(tǒng)計局:中國統(tǒng)計數(shù)據(jù)經(jīng)濟中國中國商業(yè)報告庫和百度也是常用的數(shù)據(jù)來源特別提示:要學(xué)會使用學(xué)校圖書館的免費數(shù)據(jù)庫財政學(xué)系09級碩士生曾穎同學(xué)常用的數(shù)據(jù)庫(詳細內(nèi)容見網(wǎng)絡(luò)平臺中的課件“曾穎的數(shù)據(jù)庫”)1、國研網(wǎng)數(shù)據(jù)庫特點:統(tǒng)計數(shù)據(jù)庫包含宏觀數(shù)據(jù)、金融、教育、行業(yè)數(shù)據(jù)等,但是宏觀數(shù)據(jù)年度跨度不大。適合對個別指標進行跨省、跨時間的統(tǒng)一檢索。另外有全文數(shù)據(jù)庫等,包含一些專家學(xué)者的文章,可以作為參考。2、中經(jīng)網(wǎng)&height=708特點:以宏觀數(shù)據(jù)為主,包含國家一級、31個省以及200多個市的數(shù)據(jù),與國研網(wǎng)的統(tǒng)計數(shù)據(jù)庫類似,統(tǒng)計項目沒有國研網(wǎng)多,但是有些指標年份跨度更大。適合統(tǒng)一檢索。3、資訊行特點

13、:非常全的數(shù)據(jù)庫,幾乎囊括了所有最新的年鑒。適合尋找數(shù)據(jù)的來源。缺點在于:沒有1995年之前的年鑒,數(shù)據(jù)不是表格形式,需要自己修改。(可行的方法包括:粘貼到word中,把空白(Aw)替換為制表符(N),或者直接粘貼到excel2007,進行數(shù)據(jù)分列)。4、統(tǒng)計局數(shù)據(jù)庫特點:最近幾年剛出的,還在完善中。可以對統(tǒng)計局出版的年鑒數(shù)據(jù)進行統(tǒng)一檢索。(和1、2很相似)有時候能找到1、2所沒有的數(shù)據(jù)。5、年鑒包括歷年統(tǒng)計年鑒以及普查數(shù)據(jù)、專題數(shù)據(jù)等,適合瀏覽年鑒。實際上,目前很多最新年鑒,包括新中國六十年統(tǒng)計資料匯編、2010年統(tǒng)計摘要等都可以在網(wǎng)上下載到excel版本。6、知網(wǎng)文獻非常全的學(xué)術(shù)文獻數(shù)據(jù)庫

14、,包括了期刊、學(xué)位論文、學(xué)術(shù)會議論文等。這個加上維普的話,基本上可以把中國比較好的期刊論文都包括了。年鑒中國統(tǒng)計年鑒數(shù)據(jù)庫(挖掘版)&p=提供對統(tǒng)計年鑒的統(tǒng)一檢索,但是效果不理想,比較凌亂。列出了500部左右的年鑒,比較全,但是不一定有最新的??梢韵仍谫Y訊行搜索數(shù)據(jù)指標所屬的年鑒,再在這里找到年鑒。三、調(diào)查誤差1、登記誤差:調(diào)查過程中,工作的不準確所造成的誤差。(1)偶然性登記誤差:調(diào)查人員責(zé)任心不強、技術(shù)不高所造成的觀察、測量、計算錯誤、筆誤、錯填、遺漏,以及被調(diào)查者回答有誤、理解有誤。特點:一般不具有傾向性,即在數(shù)量不會偏向某一方,理論上它可以用某種方法加以消除(2)系統(tǒng)誤差:具有

15、明顯的傾向性,在數(shù)量上往往偏向某一方,又稱偏差。A、 有意誤差:故意虛報、瞞報、假報、編造、有意歪曲事實。B、 非主觀原因所引起的誤差。測量工具的不準、調(diào)查方式安排不當。例如:使用非概率抽樣方法進行的調(diào)查可能由于訪問時的樣本偏倚而出現(xiàn)誤差案例1:1936年,富蘭克林羅斯福(FranklinRoosevelt)的第一任總統(tǒng)任期屆滿,共和黨候選人、堪薩斯州州長阿爾弗雷德蘭登(AlfredLandon)與其競選總統(tǒng)。為了預(yù)測大選結(jié)果,文摘雜志(LiteraryDigest)發(fā)出了1000萬張模擬選票,收回萬張。據(jù)此,文摘雜志預(yù)測蘭登將以57%對43%的壓倒性優(yōu)勢獲勝,但選舉的結(jié)果卻是羅斯福以62%對

16、38%的優(yōu)勢擊敗蘭登。LiteracyDigest雜志的民意調(diào)查盡管樣本容量很大(240萬),但是樣本選擇的偏倚仍導(dǎo)致預(yù)測失敗,該雜志的可信度大大降低,最終走向了破產(chǎn)。與此同時,喬治蓋洛普在1936年的大選預(yù)測中首先使用運用定額抽樣方法(即按照總體單位的多個特征將總體分層,安排每個層次的樣本數(shù)額),利用一個約5萬人的樣本,準確預(yù)測出羅斯福將獲勝。LiteracyDigest的問題出在哪呢文摘雜志的調(diào)查對象大多數(shù)是從電話簿和俱樂部的花名冊上選擇。這樣的抽樣方法從兩方面影響了樣本的代表性。其一,當時只有1/4的家庭擁有電話,而且擁有電話的絕大多數(shù)都是富人。其二,如果是在1936年以前,這種偏好對預(yù)

17、測的影響可能不大,因為富人和窮人依據(jù)相同的路線投票。而在大蕭條年代,政治上的劃分更緊密地遵循經(jīng)濟路線,絕大多數(shù)窮人投民主黨的票,而比較富有的人則傾向于共和黨。案例2:1948年美國大選時,蓋洛普聯(lián)合全美約100家獨立報紙,繼續(xù)采用定額抽樣的方法對5萬人次進行尋訪,預(yù)測杜威(Dewe”將戰(zhàn)勝杜魯門,而結(jié)果是杜魯門以%勺選票獲勝,杜威的得票率為%。芝加哥論壇報甚至未等大選最后的結(jié)果揭曉,就在頭版以大標題宣布杜威戰(zhàn)勝杜魯門,結(jié)果成為民意研究歷史上的一大笑話。而在那年大選中,密歇根的調(diào)查研究中心所采用的概率抽樣宣告勝利。蓋洛普的問題出在哪呢定額抽樣似乎保證了樣本和選舉總體在被認為對選舉行為有影響的所有

18、主要特征方面將會相似,但是選民的哪些特征會影響他們選擇,這恰恰是調(diào)查機構(gòu)所不知道而正努力嘗試去發(fā)現(xiàn)的。并且在規(guī)定的定額內(nèi),訪問人員可以自由選擇他喜歡的任何人,這給人為選擇留有過多的余地。2、代表性誤差:非全面調(diào)查所固有的產(chǎn)生原因:抽取樣本時沒有遵循隨機原則;個別或部分單位不能完全反映總體的性質(zhì);樣本容量不足;由部分單位數(shù)值來推斷總體數(shù)值所產(chǎn)生的誤差,它不可以消除,但通??梢允孪扔嬎?,并能將它控制在一定的范圍內(nèi)。§統(tǒng)計調(diào)查方案與實踐北京大學(xué)校園主流文化調(diào)查問卷問卷編號:調(diào)查時間:2010年月日調(diào)查地點:調(diào)查人:學(xué)號數(shù)據(jù)審核人:學(xué)號親愛的同學(xué):您好!我們是經(jīng)濟學(xué)院本科生,為了解北京大學(xué)現(xiàn)

19、在的主流校園文化,并為我們的統(tǒng)計學(xué)案例教學(xué)搜集數(shù)據(jù),我們在北大校園內(nèi)展開此次調(diào)查。此問卷采取匿名填寫方式,決不用于任何商業(yè)目的。謝謝您的支持!【填寫說明】請在每一問題后所給的備選答案中選擇符合你的情況或你同意的答案,并在所選答案前的方框內(nèi)打,或在問題中一處填寫適當?shù)膬?nèi)容。1 .您現(xiàn)在所在年級是(1)大二(2)大三(3)大四2 .您的性別是(1)男女3 .您來自院系。4 .您的家庭來自(1)大城市(2)中小城市(3)農(nóng)村5 .您家里的經(jīng)濟情況怎么樣(1) 還不錯(2)一般吧(3)比較差6 .您父母的受教育程度:父親母親(1)大學(xué)(2)高中(3)初中(4)小學(xué)7 .您認為北大最可貴的地方是:(1)學(xué)術(shù)實力強,學(xué)術(shù)氛圍好(2)兼容并包、思想自由(3)名氣大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論