統(tǒng)計(jì)調(diào)查與數(shù)據(jù)分析講座_第1頁
統(tǒng)計(jì)調(diào)查與數(shù)據(jù)分析講座_第2頁
統(tǒng)計(jì)調(diào)查與數(shù)據(jù)分析講座_第3頁
統(tǒng)計(jì)調(diào)查與數(shù)據(jù)分析講座_第4頁
統(tǒng)計(jì)調(diào)查與數(shù)據(jù)分析講座_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)調(diào)查與數(shù)據(jù)分析講座課程要點(diǎn)一、數(shù)據(jù)的收集二、數(shù)據(jù)的整理三、數(shù)據(jù)的統(tǒng)計(jì)特性分析一、數(shù)據(jù)的收集兩種數(shù)據(jù)來源:原始數(shù)據(jù)次級數(shù)據(jù)兩種數(shù)據(jù)形式橫截面數(shù)據(jù)(點(diǎn))時間數(shù)列數(shù)據(jù)(面)數(shù)據(jù)的來源與分類數(shù)據(jù)收集(調(diào)查)策劃調(diào)查目的調(diào)查對象-調(diào)查內(nèi)容-調(diào)查方法調(diào)查結(jié)果滿足調(diào)查目的調(diào)查對象一、全面調(diào)查不重復(fù)、不遺漏二、非全面調(diào)查代表性、選擇偏性例—1936年羅斯福與蘭登的總統(tǒng)競選:《文學(xué)摘要》:羅斯福(43%)蘭登(57%)1千萬蓋洛普:羅斯福(56%)5萬人實(shí)際結(jié)果:羅斯福(62%)蘭登(38%)調(diào)查方法方法對象特點(diǎn)適用條件普查全部單位一次性、周期性、數(shù)據(jù)準(zhǔn)確、全面、使用面窄掌握總體情況有限總體抽樣調(diào)查樣本單位經(jīng)濟(jì)、實(shí)用、準(zhǔn)確、適應(yīng)面廣掌握總體情況、有限總體與無限總體重點(diǎn)調(diào)查重點(diǎn)單位非隨機(jī)性掌握趨勢存在重點(diǎn)單位典型調(diào)查典型單位非隨機(jī)性用于定性分析統(tǒng)計(jì)報(bào)表全部單位與非全部單位統(tǒng)一性、準(zhǔn)確性調(diào)查內(nèi)容(一)問卷結(jié)構(gòu):說明詞、填寫要求、問卷正文及結(jié)尾說明詞:主辦單位及調(diào)查員身份、調(diào)查的目的和意義、承諾及感謝問卷正文:需要調(diào)查的問題及答案、被調(diào)查者的背景資料結(jié)尾:說明問卷設(shè)計(jì)清楚定義內(nèi)容:5w“您使用什么品牌的化妝品”用詞通俗、詞義明確“您經(jīng)常收看電視節(jié)目嗎?”“1、從來不看;2、偶爾看;3、有時看;4、經(jīng)???;5、天天看”避免隱含的選擇(乘車、牛仔褲)避免否定形式的提問避免誘導(dǎo)性或傾向性的詞匯、避免重疊、答案詳盡(二)問卷的措辭(三)問題的順序1、先易后難2、封閉型問題置前,敏感性、開放性問題置后3、注意對后繼問題的影響:1)您在選擇購物時,哪些因素是重要的?2)您在選擇購物時,售后服務(wù)這個因素的重要性如何?4、邏輯思路保持一致二、數(shù)據(jù)的整理審核分組(品質(zhì)數(shù)據(jù)、數(shù)量數(shù)據(jù))計(jì)算頻數(shù)與頻率觀察數(shù)據(jù)的表現(xiàn)審核數(shù)據(jù)資料的可用性方法錯誤如:時間,空間,口徑等邏輯錯誤如:產(chǎn)值與銷售值,年齡與工作年限主觀錯誤敏感性、政治性等如:失業(yè)率與平均每周申請失業(yè)保險人數(shù)

IBM

IBM

帕科特?貝爾

康柏

IBM帕科特?貝爾

蘋果

蘋果

蓋威特-2000

帕科特?貝爾康柏

康柏

蘋果

…………………數(shù)據(jù)的分組與頻率的計(jì)算(一)品質(zhì)數(shù)據(jù)的分組與計(jì)算頻數(shù):每組數(shù)據(jù)值出現(xiàn)的次數(shù)

例:下表為購買50臺計(jì)算機(jī)的樣本數(shù)據(jù)

下表為購買計(jì)算機(jī)數(shù)據(jù)的頻數(shù)分布表按公司分組頻數(shù)蘋果機(jī)13康柏機(jī)12蓋威特-20005IBM9帕科特?貝爾11合計(jì)50數(shù)量數(shù)據(jù)頻數(shù)分布的分組需要3個步驟:1.確定組數(shù);2.確定組距;3.確定組限。1214191815151817202722232221332814181613(二)數(shù)量數(shù)據(jù)的整理案例:下表為年終審計(jì)耗用的時間(單位:天)=

1.確定分組數(shù)目:本例組數(shù)=

=5.3確定分5個組。2.確定組距:本例組距=

取整數(shù)5天按審計(jì)時間分組(天)頻

數(shù)10-14415-19820-24525-29230-341合

計(jì)203.計(jì)算頻數(shù)與頻率5.計(jì)算審計(jì)時間數(shù)據(jù)的相對頻數(shù)和百分比頻數(shù)分布:按審計(jì)時間分組(天)相對頻數(shù)百分比頻數(shù)10-140.202015-190.404020-240.252525-290.101030-340.055合

計(jì)1.00100按審計(jì)時間分組(天)頻數(shù)向上累計(jì)頻數(shù)分布向下累計(jì)頻數(shù)分布10-14442015-198121620-24517825-29219330-341201合

計(jì)20——

6.計(jì)算審計(jì)時間數(shù)據(jù)的累積頻數(shù)分布在數(shù)量數(shù)據(jù)整理中要注意的問題1、在一些應(yīng)用中,我們需要知道各分組的中點(diǎn),也就是組中值。2、開口組(即只有上限或只有下限的組),其組中值用鄰組的組距計(jì)算。3、在數(shù)據(jù)較少的情況下,可用品質(zhì)數(shù)據(jù)整理的方式,采取單變量值分組。4、連續(xù)變量與離散變量的組限問題上組限不在內(nèi)5、等距與不等距分組觀察數(shù)據(jù)的表現(xiàn)觀察數(shù)據(jù)的表現(xiàn)(特征)一般通過圖表來分析:統(tǒng)計(jì)圖統(tǒng)計(jì)表統(tǒng)計(jì)指標(biāo)(一)統(tǒng)計(jì)圖1、直方圖:是用圖形說明數(shù)量數(shù)據(jù)的一種常用方法。

下圖為審計(jì)時間數(shù)據(jù)直方圖2、條形圖:是用圖的方式描述已概括成頻數(shù)、相對頻數(shù)或百分比頻數(shù)分布的數(shù)據(jù)的特征3、餅圖:是用圓的各部分面積來呈現(xiàn)品質(zhì)數(shù)據(jù)的常用方法。本例中所有各組計(jì)算機(jī)購買的百分比頻數(shù)總和為100,一個圓有360°,則餅圖中蘋果機(jī)的部分為26%X360°=93.6°其他組的部分以此類推算出:4.統(tǒng)計(jì)折線圖與曲線圖洛倫茨曲線生命曲線投機(jī)需求曲線質(zhì)量曲線5、象形圖按收入大小順序排列的家庭數(shù)占總收入的%累計(jì)家庭數(shù)%累計(jì)收入的%最低的20%4.7204.7第二個20%114015.7第三個20%176032.4第四個20%24.48056.8最高的20%43.2100100洛倫茨曲線累計(jì)收入的%累計(jì)家庭的%197519851995100101(二)統(tǒng)計(jì)表年份國內(nèi)生產(chǎn)總值最終消費(fèi)最終消費(fèi)率年末人口)1989112704199018319.511365.261.3114333199121280.413145.960.8115838199225863.615952.159.91171711993199419951996

合計(jì)34500.647110.959404.968498.2

274978.120182.158.327216.258.234529.459.040171.758.6

162562.6118517119850121121122389

—三、數(shù)據(jù)的統(tǒng)計(jì)特性分析絕對數(shù)與相對數(shù)集中趨勢:眾數(shù)、中位數(shù)、平均數(shù)離散趨勢:全距方差、標(biāo)準(zhǔn)差方差系數(shù)、標(biāo)準(zhǔn)差系數(shù)一.絕對數(shù)與相對數(shù)(一)絕對數(shù)反映社會現(xiàn)象整體規(guī)模和水平時期數(shù)時點(diǎn)數(shù)(二)相對數(shù)結(jié)構(gòu)、比較、計(jì)劃等(三)絕對數(shù)與相對數(shù)的應(yīng)用1、指標(biāo)內(nèi)涵和可比性:GNP、工業(yè)增加值2、指標(biāo)的結(jié)合運(yùn)用舉例:在美國,1985年有19893人遭謀殺,與1970年16848人遭到謀殺相比,增加了20%。這些數(shù)字揭示了在1970-1985年期間美國變成一個更多暴力的社會中國的國民生產(chǎn)總值增長了8%,美國的為1%二.數(shù)據(jù)集中趨勢的分析(一)眾數(shù)Mode

眾數(shù)是總體數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。

例一:有10名大學(xué)生的年齡:18,18,19,19,19,19,19,20,20,21,在這里19歲的人數(shù)最多,所以19歲是眾數(shù)。

例二:有10名職工的年齡:20,21,22,23,24,25,26,27,28,29,由于各年齡的人數(shù)相同,沒有明顯集中趨勢點(diǎn)的數(shù)值,所以這里沒有眾數(shù)。注意:1、是位置平均數(shù),不受極端值的影響2、假定各單位在組內(nèi)是均勻分布的3、信息量小,缺乏敏感性,不適合代數(shù)運(yùn)算4、用于非對稱的次數(shù)數(shù)列、特別是品質(zhì)標(biāo)志數(shù)列5、用于數(shù)列中有較多的數(shù)值向某一數(shù)值集中6、有時會存在多個眾數(shù)(二)中位數(shù)Medium中位數(shù)就是把計(jì)算對象的數(shù)據(jù)按大小順序排列后,處于中間位置上的變量值。1、是位置平均數(shù),不受極端值的影響2、假定各單位在組內(nèi)是均勻分布的3、信息量小,缺乏敏感性,不適合代數(shù)運(yùn)算4、用于非對稱的次數(shù)數(shù)列如:個人收入、年齡注意:(三)均值

Mean1.定義:均值就是分布中全部數(shù)據(jù)的算術(shù)平均值。

2.確定

1、對未經(jīng)整理的原始數(shù)據(jù),

表示均值

2、對分組數(shù)據(jù)(加權(quán))的均值某公司推銷員工作量如下:推銷量(件)組中值X推銷員人數(shù)(人)FXF20-3030-4040-5050-6060-7025354555652810415028045022065合

計(jì)——251065舉例對平均數(shù)的理解:(1)某房間有10人平均身高1.6米,第11人走進(jìn),其身高1.9米,求11人的平均身高;若房間里20個人身高平均1.6米則第21人走進(jìn),21人的身高又會如何(2)一教師出3個問題,每題1分班級中30%得3分,50%得2分,10%得1分,10%得0分;全班有10個人;全班有20人?(3)經(jīng)濟(jì)衰退時,工人的平均工資高,平均失業(yè)期短;經(jīng)濟(jì)繁榮時,平均工資低,平均失業(yè)期長;

這會是真實(shí)嗎?注意:1.平均數(shù)的大小受變量值和權(quán)重兩個因素的影響2.平均數(shù)收極端值的影響3.權(quán)重的選擇要注意其經(jīng)濟(jì)意義4.正確理解各平均數(shù)指標(biāo)測度值優(yōu)

點(diǎn)缺

點(diǎn)眾數(shù)1、當(dāng)數(shù)據(jù)有明顯的集中趨勢又是偏態(tài)分布時其代表性較好;2、不受極端數(shù)值的影響;1、具有不唯一性,有的分布有不只一個眾數(shù),有的分布沒有眾數(shù);2、具有假定性,當(dāng)假定不成立時其代表性會很差。中位數(shù)1、不受極端數(shù)值的影響;2、可描述集中趨勢不明顯;3、數(shù)據(jù)分布中心值;1、具有假定性,當(dāng)假定性不成立時其代表性會很差;2、當(dāng)分組數(shù)較少而分布又較集中時,中位數(shù)不一定準(zhǔn)確。均值1、數(shù)據(jù)信息提取最充分,具有優(yōu)良的數(shù)學(xué)性質(zhì);2、既是數(shù)據(jù)分布的中心,又是數(shù)據(jù)的重心,應(yīng)用廣泛,是其他統(tǒng)計(jì)方法的基礎(chǔ);1、對組距分組數(shù)據(jù)計(jì)算均值具有一定的假定性;2、受極端數(shù)值的影響;眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用場合三.數(shù)據(jù)分布離散程度的分析

離散程度是評價數(shù)據(jù)一般水平代表性大小的依據(jù),并可以反映數(shù)據(jù)分布的均衡程度。(一)全距(Range)與四分位距:全距也稱極差,是用分布數(shù)據(jù)中的最大值減去最小值的差,表示為四分位距:將所有數(shù)據(jù)分為4份,每部分之間的分界點(diǎn)為四分位數(shù)據(jù)

1、簡單標(biāo)準(zhǔn)差:(二)標(biāo)準(zhǔn)差與方差舉例:某百貨公司有6家分店,經(jīng)理要求掌握這6家分店的年凈收入差異水平,其標(biāo)準(zhǔn)差計(jì)算如下:平均年凈收入

年凈收入(萬元)離差(

)離差平方(

)490-684624538-204005602457012144590321024600421764合

計(jì)07960(三)對標(biāo)準(zhǔn)差的理解:1、相同的數(shù)列,用原始數(shù)據(jù)計(jì)算和用分組數(shù)據(jù)計(jì)算,標(biāo)準(zhǔn)差有何不同?2、10個數(shù)的數(shù)列,若只包括1、9且標(biāo)準(zhǔn)差最大,這10個數(shù)是什么?

1、是非變量的標(biāo)準(zhǔn)差在統(tǒng)計(jì)研究中,經(jīng)常遇到這樣一種情況,即統(tǒng)計(jì)對象總體只有兩種表現(xiàn)的可能,這類總體的現(xiàn)象表現(xiàn)就是是非變量。一般我們將其中一種表現(xiàn)的變量值表示為1,另一種表現(xiàn)的變量值表示為零,如果我們用P表示變量值1在總體中出現(xiàn)的頻率,用Q表示變量值零在總體中出現(xiàn)的頻率,則有:

,

,

(四)其他形式的標(biāo)準(zhǔn)差是非變量的均值:

是非變量的方差:2.總體方差與組方差舉例:某廠某班組12名工人日產(chǎn)量件數(shù)如下:9,11,14,15,16,19,20,21,21,22,23,28,對上述12名工人求日產(chǎn)量的均值及總方差得:

如果對上述12名工人按工人的技術(shù)等級分為兩組:第一組工人的日產(chǎn)量分別為9,11,14,15,16這5個變量值,則其組內(nèi)均值:

組方差:

第一組的方差:

第二組的方差:同理,第二組2人日產(chǎn)量分組有19,20,21,21,22,23,28七個變量值,則其組內(nèi)均值和組內(nèi)方差為:

工人分組工人日產(chǎn)量(件)工人數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論