




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章統(tǒng)計(jì)數(shù)據(jù)的描述一、數(shù)據(jù)的預(yù)處理通過各種渠道將統(tǒng)計(jì)數(shù)據(jù)搜集上來之后,首先應(yīng)對這些數(shù)據(jù)進(jìn)行加工整理,使之系統(tǒng)化、條理化,以符合分析的需要。數(shù)據(jù)整理通常包括數(shù)據(jù)的預(yù)處理、分類或分組、匯總等幾個(gè)方面的內(nèi)容,它是統(tǒng)計(jì)分析之前的必要步驟。數(shù)據(jù)的預(yù)處理是數(shù)據(jù)分組整理的先前步驟,內(nèi)容包括數(shù)據(jù)的審核與篩選、排序等。(一)數(shù)據(jù)的審核與篩選在對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行整理時(shí),首先需要進(jìn)行審核,以保證數(shù)據(jù)的質(zhì)量,為進(jìn)一步整理與分析打下基礎(chǔ)。從不同渠道取得的統(tǒng)計(jì)數(shù)據(jù),在審核的內(nèi)容與方法上都有所不同。對于通過直接調(diào)查取得的原始數(shù)據(jù)應(yīng)主要從完整性和準(zhǔn)確性兩個(gè)方面去審核。完整性審核主要是檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏,所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全等。準(zhǔn)確性審核主要包括兩個(gè)方面,一是檢查數(shù)據(jù)資料是否真實(shí)地反映了客觀實(shí)際情況,內(nèi)容是否符合實(shí)際;二是檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等。審核數(shù)據(jù)準(zhǔn)確性的方法主要有邏輯檢查數(shù)據(jù)的審核和計(jì)算檢查。對于通過其他渠道取得的第二手?jǐn)?shù)據(jù),除了對其完整性和準(zhǔn)確性進(jìn)行審核外,還應(yīng)著重審核數(shù)據(jù)的適用性和時(shí)效性。第二手?jǐn)?shù)據(jù)可以來自多種渠道,有些數(shù)據(jù)可能是為特定目的通過專門調(diào)查取得的,或者是已經(jīng)按照特定目的的需要做了加工整理,對于使用者來說,首先應(yīng)弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景資料,以便確定這些數(shù)據(jù)是否符合自己分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。此外還要對數(shù)據(jù)的時(shí)效性進(jìn)行審核,對于有些時(shí)效性較強(qiáng)的問題,如果所取得的數(shù)據(jù)過于滯后,可能失去了研究的意義,一般來說,我們應(yīng)盡可能使用最新的統(tǒng)計(jì)數(shù)據(jù)。數(shù)據(jù)在經(jīng)過審核后,確認(rèn)適合于實(shí)際需要,才有必要做進(jìn)一步的加工整理。數(shù)據(jù)篩選對審核過程中發(fā)現(xiàn)的錯(cuò)誤,應(yīng)盡可能予以糾正,在調(diào)查結(jié)束后,當(dāng)對數(shù)據(jù)中發(fā)現(xiàn)的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時(shí),就需要對數(shù)據(jù)進(jìn)行篩選。數(shù)據(jù)篩選包括兩方面內(nèi)容:一是將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔出;二是將符合特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔出。數(shù)據(jù)的篩選對通過市場調(diào)查取得的數(shù)據(jù)十分必要。(二)數(shù)據(jù)的排序數(shù)據(jù)排序是按一定順序?qū)?shù)據(jù)排列,以便于研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征趨勢或解決問題的線索,除此之外,排序還有助于對數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類分組等提供依據(jù)。在某些場合,排序本身就是分析的目的之一。排序可借助于計(jì)算機(jī)很容易地完成。對于數(shù)字型數(shù)據(jù)排序只有兩種:遞增和遞減。市場調(diào)查中的數(shù)據(jù)許多是屬于定性的,對于字母型數(shù)據(jù)排序也有升序降序之分,但習(xí)慣上升序用得多些,因升序與字母的自然順序相同。漢字型數(shù)據(jù)的排序方式最多,按拼音方式排列與字母型數(shù)據(jù)排序完全一樣,而按筆畫則有筆多少的升序降序之分。交替運(yùn)用不同方式排序在漢字型數(shù)據(jù)的檢錯(cuò)糾錯(cuò)過程中十分有用,應(yīng)予重視。統(tǒng)計(jì)分組是數(shù)據(jù)整理中的一項(xiàng)重要工作,它是根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某種特征或標(biāo)準(zhǔn)分成不同的組別。分組時(shí)所依據(jù)的特征或標(biāo)準(zhǔn)稱為統(tǒng)計(jì)分組標(biāo)志,它有品質(zhì)標(biāo)志和數(shù)量標(biāo)志兩種。品質(zhì)標(biāo)志是說明事物的性質(zhì)和屬性特征的,它不能用數(shù)值來表現(xiàn)。數(shù)量標(biāo)志是說明事物數(shù)量特征的,它可以具體表現(xiàn)為數(shù)值。將統(tǒng)計(jì)數(shù)據(jù)按分組標(biāo)志進(jìn)行分組的過程,就是次數(shù)分配形成的過程。次數(shù)分配就是觀測值按其分組標(biāo)志分配在各組內(nèi)的次數(shù)。2.1.3次數(shù)分配按某種標(biāo)志對數(shù)據(jù)進(jìn)行分組后,再計(jì)算出所有類別或數(shù)據(jù)在各組中出現(xiàn)的次數(shù)或頻數(shù),就形成了一張頻數(shù)分布表。我們把全部數(shù)據(jù)按其分組標(biāo)志在各組內(nèi)的分布狀況稱為頻數(shù)分布或次數(shù)分布,分布在各組內(nèi)的數(shù)據(jù)個(gè)數(shù)稱為頻數(shù)或次數(shù),各組頻數(shù)與全部頻數(shù)之和的比值稱為頻率或比重。對數(shù)據(jù)進(jìn)行分組的過程也就是頻數(shù)分布的形成過程。按品質(zhì)標(biāo)志分組的同時(shí)計(jì)算出各組的頻數(shù)或頻率,就形成我們所需要的頻數(shù)分布表。
1998年我國大陸人口按性別分組表按性別分組人數(shù)(萬人)比重(%)男6362950.98女6118149.02合計(jì)124810100按數(shù)量標(biāo)志分組時(shí),可先將數(shù)據(jù)進(jìn)行排序,然后再根據(jù)需要進(jìn)行分組。按數(shù)量標(biāo)志分組的方法很多,主要有兩種:一是單變量值分組,二是組距分組。單變量值分組單變量值分組是把每一個(gè)變量值作為一組,這種分組方法通常只適合于離散變量,且變量值較少的情況下使用。在數(shù)據(jù)較多的情況下,單變量值分組由于組數(shù)較多而不便于觀察數(shù)據(jù)分布的特征和規(guī)律,而且對于連續(xù)變量或變量值較多的情況,可采用組距分組。缺下限的組中值=本組上限-鄰組組距/2缺上限的組中值=本組下限+鄰組組距/2次數(shù)分配表按零件加工數(shù)分組人數(shù)80-90390-1007100-11013110-1205120-1302合計(jì)30根據(jù)單變量數(shù)列眾數(shù)的確定
某班學(xué)生按年齡分組按年齡分組(歲)人數(shù)(人)176181419眾數(shù)18頻數(shù)最大209213合計(jì)50按零件加工數(shù)分組人數(shù)80-90390-1007100-11013110-1205120-1302合計(jì)30根據(jù)組距數(shù)列確定眾數(shù)根據(jù)組距數(shù)列確定眾數(shù)下限公式:上限公式:組距分組眾數(shù)的計(jì)算分組數(shù)據(jù)中位數(shù)的計(jì)算單值分組:先根據(jù)公式N/2確定中位數(shù)的位置,再根據(jù)累計(jì)頻數(shù)確定其所在組,對應(yīng)的變量值即為中位數(shù)。組距分組:先根據(jù)公式N/2確定中位數(shù)的位置,再根據(jù)累計(jì)頻數(shù)確定其所在組,然后采用下面公式:N為數(shù)據(jù)個(gè)數(shù),L為中位數(shù)所在組的下限,Sm-1為中位數(shù)所在組以前各組的累積頻數(shù),Sm+1為中位數(shù)所在組以后各組的累積頻數(shù),fm為中位數(shù)所在組的頻數(shù),i為中位數(shù)所在組的組距。某車間工人周加工零件數(shù)計(jì)算表按加工數(shù)量分組組中值權(quán)數(shù)累積頻數(shù)向上累積向下累積80~9085333090~1009571027100~110105132320110~1201155287120~1301252302合計(jì)—30——根據(jù)累積頻數(shù)可確定中位數(shù)在第三組均值加權(quán)均值的變形加權(quán)幾何均值:<<<<調(diào)和均值:各變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù).簡單調(diào)和均值:加權(quán)調(diào)和均值:2.4分布偏態(tài)與峰度的測度偏態(tài)及其測度
偏態(tài)是對分布偏斜方向及程度的測度。常用偏態(tài)系數(shù)。
當(dāng)a3=0時(shí),為對稱分布;a3>0時(shí),為正偏或右偏分布;a3<0時(shí),為負(fù)偏或左偏分布。峰度及其測度峰度是分布集中趨勢高峰的形狀。峰度系數(shù):
正態(tài)分布的峰度系數(shù)為3,當(dāng)a4>3時(shí)為尖峰分布,a4<3時(shí)為扁平分布。統(tǒng)計(jì)表是用于顯示統(tǒng)計(jì)數(shù)據(jù)的基本工具一般有四個(gè)主要的組成部分:表頭、行標(biāo)題、列標(biāo)題和數(shù)字資料表頭一般應(yīng)包括表號、總標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)容,標(biāo)題內(nèi)容應(yīng)滿足3W(時(shí)間When,地點(diǎn)Where以及何種數(shù)據(jù)What)表中的上下兩條橫線一般用粗線,中間的其他線用細(xì)線,統(tǒng)計(jì)表的左右兩邊不封口,列標(biāo)題之間一般用豎線分開,而行標(biāo)題之間通常不必用橫線隔開,表中數(shù)據(jù)一般是右對齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對齊,且小數(shù)點(diǎn)位數(shù)應(yīng)統(tǒng)一,對于沒有數(shù)據(jù)的單元格,一般用“—”表示。使用統(tǒng)計(jì)表時(shí),必要時(shí)可在表的下方加上必要的注釋,特別要注意注明資料來源。年份城鎮(zhèn)居民農(nóng)村居民
19911700.6708.619922026.6784.019932577.4921.619943496.21221.019954283.01577.719964838.91926.119975160.32091.11991-1997年我國城鄉(xiāng)居民家庭人均收入
單位:元↑行標(biāo)題表頭↓←列標(biāo)題數(shù)字資料↓統(tǒng)計(jì)圖是統(tǒng)計(jì)數(shù)據(jù)直觀的表現(xiàn)形式??蓪?fù)雜的數(shù)據(jù)用生動(dòng)的圖形表現(xiàn)出來,因而,匯制并使用好統(tǒng)計(jì)圖就成為統(tǒng)計(jì)分析的基本功。在Excel的“插入”功能中有個(gè)“圖表”功能鍵,可以利用已有數(shù)據(jù)畫出折線圖、條形圖、圓形圖、環(huán)形圖、雷達(dá)圖等。具有生動(dòng)、形象、簡單易懂的特點(diǎn)。折線圖條形圖我國國內(nèi)生產(chǎn)總值(萬元)年份20062005第一產(chǎn)業(yè)24710.0322607.80第二產(chǎn)業(yè)101981.2186237.83第三產(chǎn)業(yè)82715.7773475.36合計(jì)209407.00182321.00圓形圖環(huán)形圖莖葉圖
(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息莖葉圖
(例題分析)莖葉圖
(擴(kuò)展的莖葉圖)箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖箱線圖
(例題分析)最小值84最大值128中位數(shù)105下四分位數(shù)96上四分位數(shù)10980859095100105110150120125130周加工零件數(shù)的箱線圖分布的形狀與箱線圖
對稱分布QL中位數(shù)
QU左偏分布QL中位數(shù)
QU右偏分布QL
中位數(shù)
QU不同分布的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例】
從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級學(xué)生中隨機(jī)抽取11人,對8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場營銷學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)8門課程考試成績的箱線圖11名學(xué)生8門課程考試成績的箱線圖min-max25%-75%medianvalue455565758595105學(xué)生1學(xué)生
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第九單元課題1 溶液的形成教學(xué)設(shè)計(jì)-2023-2024學(xué)年九年級化學(xué)人教版下冊
- 10《竹節(jié)人》教學(xué)設(shè)計(jì)-2024-2025學(xué)年六年級上冊語文統(tǒng)編版
- 浙教版信息技術(shù)必修-2.2-因特網(wǎng)上信息的瀏覽和獲取-教學(xué)設(shè)計(jì)
- 第2課《我們的班規(guī)我們訂》第一課時(shí) 教學(xué)設(shè)計(jì)-2024-2025學(xué)年道德與法治四年級上冊統(tǒng)編版
- 2025年度汽車美容店員工勞動(dòng)爭議處理及調(diào)解合同
- 2025年度房貸裝修工程進(jìn)度與監(jiān)理合同
- 二零二五年度體育賽事資金托管與市場推廣協(xié)議
- 劇院全包裝修合同樣本
- 二零二五年度競業(yè)限制合同在體育產(chǎn)業(yè)的合同應(yīng)用
- 第十七章第一節(jié)《電流與電壓和電阻的關(guān)系》教學(xué)設(shè)計(jì)-2024-2025學(xué)年人教版物理九年級上學(xué)期
- 八年級下綜合實(shí)踐教案全套
- 第8課《山山水水》教學(xué)設(shè)計(jì)(新人教版小學(xué)美術(shù)六年級上冊)
- word 公章 模板
- 世界技能大賽PPT幻燈片課件(PPT 21頁)
- Python程序設(shè)計(jì)ppt課件完整版
- T∕ZSQX 008-2020 建設(shè)工程全過程質(zhì)量行為導(dǎo)則
- 質(zhì)量管理體系基礎(chǔ)知識培訓(xùn)-2016
- 《腹膜透析》ppt課件
- 甲醇催化劑說明書
- 北京課改版(2021年春修訂版)數(shù)學(xué)四年級下冊全冊教學(xué)課件
- 汽車標(biāo)準(zhǔn)法規(guī)(課堂PPT)
評論
0/150
提交評論