第二章統(tǒng)計(jì)資料收集

上傳人：9*** IP屬地：湖北上傳時(shí)間：2023-02-06 格式：PPT 頁(yè)數(shù)：119 大?。?.81MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩114頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用統(tǒng)計(jì)學(xué)第二章

統(tǒng)計(jì)數(shù)據(jù)的收集、整理與描述第二章（一）

第一節(jié)數(shù)據(jù)的計(jì)量尺度與問卷設(shè)計(jì)

重點(diǎn)掌握一、不同類研究變量的測(cè)量方法二、調(diào)查問卷結(jié)構(gòu)與設(shè)計(jì)方法一、數(shù)據(jù)的計(jì)量尺度數(shù)據(jù)定義：數(shù)據(jù)是用一定的方法所測(cè)得的量化反映客觀事物屬性的信息。收集反映客觀事物屬性信息（數(shù)據(jù)）的第一步工作就是確定測(cè)量方法。測(cè)量方法分類：依據(jù)客觀事物屬性不同特點(diǎn)，測(cè)量方法分為：列名尺度（定類尺度）順序尺度（定序尺度）間隔尺度（定距尺度）比例尺度（定比尺度）1、列名尺度nominalscale（1）定義：按事物的某種屬性對(duì)事物進(jìn)行平行分類或分組。劃分的各類別之間無大小或優(yōu)劣之分，且次序可以改變。（2）適用：取值只能大體進(jìn)行平行分類的品質(zhì)型標(biāo)志（變量）。（3）記錄方式：變量名稱：類別名羅列或用無意義數(shù)字表示。

例：性別：男/女性別：（1）男（2）女2、順序尺度ordinalscale（1）定義：按事物的某種屬性對(duì)事物進(jìn)行分類或分組基礎(chǔ)上，再將類別等級(jí)由大到小或由小到大排序。（2）適用：取值可以進(jìn)行分類且各類別具有等級(jí)差異的品質(zhì)型標(biāo)志（變量）。（3）記錄方式：品質(zhì)變量名：類別名序號(hào)由大到小或由小到大排列。例：文化程度（1）文盲（2）小學(xué)（3）初中（4）高中以上3、間隔尺度intervalscale（1）定義：選定一個(gè)測(cè)量單位，對(duì)數(shù)值變量在分類排序基礎(chǔ)上測(cè)量其間距（差距）。測(cè)量出的數(shù)值有加、減意義，無乘除意義。（2）適用：可用數(shù)值記錄其值而無比率意義的數(shù)值型標(biāo)志。（3）記錄形式：數(shù)值變量名：________

例：語(yǔ)文成績(jī)：________**表述語(yǔ)：甲(60分)比乙(30分)高30分4、比例尺度ratioscale（1）定義：選定一個(gè)測(cè)量單位，對(duì)數(shù)值型標(biāo)志（變量）在測(cè)量間距基礎(chǔ)上，測(cè)量其比率。（2）適用：可用數(shù)值記錄其值且有比率意義的數(shù)值型變量。（3）記錄形式：數(shù)值變量名：_______

例：家庭人口數(shù)：_______**表述語(yǔ)：甲家庭(6人)比乙家庭(3人)多3人,甲家庭人口與乙家庭人口之比為2:1綜合例題分析：企業(yè)狀況調(diào)查企業(yè)類型：（1）民營(yíng)；（2）合資企業(yè)；（3）國(guó)有企業(yè)。企業(yè)文化環(huán)境：（1）優(yōu)（2）良好（3）一般（4）較差（5）差工人平均工資：_______工人對(duì)企業(yè)管理的滿意度：1—2—3—4—5—6—7—8—9—10

二、調(diào)查問卷設(shè)計(jì)

問卷結(jié)構(gòu)：表頭、表體和表外附加3部分。（一）表頭：調(diào)查表名稱。（二）表體：說明詞和調(diào)查項(xiàng)目。1、說明詞：包括問候語(yǔ)、調(diào)查目的說明、填表說明和問卷編號(hào)等。2、調(diào)查項(xiàng)目：分為品質(zhì)型變量與數(shù)值變量。（三）表外附加：包括調(diào)查人簽名、調(diào)查日期、被調(diào)查人合作程度等。實(shí)例練習(xí)

某家電企業(yè)想通過市場(chǎng)調(diào)查了解以下問題：（1）企業(yè)產(chǎn)品的知名度（2）產(chǎn)品的市場(chǎng)占有率（3）用戶對(duì)產(chǎn)品質(zhì)量的評(píng)價(jià)及滿意程度

試設(shè)計(jì)一份調(diào)查問卷第二章（二）

第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的來源

統(tǒng)計(jì)調(diào)查——社會(huì)經(jīng)濟(jì)類研究問題直接來源數(shù)據(jù)來源科學(xué)實(shí)驗(yàn)——自然科學(xué)類研究問題間接來源：圖書、期刊、網(wǎng)絡(luò)查詢等本節(jié)主要講授統(tǒng)計(jì)調(diào)查，重點(diǎn)掌握一、不同類統(tǒng)計(jì)調(diào)查方法適用的研究問題二、抽樣調(diào)查的基本方法一、統(tǒng)計(jì)調(diào)查的類型（一）普查1、定義：對(duì)總體中所有單位都實(shí)施的調(diào)查。**人口普查、農(nóng)業(yè)普查、庫(kù)存物資清查。調(diào)查結(jié)果直接給出了總體的準(zhǔn)確情況。2、適用的研究問題：國(guó)家或部門需要準(zhǔn)確掌握國(guó)情、國(guó)力及資源狀況時(shí)實(shí)施普查法。3、方法：確定標(biāo)準(zhǔn)調(diào)查時(shí)點(diǎn)后對(duì)該時(shí)點(diǎn)內(nèi)的所有單位都實(shí)施調(diào)查。

（二）重點(diǎn)調(diào)查1、定義：在調(diào)查對(duì)象中選擇若干個(gè)在總體中占絕大比重的單位進(jìn)行的調(diào)查。例：（1）對(duì)全國(guó)2005年鋼鐵生產(chǎn)狀況調(diào)查。調(diào)查鞍鋼、上綱、武鋼、太鋼、寶鋼五大鋼鐵生產(chǎn)巨頭（2）陜西師范類院校生源狀況調(diào)查。調(diào)查陜師大、咸陽(yáng)師范學(xué)院、渭南師范等招生量大的院校2、適用的研究問題：調(diào)查目的只要求掌握總體的大體狀況，而總體中明顯存在若干能集中反映總體狀況的單位。

（三）抽樣調(diào)查1、定義：根據(jù)隨機(jī)原則從調(diào)查總體中抽取一定數(shù)量的單位進(jìn)行調(diào)查，然后由樣本信息推斷總體。例：中國(guó)西部地區(qū)成人受教育狀況調(diào)查普查、重點(diǎn)調(diào)查是否適用？2、適用的研究問題：調(diào)查目的只要求掌握總體的大體狀況，而在總體中不存在或不明顯存在若干個(gè)能集中反映總體狀況的單位。（四）典型調(diào)查1、定義：對(duì)調(diào)查對(duì)象進(jìn)行全面分析基礎(chǔ)上，有意識(shí)選擇部分典型單位進(jìn)行的調(diào)查。例：交通事故調(diào)查中，對(duì)某一重大事故的調(diào)查。2、適用的研究問題：對(duì)特殊事件或典型事例的分析。具體調(diào)查實(shí)例分析

1、2000年人口普查2、我國(guó)農(nóng)村社會(huì)經(jīng)濟(jì)狀況調(diào)查3、2008年1月南方地區(qū)受災(zāi)情況調(diào)查4、2008年1月28日秦嶺218國(guó)道客車事故原因調(diào)查5、中國(guó)0-14歲兒童智力狀況調(diào)查二、基本抽樣方法（一）簡(jiǎn)單隨機(jī)抽樣法1、定義：對(duì)總體單位不進(jìn)行分類或排序，完全按隨機(jī)法抽樣。2、適用研究問題：總體各單位特征差異較小，不存在類別差異。3、基本方法：（1）抽簽法：用簡(jiǎn)單簽條進(jìn)行抽樣，抽出的樣本誤較大。（2）隨機(jī)數(shù)字表法：用“隨機(jī)數(shù)字表”進(jìn)行抽樣，抽出的樣本誤較小。（3）計(jì)算機(jī)隨機(jī)抽樣法：在EXCEL軟件中用RAND（）函數(shù)抽樣，抽出的樣本誤最小。**三種方法如何選擇？課堂演示：隨機(jī)數(shù)字表法**從50位同學(xué)中抽出10位同學(xué)進(jìn)行身高測(cè)量第一步，給50位同學(xué)進(jìn)行編號(hào)010203040506……50第二步，在隨機(jī)數(shù)字表中隨機(jī)確定一個(gè)查號(hào)起點(diǎn)第三步，從起點(diǎn)開始兩兩讀取數(shù)字，與編號(hào)相同的同學(xué)被抽中↗474373860136614698637162……抽中:4743013646……

（二）分層抽樣1、定義：按影響調(diào)查結(jié)果的某一標(biāo)志對(duì)總體進(jìn)行分層（類），在各層中進(jìn)行隨機(jī)抽樣。2、適用研究問題：總體各類別中存在有較大的特征差異。3、方法：（1）按影響調(diào)查結(jié)果的某一標(biāo)志對(duì)總體進(jìn)行分層，或按空間方位進(jìn)行分層。（2）確定總樣本量n（3）確定各層的抽樣數(shù)目n1

有兩種分配方法：等額分配法——ni=n/k

等比例分配法——ni=Ni/N*n（4）按簡(jiǎn)單隨機(jī)法在各層進(jìn)行抽樣。

n=Σni分層抽樣方法實(shí)例分析***企業(yè)技術(shù)工人素質(zhì)現(xiàn)狀調(diào)查，要求總樣本量為1500人1、按“企業(yè)類型”（國(guó)營(yíng)、合資、民營(yíng)）分為3類（層）2、確定各類的抽樣數(shù)目n1

按等額分配法——ni=n/k=1500/3=500人

等比例分配法——ni=Ni/N*n？？3、按簡(jiǎn)單隨機(jī)法在三類企業(yè)中各抽500名技術(shù)工人進(jìn)行調(diào)查

思考與討論企業(yè)某產(chǎn)品全國(guó)市場(chǎng)銷售狀況調(diào)查，要求樣本量為1000個(gè)銷售點(diǎn)。按什么分層？如何抽樣？（三）等距抽樣法1、定義：對(duì)總體單位進(jìn)行排序后，再每隔一定的間距進(jìn)行抽取樣本單位。2、適用研究問題：（1）總體各單位數(shù)值存在由大到小的順序差異。如：工資調(diào)查（2）總體各單位的位置自然處于排序狀態(tài)如：居民門牌號(hào)、企業(yè)自動(dòng)生產(chǎn)線上的產(chǎn)品。3、方法（1）無關(guān)標(biāo)志排隊(duì)等距抽樣法：指排隊(duì)標(biāo)志與調(diào)查內(nèi)容無關(guān)。例：對(duì)身高調(diào)查時(shí)，按學(xué)號(hào)順序過程：A、按無關(guān)標(biāo)志對(duì)各單位進(jìn)行排隊(duì)；

B、計(jì)算抽樣間距K=N/nN—總體單位數(shù)，n–樣本數(shù)C、按間距K進(jìn)行抽樣（2）有關(guān)標(biāo)志排隊(duì)等距抽樣：指排隊(duì)標(biāo)志與調(diào)查內(nèi)容有關(guān)。（1）半距起點(diǎn)法：優(yōu)點(diǎn)是較簡(jiǎn)單，但僅能抽到一個(gè)樣本。

|——O——|——O——|——O——|——O——|——O——|——O——|

（2）對(duì)稱等距抽樣|—O———|———O—|—O———|———O—|—O———|———O—|等距抽樣實(shí)例分析**某小區(qū)共有1500戶居民，從中抽取300戶進(jìn)行家庭狀況調(diào)查。第一步，確定以“居民門牌號(hào)”為排對(duì)標(biāo)志第二步，計(jì)算抽樣間距

K=N/n=1500/300=5（戶）第三步，在第1間距內(nèi)任意取1戶為起點(diǎn)（如第3戶）進(jìn)行調(diào)查，再每隔5戶調(diào)查1戶（9、15、21……）。（四）整群抽樣法1、定義：將總體按某指標(biāo)分為若干部分（群），然后以“群”為單位進(jìn)行抽樣，對(duì)抽到“群”中的所有個(gè)體都進(jìn)行調(diào)查。如：以“班”為單位的抽樣調(diào)查2、適用研究問題：總體各單位自然成“群”。整群抽樣實(shí)例分析***“秦巴山區(qū)示范區(qū)兒童MR患病狀況調(diào)查”某鄉(xiāng)共有6個(gè)自然村，0-14歲兒童人數(shù)分別為190、134、116、106、144、175。要求該鄉(xiāng)抽取一半的村（3個(gè)村），共抽取430名兒童進(jìn)行調(diào)查。**練習(xí)用抽簽法或隨機(jī)數(shù)字表法進(jìn)行抽樣上機(jī)實(shí)踐操作2：

EXCEL軟件介紹EXCEL軟件抽樣法作業(yè)1:用EXCEL軟件從50個(gè)數(shù)字中隨機(jī)抽取15個(gè)數(shù)字.第二章（三）

第三節(jié)數(shù)據(jù)統(tǒng)計(jì)匯總

指在分組基礎(chǔ)上，對(duì)數(shù)據(jù)分布情況用表（頻數(shù)分布表）或圖（統(tǒng)計(jì)圖）進(jìn)行描述。本節(jié)重點(diǎn)掌握一、頻數(shù)分布表的編制方法二、直方圖制作方法一、頻數(shù)分布表（一）定義：指在統(tǒng)計(jì)分組基礎(chǔ)上，對(duì)附合各組特征的單位進(jìn)行分類匯總，形成總體各單位在各組中的分布，又稱分布數(shù)列。(二)一般形式：由三列組成

（三）類型1、單項(xiàng)數(shù)列(簡(jiǎn)單頻數(shù)分布表)：一個(gè)變量值就是一組。適用于：品質(zhì)變量或離散型數(shù)值變量，數(shù)據(jù)類型較少時(shí)的數(shù)據(jù)

2、組距數(shù)列：按數(shù)值區(qū)間分組后形成的頻數(shù)分布表。適用于：離散型數(shù)值變量，數(shù)據(jù)類型較多的數(shù)據(jù)；

連續(xù)型數(shù)值變量。

1、簡(jiǎn)單頻數(shù)分布表員工對(duì)主管盡職情況的評(píng)定人數(shù)比例%①非常不盡職②不盡職③不置可否④盡職⑤非常盡職911.253037.501012.502531.2567.50總計(jì)80100表3-180名員工對(duì)部門主管盡職程度調(diào)查結(jié)果2、組距式頻數(shù)分布表成績(jī)組中值頻數(shù)累積頻數(shù)95～97.52290～92.52485～87.53780～82.551275～77.582070～72.5113165～67.594060～62.554555～57.544950～52.525145～47.5152合計(jì)5252表3-2某班52名學(xué)生數(shù)學(xué)成績(jī)次數(shù)分布表組距式頻數(shù)分布表相關(guān)概念組上限—每組最大值組下限—每組最小值組距=組上限-下限組中值=（組上限+下限）/2缺下限組組中值=上限-鄰組組距/2

例：60以下缺上限組組中值=下限+鄰組組距/2例：90以上組上限——每組最大值組下限——每組最小值組距——組上限-下限（四）頻數(shù)分布表編制1、單項(xiàng)數(shù)列表編制用計(jì)算機(jī)自動(dòng)完成SPSS——》analysis——》descriptivestatistic——》frequency

2、組距數(shù)列表編制

（1）確定組數(shù)A、經(jīng)驗(yàn)法或行業(yè)約定法。例：對(duì)年齡的分組按人群特點(diǎn)分為嬰幼兒（0-6歲）、少年兒童（7-17歲）中青年（18-59歲）、老年（60歲以上）。B、正態(tài)分布數(shù)據(jù)：斯特吉斯經(jīng)驗(yàn)公式法（Sturges’rule）。K=1+3.322log10nK——組數(shù)n—數(shù)據(jù)個(gè)數(shù)（2）計(jì)算組距等距數(shù)列d=（數(shù)據(jù)極大值-數(shù)據(jù)極小值）/K（3）確定各組上、下限第一組：下限=總體數(shù)據(jù)極小值-組距/2

上限=總體數(shù)據(jù)極小值+組距/2

其它組順延。（4）計(jì)算各組頻數(shù)、頻率、累積頻數(shù)、累積頻率、組中值頻數(shù)、頻率：按上限組不在內(nèi)原則進(jìn)行匯總。累積頻數(shù)、累積頻率：P24表2.10向下累積值意義——指達(dá)到本組上限以下的人數(shù)或比例。向上累積值意義——指達(dá)到本組下限以上的人數(shù)或比例。

組距數(shù)列表編制實(shí)例分析***50名工人，最少日加工零件數(shù)為107件，最多為139件，編制組距式頻數(shù)分布表（1）計(jì)算組數(shù)：（2）計(jì)算組距d=（139-107）/7=5（3）確定第一組上、下限下限=107-5/2≌105上限=107+5/2≌110其它組順延。

二、頻數(shù)分布圖在編制頻數(shù)分布表的基礎(chǔ)上，可以繪制頻數(shù)分布圖，使一組數(shù)據(jù)特征更加直觀和概括,而且還可以對(duì)數(shù)據(jù)的分布情況和變動(dòng)趨勢(shì)作粗略的分析。繪制頻數(shù)分布圖可以用計(jì)算機(jī)程序，如EXCEL，也可以用專門的統(tǒng)計(jì)程序。1、頻數(shù)分布直方圖直方圖(histogram)又稱為等距直方圖，是以矩形的面積表示連續(xù)性隨機(jī)變量頻數(shù)分布的圖形。一般用縱軸表示數(shù)據(jù)的頻數(shù)，用橫軸表示數(shù)據(jù)的等距分組點(diǎn)，即各分組區(qū)間的上下限。直方圖是統(tǒng)計(jì)學(xué)中常用而且又有特殊意義的一種統(tǒng)計(jì)圖，有著重要的應(yīng)用價(jià)值。例：根據(jù)52個(gè)學(xué)生的數(shù)學(xué)成績(jī)所作直方圖圖3-152名學(xué)生數(shù)學(xué)成績(jī)分布的頻數(shù)直方圖4550556065707580859095100還可以做成下面這種形式圖3-252名學(xué)生數(shù)學(xué)成績(jī)頻數(shù)分布直方圖2、頻數(shù)分布多邊圖（折線圖）頻數(shù)分布多邊形圖（frequencypolygon）是一種表示連續(xù)性隨機(jī)變量次數(shù)分布的線形圖（折線圖）。繪制方法：以各分組區(qū)間的組中值為橫坐標(biāo)，以各組的頻數(shù)為縱坐標(biāo)，描點(diǎn)；將各點(diǎn)以直線連接即構(gòu)成多邊圖形。當(dāng)N為無窮大時(shí)，形成光滑線，即得分布曲線。**P26圖2.3正態(tài)、偏態(tài)分布（左、右偏的特點(diǎn)）

圖3-352名學(xué)生數(shù)學(xué)成績(jī)分布圖人數(shù)圖3-452名學(xué)生數(shù)學(xué)成績(jī)分布圖人數(shù)成績(jī)利用頻數(shù)分布多邊圖（折線圖）還可以把幾組資料放在一起進(jìn)行比較。但需要注意的是，這時(shí)必須把數(shù)據(jù)的次數(shù)換算成百分比。圖3-52組數(shù)據(jù)的次數(shù)分布圖3、累積頻數(shù)分布圖根據(jù)累積頻數(shù)，可以繪制累積頻數(shù)分布圖。累積頻數(shù)分布曲線當(dāng)數(shù)據(jù)的總數(shù)較多時(shí)，將累積頻數(shù)分布圖中的橫坐標(biāo)以每一分組區(qū)間的精確上限或精確下限表示，縱坐標(biāo)以累積頻數(shù)表示，則可繪制累積頻數(shù)分布曲線，即累積曲線。圖3-8累積頻數(shù)分布曲線累積曲線可用于判斷一組數(shù)據(jù)的大致分布形態(tài)。圖3-9正態(tài)分布數(shù)據(jù)的累積曲線圖3-10正偏態(tài)數(shù)據(jù)累積曲線圖3-11負(fù)偏態(tài)數(shù)據(jù)累積曲線上機(jī)操作3某大學(xué)四年級(jí)80名學(xué)生的畢業(yè)成績(jī)?nèi)缦拢?/p>

56837668809269816278578171705966667561488450938272704984696693747069567468855397615258507393527465816853549568729482696066859057677582554668478957677551836855501、用SPSS編制單項(xiàng)數(shù)列表2、編制一個(gè)組距式頻數(shù)分布表，并用SPSS進(jìn)行頻數(shù)統(tǒng)計(jì)。第二章（四）

第四節(jié)統(tǒng)計(jì)圖制作

數(shù)據(jù)顯示包括了統(tǒng)計(jì)表與統(tǒng)計(jì)圖兩種主要形式，本節(jié)主要講述圖與表的配合使用及其制作。本節(jié)重點(diǎn)掌握：一、常用統(tǒng)計(jì)圖及其適用的數(shù)據(jù)類型二、不同類統(tǒng)計(jì)圖的計(jì)算機(jī)制作方法一、條形圖（barcharts）1、圖例：以各組代表值為X軸，以測(cè)量值為Y軸（柱狀圖）；或以各組代表值為Y軸，以測(cè)量值為X軸（條形圖）；2、適用資料類型：（1）同一總體，不同測(cè)量指標(biāo)值（標(biāo)準(zhǔn)分?jǐn)?shù)）的比較；例：同班同學(xué)不同課程考試成績(jī)比較。（2）不同總體，同質(zhì)性測(cè)量指標(biāo)值間的比較。例：不同班級(jí)同一門課程考試成績(jī)的比較。

二、餅圖（pie）1、圖例：以各組數(shù)據(jù)值構(gòu)成餅圖各扇形面積，總面積之和為100%。

2、適用資料類型：（1）同一總體，不同部分所占比例的比較，用餅圖；（2）不同總體，同質(zhì)性部分所占比例的比較，用環(huán)形圖。例：兩個(gè)調(diào)查小組抽樣學(xué)生所占比例的相互比較。

三、線圖（line）1、圖例：以時(shí)間段為X軸，以測(cè)量值為Y軸。2、適用資料類型：隨時(shí)間變化的數(shù)據(jù)，發(fā)展趨勢(shì)分析。

四、散點(diǎn)圖（scatterplots）1、圖例：以第一變量為X軸，第二變量為Y軸。2、適用資料類型：兩個(gè)變量相關(guān)關(guān)系趨勢(shì)分析。

上機(jī)實(shí)踐操作4：統(tǒng)計(jì)圖制作1、條形圖制作。用P59第1題制作2、餅圖制作用P61第6題數(shù)據(jù)制作。

第二章（五）

第五節(jié)數(shù)據(jù)分布集中趨勢(shì)測(cè)量

*意義：指計(jì)算一組數(shù)據(jù)的一般水平或中心值。*常用指標(biāo)：包括算術(shù)平均數(shù)、中位數(shù)、眾數(shù)、加權(quán)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)等等。本節(jié)重點(diǎn)掌握一、不同類數(shù)據(jù)集中趨勢(shì)測(cè)量所使用的方法二、計(jì)算機(jī)常用集中趨勢(shì)測(cè)量操作方法一、算術(shù)平均數(shù)算術(shù)平均數(shù)（arithmeticaverage

）一般簡(jiǎn)稱為平均數(shù)（average）或均數(shù)、均值（mean）。一般用Ｍ，或者用表示。算術(shù)平均數(shù)是最常用平均指標(biāo)1．算術(shù)平均數(shù)的計(jì)算公式原始數(shù)據(jù)計(jì)算公式(計(jì)算機(jī)編程公式)

(P322．3）Xi——每個(gè)樣本單位的原始測(cè)量值n——樣本量例：10位同學(xué)英語(yǔ)考試分?jǐn)?shù)為89、90、67、80、75、89、99、88、45、68則平均成績(jī)=（89+90+67+80+75+89+99+88+45+68）/10次數(shù)分布表計(jì)算公式（二手資料）（P322.4）Xi—每組的組中值f—每組的頻數(shù)用于從網(wǎng)上或期刊上查詢到的二手分組資料，無法得到原始數(shù)據(jù)的情況。表152名學(xué)生數(shù)學(xué)成績(jī)平均數(shù)計(jì)算表成績(jī)(1)Xif(2)f*Xi計(jì)算95－97.5219590－92.5218585－87.53262.580－82.55412.575－77.5862070－72.511797.565－67.59607.560－62.55312.555－57.5423050－52.5210545－47.5147.5合計(jì)523775.02、算術(shù)平均數(shù)的意義算術(shù)平均數(shù)是應(yīng)用最普遍的一種平均指標(biāo)。它是“真值”（truescore）的最佳估計(jì)值。真值是反映某種現(xiàn)象的真實(shí)水平的分?jǐn)?shù)。由于測(cè)量過程中的各種偶然因素的影響，真值往往很難得到。在實(shí)際測(cè)量中，往往采用“多次測(cè)量，取平均數(shù)”的方法，用平均數(shù)去估計(jì)真值。3、算術(shù)平均數(shù)的優(yōu)缺點(diǎn)

算術(shù)平均數(shù)具備一個(gè)良好的平均指標(biāo)所應(yīng)具備的一些特點(diǎn)：反應(yīng)靈敏、有公式嚴(yán)密確定、簡(jiǎn)明易懂、適合代數(shù)運(yùn)算等等。主要不足：容易受兩極端數(shù)值的影響；一組數(shù)據(jù)中有模糊不清的數(shù)值時(shí)無法計(jì)算。4、計(jì)算和應(yīng)用算術(shù)平均數(shù)的原則（1）同質(zhì)性原則：算術(shù)平均數(shù)只能用于表示同類數(shù)據(jù)的集中趨勢(shì)。（2）平均數(shù)與個(gè)體數(shù)值相結(jié)合的原則：在解釋個(gè)體特征時(shí)，既要看平均數(shù)，也要結(jié)合個(gè)體的數(shù)據(jù)。（3）平均數(shù)與標(biāo)準(zhǔn)差、方差相結(jié)合原則：描述一組數(shù)據(jù)時(shí)既要分析其集中趨勢(shì)，也要分析離散程度。（4）一般用于表示正態(tài)分布數(shù)據(jù)的集中趨勢(shì)。二、中位數(shù)中位數(shù)（median）又稱為中數(shù)，是按順序排列的一組數(shù)據(jù)中位于中間位置的數(shù)。一般用Md或Mdn、Me表示。1、中位數(shù)的計(jì)算方法原始數(shù)據(jù)計(jì)算法(計(jì)算機(jī)編程公式)首先將一組數(shù)據(jù)按順序排列

(5個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù)：

2422212620排序: 2021222426位置:123 45中位數(shù)

22位置N+125+123

(6個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):105 91268排序: 56891012位置: 123

456位置N+126+123.5中位數(shù)8+928.5次數(shù)分布表計(jì)算法（二手資料）由次數(shù)分布表計(jì)算中位數(shù)需要用到累積次數(shù)分布表。當(dāng)表中數(shù)據(jù)的累積方向不同時(shí)，計(jì)算公式也不同。由最低組至最高組（向下）累積頻數(shù)計(jì)算公式公式中:L為中位數(shù)所在組的下限

Sm-1為小于中位數(shù)所在組下限各組的累積頻數(shù)

n為數(shù)據(jù)總和

fm為中位數(shù)所在組的頻數(shù)

i為中位數(shù)組的組距中位數(shù)組：指由最低組向最高組累積，達(dá)到次數(shù)半值的組

（P312.2）表230名工人日加工零件中位數(shù)計(jì)算表組別f向下累積頻數(shù)80～3390～710100～1323110～528120～230

合計(jì)30計(jì)算表示：30名工人中，中等水平工人日加工零件數(shù)約為104件表352名學(xué)生數(shù)學(xué)成績(jī)中位數(shù)計(jì)算表成績(jī)頻數(shù)f累積頻數(shù)計(jì)算95～25290～25085～34880～54575～84070～113265～92160～51255～4750～2345～11合計(jì)522．中位數(shù)的特點(diǎn)及應(yīng)用中位數(shù)不受兩端極端數(shù)據(jù)的影響。一般用于下列情況：（1）數(shù)值數(shù)據(jù)型數(shù)據(jù)的有極端數(shù)據(jù)時(shí)，即數(shù)據(jù)明顯為偏態(tài)分布，極差較大（偏峰分布）；（2）一組數(shù)據(jù)中有個(gè)別數(shù)據(jù)不確切、不清楚時(shí)；（3）用定序尺度測(cè)量的組距式數(shù)據(jù)，即資料屬于等級(jí)性質(zhì)時(shí)。例：家庭人月均收入：（1）200-400；（2）400-600；（3）600-800；（4）800以上計(jì)算：當(dāng)?shù)刂械人郊彝サ娜司率杖胨?/p>

三．眾數(shù)眾數(shù)（mode）用Mo表示，有兩種定義：理論眾數(shù)是指與頻數(shù)分布曲線最高點(diǎn)相對(duì)應(yīng)的橫坐標(biāo)上的一點(diǎn)；粗略眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)數(shù)。眾數(shù)也是一種平均指標(biāo)，也可用來表示一組數(shù)據(jù)的集中趨勢(shì)。１．眾數(shù)的計(jì)算方法

（1）觀察法尋找粗略眾數(shù)未分組數(shù)據(jù)：出現(xiàn)次數(shù)最多的數(shù)即為眾數(shù)。已分組（次數(shù)分布表）數(shù)據(jù)：頻數(shù)最多那一組數(shù)據(jù)的組中值，即為眾數(shù)。（2）用次數(shù)分布數(shù)據(jù)精確計(jì)算眾數(shù)由最低組至最高組（向下）累積頻數(shù)計(jì)算公式

d1Mo=L+————×i（P292.1）d1+d2公式中：L—眾數(shù)組下限d1—眾數(shù)組頻數(shù)與其下限相鄰一組頻數(shù)之差d2-眾數(shù)組頻數(shù)與其上限相鄰一組頻數(shù)之差i—眾數(shù)組組距眾數(shù)組：指頻數(shù)最大的組表430名工人日加工零件眾數(shù)計(jì)算表組別f向下累積頻數(shù)80～3390～710100～1323110～528120～230

合計(jì)30計(jì)算粗略法：Mo=105精確法：d1Mo=L+————×id1+d213-7=100+————————×10

（13-7）+（13-5）

=104.29表示：30名工人中，大多數(shù)工人日加工零件數(shù)約為104件.表652名學(xué)生數(shù)學(xué)成績(jī)中位數(shù)計(jì)算表成績(jī)頻數(shù)f9529028538057587011659605554502451合計(jì)52粗略法：Mo=72.5精確法：d1Mo=L+————×id1+d211-9=70+————————×5

（11-9）+（11-8）

=72

(眾數(shù)的不唯一性)無眾數(shù)

原始數(shù)據(jù):10591268一個(gè)眾數(shù)

原始數(shù)據(jù):6

598

55多于一個(gè)眾數(shù)

原始數(shù)據(jù):

282836

4242２．眾數(shù)的應(yīng)用（1）數(shù)值型數(shù)據(jù)，數(shù)據(jù)明顯為偏態(tài)分布，極差較?。夥宸植迹唬?）社會(huì)經(jīng)濟(jì)現(xiàn)象中不宜用均值作為一般水平的現(xiàn)象。如：車輛調(diào)度、服裝加工等

（3）用定序尺度測(cè)量的組距式數(shù)據(jù)例：家庭人月均收入：（1）200-400；（2）400-600；（3）600-800；4）800以上計(jì)算：當(dāng)?shù)卮蠖鄶?shù)家庭的人月均收入水平

3眾數(shù)、中位數(shù)和均值的關(guān)系及應(yīng)用對(duì)稱分布

均值=中位數(shù)=眾數(shù)(負(fù))左偏分布均值

中位數(shù)

眾數(shù)(正)右偏分布眾數(shù)

中位數(shù)

均值正態(tài)分布數(shù)據(jù)——一般選用均值作為平均指標(biāo)，表示平均水平偏態(tài)分布數(shù)據(jù)——極差太大時(shí)，選用中位數(shù)作為平均指標(biāo)，表示中等水平偏態(tài)分布數(shù)據(jù)——極差較小時(shí)，選用眾數(shù)作為平均指標(biāo)，表示大多數(shù)個(gè)體的水平綜合練習(xí)：2004年，對(duì)某市500戶居民家庭月收入抽樣調(diào)查數(shù)據(jù)見下表。求：（1）本市居民家庭平均月收入（2）本市大多數(shù)居民家庭月收入（3）本市中等水平居民家庭月收入四、其它平均指標(biāo)（了解）除了算術(shù)平均數(shù)、中位數(shù)和眾數(shù)以外，在應(yīng)用中還有一些其它平均指標(biāo)。這些統(tǒng)計(jì)指標(biāo)可以從其它角度描述一組數(shù)據(jù)的集中趨勢(shì)。１．加權(quán)平均數(shù)加權(quán)平均數(shù)是不同比重?cái)?shù)據(jù)（或平均數(shù)）的平均數(shù)，一般用表示。計(jì)算公式：

***用于計(jì)算某單位由不同權(quán)重的項(xiàng)目分組成的總項(xiàng)目得分。

**用于計(jì)算由不同調(diào)查小組調(diào)查的平均成績(jī)計(jì)算總體平均成績(jī)。

２．幾何平均數(shù)幾何平均數(shù)（geometricmean）是n個(gè)數(shù)值連乘積的n次方根，用或表示。計(jì)算公式為用于社會(huì)現(xiàn)象中求平均發(fā)展速度P35（2．6）幾何平均數(shù)的變式兩邊取對(duì)數(shù)，得注意：幾何平均數(shù)計(jì)算的是平均的變化情況，如果要計(jì)算平均增長(zhǎng)率，需要從幾何平均數(shù)中減去基數(shù)1。第二章（五）

第五節(jié)數(shù)據(jù)離散趨勢(shì)測(cè)量

*意義：離散趨勢(shì)測(cè)量是描述一組數(shù)據(jù)中，每個(gè)觀察值偏離平均值的狀況，即數(shù)據(jù)的變異性。*常用指標(biāo)：包括極差、方差、標(biāo)準(zhǔn)差、離散系數(shù)等。特殊指標(biāo)有百分位差、四分位差、平均差等本節(jié)重點(diǎn)掌握不同類數(shù)據(jù)離散趨勢(shì)測(cè)量所使用的方法計(jì)算機(jī)常用離散趨勢(shì)測(cè)量操作方法一、極差（Rang）是一組數(shù)據(jù)中最大值與最小值之差，又稱全距。用R表示。（一）計(jì)算原始數(shù)據(jù)：

R=max（xi）-min（xi）（P392.8）頻數(shù)分布數(shù)據(jù)：最高組與最低組組中值之差，或者最高組上限與最低組下限之差。（二）適用資料用于表示偏態(tài)分布數(shù)據(jù)的離散狀況。

二、方差和標(biāo)準(zhǔn)差

方差（Variance）：是指離差平方的算術(shù)平均數(shù)，即一組數(shù)據(jù)中每個(gè)數(shù)據(jù)與該組平均數(shù)之差,平方之,再求和,再除以數(shù)據(jù)的個(gè)數(shù)，總體用σ2

表示，樣本用S2

表示。

離均差平方和樣本總數(shù)標(biāo)準(zhǔn)差（Standarddeviation

）：是指離差平方和平均后的方根。即方差的平方根。用總體σ表示，樣本用s（或SD）表示。

意義：標(biāo)準(zhǔn)差的值越大，表明這組數(shù)據(jù)的離散程度越大。（一）總體方差和標(biāo)準(zhǔn)差計(jì)算方法原始數(shù)據(jù)計(jì)算法頻數(shù)分布表計(jì)算法注意比較（二）樣本方差和標(biāo)準(zhǔn)差計(jì)算方法原始數(shù)據(jù)計(jì)算法（P402.102.12）頻數(shù)分布表計(jì)算法(P412.112.13)注意比較分?jǐn)?shù)組中值xffXfX245--47.5147.5147.521σ2=148506.3/37-(2290/37)2=183.078σ=13.53R=87.5-47.5=4050--52.5252.5252.52255--57.5057.5057.52060--62.5262.5262.52270--67.5367.5367.52375--77.5877.5877.52380--82.5782.5782.52785--87.5787.5787.527總和372290.0148506.3例：全班37個(gè)學(xué)生數(shù)學(xué)分?jǐn)?shù)標(biāo)準(zhǔn)差、極差的計(jì)算表（三）標(biāo)準(zhǔn)差的特點(diǎn)及適用資料特點(diǎn)：（1）有單位，與測(cè)量指標(biāo)單位相同。（2）有正、負(fù)，+說明高于均值，-表示低于均值適用資料：用于表示正態(tài)分布數(shù)據(jù)的離散程度。

三、離散系數(shù)（Coefficientofvariation）離散系數(shù)：是指標(biāo)準(zhǔn)差與算術(shù)平均數(shù)的百分比。它是沒有單位的相對(duì)數(shù)。計(jì)算公式：或離散系數(shù)越大，表明離散程度越大。離散系數(shù)的用途1、比較不同單位資料的離散程度例：對(duì)全班同學(xué)體重測(cè)量得到的標(biāo)準(zhǔn)差為18kg，身高測(cè)量得到的標(biāo)準(zhǔn)差為0.18m，對(duì)二者的離散程度進(jìn)行比較。能否直接比較？

2、對(duì)不同總體同一測(cè)量指標(biāo)的離散程度進(jìn)行比較。例：對(duì)全班同學(xué)體重測(cè)量，得到女生的標(biāo)準(zhǔn)差為6kg，男生測(cè)量得到的標(biāo)準(zhǔn)差為18kg，對(duì)二者的離散程度進(jìn)行比較。能否直接比較？

四其它離散程度測(cè)量指標(biāo)（了解）bi×f×NpLpp+=100Fb（一）百分位差含義：用兩個(gè)百分位數(shù)之間的距離表示差異量。百分位數(shù)的計(jì)算：Pp所求的第P個(gè)百分位數(shù)Lb百分位數(shù)所在組的精確下限

f百分位數(shù)所在組的次數(shù)Fb小于Lb的各組的次數(shù)N總次數(shù)i組距例:某鄉(xiāng)農(nóng)戶家庭收入調(diào)查結(jié)果

收入戶數(shù)向下累計(jì)5000以下6000-70007000-80008000-90009000-1000010000以上合計(jì)15030060045020010018001504501050150017001800求P25P25的位置:N*25%=1800*25%=450第2組P25=6000+(450-150)*1000/300=7000元意義：表示當(dāng)?shù)卮迕裰杏?5%的農(nóng)戶家庭收入在7000元以下（二）四分位差為了避免全距受兩極端數(shù)值影響的缺點(diǎn)，則用按一定順序排列的一組數(shù)據(jù)中間部位50%個(gè)頻數(shù)距離的一半作為差異量指標(biāo)，即四分位距。用Q表示。Q3:第三個(gè)四分位數(shù)Q1:第一個(gè)四分位數(shù)213QQQ-=四分差計(jì)算方法1（未分組資料）213QQQ-=Q1的位置：（N+1）/4Q3的位置：3（N+1）/4例：10名同學(xué)社會(huì)學(xué)考試成績(jī)?yōu)?/p>

55、60、70、72、75、80、83、88、90、92求：四分位差

Q1的位置：（10+1）/4=2.75Q3的位置：3（10+1）/4=8.25Q1=X2+0.75(X3-X2)=60+0.75(70-60)=67.5Q3=X8+0.25(X9-X8)=88+0.25(90-88)=88.5Q=(88.5-67.5)/2=10.5分

四分差計(jì)算方法2:分組資料213QQQ-=1)4(xxQxQxfiFNLQ-+=例:某鄉(xiāng)家戶家庭收入調(diào)查結(jié)果

收入戶數(shù)向下累計(jì)5000以下6000-70007000-80008000-90009000-1000010000以上合計(jì)15030060045020010018001504501050150017001800求四分位差Q1的位置:N/4=1800/4=450第2組Q3的位置:3N/4=1350第4組Q1=6000+(450-150)/300*1000=7000Q3=8000+(1350-1050)/450*1000=8666.7Q=(Q3-Q1)/2=833.35元（三）平均差是次數(shù)分布中所有原始數(shù)據(jù)與平均數(shù)絕對(duì)離差的平均值。

AD＝nXX||-SnX|Xc|-Sf

AD＝平均差的優(yōu)點(diǎn)：表示每一個(gè)數(shù)據(jù)與平均數(shù)的偏離程度，較好的反映的數(shù)據(jù)分散程度。平均差的缺點(diǎn)：取絕對(duì)值，不利于進(jìn)一步的計(jì)算，所以使用較少。

五、標(biāo)準(zhǔn)差的應(yīng)用

（一）計(jì)算標(biāo)準(zhǔn)

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第二章統(tǒng)計(jì)資料收集

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第二章統(tǒng)計(jì)資料收集

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔