第二章統(tǒng)計(jì)資料收集_第1頁(yè)
第二章統(tǒng)計(jì)資料收集_第2頁(yè)
第二章統(tǒng)計(jì)資料收集_第3頁(yè)
第二章統(tǒng)計(jì)資料收集_第4頁(yè)
第二章統(tǒng)計(jì)資料收集_第5頁(yè)
已閱讀5頁(yè),還剩114頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用統(tǒng)計(jì)學(xué)第二章

統(tǒng)計(jì)數(shù)據(jù)的收集、整理與描述第二章(一)

第一節(jié)數(shù)據(jù)的計(jì)量尺度與問卷設(shè)計(jì)

重點(diǎn)掌握一、不同類研究變量的測(cè)量方法二、調(diào)查問卷結(jié)構(gòu)與設(shè)計(jì)方法一、數(shù)據(jù)的計(jì)量尺度數(shù)據(jù)定義:數(shù)據(jù)是用一定的方法所測(cè)得的量化反映客觀事物屬性的信息。收集反映客觀事物屬性信息(數(shù)據(jù))的第一步工作就是確定測(cè)量方法。測(cè)量方法分類:依據(jù)客觀事物屬性不同特點(diǎn),測(cè)量方法分為:列名尺度(定類尺度)順序尺度(定序尺度)間隔尺度(定距尺度)比例尺度(定比尺度)1、列名尺度nominalscale(1)定義:按事物的某種屬性對(duì)事物進(jìn)行平行分類或分組。劃分的各類別之間無大小或優(yōu)劣之分,且次序可以改變。(2)適用:取值只能大體進(jìn)行平行分類的品質(zhì)型標(biāo)志(變量)。(3)記錄方式:變量名稱:類別名羅列或用無意義數(shù)字表示。

例:性別:男/女性別:(1)男(2)女2、順序尺度ordinalscale(1)定義:按事物的某種屬性對(duì)事物進(jìn)行分類或分組基礎(chǔ)上,再將類別等級(jí)由大到小或由小到大排序。(2)適用:取值可以進(jìn)行分類且各類別具有等級(jí)差異的品質(zhì)型標(biāo)志(變量)。(3)記錄方式:品質(zhì)變量名:類別名序號(hào)由大到小或由小到大排列。例:文化程度(1)文盲(2)小學(xué)(3)初中(4)高中以上3、間隔尺度intervalscale(1)定義:選定一個(gè)測(cè)量單位,對(duì)數(shù)值變量在分類排序基礎(chǔ)上測(cè)量其間距(差距)。測(cè)量出的數(shù)值有加、減意義,無乘除意義。(2)適用:可用數(shù)值記錄其值而無比率意義的數(shù)值型標(biāo)志。(3)記錄形式:數(shù)值變量名:________

例:語(yǔ)文成績(jī):________**表述語(yǔ):甲(60分)比乙(30分)高30分4、比例尺度ratioscale(1)定義:選定一個(gè)測(cè)量單位,對(duì)數(shù)值型標(biāo)志(變量)在測(cè)量間距基礎(chǔ)上,測(cè)量其比率。(2)適用:可用數(shù)值記錄其值且有比率意義的數(shù)值型變量。(3)記錄形式:數(shù)值變量名:_______

例:家庭人口數(shù):_______**表述語(yǔ):甲家庭(6人)比乙家庭(3人)多3人,甲家庭人口與乙家庭人口之比為2:1綜合例題分析:企業(yè)狀況調(diào)查企業(yè)類型:(1)民營(yíng);(2)合資企業(yè);(3)國(guó)有企業(yè)。企業(yè)文化環(huán)境:(1)優(yōu)(2)良好(3)一般(4)較差(5)差工人平均工資:_______工人對(duì)企業(yè)管理的滿意度:1—2—3—4—5—6—7—8—9—10

二、調(diào)查問卷設(shè)計(jì)

問卷結(jié)構(gòu):表頭、表體和表外附加3部分。(一)表頭:調(diào)查表名稱。(二)表體:說明詞和調(diào)查項(xiàng)目。1、說明詞:包括問候語(yǔ)、調(diào)查目的說明、填表說明和問卷編號(hào)等。2、調(diào)查項(xiàng)目:分為品質(zhì)型變量與數(shù)值變量。(三)表外附加:包括調(diào)查人簽名、調(diào)查日期、被調(diào)查人合作程度等。實(shí)例練習(xí)

某家電企業(yè)想通過市場(chǎng)調(diào)查了解以下問題:(1)企業(yè)產(chǎn)品的知名度(2)產(chǎn)品的市場(chǎng)占有率(3)用戶對(duì)產(chǎn)品質(zhì)量的評(píng)價(jià)及滿意程度

試設(shè)計(jì)一份調(diào)查問卷第二章(二)

第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的來源

統(tǒng)計(jì)調(diào)查——社會(huì)經(jīng)濟(jì)類研究問題直接來源數(shù)據(jù)來源科學(xué)實(shí)驗(yàn)——自然科學(xué)類研究問題間接來源:圖書、期刊、網(wǎng)絡(luò)查詢等本節(jié)主要講授統(tǒng)計(jì)調(diào)查,重點(diǎn)掌握一、不同類統(tǒng)計(jì)調(diào)查方法適用的研究問題二、抽樣調(diào)查的基本方法一、統(tǒng)計(jì)調(diào)查的類型(一)普查1、定義:對(duì)總體中所有單位都實(shí)施的調(diào)查。**人口普查、農(nóng)業(yè)普查、庫(kù)存物資清查。調(diào)查結(jié)果直接給出了總體的準(zhǔn)確情況。2、適用的研究問題:國(guó)家或部門需要準(zhǔn)確掌握國(guó)情、國(guó)力及資源狀況時(shí)實(shí)施普查法。3、方法:確定標(biāo)準(zhǔn)調(diào)查時(shí)點(diǎn)后對(duì)該時(shí)點(diǎn)內(nèi)的所有單位都實(shí)施調(diào)查。

(二)重點(diǎn)調(diào)查1、定義:在調(diào)查對(duì)象中選擇若干個(gè)在總體中占絕大比重的單位進(jìn)行的調(diào)查。例:(1)對(duì)全國(guó)2005年鋼鐵生產(chǎn)狀況調(diào)查。調(diào)查鞍鋼、上綱、武鋼、太鋼、寶鋼五大鋼鐵生產(chǎn)巨頭(2)陜西師范類院校生源狀況調(diào)查。調(diào)查陜師大、咸陽(yáng)師范學(xué)院、渭南師范等招生量大的院校2、適用的研究問題:調(diào)查目的只要求掌握總體的大體狀況,而總體中明顯存在若干能集中反映總體狀況的單位。

(三)抽樣調(diào)查1、定義:根據(jù)隨機(jī)原則從調(diào)查總體中抽取一定數(shù)量的單位進(jìn)行調(diào)查,然后由樣本信息推斷總體。例:中國(guó)西部地區(qū)成人受教育狀況調(diào)查普查、重點(diǎn)調(diào)查是否適用?2、適用的研究問題:調(diào)查目的只要求掌握總體的大體狀況,而在總體中不存在或不明顯存在若干個(gè)能集中反映總體狀況的單位。(四)典型調(diào)查1、定義:對(duì)調(diào)查對(duì)象進(jìn)行全面分析基礎(chǔ)上,有意識(shí)選擇部分典型單位進(jìn)行的調(diào)查。例:交通事故調(diào)查中,對(duì)某一重大事故的調(diào)查。2、適用的研究問題:對(duì)特殊事件或典型事例的分析。具體調(diào)查實(shí)例分析

1、2000年人口普查2、我國(guó)農(nóng)村社會(huì)經(jīng)濟(jì)狀況調(diào)查3、2008年1月南方地區(qū)受災(zāi)情況調(diào)查4、2008年1月28日秦嶺218國(guó)道客車事故原因調(diào)查5、中國(guó)0-14歲兒童智力狀況調(diào)查二、基本抽樣方法(一)簡(jiǎn)單隨機(jī)抽樣法1、定義:對(duì)總體單位不進(jìn)行分類或排序,完全按隨機(jī)法抽樣。2、適用研究問題:總體各單位特征差異較小,不存在類別差異。3、基本方法:(1)抽簽法:用簡(jiǎn)單簽條進(jìn)行抽樣,抽出的樣本誤較大。(2)隨機(jī)數(shù)字表法:用“隨機(jī)數(shù)字表”進(jìn)行抽樣,抽出的樣本誤較小。(3)計(jì)算機(jī)隨機(jī)抽樣法:在EXCEL軟件中用RAND()函數(shù)抽樣,抽出的樣本誤最小。**三種方法如何選擇?課堂演示:隨機(jī)數(shù)字表法**從50位同學(xué)中抽出10位同學(xué)進(jìn)行身高測(cè)量第一步,給50位同學(xué)進(jìn)行編號(hào)010203040506……50第二步,在隨機(jī)數(shù)字表中隨機(jī)確定一個(gè)查號(hào)起點(diǎn)第三步,從起點(diǎn)開始兩兩讀取數(shù)字,與編號(hào)相同的同學(xué)被抽中↗474373860136614698637162……抽中:4743013646……

(二)分層抽樣1、定義:按影響調(diào)查結(jié)果的某一標(biāo)志對(duì)總體進(jìn)行分層(類),在各層中進(jìn)行隨機(jī)抽樣。2、適用研究問題:總體各類別中存在有較大的特征差異。3、方法:(1)按影響調(diào)查結(jié)果的某一標(biāo)志對(duì)總體進(jìn)行分層,或按空間方位進(jìn)行分層。(2)確定總樣本量n(3)確定各層的抽樣數(shù)目n1

有兩種分配方法:等額分配法——ni=n/k

等比例分配法——ni=Ni/N*n(4)按簡(jiǎn)單隨機(jī)法在各層進(jìn)行抽樣。

n=Σni分層抽樣方法實(shí)例分析***企業(yè)技術(shù)工人素質(zhì)現(xiàn)狀調(diào)查,要求總樣本量為1500人1、按“企業(yè)類型”(國(guó)營(yíng)、合資、民營(yíng))分為3類(層)2、確定各類的抽樣數(shù)目n1

按等額分配法——ni=n/k=1500/3=500人

等比例分配法——ni=Ni/N*n??3、按簡(jiǎn)單隨機(jī)法在三類企業(yè)中各抽500名技術(shù)工人進(jìn)行調(diào)查

思考與討論企業(yè)某產(chǎn)品全國(guó)市場(chǎng)銷售狀況調(diào)查,要求樣本量為1000個(gè)銷售點(diǎn)。按什么分層?如何抽樣?(三)等距抽樣法1、定義:對(duì)總體單位進(jìn)行排序后,再每隔一定的間距進(jìn)行抽取樣本單位。2、適用研究問題:(1)總體各單位數(shù)值存在由大到小的順序差異。如:工資調(diào)查(2)總體各單位的位置自然處于排序狀態(tài)如:居民門牌號(hào)、企業(yè)自動(dòng)生產(chǎn)線上的產(chǎn)品。3、方法(1)無關(guān)標(biāo)志排隊(duì)等距抽樣法:指排隊(duì)標(biāo)志與調(diào)查內(nèi)容無關(guān)。例:對(duì)身高調(diào)查時(shí),按學(xué)號(hào)順序過程:A、按無關(guān)標(biāo)志對(duì)各單位進(jìn)行排隊(duì);

B、計(jì)算抽樣間距K=N/nN—總體單位數(shù),n–樣本數(shù)C、按間距K進(jìn)行抽樣(2)有關(guān)標(biāo)志排隊(duì)等距抽樣:指排隊(duì)標(biāo)志與調(diào)查內(nèi)容有關(guān)。(1)半距起點(diǎn)法:優(yōu)點(diǎn)是較簡(jiǎn)單,但僅能抽到一個(gè)樣本。

|——O——|——O——|——O——|——O——|——O——|——O——|

(2)對(duì)稱等距抽樣|—O———|———O—|—O———|———O—|—O———|———O—|等距抽樣實(shí)例分析**某小區(qū)共有1500戶居民,從中抽取300戶進(jìn)行家庭狀況調(diào)查。第一步,確定以“居民門牌號(hào)”為排對(duì)標(biāo)志第二步,計(jì)算抽樣間距

K=N/n=1500/300=5(戶)第三步,在第1間距內(nèi)任意取1戶為起點(diǎn)(如第3戶)進(jìn)行調(diào)查,再每隔5戶調(diào)查1戶(9、15、21……)。(四)整群抽樣法1、定義:將總體按某指標(biāo)分為若干部分(群),然后以“群”為單位進(jìn)行抽樣,對(duì)抽到“群”中的所有個(gè)體都進(jìn)行調(diào)查。如:以“班”為單位的抽樣調(diào)查2、適用研究問題:總體各單位自然成“群”。整群抽樣實(shí)例分析***“秦巴山區(qū)示范區(qū)兒童MR患病狀況調(diào)查”某鄉(xiāng)共有6個(gè)自然村,0-14歲兒童人數(shù)分別為190、134、116、106、144、175。要求該鄉(xiāng)抽取一半的村(3個(gè)村),共抽取430名兒童進(jìn)行調(diào)查。**練習(xí)用抽簽法或隨機(jī)數(shù)字表法進(jìn)行抽樣上機(jī)實(shí)踐操作2:

EXCEL軟件介紹EXCEL軟件抽樣法作業(yè)1:用EXCEL軟件從50個(gè)數(shù)字中隨機(jī)抽取15個(gè)數(shù)字.第二章(三)

第三節(jié)數(shù)據(jù)統(tǒng)計(jì)匯總

指在分組基礎(chǔ)上,對(duì)數(shù)據(jù)分布情況用表(頻數(shù)分布表)或圖(統(tǒng)計(jì)圖)進(jìn)行描述。本節(jié)重點(diǎn)掌握一、頻數(shù)分布表的編制方法二、直方圖制作方法一、頻數(shù)分布表(一)定義:指在統(tǒng)計(jì)分組基礎(chǔ)上,對(duì)附合各組特征的單位進(jìn)行分類匯總,形成總體各單位在各組中的分布,又稱分布數(shù)列。(二)一般形式:由三列組成

(三)類型1、單項(xiàng)數(shù)列(簡(jiǎn)單頻數(shù)分布表):一個(gè)變量值就是一組。適用于:品質(zhì)變量或離散型數(shù)值變量,數(shù)據(jù)類型較少時(shí)的數(shù)據(jù)

2、組距數(shù)列:按數(shù)值區(qū)間分組后形成的頻數(shù)分布表。適用于:離散型數(shù)值變量,數(shù)據(jù)類型較多的數(shù)據(jù);

連續(xù)型數(shù)值變量。

1、簡(jiǎn)單頻數(shù)分布表員工對(duì)主管盡職情況的評(píng)定人數(shù)比例%①非常不盡職②不盡職③不置可否④盡職⑤非常盡職911.253037.501012.502531.2567.50總計(jì)80100表3-180名員工對(duì)部門主管盡職程度調(diào)查結(jié)果2、組距式頻數(shù)分布表成績(jī)組中值頻數(shù)累積頻數(shù)95~97.52290~92.52485~87.53780~82.551275~77.582070~72.5113165~67.594060~62.554555~57.544950~52.525145~47.5152合計(jì)5252表3-2某班52名學(xué)生數(shù)學(xué)成績(jī)次數(shù)分布表組距式頻數(shù)分布表相關(guān)概念組上限—每組最大值組下限—每組最小值組距=組上限-下限組中值=(組上限+下限)/2缺下限組組中值=上限-鄰組組距/2

例:60以下缺上限組組中值=下限+鄰組組距/2例:90以上組上限——每組最大值組下限——每組最小值組距——組上限-下限(四)頻數(shù)分布表編制1、單項(xiàng)數(shù)列表編制用計(jì)算機(jī)自動(dòng)完成SPSS——》analysis——》descriptivestatistic——》frequency

2、組距數(shù)列表編制

(1)確定組數(shù)A、經(jīng)驗(yàn)法或行業(yè)約定法。例:對(duì)年齡的分組按人群特點(diǎn)分為嬰幼兒(0-6歲)、少年兒童(7-17歲)中青年(18-59歲)、老年(60歲以上)。B、正態(tài)分布數(shù)據(jù):斯特吉斯經(jīng)驗(yàn)公式法(Sturges’rule)。K=1+3.322log10nK——組數(shù)n—數(shù)據(jù)個(gè)數(shù)(2)計(jì)算組距等距數(shù)列d=(數(shù)據(jù)極大值-數(shù)據(jù)極小值)/K(3)確定各組上、下限第一組:下限=總體數(shù)據(jù)極小值-組距/2

上限=總體數(shù)據(jù)極小值+組距/2

其它組順延。(4)計(jì)算各組頻數(shù)、頻率、累積頻數(shù)、累積頻率、組中值頻數(shù)、頻率:按上限組不在內(nèi)原則進(jìn)行匯總。累積頻數(shù)、累積頻率:P24表2.10向下累積值意義——指達(dá)到本組上限以下的人數(shù)或比例。向上累積值意義——指達(dá)到本組下限以上的人數(shù)或比例。

組距數(shù)列表編制實(shí)例分析***50名工人,最少日加工零件數(shù)為107件,最多為139件,編制組距式頻數(shù)分布表(1)計(jì)算組數(shù):(2)計(jì)算組距d=(139-107)/7=5(3)確定第一組上、下限下限=107-5/2≌105上限=107+5/2≌110其它組順延。

二、頻數(shù)分布圖在編制頻數(shù)分布表的基礎(chǔ)上,可以繪制頻數(shù)分布圖,使一組數(shù)據(jù)特征更加直觀和概括,而且還可以對(duì)數(shù)據(jù)的分布情況和變動(dòng)趨勢(shì)作粗略的分析。繪制頻數(shù)分布圖可以用計(jì)算機(jī)程序,如EXCEL,也可以用專門的統(tǒng)計(jì)程序。1、頻數(shù)分布直方圖直方圖(histogram)又稱為等距直方圖,是以矩形的面積表示連續(xù)性隨機(jī)變量頻數(shù)分布的圖形。一般用縱軸表示數(shù)據(jù)的頻數(shù),用橫軸表示數(shù)據(jù)的等距分組點(diǎn),即各分組區(qū)間的上下限。直方圖是統(tǒng)計(jì)學(xué)中常用而且又有特殊意義的一種統(tǒng)計(jì)圖,有著重要的應(yīng)用價(jià)值。例:根據(jù)52個(gè)學(xué)生的數(shù)學(xué)成績(jī)所作直方圖圖3-152名學(xué)生數(shù)學(xué)成績(jī)分布的頻數(shù)直方圖4550556065707580859095100還可以做成下面這種形式圖3-252名學(xué)生數(shù)學(xué)成績(jī)頻數(shù)分布直方圖2、頻數(shù)分布多邊圖(折線圖)頻數(shù)分布多邊形圖(frequencypolygon)是一種表示連續(xù)性隨機(jī)變量次數(shù)分布的線形圖(折線圖)。繪制方法:以各分組區(qū)間的組中值為橫坐標(biāo),以各組的頻數(shù)為縱坐標(biāo),描點(diǎn);將各點(diǎn)以直線連接即構(gòu)成多邊圖形。當(dāng)N為無窮大時(shí),形成光滑線,即得分布曲線。**P26圖2.3正態(tài)、偏態(tài)分布(左、右偏的特點(diǎn))

圖3-352名學(xué)生數(shù)學(xué)成績(jī)分布圖人數(shù)圖3-452名學(xué)生數(shù)學(xué)成績(jī)分布圖人數(shù)成績(jī)利用頻數(shù)分布多邊圖(折線圖)還可以把幾組資料放在一起進(jìn)行比較。但需要注意的是,這時(shí)必須把數(shù)據(jù)的次數(shù)換算成百分比。圖3-52組數(shù)據(jù)的次數(shù)分布圖3、累積頻數(shù)分布圖根據(jù)累積頻數(shù),可以繪制累積頻數(shù)分布圖。累積頻數(shù)分布曲線當(dāng)數(shù)據(jù)的總數(shù)較多時(shí),將累積頻數(shù)分布圖中的橫坐標(biāo)以每一分組區(qū)間的精確上限或精確下限表示,縱坐標(biāo)以累積頻數(shù)表示,則可繪制累積頻數(shù)分布曲線,即累積曲線。圖3-8累積頻數(shù)分布曲線累積曲線可用于判斷一組數(shù)據(jù)的大致分布形態(tài)。圖3-9正態(tài)分布數(shù)據(jù)的累積曲線圖3-10正偏態(tài)數(shù)據(jù)累積曲線圖3-11負(fù)偏態(tài)數(shù)據(jù)累積曲線上機(jī)操作3某大學(xué)四年級(jí)80名學(xué)生的畢業(yè)成績(jī)?nèi)缦拢?/p>

56837668809269816278578171705966667561488450938272704984696693747069567468855397615258507393527465816853549568729482696066859057677582554668478957677551836855501、用SPSS編制單項(xiàng)數(shù)列表2、編制一個(gè)組距式頻數(shù)分布表,并用SPSS進(jìn)行頻數(shù)統(tǒng)計(jì)。第二章(四)

第四節(jié)統(tǒng)計(jì)圖制作

數(shù)據(jù)顯示包括了統(tǒng)計(jì)表與統(tǒng)計(jì)圖兩種主要形式,本節(jié)主要講述圖與表的配合使用及其制作。本節(jié)重點(diǎn)掌握:一、常用統(tǒng)計(jì)圖及其適用的數(shù)據(jù)類型二、不同類統(tǒng)計(jì)圖的計(jì)算機(jī)制作方法一、條形圖(barcharts)1、圖例:以各組代表值為X軸,以測(cè)量值為Y軸(柱狀圖);或以各組代表值為Y軸,以測(cè)量值為X軸(條形圖);2、適用資料類型:(1)同一總體,不同測(cè)量指標(biāo)值(標(biāo)準(zhǔn)分?jǐn)?shù))的比較;例:同班同學(xué)不同課程考試成績(jī)比較。(2)不同總體,同質(zhì)性測(cè)量指標(biāo)值間的比較。例:不同班級(jí)同一門課程考試成績(jī)的比較。

二、餅圖(pie)1、圖例:以各組數(shù)據(jù)值構(gòu)成餅圖各扇形面積,總面積之和為100%。

2、適用資料類型:(1)同一總體,不同部分所占比例的比較,用餅圖;(2)不同總體,同質(zhì)性部分所占比例的比較,用環(huán)形圖。例:兩個(gè)調(diào)查小組抽樣學(xué)生所占比例的相互比較。

三、線圖(line)1、圖例:以時(shí)間段為X軸,以測(cè)量值為Y軸。2、適用資料類型:隨時(shí)間變化的數(shù)據(jù),發(fā)展趨勢(shì)分析。

四、散點(diǎn)圖(scatterplots)1、圖例:以第一變量為X軸,第二變量為Y軸。2、適用資料類型:兩個(gè)變量相關(guān)關(guān)系趨勢(shì)分析。

上機(jī)實(shí)踐操作4:統(tǒng)計(jì)圖制作1、條形圖制作。用P59第1題制作2、餅圖制作用P61第6題數(shù)據(jù)制作。

第二章(五)

第五節(jié)數(shù)據(jù)分布集中趨勢(shì)測(cè)量

*意義:指計(jì)算一組數(shù)據(jù)的一般水平或中心值。*常用指標(biāo):包括算術(shù)平均數(shù)、中位數(shù)、眾數(shù)、加權(quán)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)等等。本節(jié)重點(diǎn)掌握一、不同類數(shù)據(jù)集中趨勢(shì)測(cè)量所使用的方法二、計(jì)算機(jī)常用集中趨勢(shì)測(cè)量操作方法一、算術(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticaverage

)一般簡(jiǎn)稱為平均數(shù)(average)或均數(shù)、均值(mean)。一般用M,或者用表示。算術(shù)平均數(shù)是最常用平均指標(biāo)1.算術(shù)平均數(shù)的計(jì)算公式原始數(shù)據(jù)計(jì)算公式(計(jì)算機(jī)編程公式)

(P322.3)Xi——每個(gè)樣本單位的原始測(cè)量值n——樣本量例:10位同學(xué)英語(yǔ)考試分?jǐn)?shù)為89、90、67、80、75、89、99、88、45、68則平均成績(jī)=(89+90+67+80+75+89+99+88+45+68)/10次數(shù)分布表計(jì)算公式(二手資料)(P322.4)Xi—每組的組中值f—每組的頻數(shù)用于從網(wǎng)上或期刊上查詢到的二手分組資料,無法得到原始數(shù)據(jù)的情況。表152名學(xué)生數(shù)學(xué)成績(jī)平均數(shù)計(jì)算表成績(jī)(1)Xif(2)f*Xi計(jì)算95-97.5219590-92.5218585-87.53262.580-82.55412.575-77.5862070-72.511797.565-67.59607.560-62.55312.555-57.5423050-52.5210545-47.5147.5合計(jì)523775.02、算術(shù)平均數(shù)的意義算術(shù)平均數(shù)是應(yīng)用最普遍的一種平均指標(biāo)。它是“真值”(truescore)的最佳估計(jì)值。真值是反映某種現(xiàn)象的真實(shí)水平的分?jǐn)?shù)。由于測(cè)量過程中的各種偶然因素的影響,真值往往很難得到。在實(shí)際測(cè)量中,往往采用“多次測(cè)量,取平均數(shù)”的方法,用平均數(shù)去估計(jì)真值。3、算術(shù)平均數(shù)的優(yōu)缺點(diǎn)

算術(shù)平均數(shù)具備一個(gè)良好的平均指標(biāo)所應(yīng)具備的一些特點(diǎn):反應(yīng)靈敏、有公式嚴(yán)密確定、簡(jiǎn)明易懂、適合代數(shù)運(yùn)算等等。主要不足:容易受兩極端數(shù)值的影響;一組數(shù)據(jù)中有模糊不清的數(shù)值時(shí)無法計(jì)算。4、計(jì)算和應(yīng)用算術(shù)平均數(shù)的原則(1)同質(zhì)性原則:算術(shù)平均數(shù)只能用于表示同類數(shù)據(jù)的集中趨勢(shì)。(2)平均數(shù)與個(gè)體數(shù)值相結(jié)合的原則:在解釋個(gè)體特征時(shí),既要看平均數(shù),也要結(jié)合個(gè)體的數(shù)據(jù)。(3)平均數(shù)與標(biāo)準(zhǔn)差、方差相結(jié)合原則:描述一組數(shù)據(jù)時(shí)既要分析其集中趨勢(shì),也要分析離散程度。(4)一般用于表示正態(tài)分布數(shù)據(jù)的集中趨勢(shì)。二、中位數(shù)中位數(shù)(median)又稱為中數(shù),是按順序排列的一組數(shù)據(jù)中位于中間位置的數(shù)。一般用Md或Mdn、Me表示。1、中位數(shù)的計(jì)算方法原始數(shù)據(jù)計(jì)算法(計(jì)算機(jī)編程公式)首先將一組數(shù)據(jù)按順序排列

(5個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):

2422212620排序: 2021222426位置:123 45中位數(shù)

22位置N+125+123

(6個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):105 91268排序: 56891012位置: 123

456位置N+126+123.5中位數(shù)8+928.5次數(shù)分布表計(jì)算法(二手資料)由次數(shù)分布表計(jì)算中位數(shù)需要用到累積次數(shù)分布表。當(dāng)表中數(shù)據(jù)的累積方向不同時(shí),計(jì)算公式也不同。由最低組至最高組(向下)累積頻數(shù)計(jì)算公式公式中:L為中位數(shù)所在組的下限

Sm-1為小于中位數(shù)所在組下限各組的累積頻數(shù)

n為數(shù)據(jù)總和

fm為中位數(shù)所在組的頻數(shù)

i為中位數(shù)組的組距中位數(shù)組:指由最低組向最高組累積,達(dá)到次數(shù)半值的組

(P312.2)表230名工人日加工零件中位數(shù)計(jì)算表組別f向下累積頻數(shù)80~3390~710100~1323110~528120~230

合計(jì)30計(jì)算表示:30名工人中,中等水平工人日加工零件數(shù)約為104件表352名學(xué)生數(shù)學(xué)成績(jī)中位數(shù)計(jì)算表成績(jī)頻數(shù)f累積頻數(shù)計(jì)算95~25290~25085~34880~54575~84070~113265~92160~51255~4750~2345~11合計(jì)522.中位數(shù)的特點(diǎn)及應(yīng)用中位數(shù)不受兩端極端數(shù)據(jù)的影響。一般用于下列情況:(1)數(shù)值數(shù)據(jù)型數(shù)據(jù)的有極端數(shù)據(jù)時(shí),即數(shù)據(jù)明顯為偏態(tài)分布,極差較大(偏峰分布);(2)一組數(shù)據(jù)中有個(gè)別數(shù)據(jù)不確切、不清楚時(shí);(3)用定序尺度測(cè)量的組距式數(shù)據(jù),即資料屬于等級(jí)性質(zhì)時(shí)。例:家庭人月均收入:(1)200-400;(2)400-600;(3)600-800;(4)800以上計(jì)算:當(dāng)?shù)刂械人郊彝サ娜司率杖胨?/p>

三.眾數(shù)眾數(shù)(mode)用Mo表示,有兩種定義:理論眾數(shù)是指與頻數(shù)分布曲線最高點(diǎn)相對(duì)應(yīng)的橫坐標(biāo)上的一點(diǎn);粗略眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)數(shù)。眾數(shù)也是一種平均指標(biāo),也可用來表示一組數(shù)據(jù)的集中趨勢(shì)。1.眾數(shù)的計(jì)算方法

(1)觀察法尋找粗略眾數(shù)未分組數(shù)據(jù):出現(xiàn)次數(shù)最多的數(shù)即為眾數(shù)。已分組(次數(shù)分布表)數(shù)據(jù):頻數(shù)最多那一組數(shù)據(jù)的組中值,即為眾數(shù)。(2)用次數(shù)分布數(shù)據(jù)精確計(jì)算眾數(shù)由最低組至最高組(向下)累積頻數(shù)計(jì)算公式

d1Mo=L+————×i(P292.1)d1+d2公式中:L—眾數(shù)組下限d1—眾數(shù)組頻數(shù)與其下限相鄰一組頻數(shù)之差d2-眾數(shù)組頻數(shù)與其上限相鄰一組頻數(shù)之差i—眾數(shù)組組距眾數(shù)組:指頻數(shù)最大的組表430名工人日加工零件眾數(shù)計(jì)算表組別f向下累積頻數(shù)80~3390~710100~1323110~528120~230

合計(jì)30計(jì)算粗略法:Mo=105精確法:d1Mo=L+————×id1+d213-7=100+————————×10

(13-7)+(13-5)

=104.29表示:30名工人中,大多數(shù)工人日加工零件數(shù)約為104件.表652名學(xué)生數(shù)學(xué)成績(jī)中位數(shù)計(jì)算表成績(jī)頻數(shù)f9529028538057587011659605554502451合計(jì)52粗略法:Mo=72.5精確法:d1Mo=L+————×id1+d211-9=70+————————×5

(11-9)+(11-8)

=72

(眾數(shù)的不唯一性)無眾數(shù)

原始數(shù)據(jù):10591268一個(gè)眾數(shù)

原始數(shù)據(jù):6

598

55多于一個(gè)眾數(shù)

原始數(shù)據(jù):

25

282836

42422.眾數(shù)的應(yīng)用(1)數(shù)值型數(shù)據(jù),數(shù)據(jù)明顯為偏態(tài)分布,極差較?。夥宸植迹唬?)社會(huì)經(jīng)濟(jì)現(xiàn)象中不宜用均值作為一般水平的現(xiàn)象。如:車輛調(diào)度、服裝加工等

(3)用定序尺度測(cè)量的組距式數(shù)據(jù)例:家庭人月均收入:(1)200-400;(2)400-600;(3)600-800;4)800以上計(jì)算:當(dāng)?shù)卮蠖鄶?shù)家庭的人月均收入水平

3眾數(shù)、中位數(shù)和均值的關(guān)系及應(yīng)用對(duì)稱分布

均值=中位數(shù)=眾數(shù)(負(fù))左偏分布均值

中位數(shù)

眾數(shù)(正)右偏分布眾數(shù)

中位數(shù)

均值正態(tài)分布數(shù)據(jù)——一般選用均值作為平均指標(biāo),表示平均水平偏態(tài)分布數(shù)據(jù)——極差太大時(shí),選用中位數(shù)作為平均指標(biāo),表示中等水平偏態(tài)分布數(shù)據(jù)——極差較小時(shí),選用眾數(shù)作為平均指標(biāo),表示大多數(shù)個(gè)體的水平綜合練習(xí):2004年,對(duì)某市500戶居民家庭月收入抽樣調(diào)查數(shù)據(jù)見下表。求:(1)本市居民家庭平均月收入(2)本市大多數(shù)居民家庭月收入(3)本市中等水平居民家庭月收入四、其它平均指標(biāo)(了解)除了算術(shù)平均數(shù)、中位數(shù)和眾數(shù)以外,在應(yīng)用中還有一些其它平均指標(biāo)。這些統(tǒng)計(jì)指標(biāo)可以從其它角度描述一組數(shù)據(jù)的集中趨勢(shì)。1.加權(quán)平均數(shù)加權(quán)平均數(shù)是不同比重?cái)?shù)據(jù)(或平均數(shù))的平均數(shù),一般用表示。計(jì)算公式:

***用于計(jì)算某單位由不同權(quán)重的項(xiàng)目分組成的總項(xiàng)目得分。

**用于計(jì)算由不同調(diào)查小組調(diào)查的平均成績(jī)計(jì)算總體平均成績(jī)。

2.幾何平均數(shù)幾何平均數(shù)(geometricmean)是n個(gè)數(shù)值連乘積的n次方根,用或表示。計(jì)算公式為用于社會(huì)現(xiàn)象中求平均發(fā)展速度P35(2.6)幾何平均數(shù)的變式兩邊取對(duì)數(shù),得注意:幾何平均數(shù)計(jì)算的是平均的變化情況,如果要計(jì)算平均增長(zhǎng)率,需要從幾何平均數(shù)中減去基數(shù)1。第二章(五)

第五節(jié)數(shù)據(jù)離散趨勢(shì)測(cè)量

*意義:離散趨勢(shì)測(cè)量是描述一組數(shù)據(jù)中,每個(gè)觀察值偏離平均值的狀況,即數(shù)據(jù)的變異性。*常用指標(biāo):包括極差、方差、標(biāo)準(zhǔn)差、離散系數(shù)等。特殊指標(biāo)有百分位差、四分位差、平均差等本節(jié)重點(diǎn)掌握不同類數(shù)據(jù)離散趨勢(shì)測(cè)量所使用的方法計(jì)算機(jī)常用離散趨勢(shì)測(cè)量操作方法一、極差(Rang)是一組數(shù)據(jù)中最大值與最小值之差,又稱全距。用R表示。(一)計(jì)算原始數(shù)據(jù):

R=max(xi)-min(xi)(P392.8)頻數(shù)分布數(shù)據(jù):最高組與最低組組中值之差,或者最高組上限與最低組下限之差。(二)適用資料用于表示偏態(tài)分布數(shù)據(jù)的離散狀況。

二、方差和標(biāo)準(zhǔn)差

方差(Variance):是指離差平方的算術(shù)平均數(shù),即一組數(shù)據(jù)中每個(gè)數(shù)據(jù)與該組平均數(shù)之差,平方之,再求和,再除以數(shù)據(jù)的個(gè)數(shù),總體用σ2

表示,樣本用S2

表示。

離均差平方和樣本總數(shù)標(biāo)準(zhǔn)差(Standarddeviation

):是指離差平方和平均后的方根。即方差的平方根。用總體σ表示,樣本用s(或SD)表示。

意義:標(biāo)準(zhǔn)差的值越大,表明這組數(shù)據(jù)的離散程度越大。(一)總體方差和標(biāo)準(zhǔn)差計(jì)算方法原始數(shù)據(jù)計(jì)算法頻數(shù)分布表計(jì)算法注意比較(二)樣本方差和標(biāo)準(zhǔn)差計(jì)算方法原始數(shù)據(jù)計(jì)算法(P402.102.12)頻數(shù)分布表計(jì)算法(P412.112.13)注意比較分?jǐn)?shù)組中值xffXfX245--47.5147.5147.521σ2=148506.3/37-(2290/37)2=183.078σ=13.53R=87.5-47.5=4050--52.5252.5252.52255--57.5057.5057.52060--62.5262.5262.52270--67.5367.5367.52375--77.5877.5877.52380--82.5782.5782.52785--87.5787.5787.527總和372290.0148506.3例:全班37個(gè)學(xué)生數(shù)學(xué)分?jǐn)?shù)標(biāo)準(zhǔn)差、極差的計(jì)算表(三)標(biāo)準(zhǔn)差的特點(diǎn)及適用資料特點(diǎn):(1)有單位,與測(cè)量指標(biāo)單位相同。(2)有正、負(fù),+說明高于均值,-表示低于均值適用資料:用于表示正態(tài)分布數(shù)據(jù)的離散程度。

三、離散系數(shù)(Coefficientofvariation)離散系數(shù):是指標(biāo)準(zhǔn)差與算術(shù)平均數(shù)的百分比。它是沒有單位的相對(duì)數(shù)。計(jì)算公式:或離散系數(shù)越大,表明離散程度越大。離散系數(shù)的用途1、比較不同單位資料的離散程度例:對(duì)全班同學(xué)體重測(cè)量得到的標(biāo)準(zhǔn)差為18kg,身高測(cè)量得到的標(biāo)準(zhǔn)差為0.18m,對(duì)二者的離散程度進(jìn)行比較。能否直接比較?

2、對(duì)不同總體同一測(cè)量指標(biāo)的離散程度進(jìn)行比較。例:對(duì)全班同學(xué)體重測(cè)量,得到女生的標(biāo)準(zhǔn)差為6kg,男生測(cè)量得到的標(biāo)準(zhǔn)差為18kg,對(duì)二者的離散程度進(jìn)行比較。能否直接比較?

四其它離散程度測(cè)量指標(biāo)(了解)bi×f×NpLpp+=100Fb(一)百分位差含義:用兩個(gè)百分位數(shù)之間的距離表示差異量。百分位數(shù)的計(jì)算:Pp所求的第P個(gè)百分位數(shù)Lb百分位數(shù)所在組的精確下限

f百分位數(shù)所在組的次數(shù)Fb小于Lb的各組的次數(shù)N總次數(shù)i組距例:某鄉(xiāng)農(nóng)戶家庭收入調(diào)查結(jié)果

收入戶數(shù)向下累計(jì)5000以下6000-70007000-80008000-90009000-1000010000以上合計(jì)15030060045020010018001504501050150017001800求P25P25的位置:N*25%=1800*25%=450第2組P25=6000+(450-150)*1000/300=7000元意義:表示當(dāng)?shù)卮迕裰杏?5%的農(nóng)戶家庭收入在7000元以下(二)四分位差為了避免全距受兩極端數(shù)值影響的缺點(diǎn),則用按一定順序排列的一組數(shù)據(jù)中間部位50%個(gè)頻數(shù)距離的一半作為差異量指標(biāo),即四分位距。用Q表示。Q3:第三個(gè)四分位數(shù)Q1:第一個(gè)四分位數(shù)213QQQ-=四分差計(jì)算方法1(未分組資料)213QQQ-=Q1的位置:(N+1)/4Q3的位置:3(N+1)/4例:10名同學(xué)社會(huì)學(xué)考試成績(jī)?yōu)?/p>

55、60、70、72、75、80、83、88、90、92求:四分位差

Q1的位置:(10+1)/4=2.75Q3的位置:3(10+1)/4=8.25Q1=X2+0.75(X3-X2)=60+0.75(70-60)=67.5Q3=X8+0.25(X9-X8)=88+0.25(90-88)=88.5Q=(88.5-67.5)/2=10.5分

四分差計(jì)算方法2:分組資料213QQQ-=1)4(xxQxQxfiFNLQ-+=例:某鄉(xiāng)家戶家庭收入調(diào)查結(jié)果

收入戶數(shù)向下累計(jì)5000以下6000-70007000-80008000-90009000-1000010000以上合計(jì)15030060045020010018001504501050150017001800求四分位差Q1的位置:N/4=1800/4=450第2組Q3的位置:3N/4=1350第4組Q1=6000+(450-150)/300*1000=7000Q3=8000+(1350-1050)/450*1000=8666.7Q=(Q3-Q1)/2=833.35元(三)平均差是次數(shù)分布中所有原始數(shù)據(jù)與平均數(shù)絕對(duì)離差的平均值。

AD=nXX||-SnX|Xc|-Sf

AD=平均差的優(yōu)點(diǎn):表示每一個(gè)數(shù)據(jù)與平均數(shù)的偏離程度,較好的反映的數(shù)據(jù)分散程度。平均差的缺點(diǎn):取絕對(duì)值,不利于進(jìn)一步的計(jì)算,所以使用較少。

五、標(biāo)準(zhǔn)差的應(yīng)用

(一)計(jì)算標(biāo)準(zhǔn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論