版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章:?jiǎn)巫兞棵枋鼋y(tǒng)計(jì)分析(上)第一節(jié)分布、頻數(shù)、頻率、比率第二節(jié)統(tǒng)計(jì)表第三節(jié)統(tǒng)計(jì)圖社會(huì)學(xué)工作者為了從經(jīng)驗(yàn)層次上證實(shí)自己在研究中所建立的概念、假設(shè)和理論,一是要正確的收集資料或數(shù)據(jù),二是要學(xué)會(huì)正確的處理這些數(shù)據(jù)。本章介紹的內(nèi)容就是從原始資料加工開始,研究單變量的情況,它包括分布、統(tǒng)計(jì)表、統(tǒng)計(jì)圖、集中趨勢(shì)和離散趨勢(shì)的分析,也就是對(duì)單變量特征的統(tǒng)計(jì)分析。單變量情況舉例1、某城市居民中有多少種民族?各占比例多少?2、女性一般在什么年齡結(jié)婚?3、某社區(qū)有多少違法者,其中多少是初犯,多少是屢犯?4、歷屆奧林匹克男子跳高冠軍所跳的高度是如何分布的?要對(duì)這些社會(huì)現(xiàn)象或變量進(jìn)行描述,我們通常有三種辦法,一是計(jì)算(compute)數(shù)據(jù),二是為數(shù)據(jù)制作一個(gè)表(table),即統(tǒng)計(jì)表,三是為數(shù)據(jù)制作制作一個(gè)圖(graph),即統(tǒng)計(jì)圖。第一節(jié)分布:頻數(shù)、頻率、比率社會(huì)統(tǒng)計(jì)學(xué)里分布(distribution)指的是一個(gè)變量的不同取值出現(xiàn)的情況,可以用頻數(shù)、頻率、百分比、比率等指標(biāo)來(lái)進(jìn)行表示。
一、頻數(shù)(frequency
)一個(gè)概念或變量的各個(gè)情況出現(xiàn)的次數(shù)或頻次,所以又稱頻數(shù)分布或頻次分布(frequencydistribution),簡(jiǎn)稱頻數(shù)或頻次。需要注意兩個(gè)問(wèn)題:(1)變量的取值必須滿足兩個(gè)條件,一是窮盡性,二是互斥性。窮盡性也叫完備性是指必須把變量的所有取值都列舉出來(lái),只有這樣才能對(duì)所有的調(diào)查對(duì)象進(jìn)行歸類?;コ庑允侵缸兞康拿總€(gè)取值都不能有交叉,從而使每個(gè)調(diào)查對(duì)象僅能歸入一類。大家看下面兩個(gè)表格分別有什么問(wèn)題?表1、工廠規(guī)模頻數(shù)分布表表2、收入頻數(shù)分布表(2)頻數(shù)分布可以用來(lái)描述全部四種層次的變量,定類(性別、婚姻狀況),定序(受教育程度),而對(duì)于定距變量(智商、溫度)和定比變量(收入、年齡),由于其取值一般很多,甚至難以窮盡,所以其頻數(shù)分布通常以分組的形式給出,我們稱為組距式分類。家庭結(jié)構(gòu)分布表家庭結(jié)構(gòu)類型頻數(shù)核心家庭1050直系家庭720聯(lián)合家庭110其他250合計(jì)2130某企業(yè)就業(yè)人員學(xué)歷分布表學(xué)歷頻數(shù)初中80高中50大學(xué)70合計(jì)200某班學(xué)生的年齡分布表年齡(歲)人數(shù)(頻數(shù))17101825195020402120225合計(jì)15072名離婚者婚齡統(tǒng)計(jì)表婚齡人數(shù)1-354-6107-92010-121413-15916-18419-21322-24225-27428-301合計(jì)72二、頻率或比例
(relativefrequencydistribution)表3、兩個(gè)假想社區(qū)中違法者和非違法者的頻數(shù)分布表研究對(duì)象社區(qū)1社區(qū)2違法者
初犯者5868屢犯者43137非違法者4811081總和5821286表4、兩個(gè)假想社區(qū)中違法者和非違法者的頻率分布表研究對(duì)象社區(qū)1社區(qū)2違法者
初犯者0.1000.053屢犯者0.0740.107非違法者0.8260.841總和1.0001.001由于有四舍五入的誤差,社區(qū)2的比例總和不是1.有時(shí)人們希望數(shù)據(jù)處理的結(jié)果使總和正好等于1.000,這就要對(duì)某些類別的比例進(jìn)行調(diào)整,按照慣例,我們一般是改變包含最大個(gè)案比例的類別中的數(shù)字,這樣做的原因是在較大的比例中改變小數(shù)點(diǎn)后最后一位的數(shù)目所造成的影響要比在較小的比例中做同樣改變所造成的影響小。這樣,社區(qū)2中非違法者的比例可以改為0.840,那么所得的總和便為1了。概念小結(jié):將每個(gè)變量值出現(xiàn)的頻數(shù)除以樣本容量,就得到該變量值在樣本中的相對(duì)頻數(shù)或者比例或者叫做頻率,將該頻率表示成百分?jǐn)?shù)形式就得到它的百分比分布。比例乘以100即可得到百分比,其含義是我們將類別的容量標(biāo)準(zhǔn)化為100,然后計(jì)算每一類別中不同變量取值的數(shù)目。我們?cè)趯?shí)際報(bào)告結(jié)果的時(shí)候,百分比要比比例多。
表5、某社區(qū)三個(gè)心理衛(wèi)生中心的個(gè)案數(shù)目和百分比分布表思考:從表中你可以得出哪些結(jié)論?類別A中心B中心C中心總和頻數(shù)百分比%頻數(shù)百分比%頻數(shù)百分比%頻數(shù)百分比%已婚者6347.38845.54136.619243.8離婚者1914.33719.22623.38218.7訂婚者2720.32010.41513.46214.2未婚母親139.83216.62118.86615.1其他118.3168.398.0368.2總和113100.0193100.0112100.0438100.0使用百分比要遵循兩條規(guī)則:(1)一定要在百分比或比例的旁邊列出個(gè)案的數(shù)目;(2)只有在百分比基數(shù)(分母)的個(gè)案數(shù)目達(dá)到50個(gè)左右才能使用百分?jǐn)?shù)。如果個(gè)案數(shù)目很少,最好直接用每個(gè)類別的個(gè)案數(shù)目而不用百分?jǐn)?shù)。
譬如假定D中心總共有25個(gè)個(gè)案,其中有4個(gè)未婚母親和7個(gè)訂婚者,那么這兩類所占的百分比就分別為16%和28%,由于許多人習(xí)慣只看百分比而不看實(shí)際的個(gè)案數(shù)目,很容易造成一種印象,就是以為訂婚者比未婚母親多得的。我們?cè)谝院笥懻撏普摻y(tǒng)計(jì)時(shí)可以看到,4個(gè)個(gè)案和7個(gè)個(gè)案之間的差別很可能是由于隨機(jī)現(xiàn)象的偶然性因素引起的。所以我們可以直接說(shuō)D中心有4個(gè)未婚母親和7個(gè)訂婚者。百分比可以從兩個(gè)方向進(jìn)行計(jì)算:上面的表格顯示出每一中心各自的情況,使我們可以看出各類個(gè)案的情況,也可以就某一類別在三個(gè)中心之間進(jìn)行比較。如果我們的興趣主要在某一類型的個(gè)案以及各中心的該類型個(gè)案的相對(duì)數(shù)目,比如我們想了解所有已婚者去B中心的百分比,在這種情況下,我們就需要橫向的計(jì)算百分比。我們?nèi)∫鸦檎叩目偤?,由此決定A中心、B中心和C中心在該類別上所占的百分比分別是多少。各百分比橫向(而不是縱向)相加應(yīng)等于100,結(jié)果如下表:表6、某社區(qū)三個(gè)心理衛(wèi)生中心的橫向計(jì)算的百分比分布*基數(shù)少于50則不計(jì)算百分比。三、比率定義:數(shù)目A對(duì)數(shù)目B的比率被定義為A除以B。這里關(guān)鍵是“對(duì)”這個(gè)詞。這個(gè)詞前面的數(shù)是分子,后面的數(shù)是分母。假定在地方選舉中作為選民登記的有365個(gè)共和黨人,420個(gè)民主黨人,130個(gè)無(wú)黨派者,則共和黨人對(duì)民主黨人的比率為365/420;共和黨人與民主黨人對(duì)無(wú)黨派者的比率為(365+420)/130。注意,比率可以取大于1的值,這點(diǎn)與比例不同。比率與比例的關(guān)系比例是比率的一個(gè)特殊類型,即分母是個(gè)案的總數(shù),分子是這個(gè)總數(shù)的一部分。一般來(lái)講,比率這一術(shù)語(yǔ)通常是指這種情況:分子和分母為各不相干的兩個(gè)類別。假如我們知道一個(gè)公司男職員對(duì)女職員的比率是3:1,那么我們可以知道,每4個(gè)人里面就有3個(gè)男的1個(gè)女的,因此男人的比例是75%。比率的分母或者基數(shù)可以是任何方便的數(shù)字。比如民主黨人對(duì)無(wú)黨派者的比率420/130可以寫成3.23比1;比如性別比一般由每100個(gè)女人中有多少男人來(lái)表示。所以性別比為94表示男人略少于女人,出生嬰兒性別比為129則表示男嬰兒數(shù)量上更有優(yōu)勢(shì)?;鶖?shù)為1,000或100,000這樣的大數(shù)時(shí),常使用比率的另一種類型——率(rate),這種情況下使用比例或百分比會(huì)得出極小極小的小數(shù)。
增長(zhǎng)率是比率的另一種常用的類型。在計(jì)算這種率時(shí)我們用一段時(shí)期內(nèi)實(shí)際增加的數(shù)量除以這段時(shí)期開始時(shí)的數(shù)量。對(duì)增長(zhǎng)率來(lái)說(shuō)如果用百分比來(lái)表示則可能超過(guò)百分之百,如果增長(zhǎng)的趨勢(shì)是逆向的,也可能是負(fù)數(shù)。比如:中國(guó)在2004年的人口自然增長(zhǎng)率是5.9/1000;印度為15.8;俄羅斯為-5.9.有報(bào)道稱,1992年巴塞羅那奧運(yùn)會(huì)舉辦前后,其房地產(chǎn)價(jià)格增長(zhǎng)了250~300%作業(yè)與練習(xí)見(jiàn)公共郵箱第二節(jié)統(tǒng)計(jì)表所謂統(tǒng)計(jì)表就是用表格形式來(lái)表示變量的分布,它不需要文字?jǐn)⑹?,就能反映出資料的特性以及資料之間的關(guān)系,方便我們對(duì)統(tǒng)計(jì)資料進(jìn)行查對(duì)、比較、分析和記憶。一、統(tǒng)計(jì)表的格式、內(nèi)容、種類格式:表號(hào)、總標(biāo)題、橫行標(biāo)題、縱欄標(biāo)題、統(tǒng)計(jì)數(shù)值;內(nèi)容:主詞和賓詞;種類:簡(jiǎn)單表;簡(jiǎn)單分組表;復(fù)合分組表。一個(gè)完整的統(tǒng)計(jì)表應(yīng)該具備的內(nèi)容有:(1)標(biāo)題部分;(2)欄目部分;(3)線格部分;(4)數(shù)字部分;(5)其他要點(diǎn)。不同層次變量統(tǒng)計(jì)表的特點(diǎn)1、定類變量表1、家庭結(jié)構(gòu)分布表
(××地,2007年8月)家庭結(jié)構(gòu)類型頻數(shù)百分比核心家庭105049.3直系家庭72033.8聯(lián)合家庭1105.2其他25011.7∑2130100.0資料來(lái)源:《社會(huì)統(tǒng)計(jì)學(xué)》(第三版)盧淑華編著,第24頁(yè)。2、定序變量定序變量統(tǒng)計(jì)表內(nèi)容、制作方法與定類變量相同。所不同的是,由于定序變量的取值有大小次序之分,因此在統(tǒng)計(jì)表制造時(shí),應(yīng)保留其變化趨勢(shì),不要任意打亂。表2、觀眾對(duì)武俠片的反應(yīng)統(tǒng)計(jì)喜愛(ài)程度頻數(shù)百分比非常愛(ài)看7017.9愛(ài)看9023.1一般10025.6不愛(ài)看10025.6很反感307.7總數(shù)39099.93、定距變量和定比變量對(duì)于定距變量,我們要區(qū)分它是連續(xù)型定距變量還是離散型定距變量。離散型變量的制表方法一般與定序變量的制表方法相同。統(tǒng)計(jì)表的變量數(shù)值按取值的大小排列,不要任意打亂。A、如果變量的取值有限,則可以采用一一列舉的方式進(jìn)行統(tǒng)計(jì)表的制作。B、如果變量取值的變化幅度過(guò)大,如果一一列舉,勢(shì)必形成很長(zhǎng)的分類,而每一類的頻數(shù)又變的很少。這種情況下適宜采用組距式統(tǒng)計(jì)表,即分段統(tǒng)計(jì)。(2)對(duì)于連續(xù)型變量,由于任意兩變量之間的取值都是無(wú)窮的,而且從原則上講沒(méi)有任意兩個(gè)觀察值是絕對(duì)相等的,所以我們沒(méi)有辦法采用一一列舉的辦法使每個(gè)取值對(duì)應(yīng)某個(gè)確定的頻數(shù),解決的辦法只能是將變量值進(jìn)行分組,制作組距式統(tǒng)計(jì)表。二、統(tǒng)計(jì)表的制作方法(1)組數(shù)(intervals):一般調(diào)查總數(shù)N與分組數(shù)有如下經(jīng)驗(yàn)性關(guān)系:表3調(diào)查總數(shù)N分組數(shù)K50-1006-10100-2507-12250以上10-20(2)等距(equallength)和非等距或異距(unequallength)分組一般來(lái)說(shuō)都是采用等距分組。但在社會(huì)學(xué)中,也并非全部都是等距分組更能反映現(xiàn)象本質(zhì)的。當(dāng)然非等距分組會(huì)給比較或作圖帶來(lái)一定困難,為了消除此影響,確切反映各組頻數(shù)的實(shí)際分布狀況,可以計(jì)算頻數(shù)密度或標(biāo)準(zhǔn)組距頻數(shù)。具體方法可以參考教材P37頁(yè)。(3)開口組(open-ended)跟閉口組(close-ended)如果觀察值或測(cè)量值中有少數(shù)非常大或非常小的值,我們叫做極端值,這些值遠(yuǎn)離大部分?jǐn)?shù)據(jù)集中的位置,這時(shí)可以用開口組,比如首組“向下開口”或者末組“向上開口”;使用開口組的另一個(gè)原因是對(duì)信息的保密。(4)如何決定分點(diǎn)的精度(degreeofaccuracy)隨著精度的提高,分組點(diǎn)(limits)的精度也要提高。一般分組點(diǎn)比原統(tǒng)計(jì)資料的精度要高一位。如統(tǒng)計(jì)資料的精度為整數(shù),則分組點(diǎn)就取小數(shù)點(diǎn)后面一位計(jì)算。舉例來(lái)說(shuō),原統(tǒng)計(jì)資料的年齡以年計(jì)算,統(tǒng)計(jì)范圍為1歲-8歲,2歲一個(gè)分組,即有1-2歲,3-4歲,5-6歲,7-8歲4個(gè)分組,為此應(yīng)在上述分組值加減0.5歲,得:0.5-2.5歲;2.5-4.5歲;4.5-6.5歲;6.5-8.5歲。前者稱為標(biāo)明組界(statedlimits);后者稱為真實(shí)組界(truelimits)。試比較上述資料兩種組界定義的不同:表4可見(jiàn),真實(shí)組界值是相鄰兩組標(biāo)明組界值的中點(diǎn),它的精度比標(biāo)明組界要高一位,組與組的分界是連續(xù)的,而標(biāo)明組界則是離散的。標(biāo)明組界只是分組資料的簡(jiǎn)化表示,在實(shí)際運(yùn)算時(shí),都要用到真實(shí)組界。標(biāo)明組界真實(shí)組界1-20.5-2.53-42.5-4.55-64.5-6.57-86.5-8.5利用原始數(shù)據(jù)資料制作組距式統(tǒng)計(jì)表呢?有兩種方法,一種是計(jì)算法;另一種是經(jīng)驗(yàn)法。我們分別來(lái)舉例說(shuō)明。1、計(jì)算法步驟1、收集數(shù)據(jù),寫成10×10數(shù)據(jù)表,數(shù)據(jù)總數(shù)N=100(數(shù)據(jù)單位“cm”)步驟2、找出數(shù)據(jù)中最大值L,最小值S,計(jì)算極差R(range)即最大值與最小值之差。先在數(shù)據(jù)表內(nèi)找出各列最大值,在數(shù)據(jù)旁邊用▲表示,然后找出全體數(shù)據(jù)的最大值L;同樣先在數(shù)據(jù)表內(nèi)找出各列最小值,在數(shù)據(jù)旁邊用×表示,然后確定全體數(shù)據(jù)的最小值S。
R=L-S=194-149=45步驟3、把數(shù)據(jù)分組(groupingthedata),假如取組數(shù)K=10;步驟4、計(jì)算組距(classinterval)hh=R/K=45/10=4.5≈5步驟5、根據(jù)組距h和分點(diǎn)精度比原統(tǒng)計(jì)數(shù)據(jù)精度高一位的原則,將數(shù)據(jù)分為K組;
148.5~153.5;153.5~158.5;……193.5~198.5步驟6、計(jì)算各組的組中值(midpoint)bi;中心值是每組中間的數(shù)值,可按下式計(jì)算:
bi=(第i組真實(shí)下界值+第i組真實(shí)上界值)/2
于是各組的中心值有:151,156,161,166,171,176,181,186,191,196步驟7、用唱票的方法畫“正”字,進(jìn)行頻數(shù)統(tǒng)計(jì),作統(tǒng)計(jì)表。表5、100名男性青年的身高統(tǒng)計(jì)表組號(hào)i標(biāo)明組界真實(shí)組界中心值bi頻數(shù)統(tǒng)計(jì)頻數(shù)頻率1149~153148.5~153.515120.022154~158153.5~158.5156正50.053159~163158.5~163.5161120.124164~168163.5~168.5166正正正正正250.255169~173168.5~173.5171280.286174~178173.5~178.5176170.177179~183178.5~183.518170.078184~188183.5~188.518630.039189~193188.5~193.519100.0010194~198193.5~198.5196一10.01總和∑=1001.002、經(jīng)驗(yàn)法即我們按照某些慣例、習(xí)慣或研究者的方便來(lái)確定組距的情況。比如我們經(jīng)常使用5、10、20等整數(shù)作為組距;人口學(xué)通常以5歲為一組進(jìn)行統(tǒng)計(jì);學(xué)生的成績(jī)通常以10為組距,比如60-69為及格;70-79為中;80-89為良;90-100為優(yōu)秀等。表6、1992年美國(guó)生育嬰兒的母親年齡統(tǒng)計(jì)表母親年齡標(biāo)明組界真實(shí)組界組距組中值新生嬰兒數(shù)(千)20歲以下?-19?-19.5??51820-2420-2419.5-24.55221,07025-2925-2924.5-29.55271,17930-3430-3429.5-34.553289535-3935-3934.5-39.553734540歲及以上40-?39.5-???58∑4,065來(lái)源:《美國(guó)統(tǒng)計(jì)摘要》(1995年)第74頁(yè)。三、累計(jì)表(cumulativetables)所謂累計(jì)表表示的是大于某個(gè)變量值的頻數(shù)或頻次是多少或小于某個(gè)變量值的頻數(shù)、頻率是多少。累計(jì)頻數(shù)一般用大寫字母F來(lái)表示。累計(jì)又分向上累計(jì)cf↑和向下累計(jì)cf↓兩種。(1)對(duì)于列舉變量取值式累計(jì)統(tǒng)計(jì)表來(lái)說(shuō),向上累計(jì)cf↑表示小于等于某組上限的累計(jì)頻數(shù);向下累計(jì)cf↓表示大于等于某組下限的累計(jì)頻數(shù)。表7、頻數(shù)分布與累計(jì)頻數(shù)分布家庭子女?dāng)?shù)頻數(shù)向上累計(jì)cf↑向下累計(jì)cf↓0222+10=12132+3=53+7=10233+5=83+4=7322+8=102+2=4411+10=111+1=2511+11=121(2)對(duì)于組距式統(tǒng)計(jì)表來(lái)說(shuō),向上累計(jì)cf↑表示小于等于某組上限的累計(jì)頻數(shù);向下累計(jì)cf↓表示大于等于某組下限的累計(jì)頻數(shù)。同理,如果把頻數(shù)換成頻率,則用c%↑或c%↓來(lái)表示。累計(jì)表的應(yīng)用,在于通過(guò)它可以比較個(gè)體在總體中的位置。比如甲、乙兩同學(xué)分布在班里都考得80分,那么誰(shuí)在班里的成績(jī)更好呢?假如甲、乙各自在班里的累計(jì)頻數(shù)cf↑分別為95和60,每個(gè)班都是100人;假如甲乙兩人都得80分,甲班200人,乙班100人,向上累計(jì)頻數(shù)甲為95,乙為60,誰(shuí)的成績(jī)更好一些?
累計(jì)頻數(shù)累計(jì)頻率成績(jī)甲班乙班甲班cf↑乙班cf↑甲班c%↑乙班c%↑60-695020502025%20%70-794540956048%60%80-8965301609080%90%90-994010200100100%100%合計(jì)200100
第三節(jié)統(tǒng)計(jì)圖統(tǒng)計(jì)圖就是用圖形的形式來(lái)表示變量的分布。它的優(yōu)點(diǎn)是比統(tǒng)計(jì)表更為直觀和形象、缺點(diǎn)是不及統(tǒng)計(jì)表精確。統(tǒng)計(jì)圖有很多種類,比如圓餅圖、條形圖、直方圖、折線圖、點(diǎn)線圖、盒形圖、莖葉圖、散點(diǎn)圖等,甚至地圖也可以視為統(tǒng)計(jì)圖的一種。目前階段,我們只要求掌握?qǐng)A餅圖、條形圖、直方圖和折線圖四種。不同層次的變量,適合選用不用的統(tǒng)計(jì)圖:定類、定序變量:圓餅圖、條形圖定距、定比變量:直方圖、折線圖一、圓餅圖(piegraph)圓餅圖也叫圓瓣圖,是將資料展示在一個(gè)圓平面上,通常用圓形代表現(xiàn)象的總體,用圓餅代表現(xiàn)象中一種情況,其大小代表變量取值在總體中所占的百分?jǐn)?shù)。圓餅圖的制作方法是將統(tǒng)計(jì)表中的百分?jǐn)?shù)乘以360度,即可得到各圓瓣的圓心角度數(shù)。表1、家庭結(jié)構(gòu)的百分?jǐn)?shù)分布及對(duì)應(yīng)圓心角度數(shù)家庭結(jié)構(gòu)頻數(shù)百分?jǐn)?shù)對(duì)應(yīng)圓心角度數(shù)核心家庭105049.3177.48°(=0.493×360°)直系家庭72033.8121.68°(=0.338×360°)聯(lián)合家庭1105.218.72°(=0.052×360°)其他25011.742.12°(=0.117×360°)圖1、家庭結(jié)構(gòu)分布圖°圓餅圖的優(yōu)缺點(diǎn)優(yōu)點(diǎn):(1)各變量取值的排列順序可以隨意;(2)易于顯示每一組的相對(duì)大小,并進(jìn)行比較;缺點(diǎn):(1)它只能顯示變量不同取值分別占的比例,不能很好的體現(xiàn)樣本容量,如果上例中樣本容量是213而不是2130,其得到的圓餅圖還是一樣的;(2)圓餅圖不適用分組太多的情況,如果分的塊非常多,而每一塊都非常小,就失去了原有的效果。所以多適用定類和定序變量。二、條形圖(bargraph)條形圖是用長(zhǎng)條的高度來(lái)表示資料類別的頻數(shù)或百分比;而長(zhǎng)條的寬度沒(méi)有意義,為了美觀起見(jiàn),一般都畫成等寬長(zhǎng)條。長(zhǎng)條既可以平行于橫軸,也可以平行于縱軸。如果是定類變量,圖形畫作離散的長(zhǎng)條;如果是定序變量,則長(zhǎng)條的排列次序應(yīng)該與變量取值次序相一致,圖形既可以畫作緊挨著的長(zhǎng)條,也可以是離散的長(zhǎng)條。圖2、家庭結(jié)構(gòu)分布條形圖圖3、某全校選修課的選課人數(shù)統(tǒng)計(jì)圖三、直方圖(Histogramgraph)直方圖只適用定距變量和定比變量。從圖形來(lái)看它也是由長(zhǎng)條所組成,但它與條形圖不同的是:(1)每一條Bar之間要連起來(lái),因?yàn)榻M與組之間實(shí)際上是連續(xù)的;(2)條形的寬度是有意義的,直方圖以面積(長(zhǎng)與寬的乘積)而不是高度來(lái)表示頻數(shù)或頻率分布。(3)條形的寬度表示組距(intervalwidth),條形的高度表示頻數(shù)密度或頻率密度。所有面積的和為樣本總量或者1。頻數(shù)密度=頻數(shù)/真實(shí)組距頻率密度=頻度/真實(shí)組距對(duì)于等距分組,用頻數(shù)或頻率作為條形高度,圖形的相對(duì)比例關(guān)系是不變的,仍然可以用頻數(shù)或頻率作為條形的相對(duì)高度;比如教材p40,圖3.1所示。但是在非等距分組情況下,如果用頻數(shù)作為條形高度,將會(huì)產(chǎn)生錯(cuò)誤。如教材圖3.2所示;所以用面積來(lái)表示各組的頻數(shù)分布就避免了不必要的錯(cuò)覺(jué)。此時(shí)長(zhǎng)條的高度不是頻數(shù)而是頻數(shù)密度。只有密度才能科學(xué)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年江蘇省南京市六年級(jí)語(yǔ)文上學(xué)期期末考試真題重組卷(統(tǒng)編版)-A4
- 《現(xiàn)代商務(wù)談判》課件
- PLC控制技術(shù)考試模擬題(附答案)
- 養(yǎng)老院老人權(quán)益保護(hù)制度
- 《動(dòng)物的權(quán)利》課件
- 2024年度影視作品拍攝模特選用合同3篇
- 教師網(wǎng)絡(luò)教學(xué)合同(2篇)
- 《藥品招商入門》課件
- 2025年肇慶大車貨運(yùn)資格證考試題
- 2024年版:股權(quán)轉(zhuǎn)讓合同模板(含代理?xiàng)l款)
- 家庭隔代教育知識(shí)講座
- 兵役法知識(shí)講座
- 魯教版(五四制)七年級(jí)數(shù)學(xué)上冊(cè)期末考試卷-附帶答案
- 動(dòng)車組轉(zhuǎn)向架檢修
- 2022管理學(xué)試題庫(kù)(馬工程)
- 化工與生活科學(xué)
- 聲音的共振與共鳴現(xiàn)象實(shí)驗(yàn)
- 2024北京西城區(qū)初二(上)期末道法試卷及答案
- 2024版國(guó)開電大??啤稒C(jī)電一體化系統(tǒng)》在線形考(形考任務(wù)1至4+實(shí)訓(xùn)作業(yè))試題及答案
- 空中交通管理基礎(chǔ) 課件 第1、2章 概論、機(jī)構(gòu)和設(shè)施
- 余華讀書分享+名著導(dǎo)讀《我們生活在巨大的差距里》
評(píng)論
0/150
提交評(píng)論