第六講-數(shù)據(jù)的統(tǒng)計圖及正態(tài)分布_第1頁
第六講-數(shù)據(jù)的統(tǒng)計圖及正態(tài)分布_第2頁
第六講-數(shù)據(jù)的統(tǒng)計圖及正態(tài)分布_第3頁
第六講-數(shù)據(jù)的統(tǒng)計圖及正態(tài)分布_第4頁
第六講-數(shù)據(jù)的統(tǒng)計圖及正態(tài)分布_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

社會統(tǒng)計學(xué)龍書ongshuqin@sina.com第六講:數(shù)據(jù)的統(tǒng)計圖及正態(tài)分布知識點一、相關(guān)圖形的含義及特征二、正態(tài)分布的特征;三、正態(tài)分布曲線下的面積;四、標(biāo)準正態(tài)分布;五、標(biāo)準正態(tài)分布表的使用;學(xué)習(xí)目標(biāo)了解條形圖、直方圖的意義掌握偏態(tài)、峰度的含義及其判斷掌握正態(tài)分布的特性;正態(tài)分布曲線下面積的含義;標(biāo)準分的計算和應(yīng)用;利用標(biāo)準正態(tài)分布表計算概率。一、基本的圖形分布1、餅圖(略)2、條形圖(Bargraphs)

就是用長條的高度來表示資料類別的次數(shù)或百分數(shù)。長條的寬度沒有意義,一般都畫成等寬長條。長條既可以平行于橫軸,也可以平行于縱軸。如果是定類變量,長條排列順序可以任意,條形是離散的如果是定序變量,長條按序排列,條形可以是離散的,也可以是緊挨著的3、直方圖(histograms)

從圖形來看,也是由緊挨著的長條所組成,但它與條形圖不同的是,直方圖的寬度是有意義的。一般而言:直方圖是以長條的面積(長乘寬的面積)來表示頻次或相對頻次;長條的長度(即縱軸高度)表示的是頻次密度(即單位組距所含有的頻次)或相對頻次密度(Relativefrequencydensity)直方圖僅適用于定距變量

用密度作為條形高度的原因在于,連續(xù)型定距變量可以采用非等距分組的緣故對于等距分組,用頻次或密度作為條形的高度,圖形的相對比例關(guān)系是不變的;在非等距分組的情況下,如果用頻次作為條形高度,就會產(chǎn)生錯誤,如右表:婚齡組(歲)頻次(人)……26-2730……40-5035……如果根據(jù)頻次來比較,就會得出40-50歲結(jié)婚的人比26-27歲結(jié)婚的人還多的結(jié)論?這個結(jié)論正確嗎?26-27歲結(jié)婚的人的頻次密度遠比40-50歲之間的頻次密度高26-274050頻次密度年齡4、折線圖如果用直線連接直方圖中條形頂端的中點,就得到了折線圖。對于離散型定距變量,將變量值、頻數(shù)對(x,n)的結(jié)合根據(jù)坐標(biāo)連成的圖就是折線圖對于連續(xù)型變量,用組中值b代替變量值,并用該組相應(yīng)的頻次作為b的頻次,于是(b,n)坐標(biāo)的連線就是折線圖5、定距變量的分布圖當(dāng)直方圖的組距逐漸減小時,折線將逐漸平滑為曲線。(1)峰點(Peak)研究單峰多峰(2)偏態(tài)(skewness)研究對稱分布右偏分布左偏分布偏態(tài)的測定方法:(1)、動差法:將三階中心距與其標(biāo)準差的三次方對比,求得偏斜度,即:=0,表示數(shù)據(jù)為對稱分布,

>0,則表示數(shù)據(jù)為右偏或正偏;

<0,則表示數(shù)據(jù)為左偏或負偏,一般的的范圍在[-3,+3]之間(2)、比較法:用算術(shù)平均數(shù)與眾數(shù)的絕對差額來表示偏斜系數(shù)一般也在+3與-3之間偏斜系數(shù)為0表示對稱分布偏斜系數(shù)為+3表示極右偏態(tài)偏斜系數(shù)為-3表示極左偏態(tài)(3)峰度(kurtosis)的測定在統(tǒng)計學(xué)中,運用動差法測定峰度,是將四階中心距與其標(biāo)準差的四次方對比,求得以無名數(shù)表示的峰度當(dāng)=3時,為正態(tài)分布當(dāng)>3時,分布曲線為尖峰當(dāng)<3時,分布曲線為平峰二、正態(tài)分布曲線

xφ(x)1、什么是正態(tài)分布?由德國數(shù)學(xué)家高斯提出,也叫高斯分布;自然界、社會經(jīng)濟生活中大量存在的分布規(guī)律;經(jīng)典統(tǒng)計推斷的基礎(chǔ);在所有的分布中,正態(tài)分布居于首要位置。xf(x)眾數(shù)=中位值=均值2、正態(tài)分布的基本特征特征一:一個高峰特征二:一條對稱軸特征三:一條漸近線對稱軸x=μxf(x)M0=Md=Mean(μ)

3、正態(tài)分布的數(shù)學(xué)表達式=總體標(biāo)準差;

=總體方差

=總體均值

=3.14159;e=2.71828x=隨機變量的取值(-

<x<

)只要將每個X值代入公式中,就可以求出該X值在正態(tài)分布中的次數(shù)有多少4、兩個參數(shù)的影響(總體的均值和標(biāo)準差μ,σ)均值μ標(biāo)準差σ

(1)μ對正態(tài)曲線的影響--決定曲線的位置μ1

μ2

μ3μ1<μ2<

μ3(2)σ

對正態(tài)曲線的影響xφ(x)CAB曲線A和B的比較總結(jié):兩個參數(shù)對正態(tài)曲線形狀的影響正態(tài)曲線的位置由均值μ決定;在方差一定的情況下,如μ增大,則圖形右移,如μ減小,則圖形左移,但整個圖形形狀不變。正態(tài)曲線的形狀“高,矮,胖,瘦”的特點由標(biāo)準差σ決定;在μ不變的情況下,σ越小,則對應(yīng)的圖形越尖瘦。三、正態(tài)曲線下的面積1、正態(tài)曲線下面積的涵義我們想象一個頻率直方圖,縱軸是頻率,將橫軸的區(qū)間(組距)劃分的越來越細、越來越細,于是頻率直方圖就轉(zhuǎn)化為分布密度曲線或概率密度曲線。因此,分布密度曲線實際上就是頻率直方圖的極限分布或理論分布。而正態(tài)曲線下的面積,實質(zhì)上就是由這無數(shù)個小直方形拼接而成的。每一塊直方圖面積表示的是總體中某一個的隨機變量在該小塊上取值所出現(xiàn)的概率。根據(jù)正態(tài)分布的公式,計算得出:變量取值在[μ-σ,μ+σ]之間的概率為0.6827變量取值在[μ-2σ,μ+2σ]之間的概率為0.9545變量取值在[μ-3σ,μ+3σ]之間的概率為0.9973參見盧淑華《社會統(tǒng)計學(xué)》,北京大學(xué)出版社2001年版p156-15795.45%正態(tài)曲線下的面積(圖)

-2

+2

2.275%2.275%

-

+

68.27%2、正態(tài)曲線的一個重要性質(zhì)無論正態(tài)曲線具有哪種均值和標(biāo)準差,在均值和橫坐標(biāo)某一點的距離內(nèi)(用標(biāo)準差來表示)曲線下的面積是常數(shù)。一般把正態(tài)曲線下的總面積約等于1為什么用標(biāo)準差作為單位,而不用原來的衡量單位呢?(李沛良p64)思考:

由于不同的變量會有不同的計量單位(如身高用厘米、體重用公斤),即使是同一個變量也可能會用不同的計量單位(如工資可能用一元、十元、或一百元作單位),結(jié)果形成了大小和形狀不同的正態(tài)分布:他們的均值和標(biāo)準差數(shù)值各不相同,其扁平或高聳的程度也各不相同,如果要分別計算每一種正態(tài)分布內(nèi)的各部分面積,就會很麻煩。用標(biāo)準差作為單位的好處,就是可以使正態(tài)分布標(biāo)準化,不受變量的計量單位的影響。因此,將正態(tài)分布的數(shù)值改用標(biāo)準差為單位具有重要意義,即可以將不同形態(tài)的正態(tài)分布歸納為一種分布。三、標(biāo)準正態(tài)分布1、什么是標(biāo)準正態(tài)分布以標(biāo)準差為單位的正態(tài)分布一般稱為標(biāo)準正態(tài)分布(standardizednormaldistribution)2、標(biāo)準值(Standardscores)

公式:

Z稱為標(biāo)準值或標(biāo)準分,它代表每個X值在標(biāo)準正態(tài)分布上的數(shù)值?!纠?】

某地家庭的平均每月娛樂費用()是90元,標(biāo)準差(S)是5,假定某個家庭的娛樂費用(x)是102元,那么它的標(biāo)準值為:根據(jù)標(biāo)準值的公式可知,標(biāo)準正態(tài)分布的均值為0,標(biāo)準差為1。因此,Z=2.4表示該值與均值(等于0)的距離是2.4個標(biāo)準差。3、標(biāo)準正態(tài)分布的數(shù)學(xué)表達式4、標(biāo)準正態(tài)分布的表達式正態(tài)分布的表達式為:

N(,

)標(biāo)準正態(tài)分布的表達式為:

N(0,1)標(biāo)準正態(tài)分布是一般正態(tài)分布的特例,即=0,

=1的正態(tài)分布。當(dāng)x=μ+σ時,

z=(x-μ)/σ=(μ+σ-μ)/σ=1當(dāng)x=μ-σ時,

z=(x-μ)/σ=(μ-σ-μ)/σ=-1當(dāng)x=μ+2σ時,

z=(x-μ)/σ=(μ+2σ-μ)/σ=2當(dāng)x=μ-2σ時,

z=(x-μ)/σ=(μ+2σ-μ)/σ=-200.135%0.135%68.26%1-195.45%2-2-335、標(biāo)準正態(tài)分布的面積P(-1≤Z≤1)=0.6827;P(-2≤Z≤2)=0.9545;P(-3≤Z≤3)=0.9973;

由于標(biāo)準正態(tài)分布N(0,1)的圖形是唯一的,因此使用標(biāo)準正態(tài)分布無須自己計算,只需要學(xué)會查表就行了。

6、標(biāo)準值的應(yīng)用和實際意義現(xiàn)有兩名學(xué)生A和B,分別來自甲、乙兩班,他們的成績都是80分。能說他們的成績是一樣好嗎?【例2】

設(shè)甲班的均值是80分,乙班的均值是60分,標(biāo)準差都是10分,比較A、B兩學(xué)生在班上的成績。解:Z(A)=(80-80)/10=0Z(B)=(80-60)/10=2Z(B)>Z(A)B生在乙班的成績比A生在甲班的成績好【例3】

假設(shè)兩個班的平均分都是60分,但是甲班的標(biāo)準差為10分,乙班的標(biāo)準差為20分,試比較A、B兩個學(xué)生在班上的成績解:

Z(A)=(80-60)/10=2Z(B)=(80-60)/20=1Z(A)>Z(B)A在甲班的成績比B在乙班的成績好【例4】

思考題:高考分數(shù)的錄取線按原始分數(shù)加總合理還是按標(biāo)準值分數(shù)加總合理?7、根據(jù)標(biāo)準值表查數(shù)值求任何兩個標(biāo)準值之間包含的面積任意兩點[Z1,Z2]之間的面積就是就是用的面積減去的面積【例5】

已知服從標(biāo)準正態(tài)分布N(0,1),

求解:根據(jù)Z=1.3,查表得到數(shù)字0.4032,所以【練習(xí)】對于例5,求【例6】

已知x服從標(biāo)準正態(tài)分布(0,1),求P(1.3<x<2.3)解:因為x服從標(biāo)準正態(tài)分布,所以,【練習(xí)】,對于例6,求【例7】

已知x滿足標(biāo)準正態(tài)分布(0,1),求滿足之值解:【例8】

根據(jù)統(tǒng)計,北京市居民的初婚年齡服從正態(tài)分布,其均值為25歲,標(biāo)準差為5歲,問25-30歲之間結(jié)婚的人,其百分數(shù)是多少?解:為了使用正態(tài)分布表,首先必須將年齡換算成標(biāo)準分所以,25-30歲之間結(jié)婚的人,其百分數(shù)是34.13%【練習(xí)&作業(yè)】1、已知隨機變量§滿足正態(tài)分布§~N(50,25),求P(§>61)2、用上題的條件,求P(44<§<55)3、一直Z滿足標(biāo)準正態(tài)分布N(0,1),求以下各個a值情況下,中的值(1)當(dāng)a=0.1(2)當(dāng)a=0.05(3)當(dāng)a=0.014、根據(jù)調(diào)查,兒童智商分布為N(100,100),某幼兒園共有兒童100人,請問智商在110-120之間的兒童有多少人?補充:洛倫茨曲線它是西方經(jīng)濟學(xué)中描述收入分配中平均程度的一種方法,以家庭(或人數(shù))的累計百分數(shù)為X軸,收入累計百分數(shù)為Y軸。當(dāng)所有家庭家庭具有相同收入時,x的取值與y的取值相同,這稱作完全的收入分配直線。x020%40%50%60%80%100%y020%40%50%60%80%100%當(dāng)社會財富集中在極少數(shù)人手中的時候,極限情況如下表所示,成為完全的分配不均而實際情況是介于兩者之間的曲線,又稱為洛倫茨曲線。基尼系數(shù):意大利經(jīng)濟學(xué)家基尼(Gini)根據(jù)洛倫茲曲線提出了判斷收入平均程度的指標(biāo),即基尼系數(shù)x020%40%50%60%80%100%y000000100%A:洛倫茲曲線與絕對平均線圍成的面積B:完全不平等折線與絕對平等線圍成的面積

G=A/BA=0:G=0,完全平等A=B:G=1,完全不平等,全部財產(chǎn)或收入集中在一人手中高度平均:G小于等于0.2相對平均:G在0.2一0.3之間中等不平等:G在0.3與0.4之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論