主題四機率分布_第1頁
主題四機率分布_第2頁
主題四機率分布_第3頁
主題四機率分布_第4頁
主題四機率分布_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、主題四機率分布 2021/4/24 主題四機率分布2 講授主題講授主題 l壹、淺說壹、淺說 l貳、間斷與連續(xù)變數(shù)的機率分佈貳、間斷與連續(xù)變數(shù)的機率分佈 l參、隨機機率分佈參、隨機機率分佈 l肆、以樣本分佈說明統(tǒng)計量的變化肆、以樣本分佈說明統(tǒng)計量的變化 l伍、樣本平均數(shù)的分佈伍、樣本平均數(shù)的分佈 l陸、母體、樣本資料與樣本分佈陸、母體、樣本資料與樣本分佈 l柒、本章小結柒、本章小結 2021/4/24 主題四機率分布3 本週重點本週重點 賭王與機率分佈賭王與機率分佈 年輕的統(tǒng)計理論與資深的機率論年輕的統(tǒng)計理論與資深的機率論 統(tǒng)計最基本的分佈統(tǒng)計最基本的分佈正態(tài)分佈正態(tài)分佈 抽樣的基本原理與推論應

2、用抽樣的基本原理與推論應用抽樣分佈抽樣分佈 2021/4/24 主題四機率分布4 壹、淺說壹、淺說 機率(機率(probability): 在隨機樣本或是隨機實驗中,在反覆抽樣或是實驗在隨機樣本或是隨機實驗中,在反覆抽樣或是實驗 的過程裡,特定事件的過程裡,特定事件/結果出現(xiàn)的比例結果出現(xiàn)的比例 擲骰子擲骰子 抽撲克牌抽撲克牌 2021/4/24 主題四機率分布5 介紹幾個基本概念介紹幾個基本概念 A.隨機實驗隨機實驗 (Random Experiment) B.基本結果(基本結果(Elementary Outcome) C.樣本空間(樣本空間(Sample Space) D.事件(事件(Ev

3、ent Set) 2021/4/24 主題四機率分布6 A.隨機實驗隨機實驗 (Random Experiment) 這是一種過程,你會知道有幾種特定的結果會出現(xiàn),這是一種過程,你會知道有幾種特定的結果會出現(xiàn), 不過,不能確定哪一個結果會出現(xiàn),也無法精確不過,不能確定哪一個結果會出現(xiàn),也無法精確 預測。預測。 隨機實驗可以重複進行,經過累積一定的觀察數(shù)量隨機實驗可以重複進行,經過累積一定的觀察數(shù)量 後,可以找出一些統(tǒng)計規(guī)則。後,可以找出一些統(tǒng)計規(guī)則。 例如,你擲一個骰子,你不確定會出現(xiàn)幾點,但是,例如,你擲一個骰子,你不確定會出現(xiàn)幾點,但是, 你知道其中一些基本原則。同理,可以推論到擲你知道其

4、中一些基本原則。同理,可以推論到擲 兩顆骰子或是抽一張撲克牌。兩顆骰子或是抽一張撲克牌。 2021/4/24 主題四機率分布7 B.基本結果(基本結果(Elementary Outcome) 隨機實驗可能出現(xiàn)的結果。隨機實驗可能出現(xiàn)的結果。 例如,例如, 擲一個骰子的基本結果是從擲一個骰子的基本結果是從1到到6。 抽一張樸克牌出現(xiàn)紅心的機會是四分之一抽一張樸克牌出現(xiàn)紅心的機會是四分之一 2021/4/24 主題四機率分布8 C.樣本空間(樣本空間(Sample Space) 列出隨機實驗中的所有可能結果。例如,擲一個列出隨機實驗中的所有可能結果。例如,擲一個 骰子的樣本空間是骰子的樣本空間是

5、S=1,2,3,4,5,6 通常用通常用S來表示之。來表示之。 2021/4/24 主題四機率分布9 D. 事件(事件(Event Set) 樣本空間的部分集合稱之為事件。樣本空間的部分集合稱之為事件。 事件可以只包括一個基本結果(簡單事件事件可以只包括一個基本結果(簡單事件simple event)或是兩個或兩個以上的基本結果)或是兩個或兩個以上的基本結果(混合事混合事 件件composite event)。 2021/4/24 主題四機率分布10 機率機率 2008年選舉結果年選舉結果 馬英九約得馬英九約得765.9萬票萬票/謝長廷約得謝長廷約得544.5萬票萬票 馬勝馬勝221萬票萬票

6、馬得票率佔有效票馬得票率佔有效票58.45/投票率投票率76.33 如果用出口名調,得到結果會如何?如果用出口名調,得到結果會如何? 2021/4/24 主題四機率分布11 主觀主觀(subjective)與客觀與客觀(objective)機率機率 選科系是依靠主觀還是客觀機率?選科系是依靠主觀還是客觀機率? 找工作是依靠主觀還是客觀機率?找工作是依靠主觀還是客觀機率? 妳可以實驗多少次?妳可以實驗多少次? 長期客觀的機率有其困難長期客觀的機率有其困難 主觀機率主觀機率 依據(jù)過去的資訊(事前機率),推測事後機率依據(jù)過去的資訊(事前機率),推測事後機率 貝氏統(tǒng)計貝氏統(tǒng)計Bayesian stat

7、istics 2021/4/24 主題四機率分布12 基本機率規(guī)則機率基本機率規(guī)則機率 P(A): A事件發(fā)生的機率事件發(fā)生的機率 lP(not A):非非A事件發(fā)生的機率事件發(fā)生的機率 (彼此互斥,窮盡全體)(彼此互斥,窮盡全體) l如果事件如果事件A與事件與事件B彼此獨立彼此獨立 P(A or B)= =P(A) + P(B) l如果事件如果事件A與事件與事件B為兩個可能結果為兩個可能結果 P(A and B)= =P(A) * P(B given A) l如果事件如果事件A與事件與事件B彼此獨立彼此獨立 P(A and B)= P(A) * P(B) )(AP )(BAP )(BAP 2

8、021/4/24 主題四機率分布13 婚姻與快樂婚姻與快樂 很快樂很快樂 H 還快樂與不快樂還快樂與不快樂 N 已婚已婚 M 210 350 560 未婚未婚 U 340 100 440 550 450 1,000 2021/4/24 主題四機率分布14 各種機率各種機率 P(未婚未婚) P(很快樂很快樂)+P(還快樂與不快樂還快樂與不快樂) P(已婚且很快樂已婚且很快樂)=P(已婚已婚)*P(已婚中很快樂已婚中很快樂) P(U)1-P(M) P(HN)= P(H)+P(N)如果兩個事件獨立如果兩個事件獨立 P(MH)= P(M)P(HM) 2021/4/24 主題四機率分布15 各種百分比各

9、種百分比 總百分比:總百分比:total %; join % 很快樂很快樂 H 還快樂與不還快樂與不 快樂快樂 N 直欄直欄 已婚已婚 M 21.0 35.0 56.0 未婚未婚 U 34.0 10.0 44.0 橫列橫列 55.0 45.0 100.0 )(HMP )(NMP )(HUP )(NUP 2021/4/24 主題四機率分布16 直欄百分比直欄百分比(column %) 很快樂很快樂 H 還快樂與不快樂還快樂與不快樂 N 直欄直欄% 已婚已婚 M 38.2 77.8 56.0 未婚未婚 U 61.8 22.2 44.0 (樣本數(shù)樣本數(shù)) (550) (450) 100.0 )|(H

10、MP )|(HUP )|(NMP )|(NUP 2021/4/24 主題四機率分布17 橫列百分比橫列百分比(row %) 很快樂很快樂 H 還快樂與不快樂還快樂與不快樂 N (樣本數(shù))(樣本數(shù)) 已婚已婚 M 37.5 62.5 ( 560) 未婚未婚 U 77.3 22.7 ( 440) 橫列橫列% 55.0 45.0 (1,000) )|(MHP )|(MNP )|(UHP )|(UNP 2021/4/24 主題四機率分布18 各種概念各種概念 l交集:交集: P(AB) l聯(lián)集:聯(lián)集:P(AB) l條件機率:條件機率: P(AB) l獨立事件:對各種機率計算的影響獨立事件:對各種機率計

11、算的影響 2021/4/24 主題四機率分布19 貳、間斷與連續(xù)變數(shù)的機率分佈貳、間斷與連續(xù)變數(shù)的機率分佈 間斷變數(shù)與連續(xù)變數(shù)之區(qū)別間斷變數(shù)與連續(xù)變數(shù)之區(qū)別 2021/4/24 主題四機率分布20 一、間斷變數(shù)的機率分佈一、間斷變數(shù)的機率分佈 表表 4.1 家中理想子女數(shù)目的分佈家中理想子女數(shù)目的分佈 y P(y) 0 0.01 1 0.03 2 0.60 3 0.23 4 0.12 5 0.01 總總計計 1.00 2021/4/24 主題四機率分布21 間斷機率分佈間斷機率分佈 P(y=4)=? P(y4)=? P(y=3.5)=? 用直方圖表示用直方圖表示 2021/4/24 主題四機率

12、分布22 二、連續(xù)機率分佈圖二、連續(xù)機率分佈圖 2021/4/24 主題四機率分布23 二、連續(xù)機率分佈二、連續(xù)機率分佈 P(y10)=? P(30y60)=? 2021/4/24 主題四機率分布24 機率分佈的母數(shù)機率分佈的母數(shù) l如果表如果表4.1是母體值,我們反覆抽樣的結果,會是母體值,我們反覆抽樣的結果,會 知道知道 家中理想子女數(shù)為家中理想子女數(shù)為1的機率是:的機率是:P(y=1)=? l對機率的兩個重要的描述母數(shù)(參數(shù))為對機率的兩個重要的描述母數(shù)(參數(shù))為 l平均數(shù)平均數(shù) 1.標準差標準差 2021/4/24 主題四機率分布25 間斷變數(shù)的平均數(shù)計算方式間斷變數(shù)的平均數(shù)計算方式

13、l此一數(shù)值又稱為期望值,以此一數(shù)值又稱為期望值,以E(y)表示表示 l變異數(shù)計算公式變異數(shù)計算公式 l計算理想子女數(shù)的平均數(shù)與標準差計算理想子女數(shù)的平均數(shù)與標準差 )()()( 2 yPyyV )(yPy 2021/4/24 主題四機率分布26 參、正態(tài)機率分佈參、正態(tài)機率分佈 2021/4/24 主題四機率分布27 參、正態(tài)分佈的幾個特性參、正態(tài)分佈的幾個特性 1.1.平均數(shù)、中位數(shù)與眾數(shù)是同值,而將正態(tài)曲線分成平均數(shù)、中位數(shù)與眾數(shù)是同值,而將正態(tài)曲線分成 對稱的兩個部分,各佔總分布的一半。對稱的兩個部分,各佔總分布的一半。 2.2.分布是對稱的,一旦將本分布從中間對折,兩邊會分布是對稱的,

14、一旦將本分布從中間對折,兩邊會 彼此重疊。彼此重疊。 3.3.分布的兩端分布的兩端( (尾巴尾巴) ),離平均數(shù)愈遠,會接近,離平均數(shù)愈遠,會接近X-X-軸,軸, 不過,不會接觸到不過,不會接觸到X-X-軸軸-總是會有發(fā)生的機率,總是會有發(fā)生的機率, 不過,機率很低就是了。不過,機率很低就是了。 2021/4/24 主題四機率分布28 參、正態(tài)分佈的幾個特性參、正態(tài)分佈的幾個特性 當觀察值為常態(tài)分佈時,在平均數(shù)當觀察值為常態(tài)分佈時,在平均數(shù) l正負一個標準差的區(qū)間之內,涵蓋了正負一個標準差的區(qū)間之內,涵蓋了68%的所的所 有觀察值有觀察值 l正負兩個標準差的區(qū)間之內,包括了正負兩個標準差的區(qū)間

15、之內,包括了95%的所的所 有觀察值,有觀察值, l正負三個標準差的區(qū)間之內,包括了正負三個標準差的區(qū)間之內,包括了99.7%的的 所有觀察值。所有觀察值。 2021/4/24 主題四機率分布29 兩個正態(tài)分佈圖兩個正態(tài)分佈圖 2021/4/24 主題四機率分布30 標準化分數(shù)標準化分數(shù)Z-Score 2021/4/24 主題四機率分布31 運用正態(tài)分配表運用正態(tài)分配表 2021/4/24 主題四機率分布32 運用正態(tài)分配表運用正態(tài)分配表(區(qū)域區(qū)域B或或C的比例的比例) 2021/4/24 主題四機率分布33 運用正態(tài)分配表運用正態(tài)分配表(區(qū)域區(qū)域B或或C的比例的比例) 2021/4/24 主

16、題四機率分布34 運用常態(tài)分配表運用常態(tài)分配表P(-1Z1) 2021/4/24 主題四機率分布35 運用常態(tài)分配表運用常態(tài)分配表P(-2Z2) 2021/4/24 主題四機率分布36 運用常態(tài)分配表運用常態(tài)分配表P(-3Z3) 2021/4/24 主題四機率分布37 運用常態(tài)分配表找出各區(qū)的比例運用常態(tài)分配表找出各區(qū)的比例 2021/4/24 主題四機率分布38 找出以下區(qū)域的百分比找出以下區(qū)域的百分比 lP(-1.96Z1.96) lP (ZZ) 2021/4/24 主題四機率分布39 用用Z-scores找出機率或是特定值找出機率或是特定值 l特定值需要找出一定機率,先轉換成特定值需要找

17、出一定機率,先轉換成z-score再用再用 表找出該區(qū)域的機率表找出該區(qū)域的機率 l有特定機率、百分位或是比例希望找出特定值,有特定機率、百分位或是比例希望找出特定值, 先將機率轉換成先將機率轉換成z-score,再用,再用 y=+z 2021/4/24 主題四機率分布40 兩個練習兩個練習 l4.3.一個一個IQ考試的平均數(shù)為考試的平均數(shù)為100,標準差為,標準差為16 找出找出99百分位應該要考多少分百分位應該要考多少分 lAssume that verbal SAT scores approximate a normal distribution with a mean of 430 a

18、nd a standard deviation of 100. What proportion of students verbal SAT scores is either less than 350 or more than 500. 2021/4/24 主題四機率分布41 標準常態(tài)分佈標準常態(tài)分佈 所有常態(tài)分佈,都可以轉換成標準常態(tài)分數(shù)。他的所有常態(tài)分佈,都可以轉換成標準常態(tài)分數(shù)。他的 平均數(shù)是平均數(shù)是0,標準差是,標準差是1。 我們可以先知道標準分數(shù),然後找出比這個分數(shù)高我們可以先知道標準分數(shù),然後找出比這個分數(shù)高 /低者,佔所有分布的比例低者,佔所有分布的比例 另外一個是,我們知道一

19、定的比例後,要找出這個另外一個是,我們知道一定的比例後,要找出這個 標準化分數(shù)標準化分數(shù) 我們將標準常態(tài)分布的整個區(qū)域,定為我們將標準常態(tài)分布的整個區(qū)域,定為1或是或是100%, 一半就是一半就是0.5或是或是50% 2021/4/24 主題四機率分布42 標準正態(tài)分佈圖標準正態(tài)分佈圖 標標準準常常態(tài)態(tài)分分布布曲曲線線圖圖 -4-3-2-101234 2021/4/24 主題四機率分布43 肆、以抽樣分佈說明統(tǒng)計量的變化肆、以抽樣分佈說明統(tǒng)計量的變化 l以出口民調預測選舉結果以出口民調預測選舉結果 l模擬估計過程模擬估計過程 l抽樣分佈抽樣分佈(sampling distribution) 統(tǒng)

20、計量所可能獲得數(shù)值的機率分佈統(tǒng)計量所可能獲得數(shù)值的機率分佈 2021/4/24 主題四機率分布44 伍、樣本平均數(shù)的抽樣分佈伍、樣本平均數(shù)的抽樣分佈 l我們想知道每年家庭食品支出花費我們想知道每年家庭食品支出花費 2021/4/24 主題四機率分布45 食品支出的實例 2021/4/24 主題四機率分布46 食品支出的實例(食品支出的實例(N=25N=25) MEAN25 165000.0 160000.0 155000.0 150000.0 145000.0 140000.0 135000.0 130000.0 125000.0 120000.0 115000.0 110000.0 105000.0 MEAN25 次數(shù) 12 10 8 6 4 2 0 標準差 = 12501.24 平均數(shù) = 130324.4 N = 100.00 2021/4/24 主題四機率分布47 食品支出的實例(食品支出的實例(N=100N=100) 2021/4/24 主題四機率分布48 樣本數(shù)對抽樣分佈與精確度的影響樣本數(shù)對抽樣分佈與精確度的影響 2021/4/24 主題四機率分布49 標準誤標準誤(standard error) l平均數(shù)抽樣分佈的標準差稱之平均數(shù)抽樣分佈的標準差稱之 n y / 2021

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論