概率推理中的貝葉斯定理_第1頁(yè)
概率推理中的貝葉斯定理_第2頁(yè)
概率推理中的貝葉斯定理_第3頁(yè)
概率推理中的貝葉斯定理_第4頁(yè)
概率推理中的貝葉斯定理_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

概率推理中的貝葉斯定理

基于不確定性信息的推理和決策需要基于不同結(jié)論的概率,這些結(jié)論稱為概率推理。概率推理既是概率學(xué)和邏輯學(xué)的研究對(duì)象,也是心理學(xué)的研究對(duì)象,但研究的角度是不同的。概率學(xué)和邏輯學(xué)研究的是客觀概率推算的公式或規(guī)則;而心理學(xué)研究人們主觀概率估計(jì)的認(rèn)知加工過(guò)程規(guī)律。貝葉斯推理的問(wèn)題是條件概率推理問(wèn)題,這一領(lǐng)域的探討對(duì)揭示人們對(duì)概率信息的認(rèn)知加工過(guò)程與規(guī)律、指導(dǎo)人們進(jìn)行有效的學(xué)習(xí)和判斷決策都具有十分重要的理論意義和實(shí)踐意義。1貝葉斯定理早在18世紀(jì),英國(guó)學(xué)者貝葉斯(1702~1761)曾提出計(jì)算條件概率的公式用來(lái)解決如下一類問(wèn)題:假設(shè)H1,H2…互斥且構(gòu)成一個(gè)完全事件,已知它們的概率P(Hi),i=1,2,…,現(xiàn)觀察到某事件A與H1,H2…相伴隨而出現(xiàn),且已知條件概率P(A/Hi),求P(Hi/A)。貝葉斯公式(發(fā)表于1763年)為:這就是著名的“貝葉斯定理”,一些文獻(xiàn)中把P(H1)、P(H2)稱為基礎(chǔ)概率,P(A/H1)為擊中率,P(A/H2)為誤報(bào)率。現(xiàn)舉一個(gè)心理學(xué)研究中常被引用的例子來(lái)說(shuō)明:參加常規(guī)檢查的40歲的婦女患乳腺癌的概率是1%。如果一個(gè)婦女有乳腺癌,則她有80%的概率將接受早期胸部腫瘤X射線檢查。如果一個(gè)婦女沒(méi)有患乳腺癌,也有9.6%的概率將接受早期胸部腫瘤X射線測(cè)定法檢查。在這一年齡群的常規(guī)檢查中某婦女接受了早期胸部腫瘤X射線測(cè)定法檢查。問(wèn)她實(shí)際患乳腺癌的概率是多大??設(shè)H1=乳腺癌,H2=非乳腺癌,A=早期胸部腫瘤X射線檢查(以下簡(jiǎn)稱“X射線檢查”),已知P(H1)=1%,P(H2)=99%,P(A/H1)=80%,P(A/H2)=9.6%,求P(H1/A)。根據(jù)貝葉斯定理,P(H1/A)=(1%)(80%)/[(1%)(80%)+(99%)(9.6%)]=0.078心理學(xué)家所關(guān)心的是,一個(gè)不懂貝葉斯原理的人對(duì)上述問(wèn)題進(jìn)行直覺(jué)推理時(shí)的情形是怎樣的,并將他們的判斷結(jié)果與貝葉斯公式計(jì)算的結(jié)果做比較來(lái)研究推理過(guò)程的規(guī)律。因此有關(guān)這類問(wèn)題的推理被稱為貝葉斯推理。2伯里斯理論的研究2.1基礎(chǔ)概率與被試差異Kahneman和Tversky開辟了概率推理這一重要的研究領(lǐng)域。他們?cè)?0世紀(jì)70年代初期的研究首先發(fā)現(xiàn),人們的直覺(jué)概率推理并不遵循貝葉斯原理,表現(xiàn)在判斷中往往忽略問(wèn)題中的基礎(chǔ)概率信息,而主要根據(jù)擊中率信息作出判斷。他們一個(gè)經(jīng)典性的研究是:告知被試100人中有70人是律師,30人是工程師,從中隨機(jī)選出一人,當(dāng)把該人的個(gè)性特征描述得象工程師時(shí),被試判斷該人為工程師的概率接近0.90。顯然被試忽略了工程師的基礎(chǔ)概率只有30%。后來(lái)他們還采用多種問(wèn)題驗(yàn)證基礎(chǔ)概率忽略現(xiàn)象,如讓被試解決如下出租車問(wèn)題:一個(gè)城市85%的出租車屬于綠車公司,15%屬于藍(lán)車公司,現(xiàn)有一出租車卷入肇事逃逸事件,根據(jù)一目擊者確認(rèn),肇事車屬于藍(lán)車公司,目擊者的可靠性為80%。問(wèn)肇事車是藍(lán)車的概率是多少。結(jié)果大多數(shù)被試判斷為80%,但如果考慮基礎(chǔ)概率則應(yīng)是41%。這一研究結(jié)果引發(fā)了20世紀(jì)70年代以來(lái)的大量研究。有研究支持其結(jié)論,如Eddy用前述乳腺癌問(wèn)題讓內(nèi)科醫(yī)生判斷,結(jié)果95%的人判斷介于70%~80%,遠(yuǎn)高于7.8%。Casscells等人的研究結(jié)果表明,即使哈佛醫(yī)學(xué)院的工作人員對(duì)解決如乳腺癌和與之相類似的問(wèn)題都出現(xiàn)同樣的偏差。但也有研究發(fā)現(xiàn),在許多條件下,被試對(duì)基礎(chǔ)概率的反應(yīng)是敏感的。例如,如果問(wèn)題的措辭強(qiáng)調(diào)要理解基礎(chǔ)概率與判斷的相關(guān)性或強(qiáng)調(diào)事件是隨機(jī)抽樣的,則基礎(chǔ)概率忽略現(xiàn)象就會(huì)減少或消除。另一個(gè)引人注意的是Gigerenzer和Hoffrage1995年的研究,他們強(qiáng)調(diào)概率信息形式對(duì)概率判斷的影響。采用15個(gè)類似前述乳腺癌的文本問(wèn)題進(jìn)行了實(shí)驗(yàn),問(wèn)題的概率信息用兩種形式呈現(xiàn),一種沿用標(biāo)準(zhǔn)概率形式(百分?jǐn)?shù));一種用自然數(shù)表示的頻率形式,如“1000名婦女中有10名患有乳腺癌,在患有乳腺癌的婦女中8名婦女接受早期胸部X射線測(cè)定法檢查,在沒(méi)有患乳腺癌的990名婦女中有95名接受早期胸部X射線測(cè)定法檢查”。結(jié)果在頻率形式條件下,接近50%的判斷符合貝葉斯算法,而在標(biāo)準(zhǔn)概率條件下只有20%的判斷符合貝葉斯算法。而另一些研究者對(duì)此也提出異議,有人認(rèn)為他們?cè)诟淖冃畔⑿问降牟僮髦?同時(shí)也改變了其他的變量。如Lewis和Keren提出這種概率信息的改變使原來(lái)的一般性問(wèn)題變成了當(dāng)前單個(gè)情境的具體問(wèn)題,因而問(wèn)題變得容易,被試判斷的改善不能說(shuō)明他們的計(jì)算與貝葉斯計(jì)算一致。另外Fiedler認(rèn)為,他們進(jìn)行頻率形式的操作為所有數(shù)據(jù)提供了一個(gè)共同的參照尺度——即所有數(shù)據(jù)都是相對(duì)于總體(1000名婦女)而言的,依靠它所有的數(shù)據(jù)變得容易比較。很明顯,接受X射線檢查并患乳腺癌的婦女的數(shù)量(8)與接受X射線檢查并無(wú)乳腺癌的婦女的數(shù)量(95)相比或與接受X射線檢查的婦女總數(shù)(103)相比都是非常小的。相反,在標(biāo)準(zhǔn)概率條件下,沒(méi)有共同的參照尺度,表面上擊中率(80%)遠(yuǎn)高于誤報(bào)率(9.6%),但它們是相對(duì)于大小不同的亞樣本,而不是相對(duì)于總體,不能在同一尺度上進(jìn)行數(shù)量比較。于是他們用4個(gè)問(wèn)題進(jìn)行了2(數(shù)據(jù)比較尺度:共同尺度/非共同尺度)×2(數(shù)據(jù)形式:標(biāo)準(zhǔn)概率/頻率)的被試間設(shè)計(jì),實(shí)驗(yàn)結(jié)果表明:不管采用哪一種數(shù)據(jù)形式,被試在非共同參照尺度條件下,判斷準(zhǔn)確性都低,在共同參照尺度下,判斷準(zhǔn)確性高。所以判斷準(zhǔn)確性與數(shù)據(jù)形式無(wú)關(guān)??梢?人們?cè)诟怕逝袛嘀泻雎曰A(chǔ)概率是不是一種普遍現(xiàn)象,不同的研究之間存在較大分歧。這將促使研究者們采用各種方法對(duì)人們的概率判斷推理過(guò)程進(jìn)行更深入的探討。2.2基礎(chǔ)概率信息與特殊信息的選擇策略為了探討上述問(wèn)題,人們采用了不同的研究范式。從已有的研究看,貝葉斯推理的研究范式主要有兩種,一種是文本范式,一種是經(jīng)驗(yàn)范式。文本范式是實(shí)驗(yàn)中的問(wèn)題以文本的形式直接提供各事件的基礎(chǔ)概率和擊中率、誤報(bào)率等信息,讓被試對(duì)某一出現(xiàn)的事件作出概率大小的判斷。如前述的乳腺癌問(wèn)題,工程師問(wèn)題,出租車問(wèn)題等的研究就是采用這一范式。然而,在實(shí)際生活中,人們進(jìn)行概率判斷需要從自己經(jīng)歷過(guò)的事件中搜集信息,而不是像文本范式那樣被動(dòng)得到這些信息。經(jīng)驗(yàn)范式便克服了文本范式的這一缺陷。經(jīng)驗(yàn)范式就是在實(shí)驗(yàn)中讓被試通過(guò)經(jīng)歷事件過(guò)程,主動(dòng)搜集信息來(lái)獲得基礎(chǔ)概率、擊中率和誤報(bào)率等各種情況的信息,然后作出概率判斷。例如,Lovett和Schunn為了探討基礎(chǔ)概率信息和特殊信息對(duì)被試解決問(wèn)題策略的影響,利用建筑棒任務(wù)(BuildingStickTask,BST)進(jìn)行了實(shí)驗(yàn)設(shè)計(jì)。對(duì)于一個(gè)給定的BST問(wèn)題來(lái)說(shuō),計(jì)算機(jī)屏幕下方提供3條不同長(zhǎng)度(長(zhǎng)、中、短)的建筑棒并在上方顯示一條一定長(zhǎng)度的目標(biāo)棒,要求被試用建筑棒通過(guò)加法(中棒+短棒)策略或減法(長(zhǎng)-中或短棒)策略制造目標(biāo)棒。被試只能憑視覺(jué)估計(jì)每條棒的長(zhǎng)度,迫使他們不能用代數(shù)方法而只能用策略嘗試來(lái)解決問(wèn)題?;A(chǔ)概率是兩種策略解決問(wèn)題的基本成功率;特殊信息是建筑棒與目標(biāo)棒的接近類型對(duì)選擇策略的暗示性和所選策略成功的預(yù)見性:長(zhǎng)棒接近目標(biāo)棒則暗示使用減法策略,中棒接近目標(biāo)棒則暗示使用加法策略,如果暗示性策略成功表明該策略具有預(yù)見性,否則為非預(yù)見性。問(wèn)題設(shè)計(jì)時(shí),在200個(gè)任務(wù)中控制兩種策略基本成功率(偏向:一策略高(如70%),另一策略低(如30%);無(wú)偏向:兩策略各50%)和暗示性策略對(duì)成功預(yù)見性的比例(有預(yù)見性:暗示性和非暗示性策略成功率分別為80%和20%;無(wú)預(yù)見性:暗示性和非暗示性策略成功率各50%)。研究者對(duì)被試在嘗試上述任務(wù)前后分別用10個(gè)建筑棒任務(wù)進(jìn)行了測(cè)試,發(fā)現(xiàn)被試在嘗試前主要根據(jù)特殊信息選擇策略,在嘗試后主要依據(jù)兩種策略的基本成功率信息選擇策略。說(shuō)明人們?cè)趪L試200個(gè)任務(wù)后對(duì)嘗試中的基礎(chǔ)概率信息的反映是敏感的。經(jīng)驗(yàn)范式的優(yōu)點(diǎn)在于,實(shí)驗(yàn)操作過(guò)程非常接近人們?cè)谌粘I钪蝎@得概率信息以作出判斷的情況,較為真實(shí)地反映了人們實(shí)際的表征信息和作出概率判斷的過(guò)程。所以許多研究者采用了這一范式。但研究范式的變化并沒(méi)有能消除前述的爭(zhēng)論,在不同的研究范式下都存在人們對(duì)基礎(chǔ)概率信息的忽略或敏感現(xiàn)象,并出現(xiàn)了各種對(duì)基礎(chǔ)概率信息忽略或敏感現(xiàn)象進(jìn)行解釋的理論。3基礎(chǔ)概率的忽略如前所述,人們進(jìn)行概率判斷時(shí),在一些條件下忽略基礎(chǔ)概率,在另一些條件下并沒(méi)有忽略基礎(chǔ)概率。那么,人們是如何作出判斷的呢?哪些因素在影響人們的概率推理呢?對(duì)此,不同的研究者提出了不同的觀點(diǎn)。3.1被試估計(jì)中出現(xiàn)的概率Kahneman和Tversky認(rèn)為人們直覺(jué)的概率推理受認(rèn)知策略的影響,這是一種依賴于經(jīng)驗(yàn)的判斷或猜測(cè)。所以,經(jīng)常會(huì)作出錯(cuò)誤的判斷。主要的認(rèn)知策略包括“代表性啟發(fā)法”和“可得性啟發(fā)法”。代表性啟發(fā)法是指人們傾向于根據(jù)樣本是否代表或類似總體來(lái)判斷其出現(xiàn)的概率,愈有代表性的,被判斷為出現(xiàn)的概率愈大,愈少代表性的被判斷為出現(xiàn)的概率愈小。例如,在他們的研究中,要求被試估計(jì)某城市有6個(gè)孩子的家庭中,男(B)女(G)兒童出生順序?yàn)镚BGBBG和BGBBBB(B代表男孩,G代表女孩)的比例,結(jié)果大多數(shù)被試估計(jì)前者遠(yuǎn)高于后者。因?yàn)榍罢吒艽碚麄€(gè)人口中的比例,其次它看起來(lái)更隨機(jī)。但從機(jī)會(huì)來(lái)說(shuō),兩者的概率應(yīng)是相等的。可得性啟發(fā)法是指人們傾向于根據(jù)某現(xiàn)象在知覺(jué)或記憶中容易得到的事例來(lái)估計(jì)其出現(xiàn)是概率,如他們?cè)趯?shí)驗(yàn)中要求被試估計(jì)英語(yǔ)中以字母R、L、N、K、V開頭的單詞數(shù)和以它們?yōu)榈谌齻€(gè)字母的單詞數(shù),結(jié)果絕大部分被試估計(jì)前者遠(yuǎn)多于后者。但實(shí)際上前者是的基礎(chǔ)比例遠(yuǎn)低于后者的基礎(chǔ)比例。判斷錯(cuò)誤的原因在于人們更容易回憶出以這些字母開頭的單詞,而不容易回憶起它們?cè)谥虚g位置的單詞。這與人們的記憶組織有關(guān)。3.2抽樣與被試判斷事件的概率Gavanski等認(rèn)為判斷一個(gè)事件出現(xiàn)的概率時(shí),人們從什么范圍抽取一樣本有一種自然的抽樣傾向,他們稱之為“自然抽樣空間”,如果直接從自然的抽樣空間中抽取的樣本對(duì)判斷事件的概率是無(wú)偏差的,則被試容易作出準(zhǔn)確的判斷;但若要求被試從非自然抽樣空間中抽樣才能正確判斷事件的概率,則被試容易作出錯(cuò)誤的判斷。如前述乳腺癌問(wèn)題,被試從患乳腺癌的人群中抽樣來(lái)判斷接受X射線檢查的概率較為自然,因?yàn)楸辉嚫菀渍J(rèn)為患乳腺癌的人要接受X射線檢查。但實(shí)驗(yàn)任務(wù)是要求從接受X射線的人群中抽樣來(lái)判斷患乳腺癌的概率,這與被試的自然抽樣方向相反,導(dǎo)致被試對(duì)問(wèn)題進(jìn)行了錯(cuò)誤的表征,對(duì)照貝葉斯公式,被試的錯(cuò)誤是把P(H1/A)表征為P(A/H1),剛好與問(wèn)題的要求相反,從而作出了錯(cuò)誤的判斷。3.3加工頻率信息的意識(shí)Gigerenzer和Hoffrage同意自然抽樣的觀點(diǎn),但他們所指的“自然”是人們加工概率信息的自然方式,認(rèn)為人們是通過(guò)事件的頻率而不是標(biāo)準(zhǔn)概率(百分?jǐn)?shù))來(lái)獲得環(huán)境信息的,雖然兩種信息形式的意義相同,但人們對(duì)具有同等意義的不同外部信息形式會(huì)產(chǎn)生不同的心理表征。他從進(jìn)化論的角度出發(fā)認(rèn)為,人類進(jìn)行概率推理已經(jīng)進(jìn)化了一種認(rèn)知算法規(guī)則系統(tǒng),它不適合加工以百分?jǐn)?shù)表示的標(biāo)準(zhǔn)概率信息,而適合加工以自然數(shù)表示的頻率信息,因?yàn)闃?biāo)準(zhǔn)概率是在概率論發(fā)展以后才被人們認(rèn)識(shí)的,而頻率在人類進(jìn)化的早期就被認(rèn)識(shí)了,所以人們對(duì)事件的頻率容易編碼而且?guī)缀跏亲詣?dòng)的,而對(duì)標(biāo)準(zhǔn)概率難于編碼。因此,它們預(yù)言當(dāng)問(wèn)題的陳述從標(biāo)準(zhǔn)概率形式轉(zhuǎn)變?yōu)轭l率形式時(shí),對(duì)條件概率的直覺(jué)推理會(huì)得到顯著改善,并在前述的他們的實(shí)驗(yàn)中得到了支持。如果被試在判斷中是忽略基礎(chǔ)概率的,那么在標(biāo)準(zhǔn)概率改為頻率形式時(shí)也應(yīng)表現(xiàn)出來(lái),但他們的實(shí)驗(yàn)表明加工頻率信息的被試判斷的準(zhǔn)確性明顯高于加工標(biāo)準(zhǔn)概率信息的被試。然而,正如前面所述,他們的結(jié)論也受到其他研究的挑戰(zhàn)。3.4抽樣中的偏差檢驗(yàn)Fiedler認(rèn)為對(duì)概率判斷最根本的影響既不是抽樣方向也不是概率信息形式,而是抽取不同樣本所得的數(shù)據(jù)需要進(jìn)行不同的認(rèn)知加工。概率判斷中的認(rèn)知加工分為兩個(gè)過(guò)程,一是歸納加工過(guò)程,即利用記憶中或知覺(jué)到的樣本進(jìn)行的概率估計(jì),如旅行前根據(jù)自己的經(jīng)驗(yàn)估計(jì)某個(gè)地區(qū)為晴天或雨天的概率。然而,由于受許多主觀(如個(gè)人偏好、期望等)和客觀條件(如過(guò)去的經(jīng)驗(yàn)是在一定時(shí)空下獲得的)的限制,根據(jù)可利用的樣本來(lái)估計(jì)概率會(huì)存在許多潛在的偏差,所以,要作出正確的判斷就必須調(diào)整抽樣過(guò)程中潛在的偏差,這是一個(gè)元認(rèn)知控制過(guò)程,通過(guò)它,不同來(lái)源的樣本得到整合并運(yùn)用于最后的概率判斷,這需要運(yùn)用大量基于規(guī)則的元認(rèn)知操作,包括使用邏輯規(guī)則、概率演算、統(tǒng)計(jì)學(xué)知識(shí)或元認(rèn)知知識(shí)。如變換在不同尺度上估計(jì)的數(shù)量、顛倒條件概率、對(duì)來(lái)源于有偏差的樣本進(jìn)行矯正等。判斷者之所以忽略基礎(chǔ)概率而不遵循貝葉斯原理,是因?yàn)樗麄內(nèi)狈υJ(rèn)知手段,不能調(diào)整在抽樣過(guò)程中潛在的偏差。為驗(yàn)證此結(jié)論,他們用4個(gè)問(wèn)題(在此僅以乳腺癌為例)在計(jì)算機(jī)上設(shè)計(jì)了A、B兩種卡片盒,分別讓兩組被試自己搜索信息,告知被試A卡片盒的每張卡片正面標(biāo)明是否患有乳腺癌的案例,背面告知是否參加X(jué)射線檢查,B卡片盒中每張卡片的正面和背面與前一個(gè)卡片盒的卡片內(nèi)容相反,設(shè)計(jì)時(shí)設(shè)定基礎(chǔ)概率、擊中率和誤報(bào)率。屏幕的左邊行顯示正面內(nèi)容,右邊小窗口顯示反面內(nèi)容,被試點(diǎn)擊左邊行后才出現(xiàn)右邊窗口的反饋信息,確認(rèn)后左邊行變成灰色,右邊窗口消失。信息搜索完畢時(shí),屏幕底部顯示一刻度尺,用于被試標(biāo)示判斷接受X射線檢查的婦女患乳腺癌的概率。這樣,看A卡片盒的被試明顯覺(jué)得乳腺癌

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論