0b924數(shù)據(jù)挖掘及應(yīng)用第5講分類基礎(chǔ)_第1頁(yè)
0b924數(shù)據(jù)挖掘及應(yīng)用第5講分類基礎(chǔ)_第2頁(yè)
0b924數(shù)據(jù)挖掘及應(yīng)用第5講分類基礎(chǔ)_第3頁(yè)
0b924數(shù)據(jù)挖掘及應(yīng)用第5講分類基礎(chǔ)_第4頁(yè)
0b924數(shù)據(jù)挖掘及應(yīng)用第5講分類基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩102頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第5 11231123通過(guò)特征一步步依靠特征描述找到目 維和度量的數(shù)據(jù)許多當(dāng)前的OLAP對(duì)于概念形成,數(shù)據(jù)庫(kù)屬性可以是各種各樣的數(shù)據(jù)類數(shù)據(jù)庫(kù)中屬性 也可能包括復(fù)雜的數(shù)據(jù)類用戶需要對(duì)每個(gè)維的作用有透徹的理為了找到一個(gè)滿意的描述,用戶需要使用一長(zhǎng)串OLAP操更自動(dòng)化的過(guò)首先使用關(guān)系數(shù)據(jù)庫(kù)查詢收集任務(wù)相關(guān)的數(shù) 什么叫擁有大量不同如何判斷一個(gè)屬性該被刪除、泛化、還是直接保概念如何分 經(jīng)驗(yàn)判比較對(duì)象:可比較類(或概念 模型的 知每個(gè)訓(xùn)練樣本屬于哪個(gè)類的“指導(dǎo)”下進(jìn)模型的學(xué)習(xí)不知道每個(gè)訓(xùn)練樣本屬于哪個(gè)聚類是典型的無(wú)指導(dǎo)1123vs隨后,數(shù)學(xué)家伯努利、拉斯、泊松和高斯等人對(duì)伯努納為拉斯所定義的古典概型。但這種概率定義既要求 用同一儀器多次稱量同一物體的重量,所得結(jié)果總是略有差異多次射擊,所中的環(huán)數(shù)也不盡相明天某 的價(jià)格是多少這種不確定現(xiàn)象稱為隨機(jī)現(xiàn)E1:拋一枚硬幣,觀察正面 S6:{t︱S7:{(x,y︱T0≤x≤y≤T1},這里x示最低溫度,y表示最高包含:AB或B,稱事件B包含事件A,即事件A發(fā)生相等:AB且BA,即AB,稱事件A與事件B和:AB,表示A、B二事件中至少有一個(gè)發(fā)生; 示n個(gè)事件A1,A2,…,An中至少有一個(gè)發(fā)生。 n個(gè)事件A1A2An

k生;若n個(gè)事件A1A2An的任意兩個(gè)事件不能同時(shí)發(fā)生,則稱A1,A2,…,An互不相容。對(duì)立(互逆):若AB=S,且AB=,則A與B逆。有AAS,AA

ABBA,ABBA;ABCABC,ABCABABCABAC,德·

ABABABA對(duì)于個(gè)事件,德·對(duì)于一個(gè)隨機(jī)事件A(除必然事件和不可能事件外)來(lái)說(shuō), A發(fā)生的次數(shù)nA稱為事件A發(fā)生的頻數(shù)。比值nAn稱為事號(hào)n=n=1223314551627482933⑶可列可加性:設(shè)A1,A2,…兩兩互不相容的事件,即對(duì)于i≠j, AiAj=,i,j=1,2,…,則有 PAnP(An 性質(zhì) P(S)1,P()性質(zhì)2 對(duì)任意n個(gè)事件A1,A2,,An,若他們是兩互不相容的事件,則有niP(A)ii

i

P(Aini否 P(A)ii

P(AiAjni 1ijn P(AAA)1nP( 1ijk性質(zhì)3 設(shè)A,B是兩個(gè)事件,AB,則P(BA)P(B)P(A);P(B)P(性質(zhì) 對(duì)于任一事件A,P(A)性質(zhì) 若為A的對(duì)立事件, P(A)1否則

若AB,則PABPAP(B);PABPAP(BPAB).P(AB)P(AB)1P(A1{P(A)P(B)P(

832000

6

P(AB)

P(A)

250 83

p1 20008P(B)

2000 為個(gè),記為e1,e2,…,en,而且這些事件是兩兩互不 1=P(S)=P({e1}∪{e2}∪…∪{en})=若事件

這里ii,i是這里ii,i是中某k個(gè)不同的數(shù)。則有

iP(A

A包含的樣本點(diǎn)數(shù)j

樣本點(diǎn)總數(shù) ⑵由于A2={TTT},于PA1PA11 任一個(gè)盒子,故共有Nn種不同的放法,而每個(gè)盒子中至A NN1Nn A p N N 為(男,男),(男,女),(女,男),(女,女)的可能性是一樣的。若以記 P(AB)2

P(AB)P(B)m(P(AB)m(AB)

m(S P(AB)

m(S

P(B) P(P(BA)P(⑶可列可加性:設(shè)B1,B2,…兩兩互不相容的事件,即對(duì)于i≠j, BiBj= ,i,j=1,2,…,則有 PBiA

i iP(B)P(A1A2B)P(A1B)P(A2B)P(A1A2 –,且條件概率是在試驗(yàn)的條件上加上一個(gè)新條件如發(fā)生求事件如發(fā)生的概率。條件概率與的區(qū)別就是在E的條件上增加了一個(gè)新條件。而無(wú)條件概率是沒(méi)有增加新條件的概率。。⑴BiBj=,i≠j,i,j=1,2,…,n;,B1,B2,…,Bn為S的一個(gè)劃分,且P(Bi)>0(i=1,2,…,n),則 樣本空間可以劃分為事件一知道正確答案,A一不知P(B∣A)=1,而P(B∣A)=1/4。由全概率公式 1123Thomas(做過(guò)神甫)P(AB)P(BA)P(P(B) 感冒——發(fā)燒、流鼻涕、頭發(fā)燒、流鼻涕、頭痛——感冒長(zhǎng)壽——吃大吃大蒜…一個(gè)劃分,且P(A)>0,P(Bi)>0(I=1,2,…,n),則

A)

P(ABj)P(BjP(ABiP(ABi)P(Bin

,i1,2,, P(AP(ABi)P(BiP(Bi

A)

nnP(ABj)P(Bjj

,i1,2,,設(shè)村民過(guò)去 P(`H)=0.21)1)P(Bi

A)

P(ABj)P(BjP(ABiP(ABi)P(Bin

,i1,2,,貝葉斯決策就是在不完全下,對(duì)部分未知的狀態(tài)用主1、已知類條件概率密度參數(shù)表達(dá)式和先驗(yàn)概2、利用貝葉斯公式轉(zhuǎn)換成后驗(yàn)概3Cf1f2f3P(健康|P(小李癥狀|P(P(小李癥狀)=P(打噴嚏|健康)P(咳嗽|健康)P(不發(fā)燒|健康)P(健康)/P(小李癥狀)=0.1×0.1×(1-0.01)×0.9/P(小李癥狀)=0.0089PP(感冒|0.05)(0.9)(0.8)(0.3)/P(E)=0.01PP(過(guò)敏|P0.0089+0.010.019P(健康|P(感冒|P(過(guò)敏| –表達(dá)能力強(qiáng),基本反映客觀現(xiàn)實(shí)但無(wú)法計(jì)算 反映較小部分客觀現(xiàn)實(shí),可計(jì)算,代價(jià)較 Bayesiannetwork又稱信任網(wǎng)絡(luò)(beliefnetwork)或是有向非循環(huán)圖形模型(directedacyclicgraphicalmodel),是一種概率圖型模型,借由有向非循環(huán)圖形(directedacyclicgraphs,orDAGs)中得知一組隨 分配(conditionalprobabilitydistributions,orCPDs)的 概念描述與OLAP的區(qū)別是什么概念描述方法有哪什么是分類,什么是有指導(dǎo)/無(wú)指導(dǎo)學(xué)習(xí)什么是決定性現(xiàn)象,什么是不確定現(xiàn)象什么是隨機(jī)試驗(yàn)、樣本空間、樣本點(diǎn)什么是隨機(jī)事件、基本事件、復(fù)合事件、必然事件、不可能事

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論