版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
安邦BI系統(tǒng)數(shù)據(jù)模型介紹主題維度建模的基本概念模型概述模型介紹模型運(yùn)用方法與技巧相關(guān)技術(shù)問(wèn)題如何建立分析集市模型行業(yè)經(jīng)驗(yàn)BI.InsuranceDWM工作組和建模持續(xù)發(fā)展業(yè)務(wù)需求安邦分析集市模型業(yè)務(wù)驅(qū)動(dòng)根據(jù)固定報(bào)表和KPI、持續(xù)率、承保理賠、執(zhí)行力、再保五個(gè)數(shù)據(jù)集市的業(yè)務(wù)需求,結(jié)合BI.InsuranceDWM的建模方法,建立TaipingEDW分析集市模型分析集市模型概念維度建模一種非規(guī)范化的關(guān)系模型由一組屬性構(gòu)成的表所組成表跟表之間的關(guān)系通過(guò)關(guān)鍵字和外鍵來(lái)定義以良好的可理解性和方便的產(chǎn)生報(bào)表來(lái)進(jìn)行數(shù)據(jù)組織,很少考慮修改的性能通過(guò)SQL或者相關(guān)的工具實(shí)現(xiàn)數(shù)據(jù)的查詢和維護(hù)分析集市模型概念事實(shí)表(一)每一個(gè)事實(shí)表通常包含了業(yè)務(wù)需求所關(guān)心的一系列的指標(biāo)值每一個(gè)事實(shí)表的行包括具有可加性的數(shù)值型的指標(biāo)值文本事實(shí)通常具有不可預(yù)見(jiàn)的內(nèi)容,很難進(jìn)行分析與維表相連接的外鍵通常具有兩個(gè)和兩個(gè)以上的外鍵外鍵之間表示維表之間多對(duì)多的關(guān)系分析集市模型概念事實(shí)表(二)事實(shí)表的特征非常的大包含幾萬(wàn)、幾十萬(wàn)甚至幾百幾千條的記錄內(nèi)容相對(duì)的窄列數(shù)較少經(jīng)常發(fā)生變化現(xiàn)實(shí)世界中新事件的發(fā)生→事實(shí)表中增加一條記錄典型情況下,僅僅是數(shù)據(jù)的追加事實(shí)表的使用各類指標(biāo)值的聚集計(jì)算分析集市模型概念維表(一)每一張維表對(duì)應(yīng)現(xiàn)實(shí)世界中的一個(gè)對(duì)象或者概念例如:客戶、產(chǎn)品、保單、標(biāo)的、案件維表的特征包含了眾多描述性的屬性列如保單維表里的銷售渠道、保費(fèi)區(qū)間、風(fēng)險(xiǎn)等級(jí)等通常情況下,跟事實(shí)表相比,行數(shù)相對(duì)較小通常<10萬(wàn)條內(nèi)容相對(duì)固定幾乎就是一類查找表分析集市模型概念維表(二)維表的應(yīng)用基于維屬性的過(guò)濾(切片、切塊等)基于維屬性的各種聚集操作報(bào)表中各類標(biāo)簽的主要來(lái)源事實(shí)表通過(guò)維表進(jìn)行引用分析集市模型概念
Facts屬性個(gè)數(shù)少(窄)記錄行數(shù)多(大)數(shù)值型指標(biāo)隨著時(shí)間的推移,數(shù)據(jù)增長(zhǎng)
Dimensions
屬性個(gè)數(shù)多(寬)記錄行數(shù)少(?。┟枋鲂詫傩造o態(tài)的,很少發(fā)生變化
事實(shí)表與維表的比較
分析主題域數(shù)據(jù)(AnalyticalSubjectAreas)
通過(guò)事實(shí)(Facts)和維度(Dimensions)模型方式表達(dá),為典型保險(xiǎn)分析應(yīng)用提供分析型數(shù)據(jù)架構(gòu),為數(shù)據(jù)集市提供統(tǒng)一的指標(biāo)和維度,為數(shù)據(jù)應(yīng)用提供統(tǒng)一的數(shù)據(jù)信息。分析主題域數(shù)據(jù),將業(yè)務(wù)需求階段定義的分析主題域,按照維度建模方法,格式化成符合維度-事實(shí)表的星型模型或雪花模型。其中維度信息由核心原子數(shù)據(jù)按照定義的層次形成相關(guān)的維度視圖,事實(shí)表數(shù)據(jù)通過(guò)核心原子數(shù)據(jù)相關(guān)主題域數(shù)據(jù)經(jīng)過(guò)匯總計(jì)算得到。核心原子數(shù)據(jù)和分析數(shù)據(jù)分別映射到不同的數(shù)據(jù)集市中。其中,典型的分析主題域如通用承保分析(Universalunderwritinganalysis)如下圖:分析集市模模型設(shè)計(jì)步步驟需求整理指標(biāo)維維度矩陣設(shè)計(jì)集市層層模型設(shè)計(jì)分析層層模型維度指標(biāo)矩矩陣維度指標(biāo)矩矩陣是把需需求轉(zhuǎn)化為為多維模型型的重要工工具業(yè)務(wù)分析需需求舉例與上一年相相比,各險(xiǎn)險(xiǎn)種所占的的份額有何何差異?每個(gè)機(jī)構(gòu)在在各險(xiǎn)種所所占份額是是多少?機(jī)構(gòu)險(xiǎn)種時(shí)間2006和2007年度各險(xiǎn)種種份額對(duì)比比20062007Thousands2006年度各機(jī)構(gòu)構(gòu)在各險(xiǎn)種種上的份額額維度建模舉舉例時(shí)間機(jī)構(gòu)險(xiǎn)種客戶主題維度建模的的基本概念念模型概述模型介紹模型運(yùn)用方方法與技巧巧相關(guān)技術(shù)問(wèn)問(wèn)題元數(shù)據(jù)模型在整個(gè)個(gè)系統(tǒng)架構(gòu)構(gòu)中的定位位ETL過(guò)程核心收付車險(xiǎn)理賠財(cái)務(wù)面向業(yè)務(wù)應(yīng)應(yīng)用數(shù)據(jù)集市Cube最終用戶基本上與業(yè)業(yè)務(wù)數(shù)據(jù)同同構(gòu)保留詳細(xì)交交易數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)面向分析主題輕度匯總數(shù)據(jù)StarSchema建模中間表財(cái)務(wù)賬戶活動(dòng)理賠事件收付費(fèi)處理資金供應(yīng)角色實(shí)物地理位置協(xié)議產(chǎn)品分析層分析層模型型主題域分析層模型型每個(gè)主題題域?yàn)橥愵惖臉I(yè)務(wù)處處理,共享享相同的維維度承保理賠分分析記錄安邦保保險(xiǎn)所關(guān)注注的主要承承保理賠業(yè)業(yè)務(wù)指標(biāo)。。收付費(fèi)分析析記錄財(cái)務(wù)收收付中應(yīng)收收保費(fèi)、實(shí)實(shí)收保費(fèi)、、應(yīng)收率、、應(yīng)付賠款款、實(shí)付賠賠款等收付付類信息。。核賠效率分分析記錄理賠環(huán)環(huán)節(jié)中查勘勘、定損、、核損、繕繕制過(guò)程的的相關(guān)指標(biāo)標(biāo)。主題維度建模的的基本概念念模型概述模型介紹模型運(yùn)用方方法與技巧巧相關(guān)技術(shù)問(wèn)問(wèn)題分析層模型型結(jié)構(gòu)收付費(fèi)分析析的星型結(jié)結(jié)構(gòu)分析層模型型介紹“承保理賠賠分析事實(shí)實(shí)表”、““收付費(fèi)分分析事實(shí)表表”、“核核賠效率分分析事實(shí)表表”都是經(jīng)經(jīng)輕度匯總總生成的表表,它們?nèi)慷际鞘率聞?wù)型事實(shí)實(shí)表中間事實(shí)表表都是經(jīng)過(guò)過(guò)版本化的的歷史表,,保存最細(xì)細(xì)粒度的數(shù)數(shù)據(jù)中間事實(shí)表表主要用于于生成輕度度匯總表的的過(guò)渡,除除此之外,,通過(guò)冗余余相關(guān)屬性性,中間事事實(shí)表的設(shè)設(shè)計(jì)也考慮慮了其它無(wú)無(wú)法從直接接從分析層層計(jì)算的指指標(biāo)的計(jì)算算事務(wù)型事實(shí)實(shí)和快照型型事實(shí)機(jī)構(gòu)險(xiǎn)種日期未決變化201010210112008-9-121000201010210112008-9-13-300201010210112008-9-122200201020120312008-9-12100201020220012008-9-121000201020220012008-9-131200201020220012008-9-14-2200事務(wù)型快照型快照型事實(shí)實(shí)表的指標(biāo)標(biāo)通常包含含時(shí)點(diǎn)值,,隨著時(shí)間間積累,維維度組合會(huì)會(huì)越來(lái)越細(xì)細(xì),此類型型的事實(shí)表表通常用于于粒度較粗粗的數(shù)據(jù)集集市或Cube;而事務(wù)型型事實(shí)表的的度量都是是可累加的的,其對(duì)于于維度較多多的輕度匯匯總表是有有利。如果果OLAPserver支持在事務(wù)務(wù)型事實(shí)表表上計(jì)算時(shí)時(shí)點(diǎn)值,建建議在維度度較細(xì)的Cube上使用事務(wù)務(wù)型事實(shí)。。機(jī)構(gòu)險(xiǎn)種日期期末未決201010210112008-9-121000201010210112008-9-13700201010210112008-9-142900201020120312008-9-12100201020120312008-9-13100201020120312008-9-14100201020220012008-9-121000201020220012008-9-132200201020220012008-9-140中間層歷史史數(shù)據(jù)的版版本化數(shù)據(jù)倉(cāng)庫(kù)中中的歷史數(shù)數(shù)據(jù)決不會(huì)會(huì)被刪除或或覆蓋,因因此需要加加入數(shù)據(jù)版版本特性來(lái)來(lái)區(qū)分隨時(shí)時(shí)間變化的的業(yè)務(wù)信息息,使得在在任一給定定時(shí)間點(diǎn)上上都能檢索索到正確的的數(shù)據(jù)。數(shù)據(jù)是否需需要版本化化,首先依依賴于實(shí)體體是否有時(shí)時(shí)變特性,,比如“報(bào)報(bào)案信息””通常是在在某個(gè)時(shí)間間點(diǎn)上發(fā)生生,它就沒(méi)沒(méi)有時(shí)變特特性,因此此就不需要要版本化。。在實(shí)體中加加入時(shí)間戳戳屬性可以以實(shí)現(xiàn)數(shù)據(jù)據(jù)版本化,,這個(gè)時(shí)間間戳可以基基于業(yè)務(wù)涵涵義,如對(duì)對(duì)保單的某某次批改的的生效日期期;也可以以僅僅是技技術(shù)上的,,比如員工工某項(xiàng)登記記信息被修修改,則生生成新的員員工記錄,,并指定該該記錄的有有效(Valid)期間,ETL處理需要實(shí)實(shí)現(xiàn)數(shù)據(jù)相相鄰版本時(shí)時(shí)間戳的鏈鏈接。需要為版本本化的實(shí)體體找出一個(gè)個(gè)錨ID來(lái)唯一標(biāo)識(shí)識(shí)每個(gè)數(shù)據(jù)據(jù)實(shí)例,比比如保單實(shí)實(shí)體的錨ID可以是保單單號(hào),表明明該實(shí)體中中最原子的的粒度是保保單。時(shí)間戳與數(shù)數(shù)據(jù)版本業(yè)務(wù)信息的的不同版本本的時(shí)間鏈鏈時(shí)間戳(start_date/end_date)員工姓名職位離職時(shí)間start_dateend_date張三初級(jí)核保人2006-5-212007-12-3張三中級(jí)核保人2007-12-39999-12-31李四業(yè)務(wù)員2004-3-122006-10-8李四業(yè)務(wù)經(jīng)理2006-10-82008-5-9李四業(yè)務(wù)經(jīng)理2008-5-92008-5-99999-12-31以上start_date為紅色的是是該數(shù)據(jù)實(shí)實(shí)例被創(chuàng)建建時(shí)的版本本,該值從從邏輯上看看應(yīng)該為數(shù)數(shù)據(jù)的業(yè)務(wù)務(wù)創(chuàng)建日期期,比如入入職日期,,但為了避避免受到數(shù)數(shù)據(jù)質(zhì)量的的影響,我我們通常把把每個(gè)數(shù)據(jù)據(jù)實(shí)例的第第一個(gè)版本本的start_date置為1900-01-01承保中間表表場(chǎng)景示例例保單號(hào)批單號(hào)保險(xiǎn)起期保險(xiǎn)金額保費(fèi)核保日期批改原因startdateenddate0001---2006-3-712000802006-3-4N/A1900-1-12006-5-18000100012006-3-7002006-5-18注銷2006-5-189999-12-310002---2006-4-19223001202006-4-7N/A1900-1-12006-5-10000200022006-4-19223001202006-5-10修改2006-5-102006-5-21000200032006-4-19223001382006-5-21加保2006-5-219999-12-310003---2007-1-121200008902007-1-8N/A1900-1-19999-12-310004---2007-5-2570005002007-4-22N/A1900-1-19999-12-310005---2008-3-1440000036002008-3-8N/A1900-1-12008-4-6000500042008-3-1431000030002008-4-6退保2008-4-62008-4-16000500052006-3-1431000030002008-4-16修改2008-4-169999-12-31收付費(fèi)中間間表場(chǎng)景示示例單據(jù)號(hào)type狀態(tài)應(yīng)收保費(fèi)實(shí)收保費(fèi)應(yīng)付賠款實(shí)付賠款應(yīng)付手續(xù)費(fèi)實(shí)付手續(xù)費(fèi)startdateenddate0001保費(fèi)應(yīng)收2000.000.00
1900-1-12006-5-180001保費(fèi)實(shí)收2000.002000.00
2006-5-189999-12-310002手續(xù)費(fèi)應(yīng)付
132.000.001900-1-12006-5-100002手續(xù)費(fèi)實(shí)付
132.00132.002006-5-102006-5-110002手續(xù)費(fèi)沖正
132.000.002006-5-119999-12-310003保費(fèi)應(yīng)收10000.000.00
1900-1-19999-12-310004賠款應(yīng)付
26700.000.00
1900-1-19999-12-310005賠款應(yīng)付
14700.000.00
1900-1-12006-4-60005賠款實(shí)付
14700.0014700.00
2006-4-69999-12-310006保費(fèi)應(yīng)收3500.000.00
1900-1-19999-12-31理賠中間事事實(shí)表場(chǎng)景景示例賠案號(hào)次數(shù)立案日期估損金額賠付金額結(jié)案日期結(jié)案狀態(tài)startdateenddate000112006-3-73000
9999-12-31N1900-1-12006-53-7300032002006-5-18Y2006-5-189999-12-31000212006-4-1912000
9999-12-31N1900-1-12006-5-10000212006-4-1911000
9999-12-31N2006-5-102006-5-21000212006-4-1911000100002006-5-21Y2006-5-219999-12-31000312007-1-12900
9999-12-31N1900-1-19999-12-31000412007-5-257000
9999-12-31N2007-5-29999-12-31000512008-3-1421000
9999-12-31N1900-1-12006-4-6000512008-3-1421000200002006-4-6Y2006-4-69999-12-31000522006-4-163003002006-5-26Y1900-1-19999-12-31中間層的構(gòu)構(gòu)建算法請(qǐng)安邦項(xiàng)目目組自行用用Visio畫出算法流流程圖,分分頁(yè)貼在此此處分析層模型型未涵蓋的的特殊分析析應(yīng)用需求中有部部分的指標(biāo)標(biāo)在計(jì)算上上比較獨(dú)特特,且與其其它指標(biāo)沒(méi)沒(méi)有太多的的共享價(jià)值值,因此未未納入分析析層模型的的考查范疇疇,這些指指標(biāo)主要有有:核保效率分分析——用mid_policy_fact與核保信息息表關(guān)聯(lián),,再經(jīng)過(guò)聚聚合計(jì)算可可得到相應(yīng)應(yīng)的分析指指標(biāo)理財(cái)險(xiǎn)網(wǎng)點(diǎn)點(diǎn)活動(dòng)率——該指標(biāo)為非非累計(jì)指標(biāo)標(biāo),不考慮慮安置在分分析層,可可在構(gòu)建CUBE時(shí)按原始算算法計(jì)算,,但日、月月、季、年年的匯總值值要分別計(jì)計(jì)算車貸險(xiǎn)指標(biāo)標(biāo)——該類指標(biāo)的的數(shù)據(jù)源比比較特殊,,不考慮建建立分析層層,可在構(gòu)構(gòu)建CUBE時(shí)按原始算算法計(jì)算從中間層到到分析層———承保理理賠簽單類只計(jì)算保單單,口徑為為:核保日日期在當(dāng)期期andstart_date=‘1900-1-1’’主要指標(biāo)有有:保險(xiǎn)金金額、保單單保費(fèi)、保保單筆數(shù)、、累計(jì)儲(chǔ)金金、已驗(yàn)車車數(shù)量、應(yīng)應(yīng)驗(yàn)車數(shù)量量需要減去退退保和注銷銷會(huì)計(jì)年度類類不考慮版本本,所有記記錄一起計(jì)計(jì)算,口徑徑為:核保保日期在當(dāng)當(dāng)期保額和保費(fèi)費(fèi)只累計(jì)變變化值主要指標(biāo)有有:保費(fèi)收收入、批增增批減保費(fèi)費(fèi)(件數(shù)))、退保((注銷)保保費(fèi)(件數(shù)數(shù))等理賠類口徑:結(jié)案案日期在當(dāng)當(dāng)期或估損損修改日期期在當(dāng)期部分指標(biāo)只只考慮起始始兩個(gè)版本本,即立案案和結(jié)案,,比如立案案估損金額額、結(jié)案天天數(shù)主要指標(biāo)有有:已決筆筆數(shù)、已決決賠款、未未決筆數(shù)變變化、未決決賠款變化化、立案估估損金額、、估損偏差差絕對(duì)值、、加權(quán)估損損金額、結(jié)結(jié)案天數(shù)特殊口徑類類已賺保費(fèi)---算法參參見(jiàn)“模型型運(yùn)用方法法與技巧””有部分指標(biāo)標(biāo)不需要定定義在分析析層,因?yàn)闉樗鼈兛梢砸詮囊陨现钢笜?biāo)衍生,,比如車險(xiǎn)險(xiǎn)續(xù)保指標(biāo)標(biāo)、理財(cái)險(xiǎn)險(xiǎn)指標(biāo),都都可以從承承保理賠分分析表以保保險(xiǎn)止期維維度為口徑徑聚合生成成。從中間層到到分析層———收付費(fèi)費(fèi)收付費(fèi)指標(biāo)標(biāo)的主要口口徑基本上上都是以收收付確認(rèn)日日期來(lái)計(jì)算算,在源系系統(tǒng)中體現(xiàn)現(xiàn)為應(yīng)收(付)確認(rèn)日期和和實(shí)收(付)確認(rèn)日期需求中要求求按幣種分分別展現(xiàn)人人民幣和非非人民幣的的統(tǒng)計(jì)值,,由于本事事實(shí)表已經(jīng)經(jīng)包含保單單維度,因因此這些指指標(biāo)都可以以根據(jù)保單單維度中的的幣種重新新匯總生成成應(yīng)收保費(fèi)變變化的計(jì)算算規(guī)則是::應(yīng)收一筆筆保費(fèi)以正正數(shù)累計(jì),,實(shí)收一筆筆保費(fèi)以負(fù)負(fù)數(shù)累計(jì),,對(duì)實(shí)收的的沖正以正正數(shù)累計(jì)滾動(dòng)12個(gè)月財(cái)務(wù)保保費(fèi)收入是是應(yīng)收保費(fèi)費(fèi)收入的衍衍生指標(biāo)核賠效率分分析核賠效率分分析的指標(biāo)標(biāo)基本都有有共享的維維度,因此此為其建立立一個(gè)分析析層主題是是合適的核賠效率分分析涉及的的源表比較較分散,且且增量機(jī)制制較為復(fù)雜雜,因此建建立中間表表有一定的的難度,目目前的策略略是參照原原指標(biāo)算法法分別計(jì)算算出各指標(biāo)標(biāo),并插入入一臨時(shí)表表中,再對(duì)對(duì)該表執(zhí)行行聚合操作作由于源系統(tǒng)統(tǒng)可能會(huì)更更新核賠數(shù)數(shù)據(jù)的狀態(tài)態(tài),因而導(dǎo)導(dǎo)致部分指指標(biāo)存在““過(guò)期”現(xiàn)現(xiàn)象,在目目前沒(méi)有歷歷史數(shù)據(jù)支支持的情況況,我們的的解決辦法法是由業(yè)務(wù)務(wù)部門確定定一個(gè)過(guò)期期閥值天數(shù)數(shù)N,超過(guò)過(guò)N天之前前的指標(biāo)不不會(huì)再過(guò)期期,那么每每天加載核核賠效率事事實(shí)表時(shí),,不僅僅計(jì)計(jì)算當(dāng)天的的事實(shí)數(shù)據(jù)據(jù),而是把把N天之前前的數(shù)據(jù)也也都復(fù)算一一遍主題維度建模的的基本概念念模型概述模型介紹模型運(yùn)用方方法與技巧巧相關(guān)技術(shù)問(wèn)問(wèn)題數(shù)據(jù)版本的的截取時(shí)間間點(diǎn)查詢出2008-4-10各業(yè)務(wù)員的的數(shù)據(jù):select*from業(yè)務(wù)員表wherestart_date<=‘2008-4-10’andend_date>‘2008-4-10’保單中間表表連接員工工表獲取員員工的職位位屬性:selecta.policy,……,b.職位frommid_policy_facta,業(yè)務(wù)員表bwherea.c_emp_cde=b.c_emp_cdeandb.start_date<=t_udr_dateandb.end_date>t_udr_date截取時(shí)間為為常量截取時(shí)間為為連接主表表的相關(guān)時(shí)時(shí)間字段時(shí)間鏈的生生成技巧假定經(jīng)過(guò)相相應(yīng)的處理理后得到一一個(gè)數(shù)據(jù)集集T,T可以是一個(gè)個(gè)臨時(shí)表、、視圖或子子查詢,并并包含一個(gè)個(gè)日期字段段Start_date(不可有空值值)作為時(shí)間鏈鏈的開始日日期,但End_date還未生成,,則可以用用以下SQL生成時(shí)間鏈鏈:Selectanchor_id,…,start_date,lead(start_date,1,to_date(‘99991231’,’yyyymmdd’)over(partitionbyanchor_idorderbystart_date)asend_dateFromT;其中Anchor_id是數(shù)據(jù)集的的錨ID,比如保單單號(hào)、單據(jù)據(jù)號(hào)等歷史表增量量加載策略略在常規(guī)情況況下,該算算法也適合合全量加載載,此時(shí)數(shù)數(shù)據(jù)集是全全量數(shù)據(jù),,而目標(biāo)表表的初始狀狀況是空表表。由于目標(biāo)表表中要求第第一條版本本記錄的Start_date應(yīng)該為‘1900-1-1‘‘,這里的算算法要考慮慮T01的增量在目目標(biāo)表中沒(méi)沒(méi)有前續(xù)版版本記錄的的情況已賺保費(fèi)的的計(jì)算以上有效時(shí)時(shí)間段不能能采用保單單版本的時(shí)時(shí)間鏈,而而要按業(yè)務(wù)務(wù)上的保單單生效規(guī)則則來(lái)確定時(shí)時(shí)間范圍一般情況下下,保單的的生效開始始日期就是是保險(xiǎn)起期期,但對(duì)于于倒簽單,,則按核保保日期計(jì)算算,因此回回避了在此此之前已匯匯總的漏算算問(wèn)題最好在承保保中間表中中事先計(jì)算算出業(yè)務(wù)有有效時(shí)間范范圍,作為為業(yè)務(wù)時(shí)間間鏈,不僅僅避免在匯匯總指標(biāo)時(shí)時(shí)多做計(jì)算算,而且有有利于測(cè)試試時(shí)核對(duì)數(shù)數(shù)據(jù)由于涉及到到除法,如如果時(shí)間維維的粒度太太細(xì),可能能導(dǎo)致過(guò)多多的精度誤誤差,建議議匯總表中中該指標(biāo)字字段保留更更多的小數(shù)數(shù)位,比如如6~8位2007.12007.6安邦以前的的算法累加各版本本保費(fèi)變化化乘以當(dāng)期期內(nèi)的保險(xiǎn)險(xiǎn)期限時(shí)間間段在當(dāng)前前保險(xiǎn)期限限內(nèi)的占比比2007.12007.6較準(zhǔn)確的算算法累加各版本本當(dāng)前保費(fèi)費(fèi)乘以當(dāng)期期內(nèi)的有效效時(shí)間段在在當(dāng)前保險(xiǎn)險(xiǎn)期限內(nèi)的的占比每個(gè)線段表表示保單各各版本用于于計(jì)算當(dāng)期期有效天數(shù)數(shù)的基準(zhǔn)時(shí)時(shí)間段,而而被陰影覆覆蓋的部分分作為時(shí)間間占比的分分子承保理賠分分析應(yīng)用———場(chǎng)景假假設(shè)Ply_prof_idDpt_id統(tǒng)計(jì)月份簽單件數(shù)已決件數(shù)未決件數(shù)變化100120012007.2103100120012007.321-1100120022007.3101100220022007.3112100120012007.4011100120022007.4102100220022007.421-1100220032007.4101100220032007.5100100120022007.5010100220022007.501-1100220032007.6011Ply_prof_id保險(xiǎn)起期10012007.210022007.3Ply_prof_dm為簡(jiǎn)化起見(jiàn)見(jiàn),假定保保單維表只只有一個(gè)維維屬性:保保險(xiǎn)起期((月)DM_FACT承保理賠分分析事實(shí)表表經(jīng)過(guò)聚合合計(jì)算后生生成的局部部視圖,含含有三個(gè)指指標(biāo),除統(tǒng)統(tǒng)計(jì)月份外外的維度組組合有四種種(不同的的顏色區(qū)分分)承保理賠賠分析應(yīng)應(yīng)用———轉(zhuǎn)換成成快照型型事實(shí)經(jīng)過(guò)與月月維表的的分區(qū)外外連接,,以上查查詢填充充了遺漏漏的月份份,并利利用分析析函數(shù)計(jì)計(jì)算出““期末未未決”這這個(gè)時(shí)點(diǎn)點(diǎn)值??煽梢岳糜么瞬樵?cè)兘ubeDM_FACT應(yīng)該是經(jīng)經(jīng)聚合后后粒度已已經(jīng)較粗粗的事實(shí)實(shí),可以以是表、、視圖、、物化視視圖或子子查詢可以通過(guò)過(guò)對(duì)月維維表增加加查詢條條件來(lái)減減少最終終快照型型事實(shí)的的維度組組合,比比如保單單維表中中實(shí)際上上是包含含“核保保月份””的,則則可以增增加一個(gè)個(gè)連接條條件為““v1.mon_id>=核保月份份”,但但這種做做法必須須要有數(shù)數(shù)據(jù)質(zhì)量量的保證證會(huì)計(jì)年度度的報(bào)表表或分析析應(yīng)用可可以在該該查詢結(jié)結(jié)果的基基礎(chǔ)上直直接以mon_id為時(shí)間維維度進(jìn)行行聚合得得到WITHv1AS(SELECTmon_idFROMcal_monWHEREmon_id<=200706)SELECTply_prof_id,dpt_id,mon_id,簽單件數(shù)數(shù),已決件數(shù)數(shù),sum(未決件數(shù)數(shù)變化)OVER(PARTITIONBYply_prof_id,dpt_idORDERBYmon_idROWSUNBOUNDEDPRECEDING)as期末未決決件數(shù)FROM(SELECTply_prof_id,dpt_id,v1.mon_id,簽單件數(shù)數(shù),已決件數(shù)數(shù),未決決件數(shù)變變化FROMdm_factPARTITIONBY(ply_prof_id,dpt_id)RIGHTOUTERJOINv1ON(v1.mon_id=統(tǒng)計(jì)月份份))承保理賠賠分析應(yīng)應(yīng)用———保單年年度算法法保單年度度分析是是在兩個(gè)個(gè)時(shí)間維維度上的的快照型型事實(shí),,兩個(gè)時(shí)時(shí)間維度度分別是是保險(xiǎn)起起期和截截止月份份,所有有指標(biāo)都都是在截截止月份份維度上上的時(shí)點(diǎn)點(diǎn)值,計(jì)計(jì)算該快快照型事事實(shí)可參參考下面面的SQL。該算法同同樣可以以增加條條件減少少維度組組合,比比如通常常在保險(xiǎn)險(xiǎn)責(zé)任結(jié)結(jié)束N年后,保保單年度度分析的的價(jià)值已已經(jīng)減退退,因此此可以在在連接條條件中增增加“v1.mon_id<=pf.保險(xiǎn)止期期+N””,注意:由由于實(shí)際際模型中中保單維維表不止止保險(xiǎn)起起期一個(gè)個(gè)屬性,,則以下下查詢?cè)谠诰S度上上還存在在重復(fù)值值,直接接使用需需要再進(jìn)進(jìn)行聚合合。WITHv1AS(SELECTmon_idFROMcal_monWHEREmon_id<=200706)SELECT保險(xiǎn)起期期,dpt_id,mon_id,sum(簽單件數(shù)數(shù))OVER(PARTITIONBYply_prof_id,dpt_idORDERBYmon_idROWSUNBOUNDEDPRECEDING)AS簽單件數(shù)數(shù)sum(已決件數(shù)數(shù))OVER(PARTITIONBYply_prof_id,dpt_idORDERBYmon_idROWSUNBOUNDEDPRECEDING)AS已決件數(shù)數(shù)sum(未決件數(shù)數(shù)變化)OVER(PARTITIONBYply_prof_id,dpt_idORDERBYmon_idROWSUNBOUNDEDPRECEDING)AS未決件數(shù)數(shù)FROM(SELECTpf.保險(xiǎn)起期期,dpt_id,v1.mon_id,簽單件數(shù)數(shù),已決件數(shù)數(shù),未決決件數(shù)變變化FROMdm_factINNERJOINply_prof_dmpfON(pf.ply_prof_id=dm_fact.ply_prof_id)PARTITIONBY(ply_prof_id,dpt_id)RIGHTOUTERJOINv1ON(v1.mon_id=統(tǒng)計(jì)月份份andv1_mon_id>=pf.保險(xiǎn)起期期))承保理賠賠分析應(yīng)應(yīng)用———保單年年度快照照事實(shí)保險(xiǎn)起期Dpt_id截止月份簽單件數(shù)已決件數(shù)未決件數(shù)2007.220012007.21032007.220012007.33122007.220012007.43232007.220012007.53232007.220012007.63232007.220022007.20002007
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024戶外廣告牌制作安裝合同
- 2024年合作投資協(xié)議書模板
- 2024苗木購(gòu)銷合同范本簡(jiǎn)單版
- 2024股東合作經(jīng)營(yíng)合同協(xié)議書
- 城市街道廣告位租賃合同
- 插畫約稿合同樣本
- 二房東租房合同租房合同協(xié)議范本
- 2024股份制工程合作協(xié)議書
- 貨物運(yùn)輸合同簽訂技巧
- 4.1 夯實(shí)法治基礎(chǔ)(導(dǎo)學(xué)案) 2024-2025學(xué)年統(tǒng)編版道德與法治九年級(jí)上冊(cè)
- (培訓(xùn)體系)2020年普通話測(cè)試培訓(xùn)材料
- 3-4單元測(cè)試-2024-2025學(xué)年統(tǒng)編版語(yǔ)文六年級(jí)上冊(cè)
- 北師版數(shù)學(xué)八年級(jí)上冊(cè) 5.8三元一次方程組課件
- 2024混合動(dòng)力汽車賽道專題報(bào)告-2024-10-市場(chǎng)解讀
- DB34T 4338-2022 行政規(guī)范性文件合法性審核規(guī)范
- 企業(yè)單位消防安全規(guī)范化管理指導(dǎo)手冊(cè)
- 廢舊物資回收投標(biāo)方案(技術(shù)方案)
- 宣傳視頻拍攝服務(wù)投標(biāo)方案(技術(shù)方案)
- 森林防火課件下載
- 3《歡歡喜喜慶國(guó)慶》(教學(xué)設(shè)計(jì))2024-2025學(xué)年統(tǒng)編版道德與法治二年級(jí)上冊(cè)
- 2024糧改飼工作總結(jié)五篇
評(píng)論
0/150
提交評(píng)論