信貸數(shù)據(jù)風(fēng)控體系設(shè)計_第1頁
信貸數(shù)據(jù)風(fēng)控體系設(shè)計_第2頁
信貸數(shù)據(jù)風(fēng)控體系設(shè)計_第3頁
信貸數(shù)據(jù)風(fēng)控體系設(shè)計_第4頁
信貸數(shù)據(jù)風(fēng)控體系設(shè)計_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

信貸數(shù)據(jù)風(fēng)控體系設(shè)計第一頁,共19頁。大綱21. 我們是誰理解風(fēng)控理解用戶風(fēng)控系統(tǒng)的架構(gòu)設(shè)計第二頁,共19頁。2.理解風(fēng)控3信貸產(chǎn)品的組成部分什么數(shù)據(jù)是有用的數(shù)據(jù)個人借款風(fēng)險的原因數(shù)據(jù)與風(fēng)險的關(guān)系第三頁,共19頁。2.1

信貸產(chǎn)品的組成部分???????????????????????????????????????4第四頁,共19頁。2.2什么數(shù)據(jù)是有用的數(shù)據(jù)5可觀查到并記錄下來的都是數(shù)據(jù)。被動收集與主動收集。不同的數(shù)據(jù)有不同的價值。第五頁,共19頁。2.3

個人借款風(fēng)險6風(fēng)險包括:欺詐風(fēng)險和信用風(fēng)險欺詐風(fēng)險:第三方欺詐:主動賴賬:信用風(fēng)險:財務(wù)收入:支出管理:不良嗜好:第六頁,共19頁。2.4數(shù)據(jù)與風(fēng)險的關(guān)系7統(tǒng)計模型適合個人信貸決策。相關(guān)性比因果關(guān)系更重要。數(shù)據(jù)整理--‐>數(shù)據(jù)整合--‐>數(shù)據(jù)特性原始裸數(shù)據(jù)--‐>簡單特征變量--‐>復(fù)雜特征變量信用卡原始交易記錄(時間、地點、商家、金額等)簡單變量(不同品類、時間段、地點的消費金額和頻次)簡單特征變量的組合特征(在深夜購買游戲點卡的消費金額和頻次,等等)模型應(yīng)用。第七頁,共19頁。大綱1. 我們是誰理解風(fēng)控理解用戶風(fēng)控系統(tǒng)的架構(gòu)設(shè)計8第八頁,共19頁。3.

理解用戶風(fēng)控政策人員數(shù)據(jù)科學(xué)家產(chǎn)品開發(fā)工程師9第九頁,共19頁。3.1

風(fēng)控政策人員特點對金融市場的風(fēng)險有豐富經(jīng)驗。有一定統(tǒng)計分析的背景,復(fù)雜算法的能力不足。對負責(zé)的產(chǎn)品理解深刻,但對其他產(chǎn)品認識有限。需求靈活方便的控制風(fēng)控政策的執(zhí)行。執(zhí)行歷史的BI報表和報警機制。簡單高效的政策分析和回測。研究成果的跨團隊共享。10第十頁,共19頁。3.2數(shù)據(jù)科學(xué)家特點對數(shù)據(jù)挖掘和機器學(xué)習(xí)算法有深入的理解。對數(shù)據(jù)有很好的感覺。有一定的編程能力。需求完整清晰的數(shù)據(jù)定義和數(shù)據(jù)流。高性能的分布式計算集群和基礎(chǔ)設(shè)施。多人協(xié)作以及跨團隊協(xié)作的能力。能輕松將研究成果應(yīng)用到業(yè)務(wù)系統(tǒng)中。11第十一頁,共19頁。3.3

產(chǎn)品開發(fā)工程師特點專業(yè)的系統(tǒng)開發(fā)能力。開發(fā)任務(wù)排期緊張。關(guān)注系統(tǒng)穩(wěn)定性和性能。需求對接工作盡量簡單。有完善的文檔和測試環(huán)境。有系統(tǒng)級別的監(jiān)控報警。有專人負責(zé)對接工作和問題聯(lián)調(diào)。12第十二頁,共19頁。大綱1. 我們是誰理解風(fēng)控理解用戶風(fēng)控系統(tǒng)的架構(gòu)設(shè)計13第十三頁,共19頁。4.

風(fēng)控系統(tǒng)的架構(gòu)設(shè)計總體結(jié)構(gòu)數(shù)據(jù)整合部分–

知識圖譜政策執(zhí)行部分

決策引擎實驗分析部分– ALBUS14第十四頁,共19頁。4.1

總體結(jié)構(gòu)決策執(zhí)行RE分析平臺Albus數(shù)據(jù)整合KG風(fēng)險政策人員(非技術(shù))貸款產(chǎn)品開發(fā)人員數(shù)據(jù)挖掘科學(xué)家riskmodeldatadata15第十五頁,共19頁。4.2

數(shù)據(jù)整合部分

知識圖譜QueryEnginecrawlercontrollerRESTClientDBHDFSFileKGwebfrontRESTClientrealtimesourcerealtime/batchextractionrealtimeinsertscommandswebtracebatchprocessingWebcrawlerslogging............Kafkasparkstreamingweb

extractionconfigonline

knowledgeprocessingofflinecomplexreasoningentity

retrievegraph

traversefulltextsearchKGrepositorybatch

loggingpartnersQueryEnginedataintegration16第十六頁,共19頁。4.3政策執(zhí)行部分

–決策引擎17第十七頁,共19頁。4.4

實驗分析部分– ALBUS讀數(shù)據(jù)數(shù)據(jù)過濾和采樣特征擴充模型執(zhí)行結(jié)果可視化邏輯層執(zhí)行層HDFSHbaseHiveMySQ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論