用戶畫(huà)像構(gòu)建與應(yīng)用_第1頁(yè)
用戶畫(huà)像構(gòu)建與應(yīng)用_第2頁(yè)
用戶畫(huà)像構(gòu)建與應(yīng)用_第3頁(yè)
用戶畫(huà)像構(gòu)建與應(yīng)用_第4頁(yè)
用戶畫(huà)像構(gòu)建與應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

機(jī)器學(xué)習(xí)自然語(yǔ)言處理視覺(jué) 導(dǎo)讀今天分享的主題是信貸場(chǎng)景用戶畫(huà)像構(gòu)建與應(yīng)用,將結(jié)合信貸場(chǎng)景的特殊性,深入討論如何建立一個(gè)服務(wù)于整個(gè)信貸業(yè)務(wù)場(chǎng)景的用戶畫(huà)像特征體系。今天的介紹會(huì)圍繞下面五點(diǎn)展開(kāi):1.信貸場(chǎng)景用戶畫(huà)像構(gòu)建方法2.信貸場(chǎng)景用戶畫(huà)像構(gòu)建實(shí)踐3.信貸場(chǎng)景用戶畫(huà)像應(yīng)用4.擴(kuò)展方向1.信貸用戶畫(huà)像業(yè)務(wù)目標(biāo)QiFU奇富科技xataFun.從互聯(lián)網(wǎng)信貸的業(yè)務(wù)視角理解畫(huà)像需求,精準(zhǔn)識(shí)別和理解潛在用戶,提供個(gè)性化的信貸產(chǎn)品和服務(wù),提高信貸風(fēng)險(xiǎn)決策準(zhǔn)確性與管理效率,降低不良貸款率,提升盈利能力,實(shí)現(xiàn)持續(xù)發(fā)展。服務(wù)服務(wù)安全合規(guī)規(guī)模風(fēng)險(xiǎn)利潤(rùn)在核心業(yè)務(wù)場(chǎng)景中實(shí)現(xiàn)應(yīng)用,以實(shí)現(xiàn)閉環(huán)效果?!ぬ嵘龢I(yè)務(wù)指標(biāo):公司的核心目標(biāo)是盈利,因此需要在獲客、經(jīng)營(yíng)、風(fēng)險(xiǎn)、催收等環(huán)節(jié)提·提升對(duì)自身用戶的認(rèn)知:借貸市場(chǎng)不斷變化,客群構(gòu)成和質(zhì)量都在變化,因此實(shí)時(shí)、準(zhǔn)·提升客戶滿意度:通過(guò)畫(huà)像構(gòu)建,提高客戶滿意度,增加客戶留存率。·防范系統(tǒng)和客戶風(fēng)險(xiǎn):通過(guò)畫(huà)像構(gòu)建的信息,有效防范潛在的系統(tǒng)性風(fēng)險(xiǎn)和客戶風(fēng)險(xiǎn)?!づ浜虾弦?guī)改造:確保業(yè)務(wù)在合規(guī)框架內(nèi)運(yùn)營(yíng),配合合規(guī)改造的需求。2.信貸用戶畫(huà)像做什么信貸用戶畫(huà)像做什么外部數(shù)據(jù)精準(zhǔn)化營(yíng)銷精細(xì)化運(yùn)營(yíng)精細(xì)化風(fēng)險(xiǎn)管理3.信貸用戶畫(huà)像構(gòu)建技術(shù)難點(diǎn)口數(shù)據(jù)收集和整合口隱私和安全保障口數(shù)據(jù)驗(yàn)證和精準(zhǔn)度評(píng)估□實(shí)時(shí)性和動(dòng)態(tài)性·隱私和安全的保障:由于涉及到用戶個(gè)人信息和隱私數(shù)據(jù),需要保障隱私和安全。數(shù)據(jù)獲取需要獲得完整、合規(guī)的授權(quán)鏈路,采用有效措施確保數(shù)據(jù)的安全和保密。敏感數(shù)據(jù)需按照規(guī)則進(jìn)行脫敏,避免泄密?!?shù)據(jù)驗(yàn)證與精準(zhǔn)度評(píng)估:構(gòu)建用戶畫(huà)像后,需要進(jìn)行有效性驗(yàn)證,確保在實(shí)際業(yè)務(wù)中的準(zhǔn)確和可用性?;A(chǔ)畫(huà)像可以通過(guò)groundtruth和交叉驗(yàn)證進(jìn)行評(píng)估,而一些場(chǎng)景下可能需要采用問(wèn)卷調(diào)研等方式進(jìn)行評(píng)估和驗(yàn)證。·實(shí)時(shí)性和動(dòng)態(tài)性:有些畫(huà)像越穩(wěn)定越好,如廣告設(shè)備維度預(yù)測(cè)的性別,如果波動(dòng)很大,說(shuō)明模型構(gòu)建得不夠好。有些畫(huà)像則越能反映用戶行為和情景的變化越好,如我們通過(guò)用戶埋點(diǎn)信息挖掘出來(lái)的需求畫(huà)像。這些畫(huà)像從數(shù)據(jù)獲取、數(shù)據(jù)處理到畫(huà)像生成都需要高效的數(shù)據(jù)實(shí)時(shí)處理和更新機(jī)制支撐。4.用戶畫(huà)像建模流程用戶畫(huà)像建模流程構(gòu)建閉環(huán)式用戶畫(huà)像構(gòu)建機(jī)制,運(yùn)用專業(yè)技術(shù)規(guī)范畫(huà)像構(gòu)建流程,提升用戶畫(huà)像建模效果(提升模型指標(biāo)、業(yè)務(wù)指標(biāo))數(shù)據(jù)畫(huà)像理解數(shù)據(jù)理解數(shù)據(jù)準(zhǔn)備建立模型畫(huà)像評(píng)估畫(huà)像發(fā)布一模型部署一模型監(jiān)控一線上測(cè)試一線上服務(wù)一模型部署一模型監(jiān)控一線上測(cè)試一線上服務(wù)一評(píng)價(jià)標(biāo)準(zhǔn)一技術(shù)指標(biāo)評(píng)估一業(yè)務(wù)指標(biāo)評(píng)估一技術(shù)指標(biāo)評(píng)估一業(yè)務(wù)指標(biāo)評(píng)估用戶畫(huà)像構(gòu)建的核心流程包括以下幾個(gè)步驟:·畫(huà)像理解:從算法和數(shù)據(jù)的角度定義畫(huà)像,清晰認(rèn)知畫(huà)像的價(jià)值。理解畫(huà)像的定義對(duì)于算法和數(shù)據(jù)的角度是至關(guān)重要的?!?shù)據(jù)了解與準(zhǔn)備:了解數(shù)據(jù)的采集方式,進(jìn)行數(shù)據(jù)探索分析,如可視化分析等。對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估,并進(jìn)行數(shù)據(jù)清洗、變換以及特征工程,以滿足模型的需求。·評(píng)估:制定評(píng)估標(biāo)準(zhǔn),從技術(shù)指標(biāo)和業(yè)務(wù)指標(biāo)兩個(gè)維度對(duì)畫(huà)像進(jìn)行評(píng)估。評(píng)估合格后,將畫(huà)像或特征上線部署,并建立相應(yīng)的監(jiān)控和線上測(cè)試服務(wù)?!さc更新:畫(huà)像的構(gòu)建并非一次性完成,在需求變化、認(rèn)知深入以及新的有效數(shù)據(jù)源增加的時(shí)候,需要對(duì)畫(huà)像進(jìn)行升級(jí)。畫(huà)像的構(gòu)建過(guò)程是一個(gè)閉環(huán)迭代的循環(huán)。這一流程確保了畫(huà)像的質(zhì)量、實(shí)用性,并使其能夠適應(yīng)業(yè)務(wù)需求的不斷變化。信貸場(chǎng)景用戶畫(huà)像構(gòu)建實(shí)踐1.用戶核心畫(huà)像用戶核心畫(huà)像常房產(chǎn)負(fù)債/競(jìng)品核心用戶畫(huà)像主要包括以下九類特征:小微身份:表示用戶是否為企業(yè)主、個(gè)體戶等。雖然在工商數(shù)據(jù)中無(wú)法直接查找相關(guān)信息,但他們?cè)谟脩粜袨?、質(zhì)量和需求等方面表明其與工商的小微身份相近。行業(yè)信息:可以基于國(guó)標(biāo)的行業(yè)分類,并從風(fēng)險(xiǎn)和需求角度重新優(yōu)化行業(yè)分類標(biāo)準(zhǔn)。采用規(guī)則和NLP算法進(jìn)行構(gòu)建的行業(yè)框架能更好地反映用戶的行業(yè)特點(diǎn)。學(xué)歷標(biāo)簽:包括??埔韵?、??埔陨希究埔韵?、本科以上等分類??赡軙?huì)細(xì)分專業(yè)、理工科等類別,甚至根據(jù)畢業(yè)學(xué)校的等級(jí)進(jìn)行分類,以提高對(duì)用戶風(fēng)險(xiǎn)的區(qū)分度。房產(chǎn)標(biāo)簽:包括是否擁有房產(chǎn)以及房產(chǎn)價(jià)值,并通過(guò)挖掘房產(chǎn)地理位置,關(guān)聯(lián)小區(qū)、周邊商圈、周邊POI分布、人流等信息。車產(chǎn)標(biāo)簽:通常來(lái)自第三方數(shù)據(jù),包括車輛的基本信息,如車輛的品牌、檔次、價(jià)值、年限、殘值等信息。收入標(biāo)簽:采用多種方式進(jìn)行建模,可以是回歸、多分類或單分類等,結(jié)合業(yè)務(wù)指標(biāo)評(píng)估收入分的穩(wěn)定性和可解釋性。負(fù)債信息:挖掘用戶在消金、小貸、消費(fèi)貸、銀行等機(jī)構(gòu)的負(fù)債信息,了解用戶的整體負(fù)債情況。競(jìng)品信息:通過(guò)特征挖掘,獲取用戶在消金、小貸、消費(fèi)貸、銀行等領(lǐng)域的競(jìng)品信息,幫助了解用戶的競(jìng)品使用情況。2.用戶畫(huà)像體系策策略用戶畫(huà)像體系以業(yè)務(wù)需求為驅(qū)動(dòng),從信貸場(chǎng)景的策略應(yīng)用到畫(huà)像特征粒度,建立涵蓋核心畫(huà)像、基礎(chǔ)畫(huà)像和特征畫(huà)像三層的用戶畫(huà)像體系年齡年齡小微/泛小微身份設(shè)備偏好行業(yè)職業(yè)學(xué)歷房產(chǎn)車產(chǎn)興趣地域收入負(fù)債/競(jìng)品多頭航旅消費(fèi)PreA質(zhì)量分基礎(chǔ)畫(huà)像PreA意向分完件意向分稅務(wù)特征企業(yè)經(jīng)營(yíng)特征動(dòng)支意愿分人行征信競(jìng)品解讀信用子分AP撞庫(kù)特征電銷行為特征電銷標(biāo)簽特征INR特征點(diǎn)擊登錄等埋點(diǎn)注冊(cè)完件授信動(dòng)支還款逾期催收調(diào)額調(diào)價(jià)關(guān)系網(wǎng)特征信息流廣告特征短信營(yíng)銷特征APP偏好資方拒絕性別畫(huà)像的特征體系還包括基礎(chǔ)畫(huà)像和特征畫(huà)像兩類?;A(chǔ)畫(huà)像包含通用的年齡、性別、設(shè)備偏好、APP偏好,以及用戶的習(xí)慣、所屬地域,所屬地域可以衍生出許多屬性,比如出生地、手機(jī)和身份證所在地。除此之外還有航旅,比如坐飛機(jī)或者坐高鐵的習(xí)慣,以及Wifi接入,POl的信息等第三個(gè)層面就是特征畫(huà)像,其粒度更細(xì),涵蓋范圍更廣。它包括信息流廣告特征,主要是從RTA請(qǐng)求中抽取的特征,如不同媒體的請(qǐng)求、廣告位,請(qǐng)求的次數(shù)、時(shí)間分布、設(shè)備信息等等,都挖掘成設(shè)備廣告特征。此外,還有一些營(yíng)銷類的特征,如電銷的營(yíng)銷行為。還有埋點(diǎn)的特征,對(duì)于埋點(diǎn)特征,用戶通常已經(jīng)下載了APP,并且大部分已經(jīng)完成了注冊(cè),用戶再去登錄,一定與其需求或者關(guān)注點(diǎn)是強(qiáng)相關(guān)的,所以從中可以挖掘出很多特征。我們也會(huì)把業(yè)務(wù)中各個(gè)環(huán)節(jié)的累積行為數(shù)據(jù)挖掘成相關(guān)的特征,比如從注冊(cè)到授信、動(dòng)支、還款、逾期、催收等,還有調(diào)額調(diào)價(jià)這種業(yè)務(wù)的主動(dòng)行為,以及經(jīng)營(yíng)行為帶來(lái)的用戶反饋,也建成相應(yīng)的特征主題表。除此之外,為了方便使用,在提供特征寬表給業(yè)務(wù)使用時(shí),往往也會(huì)結(jié)合具體業(yè)務(wù)側(cè)的應(yīng)用建立分場(chǎng)景的模型,如PreA質(zhì)量分、PreA意愿分、動(dòng)資意愿分、信用子分等。對(duì)小微企業(yè)主,挖掘企業(yè)相關(guān)的經(jīng)營(yíng)類的特征,比如上下游供應(yīng)鏈、稅票等信息。除此之外,我們也會(huì)通過(guò)關(guān)系網(wǎng)的特征,去挖掘一些畫(huà)像標(biāo)簽,或者是一些特征字段。在常規(guī)數(shù)據(jù)源和手段之外,關(guān)系網(wǎng)往往能帶目標(biāo)3.信貸場(chǎng)景畫(huà)像構(gòu)建技術(shù)框架目標(biāo)4.多數(shù)據(jù)源融合多數(shù)據(jù)源融合從特征、模型子分或置信度三個(gè)維度融合在實(shí)際中,多數(shù)據(jù)源的融合通常采用三種主要方法:·特征層面融合:將不同數(shù)據(jù)源的特征整合在一起,形成一個(gè)寬特征,并建立單一模型。這是一種較為通用的方法。這種方式有一個(gè)問(wèn)題,就是在引入新數(shù)據(jù)源的時(shí)候,需要將新模型應(yīng)用到所有的樣本上,難以平滑過(guò)度。·單獨(dú)建模再融合:不同數(shù)據(jù)源分別建模,然后使用多個(gè)模型進(jìn)行融合。例如,對(duì)外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)分別建模,然后將兩個(gè)分?jǐn)?shù)進(jìn)行回歸融合。這種方法可以降低不同數(shù)據(jù)語(yǔ)境之間的耦合,但也可能引起更新問(wèn)題,類似于特征層面融合?!ぶ眯哦热诤希翰煌臄?shù)據(jù)源單獨(dú)建立模型,利用各自的模型分給畫(huà)像賦置信度,最后融合時(shí)取最高置信度的結(jié)果。對(duì)于實(shí)事類的數(shù)據(jù)樣本,我們可以把置信度賦予最高值。這種方式的優(yōu)點(diǎn)是易于向前兼容,但整體指標(biāo)會(huì)比前兩種略差。選擇合適的融合方法取決于具體業(yè)務(wù)場(chǎng)景、數(shù)據(jù)質(zhì)量和模型效果的要求。每種方法都有其優(yōu)點(diǎn)和缺點(diǎn),需要根據(jù)實(shí)際情況進(jìn)行權(quán)衡和選擇。5.畫(huà)像部署畫(huà)像部署畫(huà)像部署畫(huà)像部署將用戶畫(huà)像產(chǎn)出結(jié)果封裝以滿足業(yè)務(wù)系統(tǒng)在不同場(chǎng)景的使用需求用戶畫(huà)像特用戶畫(huà)像特征體系6.畫(huà)像效果及價(jià)值評(píng)估畫(huà)像效果及價(jià)值評(píng)估從模型技術(shù)指標(biāo)、整體準(zhǔn)召、業(yè)務(wù)指標(biāo)三個(gè)層面判斷效果和檢驗(yàn)價(jià)值7.畫(huà)像管理畫(huà)像管理標(biāo)準(zhǔn)規(guī)范標(biāo)準(zhǔn)規(guī)范→衍生邏輯、報(bào)告模板、命名規(guī)則、準(zhǔn)確性驗(yàn)證信息融合→多數(shù)據(jù)融合、不斷提升準(zhǔn)確率和覆蓋率版本管理→多版本并行、平滑切換、影響最小化監(jiān)控報(bào)警→早發(fā)現(xiàn)、早解決(執(zhí)行情況、數(shù)據(jù)穩(wěn)定性、業(yè)務(wù)指標(biāo))知識(shí)體系→清晰、全面(字段解釋、加工和挖掘方案)畫(huà)像服務(wù)→可視化、在線離線(生產(chǎn)、部署)、特征庫(kù)、自動(dòng)化建模、高效回溯·建立標(biāo)準(zhǔn)規(guī)范:制定邏輯衍生、評(píng)估報(bào)告、命名規(guī)則等標(biāo)準(zhǔn),確保評(píng)估報(bào)告完善,驗(yàn)證準(zhǔn)確性的標(biāo)準(zhǔn)得以實(shí)施?!た趶浇y(tǒng)一:實(shí)現(xiàn)核心畫(huà)像的橫向打通,統(tǒng)一口徑,確保新老畫(huà)像的一致性?!ば畔⑷诤希簭?qiáng)調(diào)多數(shù)據(jù)源融合,不斷提升畫(huà)像的準(zhǔn)確率和覆蓋率?!ぐ姹竟芾恚汗芾矶喟姹静⑿校瑢?shí)現(xiàn)平滑切換,最小化對(duì)系統(tǒng)的影響?!けO(jiān)控報(bào)警:提前發(fā)現(xiàn)問(wèn)題,早期解決,包括執(zhí)行情況、數(shù)據(jù)穩(wěn)定性以及業(yè)務(wù)指標(biāo)等的監(jiān)·知識(shí)體系:建立清晰、全面的知識(shí)體系,包括字段解釋、加工和挖掘方案等?!ぎ?huà)像服務(wù):實(shí)現(xiàn)可視化管理,涵蓋在線離線生產(chǎn)和部署、特征庫(kù)的維護(hù)、自動(dòng)化建模以及高效回溯等功能。用戶畫(huà)像應(yīng)用從增長(zhǎng)獲客、風(fēng)險(xiǎn)管理、客戶經(jīng)營(yíng)等角度賦能信貸業(yè)務(wù)優(yōu)化反欺詐策略提升A卡性能優(yōu)化準(zhǔn)入策略提升目客群規(guī)模優(yōu)化額價(jià)策略降額xx億提升B卡性能精準(zhǔn)營(yíng)銷促完/促動(dòng)/召回等提升C卡性能優(yōu)化催收策略精準(zhǔn)獲客降低獲客成本擴(kuò)展方向采用前沿算法技術(shù),如知識(shí)圖譜、圖計(jì)算、大語(yǔ)言模型等Q&AQ1:公司大模型相關(guān)在做的有哪些應(yīng)用的探索,效果怎么樣?A1:大模型已經(jīng)在催收、電銷等業(yè)務(wù)中得到明顯的應(yīng)用效果。A2:A卡(ApplicationScoreCard)是指貸前準(zhǔn)入環(huán)節(jié)的申請(qǐng)?jiān)u分卡,用于貸前審批階段對(duì)貸款申請(qǐng)人進(jìn)行風(fēng)險(xiǎn)評(píng)估;B卡(BehaviorScoreCard)用于貸中管理,利用借款人的還款及交易行為,結(jié)合其他數(shù)據(jù)預(yù)測(cè)借款人未來(lái)的還款能力和意愿,推測(cè)用戶是否會(huì)逾期。B卡通常又分調(diào)額B卡和交易B卡;C卡(BehaviorScoreCardi)用于貸后催收管理,在借款人當(dāng)前狀態(tài)未逾期的情況下,預(yù)測(cè)未來(lái)該筆貸款變?yōu)閴馁~的概率。A3:通常是一些結(jié)構(gòu)化的表。舉個(gè)例子,比如用戶有沒(méi)有車子,用0和1表示,另外我們會(huì)把標(biāo)簽的概率值或置信度也帶上。還會(huì)包含模型版本、更新時(shí)間、數(shù)據(jù)源。Q4:可以再深入介紹一下模型融合嗎?A4:同一個(gè)用戶不能在同一個(gè)標(biāo)簽下面有多個(gè)互相沖突的結(jié)果。比一個(gè)用戶有沒(méi)有車??赡茉谡餍艌?bào)告里看到他是有車貸的,那么大概率是有車的,還可能通過(guò)外部保險(xiǎn)數(shù)據(jù)中看到他有車險(xiǎn),還有可能會(huì)用內(nèi)部所有數(shù)據(jù)建模預(yù)測(cè)其有車沒(méi)車的概率,最終可能得到多個(gè)結(jié)果,而業(yè)務(wù)希望的是只有一個(gè)結(jié)果,才簡(jiǎn)單好用,不會(huì)使策略過(guò)于復(fù)雜。這時(shí)就需要將結(jié)果融合成一個(gè),這里就是剛才提到的三種方法,三種方法各有優(yōu)劣,目前我們更多采用的是置信度融合的方法。Q5:可以介紹一下深度學(xué)習(xí)的主要應(yīng)用場(chǎng)景嗎?A5:深度學(xué)習(xí)的應(yīng)用場(chǎng)景,首先就是文中提到的ABC三個(gè)卡片,還有一個(gè)場(chǎng)景是挖掘行為序列模型。另外,自然語(yǔ)言類相關(guān)處理的模型也會(huì)用到深度學(xué)習(xí)的算法。我們不會(huì)純粹地為了使用前沿算法而去用,而是結(jié)合具體業(yè)務(wù)需求。Q6:如果樣本包含很多客群,分客群?jiǎn)为?dú)建模效果會(huì)更好嗎?A6

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論