58同城推薦系統(tǒng)設(shè)計與實(shí)現(xiàn)_第1頁
58同城推薦系統(tǒng)設(shè)計與實(shí)現(xiàn)_第2頁
58同城推薦系統(tǒng)設(shè)計與實(shí)現(xiàn)_第3頁
58同城推薦系統(tǒng)設(shè)計與實(shí)現(xiàn)_第4頁
58同城推薦系統(tǒng)設(shè)計與實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、58同城推薦系統(tǒng)設(shè)計與實(shí)現(xiàn)業(yè)務(wù)場景-5858目前分類:招聘 = 簡歷推薦+職位推薦目錄推薦簡介常用推薦方法系統(tǒng)難點(diǎn)+設(shè)計+實(shí)現(xiàn)其他第一章、推薦簡介推薦簡介用戶在在某個場景下對某個商品或信息產(chǎn)生了某種行為,系統(tǒng)會對另一些商品或信息進(jìn)行推薦要素:(1)用戶 - user(2)場景 - scene(3)商品或信息 - item(4)行為 - action(5)系統(tǒng) - recommendation-system(6)推薦結(jié)果集合 - recommendation-result / item-set系統(tǒng)概貌用戶在在某個場景下對某個商品或信息產(chǎn)生了某種行為,系統(tǒng)會對另一些商品或信息進(jìn)行推薦舉例:用戶在5

2、8同城發(fā)布了一份簡歷 user-info:uidscene-info:entry、local、cateiditem-info:jidaction:postitem-set:set第二章、常用推薦方法協(xié)同過濾-CF協(xié)同過濾:collaborative filtering Recommendation原理:用戶的相似喜好進(jìn)行推薦舉例:商家下載簡歷的推薦jid1jid2jid3jid4jid5jid6jid1000wuid1yesyesyesuid2yesyesyesyesuid3yesyesyesyesyesuid4yesyesuid100w內(nèi)容推薦舉例:商家下載簡歷的推薦步驟:(1)歷史行為收集

3、(2)id詳情查詢(3)共性內(nèi)容挖掘(行為+場景)(4)推薦詳情jid1(司機(jī),北京,8000月薪,5年經(jīng)驗(yàn),NULL)jid2(司機(jī),北京,NULL,2年經(jīng)驗(yàn),碩士研究生)zid1(司機(jī),北京,NULL,3年經(jīng)驗(yàn),NULL)內(nèi)容推薦:content-based Recommendation原理:抽取共有屬性歷史行為jid1,download jid2,download zid1,post共性(司機(jī),北京,NULL,2年經(jīng)驗(yàn),NULL)綜合排序-CTR預(yù)估CF算法推薦了50個jid,內(nèi)容推薦算法推薦了100個jid,最終頁面只需要返回5個jid,如何返回?哪個排前面?綜合排序什么決定綜合排序?

4、CTR由什么決定?CTR預(yù)估打分公式?用戶產(chǎn)品:ctrCPC商業(yè)產(chǎn)品:ctr * priceCPA商業(yè)產(chǎn)品:ctr地區(qū)+職位+薪酬范圍+工作經(jīng)驗(yàn)+學(xué)歷 發(fā)帖時間+是否下載過+是否瀏覽過+ctr-score = a*f(地區(qū)) + b*f(職位) + c*f(薪酬) + d*f(工作經(jīng)驗(yàn)) + e*f(學(xué)歷)+f*f(發(fā)帖時間) + g*f(是否下載過) + h*f(是否瀏覽過) + 第三章、推薦系統(tǒng)難點(diǎn)+設(shè)計+實(shí)現(xiàn)線下+線上的系統(tǒng)線下系統(tǒng)線上系統(tǒng)幾個問題(1)線下數(shù)據(jù)如何存儲?(2)線上數(shù)據(jù)如何存儲?(3)如何進(jìn)行數(shù)據(jù)轉(zhuǎn)化?支持實(shí)驗(yàn)的系統(tǒng)如何做算法測試?如何快速支持一個算法平臺?如何實(shí)現(xiàn)分流AB測?支持實(shí)驗(yàn)的系統(tǒng)-分流平臺作用?需求?(1)支持random分流(2)支持取模分流(3)支持與或非表達(dá)式(4)支持集合操作(5)配置熱加載支持哪些屬性的與或非,集合操作?支持實(shí)驗(yàn)的系統(tǒng)-推薦內(nèi)核作用?需求?設(shè)計與實(shí)現(xiàn)(1)算法平臺的抽象(2)實(shí)驗(yàn)平臺的擴(kuò)展(3)上下文勱態(tài)數(shù)據(jù)擴(kuò)展(4)異步框架與狀態(tài)機(jī)實(shí)時計算的檢索系統(tǒng)作用?通用需求(1)正排數(shù)據(jù)的存儲(2)倒排索引的存儲(3)數(shù)據(jù)的更新(4)map-reduce的信息查詢業(yè)務(wù)需求工程+算法的系統(tǒng)如何讓工程和算法解耦?線下算法如何分離?實(shí)驗(yàn)平臺算法如何分離?排序打分算法如何分離?效果實(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論