RAG 的開放性及企業(yè)落地_第1頁(yè)
RAG 的開放性及企業(yè)落地_第2頁(yè)
RAG 的開放性及企業(yè)落地_第3頁(yè)
RAG 的開放性及企業(yè)落地_第4頁(yè)
RAG 的開放性及企業(yè)落地_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

RAG

的開放性及企業(yè)落地姜勇Dify

架構(gòu)師目錄建設(shè)

RAG

目前的困境RAG

發(fā)展史Enterprise

RAGRAG

的展望1.2.3.4.RAG

難點(diǎn)from:

/html/2401.05856v1RAG

難點(diǎn)FP1MissingContentFP2MissedtheTopRanked

DocumentsFP3NotinContext-ConsolidationstrategyLimitationsFP4NotExtractedFP5WrongFormatFP6Incorrect

SpecificityFP7

Incomplete第一階段:Basic

RAGRAG

發(fā)展史AnswerRetrievebasedonvector

searchRAG

發(fā)展史BasicRAGPipeline:Indexing&

QueryingRAG

發(fā)展史RAG

發(fā)展史第二階段:Advanced

RAGHybrid

RetrieveAnswerResult

ProcessRAG

發(fā)展史RAG

發(fā)展史Query

typeKeyword[NDCG@3]Vector[NDCG@3]Hybrid[NDCG@3]Hybrid+SemanticRanker[NDCG@3]Conceptseeking

queries39.045.846.359.6Factseeking

queries37.849.049.163.4Exactsnippet

search51.141.551.060.8Websearch-like

queries41.846.350.058.9Keywordqueries79.211.761.066.9Lowqueryterm

overlap23.036.135.949.1Querieswith

misspellings28.839.140.654.6Long

queries42.741.648.159.4Mediumqueries38.144.746.759.9Short

queries53.138.853.063.9RAG

發(fā)展史Hybird

RetrieveAnswerResult

ProcessQuery

TransformRAG

發(fā)展史“GarbageInGarbage

Out.”RAG

發(fā)展史類型示例問(wèn)題與語(yǔ)料不相關(guān)詢問(wèn)產(chǎn)品配置庫(kù)關(guān)于貨物運(yùn)輸?shù)膯?wèn)題問(wèn)題模糊“這篇文章的作者是誰(shuí)?不是關(guān)于事實(shí)召回“總結(jié)一下這篇文章的主要內(nèi)容”包含多個(gè)子問(wèn)題"今年的歐洲杯在哪里舉辦,什么時(shí)候開始?"需要多跳邏輯“Whowonthe2023superbowlandwherewastheirheadcoach

from?”包含非語(yǔ)義組成(結(jié)構(gòu)化)“Whataremoviesaboutaliensin1980”-shouldfilterby

year=1980問(wèn)題包含比較“江蘇省房貸利率政策從2022年至2023年有哪些調(diào)整?”Howtodealwithbelowqueries

?RAG

發(fā)展史RAG

發(fā)展史類型解決方案問(wèn)題與語(yǔ)料不相關(guān)檢索前增加問(wèn)題分類或檢查步驟,如查詢路由(Queryrouting)問(wèn)題模糊基于歷史的問(wèn)題重寫(Rewrite)不是關(guān)于事實(shí)召回(總結(jié))索引過(guò)程中實(shí)現(xiàn)摘要(Summary

Index),分層檢索(Recrusive)長(zhǎng)文本窗口模型(LongContext

Model)包含多個(gè)子問(wèn)題子問(wèn)題拆分(sub-question)后并行查詢需要多跳邏輯問(wèn)題規(guī)劃(Question

Planing)迭代召回(Iterative

Retrieval)包含非語(yǔ)義組成(結(jié)構(gòu)化)元數(shù)據(jù)過(guò)濾器(Metadata

Filter)問(wèn)題包含比較問(wèn)題規(guī)劃(Question

Planing)RAG

發(fā)展史ModelMax

Tokengpt-4o128Kclaude-3200KGemini1.5

Pro1Mqwen-long10Mdeepseek-chat32KERNIE

Speed128Kglm-4128Kdoubao-lite-128k128Kmoonshot-v1-128k128K第三階段:Multiple-mode

with

longcontextRAGThemodel’s

contextsizeis

huge,so,RAGis

notrequired

???RAG

發(fā)展史機(jī)會(huì):分塊算法更靈活,可以達(dá)到文檔級(jí)別文檔之間的分析和比較更容易總結(jié)更容易更容易的記憶管理,減少壓縮技巧的使用減少幻覺(jué)為大模型支持無(wú)限

Context前的過(guò)濾手段,減少成本Long-context&

RAGRAG

發(fā)展史Parentchunkforlong-context,childchunkforretrivalEnterprise

RAGRAGSemantic

CacheModerationAuthenticationObservationEvaluationLoad

BalancingRAG

展望RAG

系統(tǒng)的本質(zhì)是基于自然語(yǔ)言的開放域問(wèn)答系統(tǒng),難點(diǎn)也在于“開放域”。要想獲得符合預(yù)期的召回效果,需要對(duì)應(yīng)用情景進(jìn)行概括和收斂,尋找合適的檢索模式或組合。在動(dòng)手設(shè)計(jì)一個(gè)

RAG

系統(tǒng)之前,最好先考慮好你的用戶是哪些人,以及他們最可能問(wèn)出什么樣的問(wèn)題。——《引入混合檢索(Hybrid

Search)和重排序(Rerank)改進(jìn)

RAG系統(tǒng)召回效果》RAG

展望沒(méi)有最好的,只有最適合場(chǎng)景的策略Nooneisbetterthantheotherbutjustwhenonefitsmoreincertaintypeofquestions.RAGPipline聯(lián)系方式Dify.AI

官方公眾號(hào)如果你喜歡Dify,歡迎:在

GitHub

上貢獻(xiàn)代碼,與我們一同共建更好的Dify;通過(guò)線上線下活動(dòng)、社交媒體向你的朋友們分享

Dify,以及你的使用經(jīng)驗(yàn);在GitHub上給我們點(diǎn)亮?/langgenius/dif

yDify.AI

官方小助手麥思博(msup)有限公司

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論