版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
RAG
的開放性及企業(yè)落地姜勇Dify
架構(gòu)師目錄建設(shè)
RAG
目前的困境RAG
發(fā)展史Enterprise
RAGRAG
的展望1.2.3.4.RAG
難點(diǎn)from:
/html/2401.05856v1RAG
難點(diǎn)FP1MissingContentFP2MissedtheTopRanked
DocumentsFP3NotinContext-ConsolidationstrategyLimitationsFP4NotExtractedFP5WrongFormatFP6Incorrect
SpecificityFP7
Incomplete第一階段:Basic
RAGRAG
發(fā)展史AnswerRetrievebasedonvector
searchRAG
發(fā)展史BasicRAGPipeline:Indexing&
QueryingRAG
發(fā)展史RAG
發(fā)展史第二階段:Advanced
RAGHybrid
RetrieveAnswerResult
ProcessRAG
發(fā)展史RAG
發(fā)展史Query
typeKeyword[NDCG@3]Vector[NDCG@3]Hybrid[NDCG@3]Hybrid+SemanticRanker[NDCG@3]Conceptseeking
queries39.045.846.359.6Factseeking
queries37.849.049.163.4Exactsnippet
search51.141.551.060.8Websearch-like
queries41.846.350.058.9Keywordqueries79.211.761.066.9Lowqueryterm
overlap23.036.135.949.1Querieswith
misspellings28.839.140.654.6Long
queries42.741.648.159.4Mediumqueries38.144.746.759.9Short
queries53.138.853.063.9RAG
發(fā)展史Hybird
RetrieveAnswerResult
ProcessQuery
TransformRAG
發(fā)展史“GarbageInGarbage
Out.”RAG
發(fā)展史類型示例問(wèn)題與語(yǔ)料不相關(guān)詢問(wèn)產(chǎn)品配置庫(kù)關(guān)于貨物運(yùn)輸?shù)膯?wèn)題問(wèn)題模糊“這篇文章的作者是誰(shuí)?不是關(guān)于事實(shí)召回“總結(jié)一下這篇文章的主要內(nèi)容”包含多個(gè)子問(wèn)題"今年的歐洲杯在哪里舉辦,什么時(shí)候開始?"需要多跳邏輯“Whowonthe2023superbowlandwherewastheirheadcoach
from?”包含非語(yǔ)義組成(結(jié)構(gòu)化)“Whataremoviesaboutaliensin1980”-shouldfilterby
year=1980問(wèn)題包含比較“江蘇省房貸利率政策從2022年至2023年有哪些調(diào)整?”Howtodealwithbelowqueries
?RAG
發(fā)展史RAG
發(fā)展史類型解決方案問(wèn)題與語(yǔ)料不相關(guān)檢索前增加問(wèn)題分類或檢查步驟,如查詢路由(Queryrouting)問(wèn)題模糊基于歷史的問(wèn)題重寫(Rewrite)不是關(guān)于事實(shí)召回(總結(jié))索引過(guò)程中實(shí)現(xiàn)摘要(Summary
Index),分層檢索(Recrusive)長(zhǎng)文本窗口模型(LongContext
Model)包含多個(gè)子問(wèn)題子問(wèn)題拆分(sub-question)后并行查詢需要多跳邏輯問(wèn)題規(guī)劃(Question
Planing)迭代召回(Iterative
Retrieval)包含非語(yǔ)義組成(結(jié)構(gòu)化)元數(shù)據(jù)過(guò)濾器(Metadata
Filter)問(wèn)題包含比較問(wèn)題規(guī)劃(Question
Planing)RAG
發(fā)展史ModelMax
Tokengpt-4o128Kclaude-3200KGemini1.5
Pro1Mqwen-long10Mdeepseek-chat32KERNIE
Speed128Kglm-4128Kdoubao-lite-128k128Kmoonshot-v1-128k128K第三階段:Multiple-mode
with
longcontextRAGThemodel’s
contextsizeis
huge,so,RAGis
notrequired
???RAG
發(fā)展史機(jī)會(huì):分塊算法更靈活,可以達(dá)到文檔級(jí)別文檔之間的分析和比較更容易總結(jié)更容易更容易的記憶管理,減少壓縮技巧的使用減少幻覺(jué)為大模型支持無(wú)限
Context前的過(guò)濾手段,減少成本Long-context&
RAGRAG
發(fā)展史Parentchunkforlong-context,childchunkforretrivalEnterprise
RAGRAGSemantic
CacheModerationAuthenticationObservationEvaluationLoad
BalancingRAG
展望RAG
系統(tǒng)的本質(zhì)是基于自然語(yǔ)言的開放域問(wèn)答系統(tǒng),難點(diǎn)也在于“開放域”。要想獲得符合預(yù)期的召回效果,需要對(duì)應(yīng)用情景進(jìn)行概括和收斂,尋找合適的檢索模式或組合。在動(dòng)手設(shè)計(jì)一個(gè)
RAG
系統(tǒng)之前,最好先考慮好你的用戶是哪些人,以及他們最可能問(wèn)出什么樣的問(wèn)題。——《引入混合檢索(Hybrid
Search)和重排序(Rerank)改進(jìn)
RAG系統(tǒng)召回效果》RAG
展望沒(méi)有最好的,只有最適合場(chǎng)景的策略Nooneisbetterthantheotherbutjustwhenonefitsmoreincertaintypeofquestions.RAGPipline聯(lián)系方式Dify.AI
官方公眾號(hào)如果你喜歡Dify,歡迎:在
GitHub
上貢獻(xiàn)代碼,與我們一同共建更好的Dify;通過(guò)線上線下活動(dòng)、社交媒體向你的朋友們分享
Dify,以及你的使用經(jīng)驗(yàn);在GitHub上給我們點(diǎn)亮?/langgenius/dif
yDify.AI
官方小助手麥思博(msup)有限公司
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度企業(yè)債券發(fā)行合同4篇
- 2025年度個(gè)人房產(chǎn)買賣合同違約金計(jì)算范本4篇
- 教育變革下的自然課堂-以小學(xué)生為對(duì)象的探究教學(xué)法應(yīng)用
- 教育技術(shù)助力的小學(xué)生圖書引導(dǎo)策略匯報(bào)
- 個(gè)人養(yǎng)老保險(xiǎn)購(gòu)買合同2024年度3篇
- 二零二五版互聯(lián)網(wǎng)金融平臺(tái)用戶協(xié)議與風(fēng)險(xiǎn)提示2篇
- 二零二五年度高端不銹鋼制品制造與安裝服務(wù)合同3篇
- 二零二五版國(guó)際旅游導(dǎo)游勞動(dòng)合同模板4篇
- 二零二五年度職業(yè)教育院校教師招聘勞動(dòng)合同樣本3篇
- 2025年度人工智能助手軟件開發(fā)及商業(yè)化推廣合同4篇
- 2024年公需科目培訓(xùn)考試題及答案
- 2024年江蘇鑫財(cái)國(guó)有資產(chǎn)運(yùn)營(yíng)有限公司招聘筆試沖刺題(帶答案解析)
- 2024年遼寧石化職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)含答案
- 廣西桂林市2023-2024學(xué)年高二上學(xué)期期末考試物理試卷
- 財(cái)務(wù)指標(biāo)與財(cái)務(wù)管理
- 部編版二年級(jí)下冊(cè)道德與法治第三單元《綠色小衛(wèi)士》全部教案
- 【京東倉(cāng)庫(kù)出庫(kù)作業(yè)優(yōu)化設(shè)計(jì)13000字(論文)】
- 保安春節(jié)安全生產(chǎn)培訓(xùn)
- 初一語(yǔ)文上冊(cè)基礎(chǔ)知識(shí)訓(xùn)練及答案(5篇)
- 血液透析水處理系統(tǒng)演示
- GB/T 27030-2006合格評(píng)定第三方符合性標(biāo)志的通用要求
評(píng)論
0/150
提交評(píng)論