版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
在辦公方向的實踐與思考分享人:阿里巴巴
釘釘
李祎嵩釘釘文檔DINGTALK
DOCS02釘釘AI助理架構(gòu)03大模型訓練的實踐和思考04展望與思考01大模型在釘釘辦公場景案例大模型在釘釘辦公場景案例AI助理
生成周報文檔
翻譯文檔
LUI文檔
LUI白板
涂鴉作畫白板
圖片風格遷移白板
智能海報IM
文件速讀IM
視頻速讀IM
圖片速讀釘釘AI助理架構(gòu)大模型訓練的實踐和思考01大模型訓練概述大模型訓練的起手式02
大模型訓練核心流程大模型訓練的起手式SFT在業(yè)務(wù)上的思考核心流程標注數(shù)據(jù),用于SFT根據(jù)人類反饋,訓練獎勵模型通過強化學習優(yōu)化模型產(chǎn)品設(shè)計生成多張圖片讓用戶選擇點贊和點踩回流用戶反饋數(shù)據(jù)03
SFT與RLHF大模型訓練的起手式微調(diào)是指在已經(jīng)預(yù)訓練好的大模型基礎(chǔ)上,使用特定數(shù)據(jù)集進行進一步的訓練,使模型適應(yīng)特定任務(wù)或領(lǐng)域。SFT
可以激發(fā)模型解決問題的能力,讓模型能夠準確地理解用戶指令,給出合理的輸出結(jié)果。簡單來說,微調(diào)主要目的是完成知識注入和指令對齊SFTSFT、訓練獎勵模型(Reward
Model,RM)、強化學習(Reinforcement
Learning,RL)。RLHFDPODPO的目的和RLHF一樣都是可以讓模型的輸出更偏向于人類喜好,但是相比RLHF,DPO不依賴于明確的獎勵建?;驈娀瘜W習,性能和計算成本更加輕量級。04
SFT常用方法大模型訓練的起手式LoRA在原模型旁邊增加一個旁路,通過低秩分解(先降維再升維)來模擬參數(shù)的更新,在訓練時只訓練矩陣A和B。FullParameterFine
Tuning通過更新所有參數(shù)來最大程度地優(yōu)化模型對新任務(wù)的理解和表現(xiàn)。FFT
訓練成本比較高,因為參數(shù)量和預(yù)訓練的相同。Adapter-basedTuning一種以串行形式加入到原模型中的模塊,使模型在推理時的速度降低了4%-6%,這使得在實際部署中往往不會考慮Adapter方法。Prefix
TuningPrefix
Tuning在每個Attention層都加入Prefix
Embedding來增加額外的參數(shù)。05
數(shù)據(jù)更加重要大模型訓練的起手式ChatmodelORbase
model預(yù)訓練模型選擇數(shù)據(jù)過于領(lǐng)域的數(shù)據(jù)會災(zāi)難性遺忘,但也某些實際業(yè)務(wù)場景,可以通過意圖識別+業(yè)務(wù)專屬模型解決。數(shù)據(jù)過多可能導致過擬合文本數(shù)據(jù)中,短文本多用戶交互,更多長文本均使用“文件”形式表達,“文檔理解”尤為重要。參數(shù)LR、
warmup、Epoch的目是讓Loss更快收斂文檔格式轉(zhuǎn)換釘釘文檔轉(zhuǎn)換為各種類型文檔,長圖、PDF、word、ppt..各類型文件的相互轉(zhuǎn)換場景分析一:文檔生成長圖文檔格式引擎文檔格式解析文檔與大模型交互,文檔還原度決定模型效果。超大文檔、超長文檔如何解決。場景分析二:文檔速讀場景文檔格式引擎場景分析三:文檔問答場景RAG
:文檔理解、分片、向量化Query優(yōu)化、召回策略排序策略架構(gòu)/產(chǎn)品:先學習,在檢索文檔格式引擎OOXML文檔格式引擎Markup
languagesOOXML核心OPC文檔格式引擎WordprocessingMLDocx是什么內(nèi)存結(jié)構(gòu)文檔格式引擎docx舉個例子內(nèi)存結(jié)構(gòu)文檔格式引擎文檔格式引擎PDF舉個例子協(xié)議數(shù)據(jù)文檔格式引擎文檔格式引擎大模型訓練實踐-AIPPT產(chǎn)品形態(tài)生成一個
PPT訓練模型生成
PPT核心問題大模型訓練實踐-AIPPTPPT內(nèi)存結(jié)構(gòu)訓練目標復(fù)雜場景的推理與訓練基于分治推理方案,整體任務(wù)使用樹描述遍歷推理。推理具備拆解任務(wù)的dataset具備葉子結(jié)點獨立計算的dataset具備任務(wù)回溯父節(jié)點的dataset訓練展望與思考安全更加重要模型訓練的數(shù)據(jù)安全模型應(yīng)用的數(shù)據(jù)安全大模型效果持續(xù)提升多模態(tài)迅速發(fā)展大模型成本持續(xù)降低Thanks!
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 實驗事故案例分析預(yù)防重于治療
- 學生創(chuàng)新創(chuàng)業(yè)教育的國際化發(fā)展趨勢研究
- 校企合作推動勞動教育創(chuàng)新發(fā)展
- 2025版?zhèn)€人房屋裝修安全責任與施工監(jiān)理協(xié)議4篇
- 2025版農(nóng)業(yè)科技合作協(xié)議下載3篇
- 2025年度智能社區(qū)房屋租賃管理服務(wù)合同4篇
- 2024酒店婚禮場地租賃協(xié)議參考樣式版B版
- 二零二五版班組工人工資調(diào)整勞務(wù)合同范本3篇
- 2025年度漁船托管運營與租賃一體化管理合同4篇
- 二零二五年度農(nóng)業(yè)大棚租賃與農(nóng)產(chǎn)品質(zhì)量安全保障合同4篇
- 獅子王影視鑒賞
- 一年級數(shù)學加減法口算題每日一練(25套打印版)
- 2024年甘肅省武威市、嘉峪關(guān)市、臨夏州中考英語真題
- DL-T573-2021電力變壓器檢修導則
- 繪本《圖書館獅子》原文
- 安全使用公共WiFi網(wǎng)絡(luò)的方法
- 2023年管理學原理考試題庫附答案
- 【可行性報告】2023年電動自行車相關(guān)項目可行性研究報告
- 歐洲食品與飲料行業(yè)數(shù)據(jù)與趨勢
- 放療科室規(guī)章制度(二篇)
- 中高職貫通培養(yǎng)三二分段(中職階段)新能源汽車檢測與維修專業(yè)課程體系
評論
0/150
提交評論