




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
生成式
AI
成為人工智能領(lǐng)域新的關(guān)鍵詞。吸納從機(jī)器智能到機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的關(guān)鍵技術(shù),生成式
AI
更進(jìn)一步,能夠根據(jù)提示或現(xiàn)有數(shù)據(jù)創(chuàng)建新的書面、視覺和聽覺內(nèi)容。在此基礎(chǔ)上,大模型和大模型應(yīng)用一時(shí)涌現(xiàn),并迅速確立AI
落地新范式。據(jù)data.ai
intelligence
數(shù)據(jù)顯示,2023
年生成式
AI
應(yīng)用激增。2024
年
AI
將會帶動
10%
的應(yīng)用下載量,包含
GenAI
功能的應(yīng)用下載量將同比增長
40%。面對生成式
AI
及其應(yīng)用落地的迅猛發(fā)展,微軟期待用
AI
重新定義軟件開發(fā)與工作的未來。從Azure
OpenAI、Copilot
Stack、開發(fā)工具到協(xié)作應(yīng)用等領(lǐng)域,微軟將
AI
融入現(xiàn)有的軟件和服務(wù)生態(tài),從提供
AI
工具到構(gòu)筑
AI
平臺和生態(tài),全方位幫助開發(fā)者應(yīng)對技術(shù)革命,予力人們運(yùn)用
AI,讓每個人都可以在工作和生活中,受益于這些突破性技術(shù),探索全新機(jī)遇與無限可能。微軟的
AI
戰(zhàn)略包括三個部分:將
AI
副駕融入每個微軟云解決方案、幫助客戶通過
AI創(chuàng)新和轉(zhuǎn)型以及負(fù)責(zé)任的
AI。前言本白皮書將全面介紹
Microsoft
Azure
生成式人工智能領(lǐng)域的解決方案、工具指南、最佳實(shí)踐以及支持
AI的云端算力及架構(gòu)優(yōu)勢,旨在幫助處于
AI
不同階段的客戶選擇適合您戰(zhàn)略的落地路徑,本白皮書介紹的落地方案涵蓋從直接使用微軟Azure
AI
和
AzureOpenAI
服務(wù),到自建大模型等四層路徑。2前言第一章
Azure
AI
及
Azure
OpenAl
服務(wù)概括第二章
生成式人工智能落地實(shí)踐的四種路徑
路徑一直接使用Azure
OpenAI
模型:
添加您的數(shù)據(jù)至Azure
OpenAl
模型
路徑二
Prompt
engineer
提示工程優(yōu)化
路徑三
基于現(xiàn)有模型進(jìn)行
Fine-tuning
微調(diào)
路徑四
訓(xùn)練您的自有模型
第三章
生成式人工智能落地成功案例參考
汽車行業(yè):
梅賽德斯-
奔馳
零售行業(yè):
沃爾瑪
游戲行業(yè):
完美世界
專業(yè)服務(wù)行業(yè):KPMG
零售行業(yè):CarMax目錄24781112151818202122233第一章AzureAI及Azure
OpenAl服務(wù)概括Azure
AI
服務(wù)AzureAI
服務(wù)包括了
Azure
機(jī)器學(xué)習(xí)平臺、認(rèn)知服務(wù)和應(yīng)用
AI
服務(wù)。其中,Azure
認(rèn)知服務(wù)有五大支柱,分別是視覺、語音、語言、決策和Azure
OpenAI
服務(wù)
。Azure
AI
服務(wù)通過現(xiàn)成的預(yù)生成可定制的
API
和模型,幫助開發(fā)人員和組織快速創(chuàng)建智能、前沿、面向市場且負(fù)責(zé)任的應(yīng)用程序,包括對話、搜索、監(jiān)視、翻譯、語音、視覺和決策的自然語言處理。這意味著,您可以使用
AzureAI組合構(gòu)建企業(yè)規(guī)模的智能應(yīng)用,并使用生成式
AI重新構(gòu)想你的業(yè)務(wù)。Azure
AI
組合在Azure
AI
的幫助下,您可以為您的組織構(gòu)建可以立即推向市場的先進(jìn)應(yīng)用程序。以微軟為例,Microsoft產(chǎn)品及應(yīng)用平臺如
Microsoft
365
Copilot、Dynamics
365
Copilot、Power
Platform
都由
Azure
AI
驅(qū)動,為每個人和組織提效生產(chǎn)力。Azure
OpenAI
服務(wù)生成自己的助手和生成式
AI
應(yīng)用程序。AzureAIContent
Safety在應(yīng)用程序和服務(wù)中檢測用戶生成的和
AI生成的有害內(nèi)容。Azure
AI
提示流創(chuàng)建可執(zhí)行的PromptFlow,通過可視化圖形鏈接大型語言模型、提示和
Python
工具。
機(jī)器學(xué)習(xí)運(yùn)營(MLOps)加速機(jī)器學(xué)習(xí)工作流的自動化、協(xié)作和可重現(xiàn)性。
負(fù)責(zé)任的AI
儀表板使用統(tǒng)一的儀表板實(shí)踐負(fù)責(zé)任、高質(zhì)量的AI,能夠輕松評估和調(diào)試機(jī)器學(xué)習(xí)模型。Azure
AI
搜索基于你自己的數(shù)據(jù)構(gòu)建、微調(diào)和訓(xùn)練自定義
AI
模型,獲得獨(dú)特的優(yōu)勢。4Azure
OpenAI
目前為各類企業(yè)提供兩類服務(wù)模式:Pay
As
You
Go
即用即付型模式:適合各類
AI
場景的測試及上線應(yīng)用,可在Azure
Portal
后臺直接啟用。
預(yù)配置吞吐容量的專屬模式
:
適合各類追求穩(wěn)定性能及穩(wěn)定延時(shí)的AI
生產(chǎn)應(yīng)用。通過提供穩(wěn)定的最大延遲和吞吐量保障穩(wěn)定可預(yù)測的性能預(yù)留專屬的容量成本節(jié)省:
與按消耗Tokens
計(jì)費(fèi)的Pay
As
You
Go
即用即付模式相比,可節(jié)省成本Azure
OpenAI
服務(wù)微軟
Azure
作為
OpenAI
的獨(dú)家云服務(wù)提供商,自
2019
年開始便以出色的、面向
AI
時(shí)代的領(lǐng)先架構(gòu),為OpenAI
的快速發(fā)展提供助力?;陔p方的戰(zhàn)略合作,現(xiàn)在
Azure
全球版客戶可以通過
Azure
OpenAI
服務(wù)直接調(diào)用
OpenAI
全部模型,包括
ChatGPT、GPT-4、GPT-4
vision、Codex
和
DALL.E
等模型,并享有
Azure
企業(yè)級
99.9%
的可用性
SLA、企業(yè)級安全保障和為人工智能優(yōu)化的基礎(chǔ)設(shè)施。目前有
18,000
多家組織使用
AzureOpenAI
服務(wù)。微軟
AI
服務(wù)一覽5Microsoft'sResponsibleAl
Principles
負(fù)責(zé)任的人工智能原則在科技行業(yè)里,微軟率先提出了打造負(fù)責(zé)任的人工智能的決心。2016
年,微軟
CEO
薩提亞納德拉發(fā)表了一篇關(guān)于人工共同責(zé)任的專欄文章,幾個月后,第一次公開提出了微軟的人工智能準(zhǔn)則:公平、可靠和安全、隱私和保障、包容、透明、責(zé)任。當(dāng)
AI
進(jìn)入主流產(chǎn)品和服務(wù)時(shí),這些原則對于創(chuàng)建負(fù)責(zé)任且值得信賴的
AI
至關(guān)重要。它們以兩個角度為指導(dǎo):道德和可解釋。閱讀標(biāo)題鏈接可閱讀詳細(xì)細(xì)節(jié)。Privacy
&SecurityToolsand
processesTrainingand
practicesRulesBuildingblocks
toenact
principlesReliability
&SafetyMicrosoft'sResponsibleA
PrinciplesFairnessInclusivenessAccountabilityGovernanceTransparency6第二章生成式人工智能落地實(shí)踐的四種路徑其中,90%
的使用場景可以通過前兩層的落地方案實(shí)現(xiàn)。在任何路徑下,您都可以通過使用檢索增強(qiáng)生成
(RAG)模式,與預(yù)訓(xùn)練的大型語言模型
(LLM)
和你自己的數(shù)據(jù)配合使用以生成響應(yīng)。同時(shí),也可以通過使用
Azure
大語言模型運(yùn)營功能
(LLMOps)
實(shí)現(xiàn)高效提示工程和開發(fā)部署,以簡化的過程來管理大模型應(yīng)用的端到端生命周期。微軟為各行業(yè)客戶
根據(jù)
AI
戰(zhàn)略階段不同提供四個層次的
AI
創(chuàng)新支持:結(jié)合您的現(xiàn)有數(shù)據(jù)直接使用
Azure
OpenAI
模型:適合各類
AI
場景的實(shí)現(xiàn)Prompt
engineer
提示工程優(yōu)化
:提高大語言模型生成響應(yīng)的準(zhǔn)確性訓(xùn)練您的自有模型:AzureAI
Infra
云端大規(guī)模
AI
算力平臺方案1234
基于現(xiàn)有模型進(jìn)行
Fine-tuning
微調(diào):使用示例數(shù)據(jù)重新訓(xùn)練現(xiàn)有的大型語言模型,從而生成使用提供的示例經(jīng)過優(yōu)化的新的“自定義”大型語言模型。7路徑一
直接使用
Azure
OpenAI
模型:
添加您的數(shù)據(jù)至
Azure
OpenAI
模型1.1
Azure
OpenAI
服務(wù)上的可用模型語言模型微軟為各行業(yè)提供四個層次的
AI
創(chuàng)新支持GPT-4-0125-preview:GPT-4-0125-preview
已發(fā)布
,
新模型旨在減少模型未完成任務(wù)的“懶惰”情況,及其他升級。GPT-4:國際版
Azure
OpenAI
服務(wù)的客戶和合作伙伴可以申請?jiān)L問
GPT-4,并開始使用
OpenAI
目前最先進(jìn)的模型構(gòu)建應(yīng)用。通過基于
Azure
AI
優(yōu)化的基礎(chǔ)設(shè)施、企業(yè)級可用性、合規(guī)性、數(shù)據(jù)安全和隱私控制提供的支持,以及與其它
Azure
服務(wù)的多種集成,實(shí)現(xiàn)您的大模型應(yīng)用架構(gòu)。GPT-4-Turbo:GPT-4
Turbo
功能更強(qiáng)大,模型信息更新到
2023
年
4
月。它具有
128K
上下文窗口,因此您可以使用
RAG(檢索增強(qiáng)生成)等技術(shù),基于企業(yè)用例所需的自定義數(shù)據(jù)定制應(yīng)用程序。GPT-3.5-Turbo:GPT-3.5-Turbo
現(xiàn)已更新至
1025
版本。8Assistants
API客戶可以開啟
Code
Interpreter,
Function
calling
等工具在自己的應(yīng)用程序內(nèi)構(gòu)建擁有指令的
AI
助手
,
并利用模型、工具和知識來響應(yīng)用戶查詢。AzureAssistantsAPI目前已支持代碼解釋器和函數(shù)調(diào)用,檢索功能將很快發(fā)布。TTS
模型OpenAI
的
TTS
模型在
AOAI
和
Azure
AI
Speech
同時(shí)上線。新的
TTS模型能生成6
種預(yù)設(shè)不同個性和風(fēng)格的人類品質(zhì)語音。多模態(tài)模型GPT-4-Turbo
with
Vision:GPT-4
Turbo
with
Vision
是由
OpenAI
開發(fā)的大型多模態(tài)模型(LMM),支持圖像分析并能對圖像有關(guān)問題生成文本響應(yīng)。它結(jié)合了自然語言處理和視覺理解能力。GPT-4
Turbo
withVision
達(dá)到了圖像理解的先進(jìn)水平。它不僅僅能夠識別圖片中的對象,更注重理解上下文和細(xì)節(jié),比如創(chuàng)建詳細(xì)的圖像標(biāo)題、提供豐富的上下文描述、回答關(guān)于視覺內(nèi)容的問題或分配智能標(biāo)簽。微調(diào)Azure
OpenAI
服務(wù)推出了三款模型的
Fine-tuning
功能(Babbage-002、Davinci-002
和
GPT-3.5-Turbo)。用戶可以使用
Azure
OpenAI
服務(wù)或
Azure機(jī)器學(xué)習(xí)對
Babbage/Davinci-002
和
GPT-3.5-Turbo
進(jìn)行
Fine-tuning。GPT-3.5-Turbo
1106
模型已支持
?ne-tuning,
同時(shí)
Training
和
Hosting
的成本比
GPT-3.5-Turbo
都降低
50%。Babbage-002
和
Davinci-002
支持
completion,Turbo支持對話式交互。通過幾個簡單的命令,您就可以指定基本模型、提供數(shù)據(jù)、進(jìn)行訓(xùn)練和部署。
點(diǎn)擊閱讀關(guān)于微調(diào)的介紹文章圖像DALL·E
3:DALL
·
E3
是一種支持文本提示的圖像生成模型,助力用戶探索創(chuàng)意表達(dá)的新領(lǐng)域,通過語言和視覺藝術(shù)的交融提供獨(dú)特的體驗(yàn)。提示越詳細(xì),圖像效果就越好。您甚至可以在已創(chuàng)建的圖像中添加文本。轉(zhuǎn)錄和翻譯Whisper:Whisper
模型提供轉(zhuǎn)錄和翻譯音頻內(nèi)容的功能,同時(shí)支持大規(guī)模高質(zhì)量的批量轉(zhuǎn)錄。91.2
添加您的數(shù)據(jù)Azure
OpenAI
Service
on
your
data,基于這項(xiàng)全新功能,用戶可以使用自己的數(shù)據(jù)驅(qū)動
OpenAI
模型,無需訓(xùn)練或微調(diào),即可釋放全部數(shù)據(jù)潛力。Azure
OpenAI
Service
on
your
data
能夠獲取并打通所有來源的數(shù)據(jù)。無論數(shù)據(jù)是存儲在本地還是云端,該功能將提供無縫連接以解鎖數(shù)據(jù)的全部潛力。借助這一先進(jìn)工具,您可以高效處理、組織、優(yōu)化數(shù)據(jù),獲得有價(jià)值、高質(zhì)量的洞察。同時(shí),用戶友好的
API和
SDK,將與您的現(xiàn)有系統(tǒng)輕松集成;定制化示例應(yīng)用程序助力快速部署。此外,數(shù)據(jù)共享和利用也將變得更輕松,您可以在企業(yè)內(nèi)部或面向客戶快速實(shí)現(xiàn)信息分發(fā)。Azure
OpenAI
Service
on
your
data連接多個數(shù)據(jù)源,包括:Azure
認(rèn)知搜索索引:您可以將數(shù)據(jù)連接到
Azure認(rèn)知搜索索引,實(shí)現(xiàn)與
OpenAI模型的無縫集成。Azure
Blob
存儲容器:將數(shù)據(jù)連接到
Azure
Blob存儲容器,使用
Azure
OpenAI
服務(wù)輕松獲取數(shù)據(jù),用于后續(xù)的分析和對話。本地文件:
連接您的
Azure
AI
門戶文件,
為數(shù)據(jù)連接提供靈活性和便利性。數(shù)據(jù)在攝取、切分之后,將導(dǎo)入
Azure
認(rèn)知搜索索引。txt、md、html、Word
文件、PowerPoint、PDF
等格式的文件都可以用于分析和對話。使用
Azure
OpenAI
服務(wù)數(shù)據(jù)支持的步驟如下:連接數(shù)據(jù)源:使用
Azure
AI
Studio
連接您所需的數(shù)據(jù)源,可通過
Azure
認(rèn)知搜索索引、Blob
存儲容器、上傳本地文件等途徑完成連接。基于數(shù)據(jù)進(jìn)行提問和聊天:
基于數(shù)據(jù)進(jìn)行提問和聊天:連接數(shù)據(jù)源之后,您就可以通過
Azure
AIStudio,向
OpenAI
模型提問和對話。這將使您獲得有價(jià)值的洞察,并在大量信息的支撐下做出商業(yè)決策。10本報(bào)告來源于三個皮匠報(bào)告站(),由用戶Id:549683下載,文檔Id:183465,下載日期:2024-12-041.3
結(jié)合
Azure
OpenAI
的
Embedding
嵌入向量生成模型將企業(yè)現(xiàn)有的結(jié)構(gòu)化知識庫與提示詞引擎結(jié)合起來,讓
GPT
模型生成更正確、更穩(wěn)定、更可靠的結(jié)果。Embedding
是一種特殊的數(shù)據(jù)表示格式,機(jī)器學(xué)習(xí)模型和算法可以輕松使用。
Embedding
是一段文本的語義含義的信息密集表示。Embedding
支持在
Azure
數(shù)據(jù)庫中進(jìn)行矢量相似性搜索,例如
Azure
Cosmos
DB
for
MongoDB
vCore
或Azure
Database
for
PostgreSQL
-
靈活服務(wù)器。路徑二
Prompt
engineer
提示工程優(yōu)化LLMapplication
pro?lesGENERATION
HEAVY在
AI
領(lǐng)域,特別是在大型語言模型中,提示指的是用戶為引起特定類型的響應(yīng)而給出的輸入或指令。要充分利用
GPT-4
等大型語言模型,就必須精心設(shè)計(jì)能產(chǎn)生有效結(jié)果的提示。挑戰(zhàn)在于如何選擇詞語、表達(dá)方式、符號和結(jié)構(gòu)的最佳組合,以引導(dǎo)模型生成準(zhǔn)確而貼切的內(nèi)容,包括回答問題、以最喜歡的作家的口吻創(chuàng)作故事、創(chuàng)作詩歌、執(zhí)行代碼相關(guān)的任務(wù)等。提示有助于
AI
明確用戶意圖和對其生成內(nèi)容的期望,更精確的提示會帶來更準(zhǔn)確、相關(guān)性更強(qiáng)的結(jié)果。需要注意的是,相似的提示可能會引發(fā)不同的響應(yīng),這取決于底層模型、訓(xùn)練數(shù)據(jù),甚至是用戶請求措辭的細(xì)微變化。您可以使用本文介紹的
15
個提示工程優(yōu)化技巧,躍升為更好的AI
提示詞工程師。GENERATION
LIGHTContent
creationChatbotSummarizationPROMPT
HEAVYPrompt
engineeringEnterprise
ChatbotPROMPT
LIGHTLLM11路徑三基于現(xiàn)有模型進(jìn)行
Fine-tuning
微調(diào)什么是
Fine-tune微調(diào)Fine-tuning
是開發(fā)人員和數(shù)據(jù)科學(xué)家用來定制大型語言模型,以滿足特定任務(wù)需求的方法之一。與“檢索增強(qiáng)生成”(Retrieval
Augmented
Generation,RAG)和“提示工程”等方法通過在提示中注入正確的信息和指令不同,F(xiàn)ine-tuning
則是通過對大型語言模型本身進(jìn)行個性化定制來實(shí)現(xiàn)的。Azure
OpenAI
服務(wù)和
Azure
機(jī)器學(xué)習(xí)提供了監(jiān)督式
Fine-tuning,允許您提供自定義數(shù)據(jù)(提示
/
補(bǔ)全或?qū)υ捠搅奶?,具體取決于選擇的模型),以教授基本模型新的技能。何時(shí)應(yīng)該使用微調(diào)在開始使用Fine-tuning
之前,我們建議您首先嘗試提示工程或
RAG(檢索增強(qiáng)生成)——這是最快的入手方式。微軟提供了如
Prompt
Flow
或
On
Your
Data
工具來使此過程變得更簡單。您可以在需要
Fine-tuning
模型的場景下進(jìn)行比較,以選擇從提示工程還是
RAG
開始入手。大多數(shù)模型都會結(jié)合提示工程和
Fine-tuning,從而避免浪費(fèi)精力。想要了解何時(shí)
/
是否應(yīng)該進(jìn)行
Fine-tuning
?一些基本規(guī)則可以為您提供指導(dǎo):1.
如果您希望簡單而快速地獲取結(jié)果,請不要立即開始使用
Fine-tuning:因?yàn)檫@需要大量的數(shù)據(jù)和時(shí)間來訓(xùn)練和評估新模型。如果時(shí)間有限,通常只需通過提示工程即可取得相當(dāng)大的進(jìn)展。2.
如果您需要最新或域外數(shù)據(jù),這是使用
RAG
和提示工程的完美用例。3.
如果您希望確保您的模型具有良好的基礎(chǔ),避免產(chǎn)生幻覺(hallucinations),那么
RAG
在這方面表現(xiàn)出色。可以考慮使用
Fine-tuning
的場景包括:1.
教會模型一項(xiàng)新技能,以便它在特定任務(wù)上表現(xiàn)出色,如分類、摘要或始終以特定格式或語調(diào)進(jìn)行回應(yīng)。有時(shí),通過
Fine-tuning
較小的模型,也能使其在特定任務(wù)上與較大的模型一樣出色。2.
通過示例向模型演示如何執(zhí)行某些操作,但在提示中很難解釋清楚,或者示例太多,上下文窗口中無法容納。這些場景有很多邊緣情況,比如自然語言查詢,或者教模型用特定的聲音或語調(diào)說話。3.
減少延遲。較長的提示可能需要更長的處理時(shí)間,而
Fine-tuning
允許您將這些較長的提示集成到模型本身中。12微調(diào)與提示工程、RAG
的使用情景一覽微調(diào)是一種高級技術(shù),需要專業(yè)知識才能正確使用。下面的問題將幫助您評估是否已經(jīng)準(zhǔn)備好使用微調(diào)。2.
您目前嘗試了哪些其他辦法?4.
你打算使用哪些數(shù)據(jù)進(jìn)行微調(diào)?1.
為什么要微調(diào)?3.
這些方法哪些情況下行不通?5.
如何衡量微調(diào)模型的質(zhì)量?如果您可以明確回答以上問題,那么,您可以開始下一步的微調(diào)計(jì)劃了。要求開始為什么用幾個示例來引導(dǎo)模型提示工程易于制作和快速實(shí)驗(yàn),門檻非常低簡單、快速部署提示工程、RAG在AzureOpenAI
上輕松使用您的數(shù)據(jù),使用提示流程,LangChain提升模型相關(guān)性RAG從您自己的數(shù)據(jù)集中檢索相關(guān)信息以插入提示最新數(shù)據(jù)信息RAG從您自己的數(shù)據(jù)庫、搜索引擎等查詢最新信息,以插入提示事實(shí)基礎(chǔ)RAG引用和檢查檢索到的數(shù)據(jù)的能力優(yōu)化具體任務(wù)微調(diào)微調(diào)經(jīng)常用于引導(dǎo)模型執(zhí)行特定任務(wù),例如以特定的格式、語調(diào)或聲音總結(jié)數(shù)據(jù)指令無法適應(yīng)提示微調(diào)微調(diào)將少樣本示例移入訓(xùn)練步驟,但增加了訓(xùn)練所需的樣本數(shù)量更低的延遲微調(diào)在提供足夠且高質(zhì)量的數(shù)據(jù)的情況下,可以微調(diào)較小、更快的模型以在特定任務(wù)上提供良好的性能,而不是使用類似
GPT4
的通用模型更低的成本適情況而定提示工程和
RAG
的初始成本較低,但長提示更昂貴;微調(diào)訓(xùn)練是昂貴的,但可能會減少提示長度。選擇始終取決于用例和數(shù)據(jù)。復(fù)雜、新穎的數(shù)據(jù)或領(lǐng)域提示工
+RAG+微調(diào)這是一個高風(fēng)險(xiǎn)領(lǐng)域。微調(diào)可以重新訓(xùn)練模型以識別新領(lǐng)域,但需要使用
RAG
來避免合理的混淆。確??蛻舨粐L試為未經(jīng)批準(zhǔn)的用途重新訓(xùn)練133.3
在
Azure
上進(jìn)行微調(diào)使用
Azure
Open
AI
服務(wù)進(jìn)行
Fine-tuning
將為您帶來雙重優(yōu)勢:您可以自定義先進(jìn)的
OpenAI
大語言模型(LLMs),同時(shí)部署在
Azure
的安全、企業(yè)級云服務(wù)上。Azure
的內(nèi)容審查功能讓您使用所需的數(shù)據(jù)進(jìn)行
Fine-tuning
時(shí),可以過濾掉任何有合規(guī)風(fēng)險(xiǎn)的數(shù)據(jù)及響應(yīng)。如果您是
Azure
OpenAI
服務(wù)和
LLMs
的新用戶,歡迎您使用微軟提供的簡單易用的
API
來訓(xùn)練和部署模型。如果您更愿意使用
GUI,可以嘗試
Azure
OpenAIStudio。如果您正在從
OpenAI
遷移到
Azure,API
可兩者兼容。Fine-tuning
分為兩個部分:訓(xùn)練
Fine-tuning
模型以及使用新定制的模型進(jìn)行推理。訓(xùn)練指定您的基本模型、訓(xùn)練和驗(yàn)證數(shù)據(jù),并設(shè)置超參數(shù),就可以開始了!您可以使用
Azure
OpenAI
Studio
進(jìn)行簡單的
GUI
操作,或者對于更高級的用戶,我們還提供了
REST
API
或
OpenAI
PythonSDK。推理訓(xùn)練完成后,新模型將在您的資源中可用。當(dāng)使用您的模型用于推理時(shí),該定制模型可像任何其他
OpenAILLM
一樣進(jìn)行部署!經(jīng)過
Fine-tuning
的模型部署后將按小時(shí)收取托管費(fèi)用,基于輸入和輸出
token
計(jì)價(jià)。如果您熟悉使用
Azure
Machine
Learning
Studio
來開發(fā)、監(jiān)控和部署模型,您可以將
Fine-tuning
集成至
AML
工作流程中的現(xiàn)有模型。除了
OpenAI
模型,Azure
機(jī)器學(xué)習(xí)還支持對開源模型進(jìn)行
Fine-tuning,例如
LLaMa。YouTube
視頻:Alicia
&
Seth
“如何在
Turbo
上進(jìn)行微調(diào)”14路徑四
訓(xùn)練您的自有模型如果您決定訓(xùn)練您的自有模型,Azure
云端大規(guī)模
AI
算力平臺是您最佳的合作伙伴!先進(jìn)
AI,離不開算力基礎(chǔ)設(shè)施、服務(wù)與專業(yè)知識。我們將微軟過去十年的超級計(jì)算經(jīng)驗(yàn)和支持超大型
AI
訓(xùn)練工作負(fù)載的經(jīng)驗(yàn)應(yīng)用于搭建具備規(guī)?;咝阅艿?/p>
AI
基礎(chǔ)架構(gòu)。您可以在
AzureAIStudio
中使用預(yù)構(gòu)建和可自定義的
AI模型,開發(fā)生成式
AI
解決方案和自定義
copilot。現(xiàn)在
Azure
AI
模型目錄中添加了新的基礎(chǔ)和生成式
AI
模型。在
Hugging
Face
中,我們引入了一系列不同的穩(wěn)定擴(kuò)散模型、falcon
模型、CLIP、Whisper
V3、BLIP
和
SAM
模型。此外,我們還添加了
分別來自
Meta
和NVIDIA
的
Code
Llama
和
Nemotron
模型,以及微軟研究的尖端
Phi
模型。模型目錄中新增了
40
個新模型和4
種新模式,包括文本到圖像和圖像嵌入模型。借助我們的模型即服務(wù),專業(yè)開發(fā)人員很快就能輕松集成最新的
AI
模型,例如
Meta
的
Llama
2、Cohere
的Command、G42
的
Jais
以及
Mistral
的高級模型作為
API
端點(diǎn)到應(yīng)用程序中。他們還可以使用自己的數(shù)據(jù)微調(diào)這些模型,Azure龐大的
GPU基礎(chǔ)設(shè)施能力,將幫助您降低配置
GPU
資源和管理托管的復(fù)雜性。4.1
Azure
為任何規(guī)模的
AI
提供世界一流的算力Azure
領(lǐng)先的
GPU
和網(wǎng)絡(luò)解決方案的獨(dú)特架構(gòu)設(shè)計(jì),為計(jì)算最密集的
AI
訓(xùn)練和推理工作負(fù)載提供了一流的性能和規(guī)模。這就是世界領(lǐng)先的
AI
公司(包括
OpenAI、Meta
等)選擇
Azure
來推進(jìn)
AI
創(chuàng)新的原因。Azure
目前位列全球
TOP500
超級計(jì)算平臺第三名,是唯一的云服務(wù)提供商。Azure
全堆棧大模型訓(xùn)練優(yōu)勢154.2
Azure
AI
Infra
GPU
虛擬機(jī)類型Microsoft
Azure
推出基于
NVIDIA
H100
Tensor
Core
GPU
的
ND
H100
v5
VM,該虛擬機(jī)支持的按需配置可達(dá)8
至上千個通過
Quantum-2
In?niBand
網(wǎng)絡(luò)互連的NVIDIAH100GPU,使得
AI
模型的性能明顯提高。在
2023年
11月份發(fā)布的
MLperf
性能基準(zhǔn)報(bào)告里,我們將
175B參數(shù)
GPT-3
模型的訓(xùn)練時(shí)間從之前的
10.94分鐘降低到
4.0085
分鐘,使用的算力是
1344
臺通過
In?niBand
互聯(lián)的
Azure
H100
虛機(jī),這只比
Nvidia
裸金屬機(jī)器慢了
2%。Azure
ND
H100
v5
系列虛擬機(jī)自建大模型的算力加持:
Azure
H100
MLperf
性能基準(zhǔn)NVLINK
高速互聯(lián)的八卡
GPU
虛擬機(jī)Quantum-2
In?niBand高速擴(kuò)展的多臺
GPU
集群單卡H100
GPUNVIDIAH100TensorCore
GPUNVSwitch+NVLink
4.0Quantum-2
In?niBand16與
Azure
共同設(shè)計(jì)超級計(jì)算機(jī)對于擴(kuò)展我們苛刻的Al
訓(xùn)練需求至關(guān)重要,
使我們在ChatGPT
等系統(tǒng)上的研究和調(diào)試工作成為可能?!狦reg
BrockmanOpenAl
總裁兼聯(lián)合創(chuàng)始人我們對于對話式AI
的關(guān)注促使我們開發(fā)和訓(xùn)練一些最復(fù)雜的大型語言模型。Azure
的
AI基礎(chǔ)結(jié)構(gòu)為我們提供了必要的性能,以便大規(guī)模、可靠地、高效處理這些模型。我們對Azure
的新
VM
及其將為我們的AI
開發(fā)工作帶來的性能提升感到非常興奮。——Mustafa
SuleymanIn?ection
首席執(zhí)行官此外
Microsoft
Azure
的
AI
Infra
機(jī)型還包括:基于
Nvidia
H100
用于中等規(guī)模模型訓(xùn)練以及推理密集型負(fù)載的
H100
虛擬機(jī)類型
NC_H100。基于
Nvidia
H100
用于機(jī)密型
AI
應(yīng)用的
H100
機(jī)型
NCC
H100v5。基于
Nvidia
H200
用于大模型訓(xùn)練和推理的
ND
H200
v5
機(jī)型。基于AMD
MI300X
用于支持大模型的高帶寬內(nèi)存
GPU
機(jī)型
ND
MI300X
v5
虛擬機(jī)。17第三章生成式人工智能落地成功案例參考01
汽車行業(yè)
梅賽德斯-
奔馳梅賽德斯
-
奔馳(奔馳)是世界知名的汽車品牌,致力于為用戶提供更互聯(lián)、更智能、更個性化的駕駛體驗(yàn)。為了實(shí)現(xiàn)這一目標(biāo),奔馳開發(fā)了
MBUX
語音助手“嘿,梅賽德斯”,讓用戶可以通過自然語音命令控制車內(nèi)的各種功能,如導(dǎo)航、娛樂、空調(diào)等。這種語音助手不僅可以提高用戶的便捷性和生產(chǎn)力,還可以增強(qiáng)用戶的安全性和舒適度。企業(yè)需求1 2 3使用
Azure
OpenAI
服務(wù)微軟
Azure
OpenAI
服務(wù)為奔馳提供了一個集成了
GPT
模型的車載語音助手,讓用戶可以通過自然語言與車輛進(jìn)行交互。這個語音助手可以理解用戶的需求和意圖,提供全面和相關(guān)的回答,還可以集成第三方服務(wù),讓用戶可以在駕駛過程中完成更多的任務(wù)。這個方案通過
Azure
的企業(yè)功能和基礎(chǔ)設(shè)施,保證了語音助手的性能和安全性,同時(shí)遵循了微軟的負(fù)責(zé)任的人工智能原則。這個方案正在美國進(jìn)行
Beta
測試,預(yù)計(jì)將為奔馳用戶帶來更互聯(lián)、更智能、更個性化的駕駛體驗(yàn)。奔馳希望盡快將
GPT
模型應(yīng)用到
MBUX
語音助手中,以搶占市場先機(jī),但
GPT
模型的部署和集成需要大量的時(shí)間和資源。奔馳需要確保
GPT
模型與MBUX語音助手的兼容性和統(tǒng)的協(xié)調(diào)性。奔馳需要保證
GPT
模型的安全性和可靠性,
以及用戶的穩(wěn)定性,以及與其他車內(nèi)系
隱私和數(shù)據(jù)的保護(hù)。18成功亮點(diǎn)奔馳可以在三個月內(nèi)完成
GPT
模型的
Beta
測試,并根據(jù)用戶的反饋進(jìn)行改進(jìn)和優(yōu)化,從而快速推出增強(qiáng)版的
MBUX
語音助手;奔馳可以使用
Azure
OpenAI
服務(wù)的預(yù)留預(yù)配置吞吐量功能,以便大規(guī)??刂?/p>
GPT
模型的配置和性能,從而支持更多的用戶和車型;奔馳可以通過
GPT
模型提供更直觀、更具對話感的語音助手,讓用戶可以通過自然語音命令完成更多的任務(wù)和功能,從而提升用戶的滿意度和忠誠度。1902
零售行業(yè)
沃爾瑪沃爾瑪是全球最大的零售商,以低價(jià)和多樣化的商品吸引了數(shù)億消費(fèi)者。沃爾瑪在
2023
財(cái)年實(shí)現(xiàn)了超過
820億美元的電子商務(wù)銷售額,并持續(xù)擴(kuò)大其活躍數(shù)字客戶群。該公司的目標(biāo)是為顧客提供最佳的數(shù)字購物體驗(yàn),讓他們能夠輕松地找到和購買自己想要的產(chǎn)品。企業(yè)需求使用
Azure
OpenAI
服務(wù)沃爾瑪選擇了微軟
Azure
OpenAI
服務(wù),以訪問世界領(lǐng)先的
AI
模型,同時(shí)獲得微軟智能云
Azure
企業(yè)級功能(包括安全性、合規(guī)性和區(qū)域可用性)的支持。結(jié)合沃爾瑪專有數(shù)據(jù)和技術(shù)、大型語言模型以及沃爾瑪建立的零售專用模型,沃爾瑪在
iOS、Android
和自有網(wǎng)站上建立了一個全新的生成式
AI
支持的搜索功能。這項(xiàng)新功能專門用于理解顧客查詢的上下文并生成個性化回復(fù)。很快,顧客將利用該功能獲得更具互動性和對話性的體驗(yàn),獲取特定問題的答案,并收到個性化的產(chǎn)品建議。借助這種前沿的生成式
AI
技術(shù),用戶可以從“滾動搜索”轉(zhuǎn)變?yōu)椤澳繕?biāo)搜索”,從而使數(shù)字購物體驗(yàn)更加流暢和直觀。成功亮點(diǎn)傳統(tǒng)搜索功能無法滿足高度個性化的需求。沃爾瑪致力于提供更個性化的商品推薦和更直觀的購物體驗(yàn)。1 2生成式
AI
技術(shù)改進(jìn)搜索功能,提供更個性化和直觀的購物體驗(yàn);5
萬名非門店員工通過“我的助手”應(yīng)用顯著提升工作效率;沃爾瑪與微軟戰(zhàn)略合作加速了數(shù)字化轉(zhuǎn)型,帶來業(yè)務(wù)創(chuàng)新。沃爾瑪希望通過引入生成式
AI
技術(shù),幫助員工完成各種任務(wù),包括文件總結(jié)和內(nèi)容創(chuàng)建。2004
游戲行業(yè)
完美世界完美世界游戲是中國最早自主研發(fā)
3D
游戲引擎的游戲企業(yè)。作為全球化的游戲開發(fā)商、發(fā)行商、運(yùn)營商,并在端游、手游、主機(jī)游戲、VR
游戲以及云游戲等多個領(lǐng)域進(jìn)行布局,旗下產(chǎn)品出口
100
多個國家和地區(qū),其出品的《誅仙》《天龍八部》《幻塔》等游戲,搭載中國文化,為全球玩家?guī)砹藘?yōu)質(zhì)的游戲體驗(yàn)。為了在MMO
游戲研發(fā)中實(shí)現(xiàn)效能突破,完美世界游戲于
2022
年開始基于
Azure
OpenAI
及其他
Azure
AI
服務(wù)探索GenAI
時(shí)代的游戲創(chuàng)新。企業(yè)需求1 2 3提升產(chǎn)品品質(zhì),打造精品游戲。大模型技術(shù)在圖像與文本生產(chǎn)領(lǐng)域的廣泛應(yīng)用為游戲行業(yè)帶來了新的機(jī)遇,然而生成式
AI的調(diào)試精度難以滿足游戲文本與美術(shù)資產(chǎn)的創(chuàng)作。升級游戲玩家的
AI
交互體驗(yàn)。AI
對話缺少與生成文本對應(yīng)的聲畫表現(xiàn),難以直接用在
MMO
項(xiàng)目中,玩家的游戲體驗(yàn)需要進(jìn)一步升級。革新技術(shù)中臺對工作室的賦能。完美世界游戲內(nèi)部早已成立AI
中心,
但如何將GenAI
的技術(shù)能力落地為各個工作室開箱即用的實(shí)用功能也是一項(xiàng)巨大挑戰(zhàn)。使用
Azure
OpenAI
服務(wù)完美世界游戲在生產(chǎn)管線、核心業(yè)務(wù)和開發(fā)工具上實(shí)現(xiàn)了全面優(yōu)化。策劃團(tuán)隊(duì)引入
GPT
3.5
和GPT-4
等
AzureOpenAI
模型,為
AI
文本創(chuàng)意、劇情拓展和定制世界觀環(huán)節(jié)提供支持;結(jié)合
GPT
4-8K
模型和
GPT
3.5微調(diào)模型以及基于
Azure
TTS
文本轉(zhuǎn)語音服務(wù),自研自動生成游戲過場動畫的工具
D+,生成角色情緒、動作、分鏡、文本、表情、口型、語音等;在美術(shù)環(huán)節(jié),基于
GPT4
+
DALL-E3
模型和微軟
3D
優(yōu)化工具
Simplygon
實(shí)現(xiàn)智能化建模、生成分鏡預(yù)覽;此外,完美世界將
Azure
OpenAI
模型強(qiáng)大的歸納、理解及總結(jié)能力應(yīng)用在量化運(yùn)營場景與安全維護(hù)場景;并基于
Azure
OpenAI
服務(wù)的
GPT-4、Codex
模型和
GitHub
Copilot
工具,實(shí)現(xiàn)了智能代碼生成和智能測試。成功亮點(diǎn)完全基于微軟
Azure
OpenAI
服務(wù)及
GPT-4
模型能力,上線
AI
原生劇本殺游戲。AI
技術(shù)在完美世界游戲在研
MMO
項(xiàng)目組中達(dá)到了全流程應(yīng)用,產(chǎn)品開發(fā)效率提升35%,美術(shù)產(chǎn)出效率提升
23%;目前生產(chǎn)管線優(yōu)化已經(jīng)完成了大于
38%
的
AI
化,核心業(yè)務(wù)優(yōu)化的
AI
滲透率占比超過60%,技術(shù)中心提供給各個工作室的技術(shù)開
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 子女作息習(xí)慣培養(yǎng)與家長支持合同
- 管理者的價(jià)值體現(xiàn)
- 建筑施工現(xiàn)場安全培訓(xùn)與咨詢服務(wù)協(xié)議
- 婚后奢侈品共有及離婚后財(cái)產(chǎn)分割及權(quán)益維護(hù)實(shí)施協(xié)議
- 半導(dǎo)體引線框架研發(fā)與市場推廣合作協(xié)議
- 緊急救援私人飛機(jī)航線申請與保障合同
- 國際藝術(shù)品物流保險(xiǎn)及風(fēng)險(xiǎn)防控合同
- 股權(quán)激勵合同模板:核心員工激勵方案
- 先進(jìn)工業(yè)模具技術(shù)升級合同補(bǔ)充條款
- 豪華游艇衛(wèi)星電話租賃及全球語音數(shù)據(jù)傳輸合同
- 湖南省長沙市師范大學(xué)附屬中學(xué)2025屆高三下學(xué)期模擬試卷二地理試題 含解析
- 產(chǎn)后康復(fù)培訓(xùn)課件
- 2025年中考?xì)v史總復(fù)習(xí)《中國歷史》七年級上冊全冊重點(diǎn)知識復(fù)習(xí)梳理(全冊)
- 足療店裝修施工合同協(xié)議
- 裝飾布展項(xiàng)目合同協(xié)議
- 《骨膜下注射技術(shù)》課件
- 建筑垃圾清運(yùn)服務(wù)方案投標(biāo)文件(技術(shù)方案)
- 2025-2030中國前列腺癌篩查行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略研究報(bào)告
- 社保知識視頻課件
- T型梁的裝焊船體加工與裝配課件
- 頂級廣告設(shè)計(jì)公司方案匯報(bào)
評論
0/150
提交評論