




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
WordChatGPT/GPT的原理及ChatGPT的技術(shù)架構(gòu)解析每一代GPT模型的參數(shù)量都爆炸式增長,堪稱“越大越好”。2021年2月發(fā)布的GPT-2參數(shù)量為15億,而2021年5月的GPT-3,參數(shù)量達(dá)到了1750億。
還是有很多讀者對于ChatGPT充滿期待(幻想?夢想),今天給大家分享技術(shù)層面的(拆解),讀完之后是否是會(huì)理性一點(diǎn)呢?enjoy~
文末(推薦)幾篇直接采訪ChatGPT創(chuàng)始人視角的文章,共賞enjoy~
去年12月1日,Open(AI)推出(人工智能)聊天原型ChatGPT,再次賺足眼球,為AI界引發(fā)了類似AIGC讓藝術(shù)家失業(yè)的大討論。
ChatGPT是一種專注于對話生成的語言模型。它能夠根據(jù)用戶的文本輸入,產(chǎn)生相應(yīng)的(智能)回答。這個(gè)回答可以是簡短的詞語,也可以是長篇大論。其中GPT是Genera(ti)vePre-trainedTransformer(生成型預(yù)訓(xùn)練變換模型)的縮寫。通過學(xué)習(xí)大量現(xiàn)成文本和對話集合(例如Wiki),ChatGPT能夠像人類那樣即時(shí)對話,流暢的回答各種問題。(當(dāng)然回答速度比人還是慢一些)無論是英文還是其他語言(例如中文、韓語等),從回答歷史問題,到寫故事,甚至是撰寫商業(yè)計(jì)劃書和行業(yè)分析,“幾乎”無所不能。甚至有(程序員)貼出了ChatGPT進(jìn)行程序修改的對話。
ChatGPT和AIGC的聯(lián)合使用
ChatGPT也可以與其他AIGC模型聯(lián)合使用,獲得更加炫酷實(shí)用的功能。
例如上面通過對話生成客廳設(shè)計(jì)圖。這極大加強(qiáng)了AI應(yīng)用與客戶對話的能力,使我們看到了AI大規(guī)模落地的曙光。
一、ChatGPT的傳承與特點(diǎn)
▌1.1OpenAI家族
我們首先了解下OpenAI是哪路大神。OpenAI總部位于舊金山,由(特斯拉)的馬斯克、SamAltman及其他投資者在2021年共同創(chuàng)立,目標(biāo)是開發(fā)造福全人類的(AI技術(shù))。而馬斯克則在2021年時(shí)因公司發(fā)展方向分歧而離開。此前,OpenAI因推出GPT系列自然語言處理模型而聞名。從2021年起,OpenAI就開始發(fā)布生成式預(yù)訓(xùn)練語言模型GPT(GenerativePre-trainedTransformer),可用于生成文章、代碼、機(jī)器翻譯、問答等各類內(nèi)容。每一代GPT模型的參數(shù)量都爆炸式增長,堪稱“越大越好”。2021年2月發(fā)布的GPT-2參數(shù)量為15億,而2021年5月的GPT-3,參數(shù)量達(dá)到了1750億。
GPT家族主要模型對比
▌1.2ChatGPT的主要特點(diǎn)
ChatGPT是基于GPT-3.5(GenerativePre-trainedTransformer3.5)架構(gòu)開發(fā)的對話AI模型,是InstructGPT的兄弟模型。ChatGPT很可能是OpenAI在GPT-4正式推出之前的演練,或用于收集大量對話數(shù)據(jù)。
ChatGPT的主要特點(diǎn)
OpenAI使用RLHF(ReinforcementLearningfromHumanFeedbac,人類反饋強(qiáng)化學(xué)習(xí))技術(shù)對ChatGPT進(jìn)行了訓(xùn)練,且加入了更多人工監(jiān)督進(jìn)行微調(diào)。此外,ChatGPT還具有以下特征:1)可以主動(dòng)承認(rèn)自身錯(cuò)誤。若用戶指出其錯(cuò)誤,模型會(huì)聽取意見并優(yōu)化答案。2)ChatGPT可以質(zhì)疑不正確的問題。例如被詢問“哥倫布2021年來到美國的情景”的問題時(shí),(機(jī)器人)會(huì)說明哥倫布不屬于這一時(shí)代并調(diào)整輸出結(jié)果。3)ChatGPT可以承認(rèn)自身的無知,承認(rèn)對專業(yè)技術(shù)的不了解。4)支持連續(xù)多輪對話。與大家在生活中用到的各類(智能音箱)和“人工智障“不同,ChatGPT在對話過程中會(huì)記憶先前使用者的對話訊息,即上下文理解,以回答某些假設(shè)性的問題。ChatGPT可實(shí)現(xiàn)連續(xù)對話,極大的提升了對話交互模式下的用戶體驗(yàn)。對于準(zhǔn)確翻譯來說(尤其是中文與人名音譯),ChatGPT離完美還有一段距離,不過在文字流暢度以及辨別特定人名來說,與其他(網(wǎng)絡(luò))翻譯工具相近。由于ChatGPT是一個(gè)大型語言模型,目前還并不具備網(wǎng)絡(luò)搜索功能,因此它只能基于2021年所擁有的數(shù)據(jù)集進(jìn)行回答。例如它不知道2022年世界杯的情況,也不會(huì)像蘋果的Siri那樣回答今天天氣如何、或幫你搜索信息。如果ChatGPT能上網(wǎng)自己尋找學(xué)習(xí)語料和搜索知識(shí),估計(jì)又會(huì)有更大的突破。即便學(xué)習(xí)的知識(shí)有限,ChatGPT還是能回答腦洞大開的人類的許多奇葩問題。為了避免ChatGPT染上惡習(xí),ChatGPT通過(算法)屏蔽,減少有害和欺騙性的訓(xùn)練輸入。
查詢通過適度A(PI)進(jìn)行過濾,并駁回潛在的種族主義或性別歧視提示。
二、ChatGPT/GPT的原理
▌2.1NLP
NLP/NLU領(lǐng)域已知局限包括對重復(fù)文本、對高度專業(yè)的主題的誤解,以及對上下文短語的誤解。對于人類或AI,通常需接受多年的訓(xùn)練才能正常對話。NLP類模型不僅要理解單詞的含義,還要理解如何造句和給出上下文有意義的回答,甚至使用合適的俚語和專業(yè)詞匯。
NLP技術(shù)的應(yīng)用領(lǐng)域本質(zhì)上,作為ChatGPT基礎(chǔ)的GPT-3或GPT-3.5是一個(gè)超大的統(tǒng)計(jì)語言模型或順序文本預(yù)測模型。
▌2.2GPTv.s.BERT
與BERT模型類似,ChatGPT或GPT-3.5都是根據(jù)輸入語句,根據(jù)語言/語料概率來自動(dòng)生成回答的每一個(gè)字(詞語)。從數(shù)學(xué)或從(機(jī)器學(xué)習(xí))的角度來看,語言模型是對詞語序列的概率相關(guān)性分布的建模,即利用已經(jīng)說過的語句(語句可以視為數(shù)學(xué)中的向量)作為輸入條件,預(yù)測下一個(gè)時(shí)刻不同語句甚至語言集合出現(xiàn)的概率分布。ChatGPT使用來自人類反饋的強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練,這種方法通過人類干預(yù)來增強(qiáng)機(jī)器學(xué)習(xí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇省啟東市高中數(shù)學(xué) 第一章 三角函數(shù) 第1課時(shí) 1.1 任意角教學(xué)實(shí)錄 蘇教版必修4
- 2024年屆九年級(jí)化學(xué)下冊 第12單元 化學(xué)與生活 12.3 有機(jī)合成材料教學(xué)實(shí)錄 (新版)新人教版
- 2023一年級(jí)語文上冊 第一單元 快樂讀書吧:讀書真快樂配套教學(xué)實(shí)錄 新人教版
- 2025年甲基丙烯酸甲酯項(xiàng)目發(fā)展計(jì)劃
- 八年級(jí)物理上冊 第二章 運(yùn)動(dòng)與能量2.1 認(rèn)識(shí)運(yùn)動(dòng)教學(xué)實(shí)錄 (新版)教科版
- 中小學(xué)勞動(dòng)教育-《勞動(dòng)創(chuàng)造美好生活》活動(dòng)方案
- 藝術(shù)仿古做舊涂料企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 滴丸制劑工藝改進(jìn)行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報(bào)告
- 深層滋養(yǎng)手膜行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 極限運(yùn)動(dòng)挑戰(zhàn)視頻行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 物聯(lián)網(wǎng)設(shè)備安裝與調(diào)試項(xiàng)目實(shí)訓(xùn)-課件全套-項(xiàng)目1-7-安裝照明裝置-安裝智能家居安防監(jiān)控系統(tǒng)
- DB11T 1905-2021 大型群眾性活動(dòng)消防安全規(guī)范
- T∕CACE 0118-2024 改性磷石膏混合料道路穩(wěn)定基層應(yīng)用技術(shù)規(guī)程
- 教師個(gè)人嘉獎(jiǎng)主要事跡材料500字(31篇)
- 暖通空調(diào)工程施工組織設(shè)計(jì)方案
- 幼兒園 小班音樂《森林音樂會(huì)》原版有聲動(dòng)態(tài)課件
- 個(gè)人外匯管理辦法實(shí)施問答(一二三四期)
- 【財(cái)務(wù)報(bào)表分析論文:美的集團(tuán)財(cái)務(wù)報(bào)表分析6400字】
- 基金基礎(chǔ)知識(shí)考試題庫100道及答案
- 婦產(chǎn)科學(xué)妊娠合并糖尿病課件
- 部編四下語文《口語交際:轉(zhuǎn)述》公開課教案教學(xué)設(shè)計(jì)【一等獎(jiǎng)】
評(píng)論
0/150
提交評(píng)論