架構(gòu)師特刊:天工開物AIGC_第1頁
架構(gòu)師特刊:天工開物AIGC_第2頁
架構(gòu)師特刊:天工開物AIGC_第3頁
架構(gòu)師特刊:天工開物AIGC_第4頁
架構(gòu)師特刊:天工開物AIGC_第5頁
已閱讀5頁,還剩112頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

熱點(diǎn)|CONTENTS熱點(diǎn)|用AIGC寫2023高考語文作文,結(jié)果如何?谷歌警告自家員工:不要使用Bard生成的代碼專題訪談|InterviewAIGC領(lǐng)域最大收購(gòu):Databricks花費(fèi)13億美元買下只有15名研發(fā)的小公司!專題訪談|Interview推薦文章|Article探索大模型智能:眾安保險(xiǎn)基于AIGC的應(yīng)用實(shí)踐推薦文章|Article編程已死,AI當(dāng)立?教授公開“唱反調(diào)”:AI還幫不了程序員視頻推薦|VideoLangChain:2023年最潮大語言模型Web開發(fā)框架視頻推薦|Video本月,這些視頻值得一看!卷首語史學(xué)家把十六、十七世紀(jì)的中國(guó)稱為“天崩地解”的時(shí)代,社會(huì)經(jīng)濟(jì)關(guān)系、工農(nóng)業(yè)內(nèi)部結(jié)構(gòu)發(fā)生變化,科學(xué)技術(shù)快速發(fā)展,因此,民間誕生了《天工開物》、《本草綱目》這樣的奇書。三百余年過去了,我們?cè)僖淮蝸淼搅丝茖W(xué)技術(shù)重構(gòu)社會(huì)經(jīng)濟(jì)關(guān)系的拐點(diǎn)——AIGC,這個(gè)最有想象力的詞正在以巨大的影響力,滲透到各行各業(yè)。在這樣的背景下,為了給大家?guī)斫?jīng)得住“拷問”的高質(zhì)量?jī)?nèi)容,InfoQ發(fā)起了《天工開物AIGC》架構(gòu)師特刊。在內(nèi)容設(shè)計(jì)方面,我們決定從“水面上”、“水面下”兩個(gè)維度著手。在“水面上”的部分,我們整理AIGC領(lǐng)域近期的熱點(diǎn)新聞和測(cè)評(píng),比如ChatGPT進(jìn)入車載系統(tǒng)的消息、Google等大廠對(duì)AIGC輔助開發(fā)的態(tài)度,希望借此最大限度地保證你的知情權(quán)?;蛟S當(dāng)下所處的行業(yè)、所任職的崗位并未受到AIGC太猛烈的沖擊,但中立的、實(shí)時(shí)的內(nèi)容報(bào)道,可以保證你時(shí)刻觀測(cè)AIGC的最新行業(yè)進(jìn)展,在變革到來之際早做準(zhǔn)備。在“水面下”的部分,我們更注重彌合信息差,擊破信息墻。近期有很多企業(yè)家在組織企業(yè)團(tuán)隊(duì)做調(diào)研,也有技術(shù)專家、產(chǎn)品專家遠(yuǎn)赴硅谷走近OpenAI,建立了對(duì)AIGC更加深度的認(rèn)知。我們借Prompt工程師的發(fā)展前景、AIGC輔助編程實(shí)踐、AIGC大模型算力優(yōu)化、AIGC重構(gòu)智能客服等幾個(gè)維度,聯(lián)系相關(guān)企業(yè)、負(fù)責(zé)人,做了深度訪談,希望有條理地、盡可能地把行業(yè)第一手信息同步給更多的讀者。從實(shí)際訪談、調(diào)查結(jié)果來看,各行業(yè)對(duì)AIGC的理解和實(shí)踐是超乎想象的,從去年12月,InfoQ于國(guó)內(nèi)第一次報(bào)道ChatGPT爆火至今,短短七個(gè)月,很多研發(fā)團(tuán)隊(duì)已經(jīng)積累了成熟的Prompt方法論,在在線設(shè)計(jì)、在線文檔、金融等領(lǐng)域做出了諸多產(chǎn)品研發(fā)嘗試,甚至研發(fā)團(tuán)隊(duì)已經(jīng)非常習(xí)慣Copilot的輔助。與過往的元宇宙、Web3相比,AIGC的影響更為深遠(yuǎn),變革更為迅速。動(dòng)作最為迅速的企業(yè),其AIGC應(yīng)用已經(jīng)發(fā)布上線;Prompt工程師崗位已經(jīng)完成JD設(shè)計(jì),并面向社會(huì)開始招聘。此外,我們特別發(fā)起了四期直播,針對(duì)以上話題,邀請(qǐng)了行業(yè)十余位有實(shí)操經(jīng)驗(yàn)的技術(shù)高管、骨干圓桌討論,超過三十萬人在InfoQ視頻號(hào)觀看了這些直播。直播的回放我們一并附在本期架構(gòu)師特刊中,以饗讀者。這期特刊包含的內(nèi)容很多,但我們不想給大家制造焦慮。信息的透明與同步,帶來的應(yīng)該是真正的平和。我們希望在這個(gè)信息爆炸的時(shí)代,去偽存真,通過經(jīng)過調(diào)查的內(nèi)容,給你帶來足夠的信息增量,有足夠的參考價(jià)值。幫助你更便捷地享受這一波科技紅利,更大程度地促成技術(shù)普惠。用AIGC寫2023高考語文作文,結(jié)果如何?作者王一鵬一年一度高考時(shí)間,令眾人關(guān)注的語文考試作文題已經(jīng)公開。那么,如果命令A(yù)IGC來完成今年的作文考試,AI大概能得多少分呢?為了完成這個(gè)測(cè)試,我們選擇了文心一言、訊飛星火認(rèn)知大模型、通義千問、ChatGPT來分別應(yīng)對(duì),作文題選用2023全國(guó)甲卷作文題,題目:閱讀下面的材料,根據(jù)要求寫作。人們因技術(shù)發(fā)展得以更好地掌控時(shí)間,但也有人因此成了時(shí)間的仆人。這句話引發(fā)了你怎樣的聯(lián)想與思考?請(qǐng)寫一篇文章。要求:選準(zhǔn)角度,確定立意,明確文體,自擬標(biāo)題;不要套作,不得抄襲;不得泄露個(gè)人信息;不少于800字。為此我們特別邀請(qǐng)了一位教齡35年以上的資深高中語文教師聶文革老師,來給各篇作文打分,每篇作文的評(píng)分放在文章下方,老師的總結(jié)性評(píng)語放在文末。需要特別指出的是,作文評(píng)分本來就有主觀因素,且高考作文的評(píng)判標(biāo)準(zhǔn)與尋常文章又有不同,本次“作文大賽”并非正式評(píng)測(cè),評(píng)測(cè)結(jié)果也不能代表各大模型本身的能力素質(zhì),僅供大家參考。下面開始。作文一:時(shí)間的主人及其悖論作者:文心一言時(shí)間,是宇宙中最為普遍的公平,無差別地賦予每一個(gè)人以生命,使之在有限的尺度內(nèi)創(chuàng)造與體驗(yàn)。然而,人們對(duì)于時(shí)間的理解和運(yùn)用卻千差萬別,有人視時(shí)間為寶庫(kù),有人視其為仆人。對(duì)此,我深感思考的必要,欲探討我們應(yīng)如何對(duì)待時(shí)間這一最珍貴的禮物。在技術(shù)的照耀下,我們得以更深入地解讀時(shí)間。古人云“光陰似箭,日月如梭”,時(shí)間的流逝在技術(shù)的輔助下,變得清晰可見。曾經(jīng),人們通過日晷、沙漏來感知時(shí)間,如今,我們借助衛(wèi)星導(dǎo)航、原子鐘等技術(shù)精確到秒的毫厘之間。技術(shù)的發(fā)展使我們更能丈量時(shí)間,從而更好地管理我們的生活。然而,技術(shù)并未完全使我們的生活擺脫時(shí)間的束縛,反而使人在某種程度上成為其奴隸。古人云“逝者如斯夫,不舍晝夜”,時(shí)間的無情在技術(shù)的洪流中似乎得到了強(qiáng)化。我們陷入了一種時(shí)間的悖論,一方面,我們通過技術(shù)得以更深入地理解時(shí)間,另一方面,我們也因技術(shù)而更加受制于時(shí)間。對(duì)此,我想說的是:我們不應(yīng)讓技術(shù)成為時(shí)間的幫兇,而應(yīng)成為我們駕馭時(shí)間的利器。我們不能讓時(shí)間的洪流沖垮我們,反而應(yīng)利用它來發(fā)展我們的能力。諸如司馬遷、貝多芬等偉大的人物,他們并未因時(shí)間的無情而退縮,反而因時(shí)間的磨礪而更加堅(jiān)韌。他們用時(shí)間來鍛造自我,使自己成為時(shí)間的勝者。此外,我們還應(yīng)學(xué)會(huì)欣賞時(shí)間的美。正如詩(shī)人徐志摩所說:“你來或者不來,花都會(huì)為你開放。”我們應(yīng)該像花那樣,靜靜地綻放,欣賞時(shí)間的贈(zèng)禮。我們應(yīng)在時(shí)間的賽道上奔跑,同時(shí)欣賞沿途的風(fēng)景,體會(huì)生活的韻味。不應(yīng)讓時(shí)間的緊迫性遮蔽了我們對(duì)生活的熱愛和對(duì)時(shí)間的敬畏。在此,我提倡一種“慢生活”,即在不忽視時(shí)間流逝的前提下,放慢生活的節(jié)奏,去體驗(yàn)生活的每一個(gè)瞬間。正如卡夫卡所言:“我們應(yīng)該感恩我們?cè)诘厍蛏系拿恳幻??!泵恳幻攵际巧囊徊糠?,都值得我們?nèi)フ湟暫腕w驗(yàn)。然而,慢生活并不意味著對(duì)時(shí)間的浪費(fèi)或者對(duì)生活的消極態(tài)度。相反,它是一種對(duì)生活的深度參與和積極體驗(yàn)。它讓人能夠在繁忙的生活中找到片刻的寧?kù)o,去思考人生的意義和價(jià)值。在這個(gè)快速發(fā)展的世界中,這樣的片刻寧?kù)o也許更能讓我們找回內(nèi)心的自我和方向??偟膩碚f,我們應(yīng)當(dāng)成為時(shí)間的主人,而非仆人。我們應(yīng)當(dāng)利用技術(shù)來更好地理解時(shí)間,但不應(yīng)被時(shí)間所驅(qū)使。我們應(yīng)該在快節(jié)奏的生活中找到時(shí)間留下的美好瞬間,去享受生活而不是被生活所驅(qū)使。只有這樣,我們才能真正地掌控時(shí)間,而不是被時(shí)間所控制。老師評(píng)分(60分制):50分作文二:掌控時(shí)間,做自己的主人作者:訊飛星火認(rèn)知大模型隨著時(shí)代的發(fā)展,科技的進(jìn)步,人們的生活水平不斷提高,但與此同時(shí),一些新的問題也隨之而來。比如:現(xiàn)在的學(xué)生因?yàn)橐瓿衫蠋煵贾玫拇罅孔鳂I(yè)而熬夜,導(dǎo)致第二天上課時(shí)無精打采;上班族因工作繁忙,經(jīng)常加班加點(diǎn),沒有充足的睡眠而導(dǎo)致身體抵抗力下降,甚至生病這些都是由于我們沒有掌控好自己的時(shí)間。我們應(yīng)該掌控好自己的時(shí)間,做自己的主人?!耙淮绻怅幰淮缃?,寸金難買寸光陰?!边@句話說得一點(diǎn)也沒錯(cuò)。時(shí)間是非常珍貴的,就像沙漏里的沙子一樣,稍不留神就會(huì)流走。魯迅先生說過:“時(shí)間就像海綿里的水,只要愿擠總還是有的?!笔前?!只要我們?cè)敢馊D,時(shí)間總是會(huì)有的。可是有的人卻把時(shí)間當(dāng)作金錢來浪費(fèi),他們整天無所事事,不知道該做些什么,最后只會(huì)落得個(gè)一事無成、白白浪費(fèi)掉自己寶貴的時(shí)間的下場(chǎng)。那么我們應(yīng)該怎樣才能更好地掌控我們的時(shí)間呢?首先,我們要學(xué)會(huì)合理地安排和規(guī)劃自己的時(shí)間。每天早上起來后,先列出今天要完成的任務(wù),然后再根據(jù)任務(wù)的輕重緩急來確定每件事情所需要的時(shí)間。在做事情的時(shí)候,要一心一意地把這件事情做好,不要一會(huì)兒做這件事,一會(huì)兒又做那件事,最后什么也沒有做好。其次,我們還要學(xué)會(huì)珍惜時(shí)間。不要以為時(shí)間很長(zhǎng),其實(shí)它是很短暫的。如果我們把每一天都過得充實(shí)有意義的話,那么一年的時(shí)間就會(huì)很快過去。所以我們要珍惜時(shí)間,不要虛度年華。最后,也是最重要的一點(diǎn)就是要有計(jì)劃、有目的地去學(xué)習(xí)知識(shí)、掌握技能。只有不斷地學(xué)習(xí)和積累才能使我們更加聰明、更加有能力。當(dāng)然了,要想做到掌控好自己的時(shí)間并不是一件容易的事情。它需要我們付出很大的努力和汗水,需要我們克服各種各樣的困難和挑戰(zhàn)。但是只要我們堅(jiān)持下去,相信我們一定能夠做到的!讓我們一起掌控好自己的時(shí)間吧!讓我們成為時(shí)間的主人!讓我們用我們的勤奮和智慧去創(chuàng)造一個(gè)更加美好的未來!老師評(píng)分(60分制):48分作文三:被技術(shù)控制的時(shí)間作者:通義千問技術(shù)的發(fā)展讓人們可以更加精準(zhǔn)地掌控時(shí)間,這原本是一件令人欣喜的事情,但是,有些人卻因此成為了時(shí)間的奴隸。在現(xiàn)代社會(huì)中,人們?cè)絹碓揭蕾嚫鞣N智能設(shè)備來幫助自己管理時(shí)間,如智能手表、智能手環(huán)、時(shí)間管理軟件等等。這些設(shè)備可以幫助人們監(jiān)測(cè)自己的運(yùn)動(dòng)量、睡眠質(zhì)量、飲食健康等各個(gè)方面,同時(shí)也可以提供諸如提醒、計(jì)時(shí)、日程安排等多種功能,讓人們可以更加高效地利用時(shí)間。然而,這種便利的技術(shù)也會(huì)帶來一些負(fù)面的影響。很多人開始沉迷于各種智能設(shè)備,甚至成為了它們的奴隸。他們不斷地查看手表、手環(huán)上的時(shí)間,生怕錯(cuò)過了任何一個(gè)重要的事情,甚至連睡覺都要把手機(jī)放在身邊,生怕錯(cuò)過了任何一個(gè)電話或者短信。這樣的生活方式不僅讓人感到疲憊不堪,而且也會(huì)嚴(yán)重地影響個(gè)人的健康和心理健康。更重要的是,這種依賴智能設(shè)備的行為也會(huì)讓人變得越來越懶惰。人們開始變得不愿意去思考、不愿意去行動(dòng),而是完全依賴于設(shè)備的提醒和幫助。這樣一來,人們就失去了自我管理的能力,也失去了對(duì)時(shí)間的掌控力。因此,我們必須認(rèn)識(shí)到技術(shù)發(fā)展所帶來的負(fù)面影響,并且努力避免成為時(shí)間的奴隸。我們需要學(xué)會(huì)自我管理和自我控制,合理地利用各種技術(shù)工具來幫助自己提高效率,而不是完全被它們所控制。同時(shí),我們也需要保持獨(dú)立思考和行動(dòng)的能力,不斷探索和追求自己的夢(mèng)想和目標(biāo),而不是成為時(shí)間的奴隸。老師評(píng)分(60分制):52分作文四:時(shí)間的掌控與被掌控作者:ChatGPT時(shí)間是偉大的創(chuàng)造者,也是無情的裁判。隨著科技的不斷發(fā)展,人們對(duì)時(shí)間的掌控力越來越強(qiáng),但也有人在這個(gè)過程中成了時(shí)間的仆人。本文將從時(shí)間的掌控與被掌控兩個(gè)方面展開探討,旨在引發(fā)讀者對(duì)時(shí)間的思考。一、時(shí)間的掌控人類歷史上,時(shí)間的掌控一直是人類追求的目標(biāo)之一。古代的日晷、水鐘,現(xiàn)代的鐘表、手機(jī)等工具,都為人們提供了更加精準(zhǔn)的時(shí)間信息。在這個(gè)信息爆炸的時(shí)代,時(shí)間管理也成為了人們追求高效、優(yōu)質(zhì)生活的必備技能之一。人們通過各種時(shí)間管理方法,如番茄工作法、GTD等,來更好地利用時(shí)間,實(shí)現(xiàn)自己的目標(biāo)。在現(xiàn)代社會(huì),時(shí)間的掌控不僅僅是個(gè)人的需要,也是企業(yè)、組織的需要。時(shí)間不僅是金錢,更是效率。企業(yè)通過時(shí)間管理,提高生產(chǎn)效率,降低成本,增加利潤(rùn)。組織通過時(shí)間管理,提高員工的工作效率和生產(chǎn)力,實(shí)現(xiàn)自己的戰(zhàn)略目標(biāo)。在這個(gè)過程中,時(shí)間成為了人們的朋友,幫助人們更好地實(shí)現(xiàn)自己的目標(biāo)。二、時(shí)間的被掌控然而,隨著科技的發(fā)展,人們的生活越來越被時(shí)間所掌控。社交網(wǎng)絡(luò)、即時(shí)通訊工具等,讓人們無時(shí)不刻地處于“在線”狀態(tài),隨時(shí)隨地接受信息和任務(wù),人們的自由時(shí)間越來越少。特別是在全球化的時(shí)代,人們需要面對(duì)不同時(shí)區(qū)、不同文化的人們,需要不斷地調(diào)整自己的生活節(jié)奏,這使得人們的生活更加被動(dòng)。此外,一些新興行業(yè)也讓人們更加被時(shí)間所掌控。比如網(wǎng)約車司機(jī)、外賣配送員等,他們需要隨時(shí)待命,承擔(dān)著不確定的工作量和工作時(shí)間。在他們看來,時(shí)間不再是自己的,而是被工作所占據(jù)。這些人們的工作,雖然帶來了一定的經(jīng)濟(jì)收益,但同時(shí)也剝奪了他們自由支配時(shí)間的權(quán)利。三、時(shí)間的啟示時(shí)間的掌控與被掌控,是人們面臨的一個(gè)共同問題。我們需要更好地掌控時(shí)間,實(shí)現(xiàn)自己的目標(biāo),但同時(shí)也需要注意不被時(shí)間所掌控。我們應(yīng)該把握好自己的時(shí)間,不斷提高自己的效率和生產(chǎn)力,實(shí)現(xiàn)自己的價(jià)值。但是,我們也應(yīng)該學(xué)會(huì)放松自己,享受生活,讓時(shí)間成為我們的伙伴,而不是我們的敵人。在現(xiàn)代社會(huì),人們需要更好地認(rèn)識(shí)時(shí)間的價(jià)值,明確時(shí)間的重要性。我們應(yīng)該尊重時(shí)間,珍惜時(shí)間,因?yàn)闀r(shí)間是不可逆轉(zhuǎn)的。我們應(yīng)該用時(shí)間去實(shí)現(xiàn)自己的夢(mèng)想和目標(biāo),去創(chuàng)造屬于自己的價(jià)值??傊?,時(shí)間是人類追求的目標(biāo)之一,也是人類必須面對(duì)的問題。我們需要掌控時(shí)間,實(shí)現(xiàn)自己的目標(biāo),但同時(shí)也需要注意不被時(shí)間所掌控。只有在這個(gè)過程中,我們才能實(shí)現(xiàn)自己的夢(mèng)想和目標(biāo),創(chuàng)造屬于自己的價(jià)值。老師評(píng)分(60分制):45分老師整體評(píng)語:這四篇作文,均能緊扣材料核心,以時(shí)間·科技·人類為話題,結(jié)合現(xiàn)實(shí)生活的現(xiàn)象,發(fā)揮辯證性思維,符合高考作文趨勢(shì)。第一篇亮點(diǎn):在時(shí)間快與慢的節(jié)奏變化中體驗(yàn)生活之美;第二篇亮點(diǎn):重點(diǎn)提出了一些具體措施,文章實(shí)用性強(qiáng);第三篇針對(duì)性極強(qiáng),有社會(huì)意義,作文為時(shí)而作,有助于解疑釋惑。第四篇結(jié)構(gòu)清晰,思維明確,綜合評(píng)分為50分,48分,52分,45分。此外,如果從高考應(yīng)試作文角度考慮,四篇作文的題目中第二篇文章的題目符合要求,其他三篇文題應(yīng)作修改。當(dāng)然,關(guān)于AIGC,極客邦科技也在努力為大家提供更多的AIGC相關(guān)內(nèi)容,滿足大家對(duì)于精品資訊、資料、課程的需求。在3月中旬,極客時(shí)間一次性發(fā)布四門AIGC公開課,其中包括句子互動(dòng)公司創(chuàng)始人兼CEO李佳芮的《ChatGPT從0到1》、新加坡科研局高級(jí)研究員黃佳的《ChatGPT和預(yù)訓(xùn)練模型實(shí)戰(zhàn)課》、優(yōu)頻科技有限公司CTO孫其瑞的《StableDiffusion:零基礎(chǔ)學(xué)會(huì)AI繪畫》以及NebulaGraph軟件工程師古思為的《GitHubCopilot實(shí)踐課》與此同時(shí),bothub創(chuàng)始人、布奇托網(wǎng)絡(luò)科技創(chuàng)始人兼CTO徐文浩,在極客時(shí)間開設(shè)了課程《AI大模型之美》,是「極客時(shí)間AIGC未來教育系列課程」之一,聚焦于讓大家充分認(rèn)識(shí)、使用OpenAI、StableDiffusion等開發(fā)工具,實(shí)現(xiàn)自主可用的AIGC應(yīng)用,現(xiàn)已有1.8w人加入學(xué)習(xí)。珠海太乙人工智能技術(shù)合伙人尹會(huì)生,則在極客時(shí)間開辦了《21天AIGC行動(dòng)營(yíng)》。都說AIGC會(huì)淘汰掉某些崗位,但有許多同學(xué)已經(jīng)在這里率先成為AIGC時(shí)代的高效工作者,AIGC變成了他們手中的效率提升工具。6月還將有重磅的AIGC主題訓(xùn)練營(yíng)與大家見面,聚焦AIGC與企業(yè)私域數(shù)據(jù)結(jié)合,開發(fā)為企業(yè)特別定制的AIGC服務(wù),相信也契合了很多研發(fā)小伙伴的實(shí)際工作。其他往期InfoQ關(guān)于AIGC的部分報(bào)道:AIGC,下一個(gè)即將爆發(fā)的萬億級(jí)AI技術(shù)風(fēng)口_技術(shù)洞察_技術(shù)趨勢(shì)_大廠實(shí)踐_InfoQ精選專題極客圓桌派:狂飆的ChatGPT|InfoQ《極客有約》_AI_InfoQ中文站_InfoQ精選視頻極客圓桌派:ChatGPT點(diǎn)燃AI|InfoQ《極客有約》_AI_InfoQ中文站_InfoQ精選視頻我們是如何探索把ChatGPT|InfoQ《極客有約》_AI_InfoQ中文站_InfoQ精選視頻程序員越“老”就越看不上AI輔助編程工具?StackOverflow2023開發(fā)者調(diào)查AI特別報(bào)告作者Tina今天,StackOverflow正式發(fā)布了一年一度的開發(fā)者調(diào)查結(jié)果。今年StackOverflow收到了來自185個(gè)國(guó)家的90,000份回復(fù),這次他們十分關(guān)注AI的使用情況。今年AI大火,StackOverflow希望了解AI對(duì)開發(fā)人員的工作方式是否產(chǎn)生了真正的影響,因此對(duì)AI的深入調(diào)查,是今年特有的。StackOverflow產(chǎn)品營(yíng)銷副總裁JoyLiuzzo表示,該公司將使用開發(fā)者的這些回復(fù)來塑造自己的AI產(chǎn)品。StackOverflow曾公開表示AI是該網(wǎng)站的“大機(jī)遇”,“我們現(xiàn)在正在投資AI,我們需要了解開發(fā)人員如何看待這項(xiàng)技術(shù),并根據(jù)回應(yīng)情況將其納入開發(fā)人員的工作流程中,”Liuzzo說道。這次調(diào)查關(guān)于AI使用的亮點(diǎn)有:相對(duì)于學(xué)習(xí)編程的人來說,專業(yè)人士對(duì)AI工具的采用更為緩慢。30%的專業(yè)開發(fā)人員表示沒有采用AI輔助編程工具的計(jì)劃。ChatGPT是最受歡迎的AI搜索工具,被83%的受訪者使用,其次是BingAI(20%)、WolframAlpha(13%)和GoogleBardAI(10%)。GitHubCopilot是最受歡迎的開發(fā)者搜索工具,被55%的受訪者使用,其次是nine(13%)和CodeWhisperer(5%)。與美國(guó)、英國(guó)和德國(guó)的開發(fā)人員相比,印度、巴西和波蘭的受訪者更有可能接受AI工具。專業(yè)開發(fā)人員信任AI嗎?StackOverflow發(fā)現(xiàn),很多開發(fā)人員已經(jīng)在使用AI。其中44%的開發(fā)人員現(xiàn)在就在他們的開發(fā)過程中使用AI工具,26%的人計(jì)劃很快開始使用。學(xué)習(xí)編程的人采用人數(shù)更多,達(dá)到55%,這些早期采用者一旦進(jìn)入專業(yè)開發(fā)人員職位,將成為技能嫻熟的AI用戶。盡管越來越多的開發(fā)人員在使用AI工具,但他們使用的種類并不多。StackOverflow詢問開發(fā)人員他們正在使用哪些工具,在今年列出的21個(gè)選項(xiàng)中,絕大多數(shù)只是使用了兩個(gè)熱門產(chǎn)品:ChatGPT(83%)和GitHubCopilot(56%)。StackOverflow還發(fā)現(xiàn),隨著經(jīng)驗(yàn)的增加,開發(fā)人員對(duì)將AI工具表現(xiàn)得更為冷淡。近40%的擁有超過21年經(jīng)驗(yàn)的開發(fā)人員表示他們不打算使用這些工具或計(jì)劃使用這些工具。畢竟更有經(jīng)驗(yàn)的開發(fā)人員通常從事更復(fù)雜的項(xiàng)目和/或代碼結(jié)構(gòu),AI工具目前無法幫助解決這些問題。而且這些較新的AI技術(shù),現(xiàn)在還處于炒作周期的早期階段。StackOverflow預(yù)計(jì),在更廣泛地應(yīng)用之前,開發(fā)人員可能還需要更多的時(shí)間調(diào)整現(xiàn)有的工作流程來適應(yīng)這些工具。導(dǎo)致AI工具在開發(fā)過程中采用速度較慢的另一個(gè)因素是專業(yè)開發(fā)人員對(duì)AI工具的準(zhǔn)確性不太信任。在使用或計(jì)劃使用AI工具的人中,只有3%非常信任它們的準(zhǔn)確性,而有兩倍多的人(6%)非常不信任。雖然多數(shù)人(39%)對(duì)AI工具有些信任,但這個(gè)回應(yīng)告訴我們AI工具仍需要證明它們的有用性。對(duì)于新工具的采用,“信任但要核實(shí)”可能是最佳方法。今年一個(gè)非常受歡迎的問題是“為什么ChatGPT在數(shù)學(xué)上不準(zhǔn)確?”這個(gè)問題涉及到AI工具(特別是那些基于大型語言模型訓(xùn)練的工具)無法理解復(fù)雜問題的問題。但實(shí)際上,人們?cè)谶@類問題上也經(jīng)常出錯(cuò)。另外,在什么地方工作也會(huì)對(duì)結(jié)果造成影響。來自印度、巴西和波蘭的專業(yè)開發(fā)人員最有可能使用或計(jì)劃在其開發(fā)流程中使用AI工具,這些國(guó)家的回應(yīng)率達(dá)到70%甚至更高。而英國(guó)、法國(guó)、美國(guó)和德國(guó)的開發(fā)人員更有可能表示他們不計(jì)劃使用AI工具(回應(yīng)率達(dá)到36%)。印度和巴西是許多“新”技術(shù)人才的來源地,這一趨勢(shì)可從過去的開發(fā)者調(diào)查中看出,因此在這些地區(qū)更廣泛地使用AI工具是有道理的。而歐盟國(guó)家和美國(guó)的情況比較特殊,因?yàn)榭梢酝ㄟ^最近的新聞推斷出GDPR法規(guī)對(duì)AI進(jìn)行監(jiān)管的可能性在增大。法國(guó)已經(jīng)開始調(diào)查針對(duì)ChatGPT的投訴。在美國(guó),雖然目前還沒有相關(guān)法規(guī),但一些公司已經(jīng)開始公布禁止在工作中使用ChatGPT的政策,同時(shí)StackOverflow和Reddit也公開表示他們將開始收費(fèi)以限制訪問社區(qū)數(shù)據(jù)。無論是準(zhǔn)確性問題還是法律規(guī)定或工作場(chǎng)所規(guī)定,這些因素都使開發(fā)人員不敢迅速采用這些AI工具。AI輔助工具的好處StackOverflow表示,無論現(xiàn)在的采用情況如何,開發(fā)人員對(duì)這些AI工具的可能性都持積極態(tài)度。調(diào)查發(fā)現(xiàn),77%的受訪者對(duì)在他們的工作流程中使用AI感到滿意,70%的受訪者今年已經(jīng)在使用或計(jì)劃使用AI編碼工具。在實(shí)際使用中,與專業(yè)開發(fā)人員相比,學(xué)習(xí)編程的人員主要是用AI工具進(jìn)行調(diào)試和獲得幫助(68%),并了解代碼庫(kù)(50%)。而專業(yè)開發(fā)人員最感興趣的是使用AI工具測(cè)試代碼(65%)、提交和審查代碼(64%),以及使用它們進(jìn)行部署和監(jiān)控(61%),以及記錄代碼或了解代碼庫(kù)(58%)。整體來說,AI工具給開發(fā)者帶來的好處,主要還是體現(xiàn)在提高生產(chǎn)力和加快學(xué)習(xí)速度上。根據(jù)調(diào)查結(jié)果來看,在對(duì)AI工具有好感的所有開發(fā)人員角色中,高級(jí)管理人員(63%)與數(shù)據(jù)科學(xué)家和區(qū)塊鏈開發(fā)人員一起位居榜首。嵌入式應(yīng)用程序開發(fā)人員、桌面/企業(yè)開發(fā)人員和硬件工程師不太可能使用這些工具,并且將來也不太愿意使用它們。StackOverflow希望硬件工程師暫時(shí)不要使用人工智能,因?yàn)檫@些工具的準(zhǔn)確性方面讓人信心不足。StackOverflow也在調(diào)查中詢問了開發(fā)人員,明年在工作流程中使用AI工具,是否會(huì)跟今年有所不同,72%的人表示或許在編寫代碼流程中會(huì)有所不同,78%的人對(duì)使用AI調(diào)試代碼持相同看法。參考資料https://survey.stackoverflow.co/2023/#aihttps://stackoverflow.co/labs/developer-sentiment-ai-ml/https://stackoverflow.blog/2023/06/13/hype-or-not-developers-have-something-to-say-about-ai//2023/6/13/23759101/stack-overflow-developers-survey-ai-cod-ing-tools-moderators-strikeChatGPT正式進(jìn)入車載系統(tǒng):奔馳首測(cè)AI語音助手,可進(jìn)行復(fù)雜對(duì)話作者凌敏AI浪潮下,千行百業(yè)實(shí)現(xiàn)了新一輪智能化轉(zhuǎn)型。此前,ChatGPT已經(jīng)開始接入各種各樣的企業(yè)級(jí)應(yīng)用中,顛覆原有的使用體驗(yàn)。近日,有消息稱,ChatGPT正式進(jìn)入車載系統(tǒng),為汽車帶來進(jìn)一步智能升級(jí)。據(jù)外媒報(bào)道,6月15日,梅賽德斯-奔馳和微軟共同宣布,兩家公司正在合作擴(kuò)大人工智能的使用,計(jì)劃將ChatGPT整合到車輛的語音控制系統(tǒng)中。據(jù)介紹,測(cè)試版計(jì)劃為期三個(gè)月,根據(jù)從中發(fā)現(xiàn)的問題以及車主反饋,梅賽德斯-奔馳公司將會(huì)考慮在更深的層次上整合ChatGPT。微軟公司發(fā)言人介紹稱,這也是ChatGPT產(chǎn)品第一次應(yīng)用在汽車環(huán)境中。據(jù)悉,這項(xiàng)合作將通過微軟的AzureOpenAI服務(wù)為車主帶來聊天機(jī)器人ChatGPT的體驗(yàn)。梅賽德斯-奔馳表示,從6月16日開始,在美90萬輛配備MBUX信息娛樂系統(tǒng)的車輛都可參與測(cè)試,使用ChatGPT驅(qū)動(dòng)的語音助手。車主可以通過登錄官方應(yīng)用程序“Mercedesme”,或在車內(nèi)使用語音命令“嘿梅賽德斯,我想加入測(cè)試計(jì)劃”,自愿注冊(cè)參與測(cè)試。注冊(cè)完成后,車主便可以通過車載語音助手訪問ChatGPT。對(duì)于此次合作,微軟指出,車載ChatGPT能支持更動(dòng)態(tài)的對(duì)話——不僅可以理解車主的語音命令,還可以進(jìn)行交互式對(duì)話,對(duì)話范圍可以涵蓋地點(diǎn)信息、菜譜、甚至是一些更加復(fù)雜的問題,進(jìn)而讓駕駛員的眼睛更專注于路況。與普通的語音助手不同,車載ChatGPT可以處理完整的對(duì)話,例如追問,并且能保持對(duì)前后文的理解。駕駛員可以提出復(fù)雜的問題或進(jìn)行多輪對(duì)話,從語音助手那里收到詳細(xì)的回復(fù)。微軟還在與梅賽德斯-奔馳探索ChatGPT的插件生態(tài)系統(tǒng),為第三方服務(wù)集成開辟可能性。駕駛員未來有望通過車載系統(tǒng),就能完成預(yù)訂餐廳、預(yù)定電影票等任務(wù),進(jìn)一步提高便利性和生產(chǎn)力。谷歌警告自家員工:不要使用Bard生成的代碼作者褚杏娟根據(jù)路透社消息,谷歌警告員工不要泄露機(jī)密信息或使用其AI聊天機(jī)器人生成的代碼,包括自己正在全球推廣的Bard。知情人士稱,谷歌母公司Alphabet已建議員工不要將機(jī)密材料輸入人工智能聊天機(jī)器人,該公司援引了長(zhǎng)期保護(hù)信息政策。研究人員發(fā)現(xiàn)AI可以重現(xiàn)它在訓(xùn)練期間吸收的數(shù)據(jù),從而造成泄漏風(fēng)險(xiǎn)。還有知情人士透露,Alphabet提醒其工程師避免直接使用聊天機(jī)器人生成的計(jì)算機(jī)代碼。該公司表示Bard會(huì)提出不受歡迎的代碼建議。問題是可能導(dǎo)致錯(cuò)誤程序或復(fù)雜、臃腫的軟件。與根本不使用AI進(jìn)行編碼相比,開發(fā)人員將花費(fèi)更多時(shí)間來修復(fù)這些問題。據(jù)Insider報(bào)道,到2月,谷歌告訴測(cè)試Bard的工作人員在發(fā)布前不要向Bard提供內(nèi)部信息?,F(xiàn)在谷歌將Bard推廣到180多個(gè)國(guó)家和40種語言。如今,告誡自己的員工不要直接使用Bard生成的代碼一事,打破了谷歌聲稱其聊天機(jī)器人可以幫助開發(fā)人員提高工作效率的說法。創(chuàng)建者自己由于隱私和安全風(fēng)險(xiǎn)都不使用的話,其他人該怎么相信并使用呢?前不久,谷歌準(zhǔn)備在歐盟地區(qū)推出Bard,但是由于歐盟隱私數(shù)據(jù)監(jiān)管機(jī)構(gòu)提出質(zhì)疑,谷歌被迫將發(fā)布日期向后推遲。愛爾蘭數(shù)據(jù)保護(hù)委員會(huì)近日指出,谷歌并沒有明確說明Bard服務(wù)將如何遵守歐盟地區(qū)的隱私數(shù)據(jù)保護(hù)規(guī)定。參考鏈接/technology/google-one-ais-biggest-backers-warns-own-staff-about-chatbots-2023-06-15/微軟也搞起了開源小模型!利用OpenAI的ChatGPT和GPT-4訓(xùn)練,實(shí)力碾壓當(dāng)前最強(qiáng)開源模型作者核子可樂褚杏娟 ChatbotArena等排行榜已經(jīng)反復(fù)證明,數(shù)十億美元支撐起來的ChatGPT仍然是聊天機(jī)器人領(lǐng)域無可爭(zhēng)辯的王者。而人們只能調(diào)用其API,無法私有化部署,無法自己訓(xùn)練調(diào)整。因此,大家現(xiàn)在熱衷于用開源大模型來構(gòu)建AI聊天機(jī)器人,希望能在性能層面達(dá)到甚至超越ChatGPT等專有模型的水平。近期,微軟出人意料地發(fā)布了一個(gè)只有13億參數(shù)但具有大模型推理能力的開源小模型Orca,它使用創(chuàng)新的訓(xùn)練方法,成為首位敢于同專有模型叫板的挑戰(zhàn)者。而且,Orca的規(guī)模僅是其競(jìng)爭(zhēng)對(duì)手的幾十分之一(甚至可能只相當(dāng)于GPT-4的幾百分之一)。令人難以置信的是,Orca在某些場(chǎng)景下甚至表現(xiàn)更好,而且完全碾壓迄今為止所謂最強(qiáng)開源模型Vicuna。論文地址:/pdf/2306.02707.pdf那么,Orca究竟是怎么做到的?新的訓(xùn)練方式:巧勁勝于蠻力在說起AI模型訓(xùn)練時(shí),資金投入基本已經(jīng)成為首要前提。具體來講,談到模型中的幾十億參數(shù),這背后的涵義包括:光是收集訓(xùn)練數(shù)據(jù)就要花上幾百萬美元;基礎(chǔ)模型的訓(xùn)練還要再花上幾百萬美元;模型的微調(diào)也可能花費(fèi)幾十萬美元;不要說人類反饋強(qiáng)化學(xué)習(xí)(RLHF)級(jí),這個(gè)環(huán)節(jié)最好碰都別碰。所以說起“大語言模型”的競(jìng)逐,其實(shí)全世界有資格參與進(jìn)來的也不過四、五家公司。因此,為了在性能層面跟ChatGPT等大體量專有模型相對(duì)抗,研究人員別無選擇,只能選擇以巧勁破解對(duì)方的財(cái)力。而在生成式AI領(lǐng)域,所謂的“巧勁”正是“蒸餾”(distillation)。簡(jiǎn)單來說,蒸餾就是選位優(yōu)秀的同志,再把它的響應(yīng)能力作為小模型的學(xué)習(xí)素材。為什么要這么干?非常簡(jiǎn)單:ChatGPT雖然擁有數(shù)十億個(gè)參數(shù),但只有“少數(shù)”參數(shù)真正重要。從原理層面來講:征。這樣做的結(jié)果就是,大部分模型中的大部分參數(shù)始終處于未使用狀態(tài)。研究人員意識(shí)到這個(gè)現(xiàn)實(shí)問題后,得出了以下結(jié)論:假設(shè)GPT-4這樣的先進(jìn)模型未來仍須以體量增長(zhǎng)作為必要條件,那在擁有了訓(xùn)練得到的大模型之后,能不能再用一個(gè)比其小得多的模型簡(jiǎn)單重現(xiàn)大模型的部分或者全部特性?換句話說,在引導(dǎo)AI模型學(xué)習(xí)現(xiàn)實(shí)情境時(shí),能不能先用大語言模型完成其中最繁重的“模式提取”任務(wù),再讓它們作為“老師”指導(dǎo)那些體量較小的模型?答案是可以。蒸餾的過程就是這樣一種AI學(xué)習(xí)方法,以大體量模型為模板訓(xùn)練小體量模型。所以開源社區(qū)的最佳AI聊天機(jī)器人開發(fā)流程基本可以概括為:對(duì)大語言模型(教師)進(jìn)行采樣,以構(gòu)建{用戶指令,輸出}的查詢數(shù)據(jù)集。這里常見的選項(xiàng)當(dāng)然是ChatGPT。接下來,選擇一個(gè)較小的模型(參數(shù)量大約在5億到150億之間)作為“學(xué)生”。學(xué)生的任務(wù)就是盡量減少自身輸出與教師輸出間的差異,學(xué)習(xí)它、模仿它??刂圃诟偷乃?。這樣新的先進(jìn)模型就此誕生,且成本僅為大模型的百分之一。聽起來不錯(cuò),但現(xiàn)實(shí)世界顯然沒那么美好。雖然這些模型能夠有效學(xué)習(xí)教師的風(fēng)格和語言連續(xù)性(例如Vicuna或Alpaca),但卻往往無法掌握對(duì)方的強(qiáng)大推理能力。也就是說,在對(duì)復(fù)雜任務(wù)做出評(píng)估時(shí),其表現(xiàn)會(huì)遠(yuǎn)遜于自己的老師。沒錯(cuò),是“遠(yuǎn)遠(yuǎn)”遜于。Orca碾壓開源模型,趕超ChatGPT現(xiàn)在,大多數(shù)開源模型的性能其實(shí)被故意夸大了。Vicuna、Alpaca等開源模型的出色性能,可能是研究人員精心挑選的結(jié)果。直到現(xiàn)在,它們?cè)谕评砘鶞?zhǔn)測(cè)試上的表現(xiàn)仍一言難盡。例如,雖然Vicuna在衡量復(fù)雜任務(wù)的基準(zhǔn)測(cè)試中,已經(jīng)能在風(fēng)格和語言連續(xù)性方面達(dá)到GPT-4的89%左右,可一旦面對(duì)七步邏輯推演等挑戰(zhàn),雙方的差距就會(huì)擴(kuò)大到令人尷尬的5400%。換句話說,這時(shí)GPT-4的性能達(dá)到Vicuna的55倍。Orca的研究人員意識(shí)到了這個(gè)問題,并努力做出了改進(jìn)。在Big-BenchHard上使用零樣本提示的性能測(cè)試中,括號(hào)內(nèi)的2900%代表Orca相對(duì)Vicuna的改進(jìn)程度。Orca在所有任務(wù)上的綜合表現(xiàn)略好于ChatGPT,但明顯落后于GPT-4,比Vicuna高出113%。與AGIEval的結(jié)果類似,Vicuna在此基準(zhǔn)測(cè)試的復(fù)雜推理任務(wù)上表現(xiàn)不佳。Orca雖然明顯優(yōu)于Vicuna且略優(yōu)于ChatGPT,但平均性能為49.7%,落后于GPT-426%。測(cè)試中,Orca在時(shí)間序列(時(shí)間推理)、導(dǎo)航(遵循導(dǎo)航指令)、彩色物品(識(shí)別給定上下文的對(duì)象顏色)方面分別優(yōu)于ChatGPT102%、3.6%和1.7%。Orca在因果判斷任務(wù)上表現(xiàn)出色,性能與GPT-4相當(dāng),同時(shí)超過ChatGPT4.7%。在檢測(cè)翻譯錯(cuò)誤上,Orca和ChatGPT水平差不多。Orca在需要各種知識(shí)的任務(wù)(例如體育、藝術(shù)家、幽默等)方面表現(xiàn)不如ChatGPT,但在電影推薦方面表現(xiàn)更好。在WebofLies測(cè)試中,Orca甚至把GPT-4也斬落馬下,性能比這套體量百倍于自身的明星模型還高出3%。Vicuna自然也不在話下,但Orca的得分比其高出24.3%。來源:Microsoft(Webofliesexample)令人印象深刻的是,在以上所有任務(wù)中,Orca的平均性能已經(jīng)超越GPT-3.5。這不僅是開源模型的一個(gè)新里程碑,同時(shí)也穩(wěn)定將性能保持在Vicuna的兩倍以上。雖然在大多數(shù)情況下,Orca仍落后于無可爭(zhēng)議的王者GPT-4,但這種以小搏大、碾壓其他開源同儕并偶爾超越老大哥的表現(xiàn),究竟是怎么實(shí)現(xiàn)的?Orca研究人員做了什么當(dāng)前小模型通過指令微調(diào)來模仿大模型的方式主要存在以下問題:指令簡(jiǎn)單且缺乏多樣性。收集的數(shù)據(jù)規(guī)模小,任務(wù)缺乏多樣性。模仿信號(hào)有限,只能通過老師模型生成的<query、response>進(jìn)行模仿學(xué)習(xí)。評(píng)估標(biāo)準(zhǔn)較弱。用大模型對(duì)小模型進(jìn)行指令調(diào)優(yōu)后的結(jié)果一般依靠進(jìn)行自動(dòng)評(píng)估,例如使用GPT-4響應(yīng)的結(jié)果進(jìn)行指令調(diào)優(yōu)后的模型傾向于生成更長(zhǎng)的文本,同時(shí)GPT-4在候選響應(yīng)的順序上有偏差。Orca的研究人員主要采取了以下兩項(xiàng)重要?jiǎng)?chuàng)新舉措:解釋性訓(xùn)練在Orca之前,Vicuna和Alpaca等模型只能從GPT-4等模型中采樣簡(jiǎn)單的{用戶指令,回答}查詢來進(jìn)行蒸餾,借此訓(xùn)練新模型模仿自己的老師:但在Orca這邊,研發(fā)思路發(fā)生了巨大轉(zhuǎn)變。研究人員沒有像之前那樣簡(jiǎn)單提取查詢,而是引入了第三項(xiàng)約束條件,即系統(tǒng)指令。也就是說,除了用戶指令和模型答案之外,微軟研究人員又額外添加了一系列指令,旨在對(duì)學(xué)生模型的行為和思考過程進(jìn)行建模,如下圖所示:這并不難理解:學(xué)生不僅需要模仿GPT-4的輸出質(zhì)量,還需要模仿老師的思維過程,從而掌握類似的推理能力。通過中間教學(xué)實(shí)現(xiàn)漸進(jìn)式學(xué)習(xí)截至目前,大多數(shù)開源模型只使用一對(duì){學(xué)生,教師}素材。但在Orca卻有兩個(gè)老師。首先自然是ChatGPT。作為第一位老師,它負(fù)責(zé)指導(dǎo)學(xué)生模型解決那些不太復(fù)雜的查詢。之后再經(jīng)由GPT-4提供更復(fù)雜的查詢指引,讓學(xué)生根據(jù)之前掌握的知識(shí)做進(jìn)一步學(xué)習(xí)。這個(gè)過程跟人類的學(xué)習(xí)方式非常相似。我們?cè)趯W(xué)習(xí)乘除法之前,先得掌握加減法的訣竅,循序漸進(jìn)突破一道道難關(guān)。而且與單純使用GPT-4的訓(xùn)練方法比較,漸進(jìn)式學(xué)習(xí)的效果確實(shí)更勝一籌。結(jié)束語目前越來越大、耗能越來越高的發(fā)展模式是否將很快走向終點(diǎn),還有待驗(yàn)證,但如今每周幾乎都會(huì)出現(xiàn)突破現(xiàn)有游戲規(guī)則和技術(shù)邊界的新成果,大家都在效率方面做了很多努力。從Orca憑借一點(diǎn)小技巧就能碾壓眾多開源模型來看,我們對(duì)于AI技術(shù)只能說還知之甚少。而作為已經(jīng)憑借ChatGPT在市場(chǎng)上占據(jù)絕對(duì)優(yōu)勢(shì)的王者,微軟率先出手,再將開源模型升級(jí)到新的維度。開源模型或?qū)㈤_啟屬于自己的新時(shí)代。參考鏈接/@ignacio.de.gregorio.noblejas/orca-microsoft-7c78ca03c803AIGC領(lǐng)域最大收購(gòu):Databricks花費(fèi)13億美元買下只有15名研發(fā)的小公司!作者Tina核子可樂智能湖倉(cāng)開發(fā)商Databricks正著手以13億美元收購(gòu)生成式AI初創(chuàng)公司MosaicML,希望幫助自家客戶在數(shù)據(jù)之上構(gòu)建和部署AI模型。值得注意的是,Databricks本身也是一家初創(chuàng)公司,成立于2013年,通過多輪融資籌得36億美元。此次的收購(gòu)成本當(dāng)中,包含挽留MosaicML員工的相應(yīng)支出。大語言模型(LLM)正在AI領(lǐng)域掀起新一波浪潮,它能夠理解查詢、分析多個(gè)數(shù)據(jù)源并用自然語言給出回應(yīng)和答案,甚至能夠輸出編程語言。當(dāng)然,這些模型也可能產(chǎn)生錯(cuò)誤或虛構(gòu)的答案,而且需要大量GPU資源才能運(yùn)行。MosaicML的主要業(yè)務(wù)就是幫助客戶在小規(guī)模系統(tǒng)上運(yùn)行模型,并使用自己的數(shù)據(jù)和非公開數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練和微調(diào)。Databricks公司CEOAliGhodsi表示,“每個(gè)組織都應(yīng)該從AI革命當(dāng)中受益,并更好地控制數(shù)據(jù)的使用方式?!苯衲?月,Databricks公布了其更新之后的開源Dolly大語言模型,標(biāo)志著公司的AI設(shè)施已可用于商業(yè)應(yīng)用,且無需大量GPU資源或者昂貴的API。這款聊天機(jī)器人能夠響應(yīng)客戶查詢,根據(jù)Databricks智能湖倉(cāng)內(nèi)的數(shù)據(jù)給出答案。MosaicML的來歷MosaicML則創(chuàng)立于2021年,聯(lián)合創(chuàng)始人分別為擔(dān)任CEO的NaveenRao(前英特爾副總裁兼AI產(chǎn)品事業(yè)部總經(jīng)理)和Hanling前英特爾AI實(shí)驗(yàn)室高級(jí)總監(jiān)),員工僅62人,其中研究人員(researchers)約為15名,“與Brain或DeepMind的龐大研究人員隊(duì)伍相比,我們規(guī)模很小”。MosaicML公司目前只公開披露過一輪融資,為6400萬美元,其開源大語言模型基于MPT-7B架構(gòu),即擁有70億參數(shù)且上下文窗口為6.4萬token。NaveenRao與HanlinTang和最近發(fā)布的目前下載量已經(jīng)超過330萬次。要比更加強(qiáng)大,且性能已經(jīng)超越初版。MosaicML的大小是精心選擇的結(jié)果,能夠輕松部署在單個(gè)GPU上——可以在16位精度對(duì)應(yīng)1塊A100-80GB,也可以在8位精度對(duì)應(yīng)1塊A100-40GB。MosaicML公司指出,其他類似的大語言模型(例如Falcon-40B)往往擁有更多參數(shù),因此無法在單個(gè)數(shù)據(jù)中心GPU上提供服務(wù)。而一旦需要的GPU超過2個(gè),就會(huì)增加推理系統(tǒng)的最低實(shí)現(xiàn)成本。MosaicML還特別提到在編程方面表現(xiàn)優(yōu)異,“這歸功于包括大量代碼的預(yù)訓(xùn)練數(shù)據(jù)。我們希望這種文本和編程功能的結(jié)合使模型成為社區(qū)的流行選擇?!盡osaicML是一家美國(guó)公司,在舊金山、紐約、帕洛阿爾托和圣迭戈設(shè)有辦事處。其客戶則包括AI2(艾倫AI研究所)、GenerallyIntelligence、HippocraticAI、Replit和ScatterLabs。Databricks表示,MosaicML的技術(shù)將為客戶提供一種簡(jiǎn)單快速的方式,能夠在保留對(duì)自身數(shù)據(jù)的控制、安全保護(hù)和所有權(quán)的前提下,享受到成本低廉的語言模型服務(wù)。與標(biāo)準(zhǔn)方案相比,MosaicML的優(yōu)化成果將模型訓(xùn)練速度提升了2到7倍,而且能夠線性擴(kuò)展。該公司聲稱,其數(shù)十億參數(shù)的模型在幾小時(shí)內(nèi)即可完成訓(xùn)練,遠(yuǎn)低于一般模型長(zhǎng)達(dá)數(shù)天的訓(xùn)練周期。NaveenRao解釋道,“我們之所以創(chuàng)辦MosaicML,就是希望解決困難的工程和研究問題,幫助每個(gè)人更輕松地進(jìn)行大規(guī)模訓(xùn)練。隨著近期掀起的生成式AI浪潮,這項(xiàng)工作也成為關(guān)注的焦點(diǎn)。我們將與Databricks一道,推動(dòng)天平向著更有利于大多數(shù)人的方向傾斜——我們是志同道合的伙伴,同樣肩負(fù)讓研究人員轉(zhuǎn)型為企業(yè)家的使命?!笔召?gòu)意欲何為?根據(jù)NaveenRao的說法,MosaicML一直致力于降低生成式AI的使用成本,從數(shù)千萬美元降至數(shù)十萬美元。生物制藥服務(wù)公司SyneosHealth的首席信息和數(shù)字官LarryPickett表示,目前根據(jù)專業(yè)健康數(shù)據(jù)訓(xùn)練模型的成本估計(jì)為100萬至200萬美元。分析師表示,這類“特定領(lǐng)域”模型對(duì)公司來說可能比ChatGPT更有用,因?yàn)樗鼈儞碛懈嗟男袠I(yè)術(shù)語和專業(yè)知識(shí)。但Pickett預(yù)計(jì),SyneosHealth通過使用較小的預(yù)訓(xùn)練模型,“而不是在OpenAI擁有的整個(gè)數(shù)據(jù)集之上構(gòu)建”,花費(fèi)會(huì)大大減少。他說,其中一些模型已經(jīng)在開源庫(kù)中可用,例如機(jī)器學(xué)習(xí)初創(chuàng)公司HuggingFace提供的庫(kù)?!安⒉皇敲總€(gè)人、每個(gè)應(yīng)用程序都需要GPT-4,”Krishna說,他指的是OpenAI的大型語言模型。他說,大型語言模型正在針對(duì)非常具體的應(yīng)用進(jìn)行微調(diào),“到那時(shí),它就會(huì)變得非常小,可以嵌入到任何手機(jī)中。”但Databricks收購(gòu)MosaicML的目的卻仍然讓很多人感到迷惑,HackerNews上不少網(wǎng)友一致認(rèn)為Databricks是在炒作,表示通過新聞稿看不明白Databricks要將LLM整合來做什么。雖然現(xiàn)在Databricks稱公司的主要技術(shù)方向?yàn)長(zhǎng)akehouse,但實(shí)際上它是由ApacheSpark創(chuàng)建者創(chuàng)立,因此有人認(rèn)為其護(hù)城河和核心價(jià)值主張是云中的ApacheSpark,主要是用Spark來處理大規(guī)模集群上的數(shù)據(jù),其中包括機(jī)器學(xué)習(xí)訓(xùn)練和推理管道,在這種情況下,Databricks整合LLM的價(jià)值主張是不夠明確的。甚至還有人認(rèn)為,Databricks不過是在借當(dāng)前大模型熱度進(jìn)行炒作,MosaicML遲早會(huì)被注銷掉。另外不得不提的是,Databricks本身成立也僅十年,去年公布年收入剛超過10Mosaic上一輪融資的估值為1.36億美元,無論是以股權(quán)還是現(xiàn)金收購(gòu),13億美元的交易價(jià)格對(duì)Mosaic來說都是一個(gè)巨大的飛躍。該交易預(yù)計(jì)將在第二季度期間完成(截至7月31日)。在交易完成后,整個(gè)MosaicML團(tuán)隊(duì)預(yù)計(jì)都將加入Databricks。隨時(shí)間推移,MosaicML的平臺(tái)將得到支持、擴(kuò)展和集成。根據(jù)Databricks的說法,客戶將獲得一套統(tǒng)一平臺(tái),可以在該平臺(tái)之上構(gòu)建、擁有和保護(hù)自己的生成式AI模型,并使用自有數(shù)據(jù)做進(jìn)一步模型訓(xùn)練。擬議的這項(xiàng)收購(gòu)案須滿足成交慣例,包括遵循相關(guān)監(jiān)管許可。目前可能還有其他生成式AI初創(chuàng)公司在與Databricks的競(jìng)爭(zhēng)對(duì)手們洽談收購(gòu)方案。參考鏈接/blog/mpt-30b/mosaicml?lang=en/articles/databricks-strikes-1-3-billion-deal-for-generative-ai-startup-mo-saicml-fdcefc06/item?id=36478734https://www.latent.space/p/mosaic-mpt-7b#detai實(shí)訪用人單位:Prompt工程師真是低門檻“香餑餑”?作者王一鵬15-50k的月薪,另外還有年終獎(jiǎng)和其他福利,你所要做的,就是研究、分析、設(shè)計(jì)在用漢語或英語做輸入的情況下,更準(zhǔn)確地描述業(yè)務(wù)想要做的事情,聽起來是不是很難以置信?然而這就是真實(shí)出現(xiàn)在BOSS直聘上的招聘啟事,其崗位名稱叫做“Prompt工程師”或“PromptEngineer”,于2023年上半年在國(guó)內(nèi)快速興起,目前已有30家左右的公司在各大平臺(tái)公開招聘該崗位。在國(guó)外,PromptEngineer的熱度似乎更高,不僅崗位數(shù)量更多,而且年薪最高達(dá)到了七位數(shù),在全球經(jīng)濟(jì)皆不景氣的當(dāng)下,顯得獨(dú)樹一幟。可是,由供需主導(dǎo)的人才市場(chǎng),似乎不太可能出現(xiàn)“頭腦發(fā)熱”癥狀。在經(jīng)過一系列研究調(diào)查,并與相關(guān)招聘單位、企業(yè)高管進(jìn)行深度訪談后,我們發(fā)現(xiàn),以為“Prompt工程師”的入行門檻低,只是一種錯(cuò)覺。當(dāng)前企業(yè)招聘的“Prompt工程師”崗位,實(shí)際上不但對(duì)應(yīng)聘者的要求很高,而且極度務(wù)實(shí)。換句話說,如果你真的成功轉(zhuǎn)型成了一名全職Prompt工程師,那么15k-50k的月薪,不但不浮夸,而且恰如其分。“魔幻”的背后是高門檻與極度務(wù)實(shí)Prompt工程師的主要工作,是通過帶參或不帶參的自然語言輸入,對(duì)預(yù)訓(xùn)練大語言模型進(jìn)行操作,并對(duì)輸出結(jié)果進(jìn)行調(diào)優(yōu)??梢哉f,Prompt工程師就是企業(yè)或組織,為了將大模型的能力帶入生產(chǎn)環(huán)境,而特別創(chuàng)造的崗位職能。這一崗位的興起,與大模型技術(shù)本身的成熟直接相關(guān)。創(chuàng)客貼是國(guó)內(nèi)頭部的平面設(shè)計(jì)在線平臺(tái),目前正在招聘Prompt工程師,其崗位職責(zé)和技能要求如下:職責(zé):基于語言模型,設(shè)計(jì)、開發(fā)和完善各種應(yīng)用程序的AI生成文本提示。監(jiān)控和分析提示性能,確定改進(jìn)的領(lǐng)域。負(fù)責(zé)用于訓(xùn)練垂直領(lǐng)域模型的數(shù)據(jù)收集方案。AI提示生成過程,參與提示詞工具開發(fā)。協(xié)助內(nèi)容和產(chǎn)品團(tuán)隊(duì)了解提示工程。要求和技能:熟悉開源和閉源語言模型。熟練生成高質(zhì)量提示詞的工程技術(shù)。具備優(yōu)秀的需求理解能力和拆解復(fù)雜任務(wù)的能力。具備一定的計(jì)算機(jī)知識(shí),如編程語言,機(jī)器學(xué)習(xí)。具備中英文寫作能力,有出色的口頭和書面溝通能力。有良好的工作習(xí)慣,善于歸納和記錄工作內(nèi)容。能夠有效與跨職能團(tuán)隊(duì)合作。創(chuàng)客貼CTO李晉松這樣描述招聘原因:“大模型能力的成熟,就像突然之間,我們手中擁有了一架強(qiáng)大的機(jī)器。但機(jī)器上的按鈕很多,且沒有說明書,需要一個(gè)同學(xué)來探索、歸納、總結(jié)其使用方法?!碑?dāng)然,這里只是針對(duì)Prompt工程師的招聘需求而談的,要對(duì)大模型的輸出結(jié)果進(jìn)行微調(diào),方法并不只有Prompt一種,其完整的概括應(yīng)該是:全部微調(diào):使用新的數(shù)據(jù)集對(duì)整個(gè)模型進(jìn)行微調(diào),包括預(yù)訓(xùn)練的部分和新加的任務(wù)特定層。這種方法通常需要大量的數(shù)據(jù)和計(jì)算資源,并且需要更長(zhǎng)的訓(xùn)練時(shí)間,但能夠獲得最好的性能。部分微調(diào):只對(duì)特定的層或幾個(gè)層進(jìn)行微調(diào),通常是模型的最后幾層或添加的任務(wù)特定層。這種方法通常需要較少的數(shù)據(jù)和計(jì)算資源,訓(xùn)練時(shí)間也較短,但性能可能不如全局微調(diào)。凍結(jié)部分層:將預(yù)訓(xùn)練模型的前幾層(如BERT的前若干層)凍結(jié),只對(duì)后面的層進(jìn)行微調(diào)。這種方法可以減少微調(diào)的參數(shù)量和計(jì)算量,但可能會(huì)影響性能。動(dòng)態(tài)掩碼微調(diào):對(duì)于需要進(jìn)行序列標(biāo)注任務(wù)的預(yù)訓(xùn)練模型,可以使用動(dòng)態(tài)掩碼微調(diào)的方法,即只對(duì)標(biāo)注序列的位置進(jìn)行微調(diào),對(duì)其他位置的參數(shù)進(jìn)行凍結(jié)。這種方法可以減少微調(diào)的參數(shù)量,提高計(jì)算效率。半監(jiān)督微調(diào):使用少量的標(biāo)注數(shù)據(jù)和大量的無標(biāo)注數(shù)據(jù)對(duì)模型進(jìn)行微調(diào),以提高性能。這種方法需要使用半監(jiān)督學(xué)習(xí)的技術(shù),如自監(jiān)督學(xué)習(xí)或基于對(duì)抗學(xué)習(xí)的方法。Prompt工程:更偏向應(yīng)用與業(yè)務(wù),通過修改輸入給大模型的提示詞,調(diào)優(yōu)輸出結(jié)果。但前面五種,都需要一定的操作成本,且一般由算法工程師或所謂AIGC工程師來完成,最后一種是在解決大模型從生產(chǎn)到應(yīng)用的“最后一公里”問題,目前是必備的,當(dāng)下一般由算法工程師或其他技術(shù)角色兼任,或是企業(yè)招聘專人負(fù)責(zé)。大眾對(duì)Prompt工程師一職印象的分裂,也多半來源于此:從表面看來,Prompt工程師是所有IT行業(yè)的工程師角色里,唯一寫自然語言的工種,且所負(fù)責(zé)的事項(xiàng),也無非是把一項(xiàng)任務(wù)表述得更清楚,似乎任何語言表達(dá)能力不錯(cuò)的人都可以做到。事實(shí)真是如此嗎?李晉松向InfoQ舉了一個(gè)形象的例子:如果有人手動(dòng)搭建了一個(gè)復(fù)雜的藝術(shù)模型,你能否通過提示詞的猜測(cè)和微調(diào),在AIGC工具里100%還原該作品?無疑相當(dāng)困難。這就是Prompt工程師入門的第一個(gè)難點(diǎn):自然語言先天的模糊性。自然語言為了承載文明,兼顧社會(huì)價(jià)值、歷史價(jià)值、文化價(jià)值……其表意通常是模糊的、泛化的,“詞義消岐”常年來就是NLP領(lǐng)域的一個(gè)固定科目。而已經(jīng)習(xí)慣了自然語言表述邏輯的我們,要使用自然語言做精確的工程性描述,也比較困難。第二個(gè)難點(diǎn)是任何一個(gè)場(chǎng)景都有大量的專用術(shù)語,普通人用白話很難精確代換。比如在平面設(shè)計(jì)行業(yè),你至少需要知道倫布朗光、徑向、層次等級(jí)、Ascender、Descender、互補(bǔ)色……才能較為精確的描述需求,修改Prompt。這導(dǎo)致所謂的Prompt工程師至少應(yīng)該成為某個(gè)領(lǐng)域的業(yè)務(wù)專家。針對(duì)以上兩個(gè)難點(diǎn)的考察,李晉松在采訪中提到,目前招聘企業(yè)都非常務(wù)實(shí),基本上需要面試者實(shí)機(jī)演示Prompt輸入和輸出結(jié)果,并對(duì)微調(diào)過程進(jìn)行考察。InfoQ同時(shí)也采訪了珠海太乙人工智能技術(shù)合伙人&項(xiàng)目總監(jiān)、極客時(shí)間21天AIGC行動(dòng)營(yíng)講師尹會(huì)生,他從另一個(gè)角度聊到這個(gè)問題:“IT領(lǐng)域大部分崗位的入門難度是逐漸上升的。比如運(yùn)維工程師,早期是研發(fā)工程師兼職轉(zhuǎn)任,熟悉資源、環(huán)境就好了,慢慢地,運(yùn)維工程師要開始會(huì)編程語言、腳本語言,比如Shell、Python,門檻開始升高。到了今天,運(yùn)維工程師的門檻已經(jīng)相當(dāng)高,需要了解容器、監(jiān)控技術(shù)等。所以相對(duì)來說,現(xiàn)在的Prompt工程師入門門檻,可能是歷史最低值,是入行的好時(shí)機(jī)?!眱蓚€(gè)角度相結(jié)合,我們或許可以得出一個(gè)復(fù)合結(jié)論:Prompt工程師并非一個(gè)“麻瓜”可以隨便上手的工作,且未來可能越來越難。尹會(huì)生同時(shí)談到另外一個(gè)思考:當(dāng)下的Prompt工程師最好來自于技術(shù)行業(yè),是某一領(lǐng)域的技術(shù)人員。因?yàn)镻rompt工程師很可能是AI技術(shù)專家身旁的“副駕”或合作者,與之協(xié)作的都是資深技術(shù)人員。如果Prompt工程師本身不懂技術(shù),那么也就無法順暢協(xié)作。Prompt工程師還應(yīng)該與時(shí)俱進(jìn),根據(jù)InfoQ寫作社區(qū)的一位算法工程師小伙伴汀的分享:Prompt工程師目前也要關(guān)注和解決與大模型相關(guān)的風(fēng)險(xiǎn)和安全問題,因此需要了解對(duì)抗性Prompt的理念和方法,與此類似的新Prompt思想還包括Active-Prompt、GraphPrompts、MultimodalCoTPrompting等,其背后是大量的學(xué)術(shù)論文支撐。圖Active-Prompt示意圖此外,站在企業(yè)的角度,所有受訪嘉賓一致同意,Prompt工程師的一大價(jià)值,應(yīng)該是能歸納總結(jié)Prompt的相關(guān)經(jīng)驗(yàn)、實(shí)踐、思路,把項(xiàng)目做成產(chǎn)品、平臺(tái)和能力,賦能企業(yè)。而針對(duì)大部分企業(yè)的普通工程師而言,這算作是一項(xiàng)進(jìn)階能力,明顯更為合理。于是,當(dāng)我們將以上所有要求匯總,得出的崗位畫像是這樣的:Prompt工程師最好是一個(gè)AI領(lǐng)域研發(fā)出身,有充足的Prompt實(shí)踐經(jīng)驗(yàn)和理論知識(shí),十分了解公司業(yè)務(wù)和所在行業(yè)、能持續(xù)學(xué)習(xí)大模型相關(guān)前沿技術(shù),并將其沉淀為團(tuán)隊(duì)能力乃至平臺(tái)、產(chǎn)品的復(fù)合型人才。根據(jù)極客邦科技雙數(shù)研究院在2021年對(duì)數(shù)字化轉(zhuǎn)型進(jìn)程中的“業(yè)務(wù)架構(gòu)師”的研究表明,既懂技術(shù)又懂業(yè)務(wù)并能將二者合二為一的人,往往是行業(yè)內(nèi)最稀缺的人才。崗位變遷:注定流行,但難說長(zhǎng)青這一崗位的發(fā)展前景,也是廣大開發(fā)者所關(guān)注的問題——甚至比工作難度大、面試通過率低,更令人擔(dān)心。道理很簡(jiǎn)單,“Prompt工程師”的發(fā)展存在一個(gè)悖論:AI的發(fā)展,本質(zhì)上是以勞動(dòng)力替代為目標(biāo)的,也就是將越來越多的工作交給機(jī)器,以達(dá)成企業(yè)降本提效的訴求。而Prompt工程師本身是大模型技術(shù)在某一發(fā)展階段的特定產(chǎn)物,因受交互方式限制,所以不得不專人專崗,理論上也是AI的替代目標(biāo)之一。況且對(duì)于企業(yè)而言,先裁撤數(shù)名業(yè)務(wù)人員,再引入數(shù)名Prompt工程師,考慮到薪資水平的差異,人力成本未必會(huì)降低。最近技術(shù)圈的新聞似乎也在印證這一點(diǎn):6月13日,阿里云機(jī)器學(xué)習(xí)團(tuán)隊(duì)在InfoQ寫作社區(qū)發(fā)文稱,推出自研Prompt美化器BeautifulPrompt,服務(wù)StableDiffusion。其原理是當(dāng)用戶輸入了一個(gè)極其簡(jiǎn)單的Prompt,該工具可以將其擴(kuò)寫成一個(gè)經(jīng)過語言模型優(yōu)化過的、細(xì)節(jié)描述詳細(xì)的Prompt,再吐給StableDiffusion。整體架構(gòu)雖然工具效果還未受到行業(yè)內(nèi)的廣泛檢驗(yàn),但可以看出,圍繞“Prompt工程師”開展的優(yōu)化動(dòng)作早就已經(jīng)開始了。隨著類似工具的不斷完善,行業(yè)專有大模型的不斷推出,“Prompt工程師”未來可能會(huì)變成一個(gè)純粹的“藍(lán)領(lǐng)”崗位。當(dāng)然這并不意味著這一崗位的壽命已經(jīng)進(jìn)入倒計(jì)時(shí),“開始優(yōu)化”和“優(yōu)化成功”,到底還是兩個(gè)概念。一旦技術(shù)的發(fā)展對(duì)市場(chǎng)產(chǎn)生了結(jié)構(gòu)性影響,那么相關(guān)人力崗位的迭代往往是漫長(zhǎng)的。以“云計(jì)算工程師”為例,該職位伴隨著云計(jì)算的崛起而出現(xiàn),高光時(shí)期曾登上人社部新興崗位名單。盡管云計(jì)算產(chǎn)業(yè)秉持著“云服務(wù)應(yīng)該像自來水一樣,讓客戶對(duì)基礎(chǔ)設(shè)施完全無感”的理念,十?dāng)?shù)年間持續(xù)優(yōu)化產(chǎn)品體驗(yàn)??稍诮袢盏恼衅钙脚_(tái),我們依然能見到“云計(jì)算工程師”的招聘啟事。另外一個(gè)例證來自“數(shù)據(jù)分析師”。讓大數(shù)據(jù)的能力普惠各行各業(yè),讓只有數(shù)據(jù)科學(xué)家才能使用的產(chǎn)品退出舞臺(tái),多年來都是眾多大數(shù)據(jù)從業(yè)者努力的方向。但經(jīng)過了二十年的大數(shù)據(jù)基建和產(chǎn)品研發(fā),“數(shù)據(jù)分析師”仍然是一個(gè)龐大的從業(yè)群體。李晉松和尹會(huì)生兩位專家都贊同“Prompt工程師”會(huì)成為AI行業(yè)接下來一段時(shí)間的常見崗位,相關(guān)熱度會(huì)越來越高。未來,會(huì)不會(huì)有新技術(shù)代替人類優(yōu)化提示詞,人類與AI大模型的交互方式會(huì)不會(huì)發(fā)生改變,還是個(gè)未知數(shù)。李晉松提到:“技術(shù)發(fā)展的每一個(gè)階段,都有特定的崗位設(shè)計(jì)。早期人們甚至需要打字員,現(xiàn)在則不需要。AIGC現(xiàn)階段的主要交互方式就是Prompt,企業(yè)應(yīng)該大膽地開始招聘,不要因?yàn)槲磥砟骋惶斓淖兓艞壆?dāng)下的發(fā)展機(jī)遇。”兩位專家同時(shí)默契地指出,即便未來大模型不再需要人工調(diào)優(yōu)Prompt,也只是該崗位的消亡,并不代表對(duì)應(yīng)的工程師會(huì)失業(yè)。李晉松作為實(shí)際的企業(yè)招聘者,對(duì)此已有規(guī)劃和安排:“我們更傾向于選擇一些在AI技術(shù)、產(chǎn)品維度有一定知識(shí)儲(chǔ)備的同學(xué),假設(shè)真的有一天,技術(shù)把Prompt工程師這一崗位取締了,他還可以轉(zhuǎn)型成為AI產(chǎn)品經(jīng)理或AI研發(fā)工程師?!币鼤?huì)生則簡(jiǎn)潔地告訴InfoQ:“我認(rèn)為,真正取代碳基生物的,永遠(yuǎn)是另一個(gè)碳基生物?!币灰D(zhuǎn)行做Prompt工程師?關(guān)于“要不要轉(zhuǎn)行做Prompt工程師”這一問題,尹會(huì)生的回答是:“我舉雙手雙腳贊成”,他說:“當(dāng)下是入行最好的時(shí)間,后面的門檻會(huì)越來越高。而且未來被淘汰的人,一定是拒絕了解、學(xué)習(xí)使用AI這種先進(jìn)工具的人?!蔽ㄒ灰⒁獾氖?,當(dāng)下行業(yè)還屬于懵懂期,各家企業(yè)基本都對(duì)Prompt工程師的績(jī)效設(shè)定、量化考核沒有太明確、成型的想法。這就導(dǎo)致一旦企業(yè)增長(zhǎng)放緩,高層考慮降低人力成本,說不清自身價(jià)值的Prompt工程師就可能會(huì)被優(yōu)先裁撤。所以積累Prompt實(shí)踐經(jīng)驗(yàn),優(yōu)先謀求內(nèi)部轉(zhuǎn)崗或兼任嘗試,可能是更穩(wěn)妥的選擇。當(dāng)然,如果對(duì)自身的能力有信心,和用人單位也充分對(duì)齊了期望、達(dá)成了共識(shí),快人一步,全職轉(zhuǎn)型Prompt工程師,也未嘗不可。尚在迷霧中的新興崗位“Prompt工程師”,正在一步步走向臺(tái)前。本文受訪嘉賓李晉松,創(chuàng)客貼CTO,互聯(lián)網(wǎng)創(chuàng)業(yè)者和資深技術(shù)專家,創(chuàng)業(yè)經(jīng)歷有老虎地圖、拉勾網(wǎng),曾任職搜狗、360AI研究院、核桃編程、作業(yè)幫、創(chuàng)客貼等歷任資深技術(shù)專家、技術(shù)總監(jiān)、技術(shù)負(fù)責(zé)人、副總經(jīng)理等職務(wù)。尹會(huì)生,珠海太乙人工智能技術(shù)合伙人&項(xiàng)目總監(jiān),前游戲公司技術(shù)總監(jiān),前新浪網(wǎng)技術(shù)經(jīng)理。已經(jīng)在極客時(shí)間開設(shè)了兩門視頻課程《零基礎(chǔ)學(xué)Python》《Linux實(shí)戰(zhàn)技能100講》,一門專欄課程《Python自動(dòng)化辦公實(shí)戰(zhàn)課》,一個(gè)行動(dòng)營(yíng)《21天AIGC行動(dòng)營(yíng)》,累計(jì)學(xué)習(xí)人數(shù)達(dá)到18萬余人。文中關(guān)于Prompt工程未來技術(shù)趨勢(shì)的參考:Prompt工程師指南[高階篇]:對(duì)抗性Prompting、主動(dòng)prompt、ReAct、GraphPrompts、MultimodalCoTPrompting等_人工智能_汀丶人工智能_InfoQ寫作社區(qū)作者:汀,一名算法工程師,主要在自然語言處理,強(qiáng)化學(xué)習(xí)以及機(jī)器學(xué)習(xí)領(lǐng)域耕深推理。歡迎大家關(guān)注id汀丶人工智能一起AI學(xué)習(xí)。神器還是垃圾?那些用AIGC編程的人,實(shí)踐得怎么樣了作者褚杏娟“大部分腳本,它寫的都能運(yùn)行,而且比我寫的還要好。”這是劉立在小試ChatGPT之后的感受?,F(xiàn)在,網(wǎng)上已經(jīng)不乏對(duì)以ChatGPT為代表的代碼生成工具的稱贊,還有大量五花八門的使用教程。程序員是好奇心比較強(qiáng)的那批人,也愿意去先吃螃蟹。2020年GPT-3發(fā)布后,他們開始摸索用大模型或AI來輔助編程。GPT-3在當(dāng)時(shí)雖被認(rèn)為是“巔峰之作”,但還不能與人對(duì)話,并未引起全民高潮。對(duì)于絕大部分程序員來說,2021年發(fā)布的Copilot可能是用大模型輔助編程的啟蒙。Copilot由修改后的生產(chǎn)版本OpenAICodex提供支持、接受了一系列公共GitHub儲(chǔ)存庫(kù)和其他公開可用原始碼訓(xùn)練的輔助編程工具。Copilot迅速引起了開發(fā)者們的注意,并得到了很多程序員的認(rèn)可?!俺绦騿T比較喜歡的一種工作方式是,我講清楚需求是什么,你能直接給我回答?!盬asmEdge創(chuàng)始人、核心開發(fā)者M(jìn)ichael說道。當(dāng)時(shí)的Copilot做到了這一點(diǎn),只要給出比較準(zhǔn)確的描述,它就可以自動(dòng)生成一段代碼,使用起來很方便?!霸诖酥暗漠a(chǎn)品,大家更多視為玩具,很有意思但不會(huì)真正使用,更不會(huì)真正花錢。Copilot做到了讓我們付費(fèi)使用?!盡ichael表示,這對(duì)一直將GitHub視為免費(fèi)工具的團(tuán)隊(duì)來說,選擇付費(fèi)并不是容易的事。但在當(dāng)時(shí),Michael公司內(nèi)部的開發(fā)者對(duì)Copilot態(tài)度是兩個(gè)極端:一部分程序員非常喜歡它,甚至到了離不開的程度,而另一部分程序員認(rèn)為它非?!澳X殘”,甚至看不起用它的程序員。這種態(tài)度分化,可能至今仍然存在。AIGC為程序員帶來了什么?就像Copilot創(chuàng)建者之一AlexGraveley說的,“代碼推理具有明確的線性,而AI模型比較適應(yīng)這種一件事做下去、前一件事對(duì)后一件事產(chǎn)生影響的應(yīng)用場(chǎng)景?!睆腉PT-3發(fā)布至今,大模型在生成代碼上表現(xiàn)得比生成自然語言要先進(jìn)一些,因?yàn)榇a只有是或不是、不容亂說。到了GPT-3.5,大模型的編程能力和邏輯能力有了非常大的提高,不僅可以生成代碼、添加注釋,還可以跟程序員對(duì)話,進(jìn)一步解釋這段代碼。而經(jīng)過兩年的驗(yàn)證,GitHub證明了AIGC工具在寫代碼和Review代碼這兩個(gè)場(chǎng)景的可用性。寫代碼,實(shí)習(xí)生水平?“我從剛開始的天天用它生成代碼,到現(xiàn)在摸清楚了,基本上不用?!苯o出描述、生成相應(yīng)的代碼,看似很酷炫的功能,但現(xiàn)在開發(fā)者還不能完全依賴這些AI工具生成的代碼。以ChatGPT為例,ChatGPT給出的很多答案其實(shí)谷歌+StackOverflow就可以查到,但是很多新手不會(huì)用這套組合,ChatGPT只是降低了這個(gè)門檻,給出了各種質(zhì)量參差不齊的答案。ChatGPT通常很難一次就給到正確的代碼,需要開發(fā)者反復(fù)調(diào)教。另外,有開發(fā)者評(píng)價(jià)ChatGPT生成的代碼很難實(shí)際使用,越深層的東西越?jīng)]用?!吧晕⑦M(jìn)階一點(diǎn)的代碼,生成得又慢又難用,不調(diào)整根本用不了。”南達(dá)科他州立大學(xué)生物信息學(xué)家XijinGe曾建議:把AI當(dāng)作暑期實(shí)習(xí)生,一些開發(fā)者也認(rèn)為其更很適合新手或者作為輔助工具。不過,還是有開發(fā)者表示,雖然是復(fù)制粘貼的水平,但能理解代碼已經(jīng)很不錯(cuò)了。在Michael看來,代碼產(chǎn)生問題的可能性是最低的,因?yàn)樯傻拇a可以立刻用起來進(jìn)行檢測(cè)。很多人吐槽ChatGPT總會(huì)先給錯(cuò)誤代碼,再讓它檢查一遍后就會(huì)給出正確答案,這是因?yàn)榇鸢傅慕o出是一個(gè)概率事件,它只是給出了其中一個(gè)答案。要提高正確率、不讓它“胡說八道”就要給更詳細(xì)、準(zhǔn)確的提示詞,讓它能夠更好地反饋出所知道的內(nèi)容。“泛泛的提問,初次會(huì)有驚艷的感覺,但問多了會(huì)有錯(cuò)覺:不過如此,那是因?yàn)椴粫?huì)提問?!眲⒘⒁脖硎尽!爱?dāng)你告訴它回答要有事實(shí)根據(jù)后,它的準(zhǔn)確率就會(huì)提高很多?!边@種需求也催生了“Prompt工程師”這一崗位的大熱,他們通過自然語言對(duì)預(yù)訓(xùn)練大語言模型進(jìn)行操作,并對(duì)輸出結(jié)果進(jìn)行調(diào)優(yōu)。憑借大模型的反饋機(jī)制,生成的代碼馬上編譯測(cè)試,甚至可以有自動(dòng)化機(jī)器人一直測(cè)試直到生成生產(chǎn)可用的代碼。國(guó)內(nèi)有企業(yè)開出60萬年薪招聘Prompt工程師,國(guó)外不僅崗位數(shù)量更多,年薪甚至最高達(dá)到了七位數(shù)。ChatGPT需要了解項(xiàng)目或需求后才能給出比較好的建議。但大模型的記憶量不大而且都是短程記憶,這常常導(dǎo)致“AI幻覺”的出現(xiàn)。為解決這個(gè)問題,業(yè)內(nèi)目前將目光聚焦在了向量數(shù)據(jù)庫(kù)上,向量數(shù)據(jù)庫(kù)擅長(zhǎng)從非結(jié)構(gòu)化數(shù)據(jù)中提取見解,查詢延遲也更低,很適合AIGC應(yīng)用。不過,即便可以給出正確的代碼,用AI生成代碼仍有很大的風(fēng)險(xiǎn)。各種AIGC編程工具會(huì)標(biāo)注這些生成代碼的來源,因此企業(yè)不清楚來源,即使是開源代碼也有不同的許可證需要遵守,但許可證通常不可見。另外,對(duì)企業(yè)來說,使用第三方工具還有數(shù)據(jù)泄露風(fēng)險(xiǎn)。因此,Linux基金會(huì)也不鼓勵(lì)項(xiàng)目直接用ChatGPT等來寫代碼,三星、蘋果等公司都不允許員工在內(nèi)部使用AI輔助編程工具,甚至谷歌也提醒自己的工程師避免直接使用Bard生成的代碼。除此之外,生成代碼還有版權(quán)問題。版權(quán)必須要百分之百匹配,只是部分匹

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論