AIGC(人工智能生成內(nèi)容)白皮書(shū)_第1頁(yè)
AIGC(人工智能生成內(nèi)容)白皮書(shū)_第2頁(yè)
AIGC(人工智能生成內(nèi)容)白皮書(shū)_第3頁(yè)
AIGC(人工智能生成內(nèi)容)白皮書(shū)_第4頁(yè)
AIGC(人工智能生成內(nèi)容)白皮書(shū)_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

AIGC(人工智能生成內(nèi)容)白皮書(shū)在當(dāng)前數(shù)字世界和物理世界加速融合的大背景下,人工智能生成內(nèi)容(ArtificialIntelligenceGeneratedContent,簡(jiǎn)稱(chēng)AIGC)正在悄然引導(dǎo)著一場(chǎng)深刻的變革,重塑甚至顛覆數(shù)字內(nèi)容的生產(chǎn)方式和消費(fèi)模式,將極大地豐富人們的數(shù)字生活,是未來(lái)全面邁向數(shù)字文明新時(shí)代不可或缺的支撐力量。

人工智能生成內(nèi)容的發(fā)展歷程與概念

1950年,艾倫·圖靈(AlanTuring)在其論文《計(jì)算機(jī)器與智能(ComputingMachineryandIntelligence)》中提出了著名的“圖靈測(cè)試”,給出了判定機(jī)器是否具有“智能”的試驗(yàn)方法,即機(jī)器是否能夠模仿人類(lèi)的思維方式來(lái)“生成”內(nèi)容繼而與人交互。某種程度上來(lái)說(shuō),人工智能從那時(shí)起就被寄予了用于內(nèi)容創(chuàng)造的期許。經(jīng)過(guò)半個(gè)多世紀(jì)的發(fā)展,隨著數(shù)據(jù)快速積累、算力性能提升和算法效力增強(qiáng),今天的人工智能不僅能夠與人類(lèi)進(jìn)行互動(dòng),還可以進(jìn)行寫(xiě)作、編曲、繪畫(huà)、視頻制作等創(chuàng)意工作。2018年,人工智能生成的畫(huà)作在佳士得拍賣(mài)行以43.25萬(wàn)美元成交,成為世界上首個(gè)出售的人工智能藝術(shù)品,引發(fā)各界關(guān)注。隨著人工智能越來(lái)越多地被應(yīng)用于內(nèi)容創(chuàng)作,人工智能生成內(nèi)容(ArtificialIntelligenceGeneratedContent,簡(jiǎn)稱(chēng)AIGC)的概念悄然興起。

AICG歷史沿革結(jié)合人工智能的演進(jìn)歷程,AIGC的發(fā)展大致可以分為三個(gè)階段:

即:早期萌芽階段(20世紀(jì)50年代至90年代中期)、沉淀積累階段(20世紀(jì)90年代中期至21世紀(jì)10年代中期),以及快速發(fā)展階段(21世紀(jì)10年代中期至今)。自2014年起,隨著以生成式對(duì)抗網(wǎng)絡(luò)(GenerativeAdversarialNetwork,GAN)為代表的深度學(xué)習(xí)算法的提出和迭代更新,AIGC迎來(lái)了新時(shí)代,生成內(nèi)容百花齊放,效果逐漸逼真直至人類(lèi)難以分辨。2017年,微軟人工智能少女“小冰”推出了世界首部100%由人工智能創(chuàng)作的詩(shī)集《陽(yáng)光失了玻璃窗》。2018年,英偉達(dá)發(fā)布的StyleGAN模型可以自動(dòng)生成圖片,目前已升級(jí)到第四代模型StyleGAN-XL,其生成的高分辨率圖片人眼難以分辨真假。2019年,DeepMind發(fā)布了DVD-GAN模型用以生成連續(xù)視頻,在草地、廣場(chǎng)等明確場(chǎng)景下表現(xiàn)突出。2021年,OpenAI推出了DALL-E并于一年后推出了升級(jí)版本DALL-E-2,主要應(yīng)用于文本與圖像的交互生成內(nèi)容,用戶(hù)只需輸入簡(jiǎn)短的描述性文字,DALL-E-2即可創(chuàng)作出相應(yīng)極高質(zhì)量的卡通、寫(xiě)實(shí)、抽象等風(fēng)格的繪畫(huà)作品。AIGC的概念與內(nèi)涵

目前,對(duì)AIGC這一概念的界定,尚無(wú)統(tǒng)一規(guī)范的定義。

國(guó)內(nèi)產(chǎn)學(xué)研各界對(duì)于AIGC的理解是“繼專(zhuān)業(yè)生成內(nèi)容(ProfessionalGeneratedContent,PGC)和用戶(hù)生成內(nèi)容(UserGeneratedContent,UGC)之后,利用人工智能技術(shù)自動(dòng)生成內(nèi)容的新型生產(chǎn)方式”。在國(guó)際上對(duì)應(yīng)的術(shù)語(yǔ)是“人工智能合成媒體(AI-generatedMedia或SyntheticMedia)”,其定義是“通過(guò)人工智能算法對(duì)數(shù)據(jù)或媒體進(jìn)行生產(chǎn)、操控和修改的統(tǒng)稱(chēng)”。綜上所述,我們認(rèn)為AIGC既是從內(nèi)容生產(chǎn)者視角進(jìn)行分類(lèi)的一類(lèi)內(nèi)容,又是一種內(nèi)容生產(chǎn)方式,還是用于內(nèi)容自動(dòng)化生成的一類(lèi)技術(shù)集合。從發(fā)展背景方面來(lái)看,AIGC的興起源于深度學(xué)習(xí)技術(shù)的快速突破和日益增長(zhǎng)的數(shù)字內(nèi)容供給需求。一方面,技術(shù)進(jìn)步驅(qū)動(dòng)AIGC可用性不斷增強(qiáng)。另一方面,海量需求牽引AIGC應(yīng)用落地。隨著數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)融合程度不斷加深,以及Meta、微軟、字節(jié)跳動(dòng)等平臺(tái)型巨頭的數(shù)字化場(chǎng)景向元宇宙轉(zhuǎn)型,人類(lèi)對(duì)數(shù)字內(nèi)容總量和豐富程度的整體需求不斷提高。

技術(shù)能力從技術(shù)能力方面來(lái)看,AIGC根據(jù)面向?qū)ο蟆?shí)現(xiàn)功能的不同可分為三個(gè)層次。一是智能數(shù)字內(nèi)容孿生其主要目標(biāo)是建立現(xiàn)實(shí)世界到數(shù)字世界的映射,將現(xiàn)實(shí)世界中的物理屬性(如物體的大小、紋理、顏色等)和社會(huì)屬性(如主體行為、主體關(guān)系等)高效、可感知地進(jìn)二是智能數(shù)字內(nèi)容編輯其主要目的是建立數(shù)字世界與現(xiàn)實(shí)世界的雙向交互。在數(shù)字內(nèi)容孿生的基礎(chǔ)上,從現(xiàn)實(shí)世界實(shí)現(xiàn)對(duì)虛擬數(shù)字世界中內(nèi)容的控制和修改,同時(shí)利用數(shù)字世界高效率仿真和低成本試錯(cuò)的優(yōu)勢(shì),為現(xiàn)實(shí)世界的應(yīng)用提供快速迭代能力。三是智能數(shù)字內(nèi)容創(chuàng)作其主要目標(biāo)是讓人工智能算法具備內(nèi)容創(chuàng)作和自我演化的能力,形成的AIGC產(chǎn)品具備類(lèi)似甚至超越人的創(chuàng)作能力。以上三個(gè)層面的能力共同構(gòu)成AIGC的能力閉環(huán)。

應(yīng)用價(jià)值從應(yīng)用價(jià)值方面來(lái)看,AIGC將有望成為數(shù)字內(nèi)容創(chuàng)新發(fā)展的新引擎,為數(shù)字經(jīng)濟(jì)發(fā)展注入全新動(dòng)能。一方面,AIGC能夠以?xún)?yōu)于人類(lèi)的制造能力和知識(shí)水平承擔(dān)信息挖掘、素材調(diào)用、復(fù)刻編輯等基礎(chǔ)性機(jī)械勞動(dòng),從技術(shù)層面實(shí)現(xiàn)以低邊際成本、高效率的方式滿(mǎn)足海量個(gè)性化需求;同時(shí)能夠創(chuàng)新內(nèi)容生產(chǎn)的流程和范式,為更具想象力的內(nèi)容、更加多樣化的傳播方式提供可能性,推動(dòng)內(nèi)容生產(chǎn)向更有創(chuàng)造力的方向發(fā)展。另一方面,AIGC能夠通過(guò)支持?jǐn)?shù)字內(nèi)容與其他產(chǎn)業(yè)的多維互動(dòng)、融合滲透從而孕育新業(yè)態(tài)新模式,打造經(jīng)濟(jì)發(fā)展新增長(zhǎng)點(diǎn),為千行百業(yè)發(fā)展提供新動(dòng)能。2021年以來(lái),“元宇宙”呈現(xiàn)出超出想象的發(fā)展爆發(fā)力;作為數(shù)實(shí)融合的“終極”數(shù)字載體,元宇宙將具備持續(xù)性、實(shí)時(shí)性、可創(chuàng)造性等特征,也將通過(guò)AIGC加速?gòu)?fù)刻物理世界、進(jìn)行無(wú)限內(nèi)容創(chuàng)作,從而實(shí)現(xiàn)自發(fā)有機(jī)生長(zhǎng)。人工智能生成內(nèi)容的技術(shù)體系及其演進(jìn)方向

AIGC技術(shù)升級(jí)步入深化階段人工智能算法的不斷迭代是AIGC發(fā)展進(jìn)步的源動(dòng)力,從技術(shù)演進(jìn)的角度出發(fā),可將AIGC技術(shù)可大致劃分為傳統(tǒng)基于模板或規(guī)則的前深度學(xué)習(xí)階段和深度神經(jīng)網(wǎng)絡(luò)快速發(fā)展的深度學(xué)習(xí)階段。AIGC大模型架構(gòu)潛力凸顯超級(jí)深度學(xué)習(xí)近年來(lái)的快速發(fā)展帶來(lái)了深度神經(jīng)網(wǎng)絡(luò)技術(shù)在大模型和多模態(tài)兩個(gè)方向上的不斷突破,并為AIGC技術(shù)能力的升級(jí)提供了強(qiáng)力的支撐和全新的可能性。AIGC技術(shù)演化出三大前沿能力AIGC技術(shù)被廣泛應(yīng)用于音頻、文本、視覺(jué)等不同模態(tài)數(shù)據(jù),并構(gòu)成了豐富多樣的技術(shù)應(yīng)用。分別是智能數(shù)字內(nèi)容孿生能力,智能數(shù)字內(nèi)容編輯能力和智能數(shù)字內(nèi)容創(chuàng)作能力。除了對(duì)各種模態(tài)數(shù)據(jù)內(nèi)容的修復(fù)和增強(qiáng),近年間,數(shù)字內(nèi)容孿生中智能增強(qiáng)技術(shù)在三維視覺(jué)領(lǐng)域取得了快速地發(fā)展。在數(shù)字內(nèi)容孿生技術(shù)的基礎(chǔ)上,智能數(shù)字內(nèi)容編輯的相關(guān)技術(shù)構(gòu)建了虛擬數(shù)字世界與現(xiàn)實(shí)物理世界間的交互通道。從技術(shù)角度看,智能數(shù)字內(nèi)容編輯主要通過(guò)數(shù)字內(nèi)容的語(yǔ)義理解和屬性控制兩類(lèi)技術(shù)來(lái)實(shí)現(xiàn)對(duì)內(nèi)容的修改和控制。資料來(lái)源:京東探索研究院人工智能生成內(nèi)容的應(yīng)用場(chǎng)景1.AIGC+傳媒:人機(jī)協(xié)同生產(chǎn),推動(dòng)媒體融合。在采編環(huán)節(jié),一是實(shí)現(xiàn)采訪錄音語(yǔ)音轉(zhuǎn)寫(xiě),提升傳媒工作者的工作體驗(yàn)。2022年冬奧會(huì)期間,科大訊飛的智能錄音筆通過(guò)跨語(yǔ)種的語(yǔ)音轉(zhuǎn)寫(xiě)助力記者2分鐘快速出稿。二是實(shí)現(xiàn)智能新聞寫(xiě)作,提升新聞資訊的時(shí)效。三是實(shí)現(xiàn)智能視頻剪輯,提升視頻內(nèi)容的價(jià)值。2022年冬奧會(huì)期間,央視視頻通過(guò)使用AI智能內(nèi)容生產(chǎn)剪輯系統(tǒng),高效生產(chǎn)與發(fā)布冬奧冰雪項(xiàng)目的視頻集錦內(nèi)容,為深度開(kāi)發(fā)體育媒體版權(quán)內(nèi)容價(jià)值,創(chuàng)造了更多的可能性。在傳播環(huán)節(jié),AIGC應(yīng)用主要集中于以AI合成主播為核心的新聞播報(bào)等領(lǐng)域。AI合成主播開(kāi)創(chuàng)了新聞?lì)I(lǐng)域?qū)崟r(shí)語(yǔ)音及人物動(dòng)畫(huà)合成的先河,只需要輸入所需要播發(fā)的文本內(nèi)容,計(jì)算機(jī)就會(huì)生成相應(yīng)的AI合成主播播報(bào)的新聞視頻,并確保視頻中人物音頻和表情、唇動(dòng)保持自然一致,展現(xiàn)與真人主播無(wú)異的信息傳達(dá)效果。2.AIGC+電商:推進(jìn)虛實(shí)交融,營(yíng)造沉浸體驗(yàn)。隨著數(shù)字技術(shù)的發(fā)展和應(yīng)用、消費(fèi)的升級(jí)和加快,購(gòu)物體驗(yàn)沉浸化成為電商領(lǐng)域發(fā)展的方向。AIGC正加速商品3D模型、虛擬主播乃至虛擬貨場(chǎng)的構(gòu)建,通過(guò)和AR、VR等新技術(shù)的結(jié)合,實(shí)現(xiàn)視聽(tīng)等多感官交互的沉浸式購(gòu)物體驗(yàn)。3.AIGC+影視:拓展創(chuàng)作空間,提升作品質(zhì)量。隨著影視行業(yè)的快速發(fā)展,從前期創(chuàng)作、中期拍攝到后期制作的過(guò)程性問(wèn)題也隨之顯露,存在高質(zhì)量劇本相對(duì)缺乏、制作成本高昂以及部分作品質(zhì)量有待提升等發(fā)展痛點(diǎn),亟待進(jìn)行結(jié)構(gòu)升級(jí)。

運(yùn)用AIGC技術(shù)能激發(fā)影視劇本創(chuàng)作思路,擴(kuò)展影視角色和場(chǎng)景創(chuàng)作空間,極大地提升影視產(chǎn)品的后期制作質(zhì)量,幫助實(shí)現(xiàn)影視作品的文化價(jià)值與經(jīng)濟(jì)價(jià)值最大化。4.AIGC+娛樂(lè):擴(kuò)展輻射邊界,獲得發(fā)展動(dòng)能在數(shù)字經(jīng)濟(jì)時(shí)代,娛樂(lè)不僅拉近了產(chǎn)品服務(wù)與消費(fèi)者之間的距離,而且間接滿(mǎn)足了現(xiàn)代人對(duì)歸屬感的渴望,重要性與日俱增。

借助于AIGC技術(shù),通過(guò)趣味性圖像或音視頻生成、打造虛擬偶像、開(kāi)發(fā)C端用戶(hù)數(shù)字化身等方式,娛樂(lè)行業(yè)可以迅速擴(kuò)展自身的輻射邊界,以更加容易被消費(fèi)者所接納的方式,獲得新的發(fā)展動(dòng)能。5.AIGC+其他:推進(jìn)數(shù)實(shí)融合,加快產(chǎn)業(yè)升級(jí)除以上行業(yè)之外,教育、金融、醫(yī)療、工業(yè)等各行各業(yè)的AIGC應(yīng)用也都在快速發(fā)展。教育領(lǐng)域,AIGC賦予教育材料新活力。金融領(lǐng)域,AIGC助力實(shí)現(xiàn)降本增效。醫(yī)療領(lǐng)域,AIGC賦能診療全過(guò)程。工業(yè)領(lǐng)域,AIGC提升產(chǎn)業(yè)效率和價(jià)值。總體來(lái)看,AIGC正在發(fā)展成與其他各類(lèi)產(chǎn)業(yè)深度融合的橫向結(jié)合體,其相關(guān)應(yīng)用正加速滲透到經(jīng)濟(jì)社會(huì)的方方面面。人工智能生成內(nèi)容發(fā)展面臨的問(wèn)題

隨著人工智能技術(shù)發(fā)展步入快車(chē)道,AIGC因?yàn)槠淇焖俚姆磻?yīng)能力、生動(dòng)的知識(shí)輸出、豐富的應(yīng)用場(chǎng)景,在社會(huì)生產(chǎn)和生活的方方面面發(fā)揮著重要的作用。

但與此同時(shí),AIGC的關(guān)鍵技術(shù)、企業(yè)核心能力和相關(guān)法律法規(guī)尚未完善,圍繞公平、責(zé)任、安全的爭(zhēng)議日益增多。關(guān)鍵技術(shù)不夠完全成熟,大規(guī)模推廣落地尚存痛點(diǎn)、難點(diǎn)。

目前,AIGC技術(shù)不斷升級(jí),進(jìn)一步釋放內(nèi)容生產(chǎn)力,但其在人工智能關(guān)鍵技術(shù)方面尚存在局限,掣肘產(chǎn)業(yè)發(fā)展進(jìn)程。一是人工智能算法存在固有缺陷;二是AIGC內(nèi)容編輯與創(chuàng)作技術(shù)不夠完善;三是企業(yè)風(fēng)險(xiǎn)治理能力尚未完善。2022年5月,最新出臺(tái)的《關(guān)于推進(jìn)實(shí)施國(guó)家文化數(shù)字化戰(zhàn)略的意見(jiàn)》,要求研究制定扶持文化數(shù)字化建設(shè)的產(chǎn)業(yè)政策,強(qiáng)調(diào)各地要因地制宜制定具體實(shí)施方案,相關(guān)部門(mén)要細(xì)化政策措施。未來(lái),各地、各部門(mén)政策的支持力度、推進(jìn)落實(shí)和動(dòng)態(tài)調(diào)整情況將決定著技術(shù)與社會(huì)的相互建構(gòu)程度,將對(duì)AIGC技術(shù)在社會(huì)情境中的發(fā)展起到重要作用。未來(lái)展望

從真實(shí)可控向多樣組合發(fā)展從技術(shù)層面上看,目前AIGC的相關(guān)算法已經(jīng)具備了真實(shí)復(fù)刻和創(chuàng)造某類(lèi)既定內(nèi)容的能力,同時(shí)相關(guān)模型對(duì)簡(jiǎn)單場(chǎng)景的內(nèi)容生成也取得了較好成果,但面對(duì)多樣性變化和復(fù)雜場(chǎng)景內(nèi)容生成的挑戰(zhàn),現(xiàn)有AIGC的算法能力仍需進(jìn)一步提升。從本地化集中式向大規(guī)模分布式發(fā)展作為數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)深度融合的新模式,AIGC通過(guò)應(yīng)用大量新型人工智能技術(shù)來(lái)創(chuàng)造和制作豐富的創(chuàng)新型、高質(zhì)量、可交互的數(shù)字內(nèi)容,這給當(dāng)前人工智能技術(shù)的研究帶來(lái)了全新的挑戰(zhàn),針對(duì)大規(guī)模分布式AIGC交互算法的研究是時(shí)下緊迫且熱門(mén)的主題,也是AIGC技術(shù)未來(lái)的發(fā)展方向之一。隨著AIGC核心技術(shù)的不斷發(fā)展,其內(nèi)容孿生、內(nèi)容編輯、內(nèi)容創(chuàng)作三大基礎(chǔ)能力將顯著增強(qiáng)。目前,AIGC已經(jīng)在多個(gè)領(lǐng)域得到廣泛應(yīng)用,如金融、傳媒、文娛、電商等,未來(lái)應(yīng)用場(chǎng)景會(huì)進(jìn)一步多元化生態(tài)建設(shè)日

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論