AIGC（人工智能生成內(nèi)容）白皮書(shū)

上傳人：產(chǎn)*** IP屬地：廣東上傳時(shí)間：2023-01-02 格式：DOC 頁(yè)數(shù)：15 大小：4.70MB 積分：7.2 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩10頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

AIGC（人工智能生成內(nèi)容）白皮書(shū)在當(dāng)前數(shù)字世界和物理世界加速融合的大背景下，人工智能生成內(nèi)容（ArtificialIntelligenceGeneratedContent，簡(jiǎn)稱(chēng)AIGC）正在悄然引導(dǎo)著一場(chǎng)深刻的變革，重塑甚至顛覆數(shù)字內(nèi)容的生產(chǎn)方式和消費(fèi)模式，將極大地豐富人們的數(shù)字生活，是未來(lái)全面邁向數(shù)字文明新時(shí)代不可或缺的支撐力量。

人工智能生成內(nèi)容的發(fā)展歷程與概念

1950年，艾倫·圖靈（AlanTuring）在其論文《計(jì)算機(jī)器與智能（ComputingMachineryandIntelligence）》中提出了著名的“圖靈測(cè)試”，給出了判定機(jī)器是否具有“智能”的試驗(yàn)方法，即機(jī)器是否能夠模仿人類(lèi)的思維方式來(lái)“生成”內(nèi)容繼而與人交互。某種程度上來(lái)說(shuō)，人工智能從那時(shí)起就被寄予了用于內(nèi)容創(chuàng)造的期許。經(jīng)過(guò)半個(gè)多世紀(jì)的發(fā)展，隨著數(shù)據(jù)快速積累、算力性能提升和算法效力增強(qiáng)，今天的人工智能不僅能夠與人類(lèi)進(jìn)行互動(dòng)，還可以進(jìn)行寫(xiě)作、編曲、繪畫(huà)、視頻制作等創(chuàng)意工作。2018年，人工智能生成的畫(huà)作在佳士得拍賣(mài)行以43.25萬(wàn)美元成交，成為世界上首個(gè)出售的人工智能藝術(shù)品，引發(fā)各界關(guān)注。隨著人工智能越來(lái)越多地被應(yīng)用于內(nèi)容創(chuàng)作，人工智能生成內(nèi)容（ArtificialIntelligenceGeneratedContent，簡(jiǎn)稱(chēng)AIGC）的概念悄然興起。

AICG歷史沿革結(jié)合人工智能的演進(jìn)歷程，AIGC的發(fā)展大致可以分為三個(gè)階段：

即：早期萌芽階段（20世紀(jì)50年代至90年代中期）、沉淀積累階段（20世紀(jì)90年代中期至21世紀(jì)10年代中期），以及快速發(fā)展階段（21世紀(jì)10年代中期至今）。自2014年起，隨著以生成式對(duì)抗網(wǎng)絡(luò)（GenerativeAdversarialNetwork,GAN）為代表的深度學(xué)習(xí)算法的提出和迭代更新，AIGC迎來(lái)了新時(shí)代，生成內(nèi)容百花齊放，效果逐漸逼真直至人類(lèi)難以分辨。2017年，微軟人工智能少女“小冰”推出了世界首部100%由人工智能創(chuàng)作的詩(shī)集《陽(yáng)光失了玻璃窗》。2018年，英偉達(dá)發(fā)布的StyleGAN模型可以自動(dòng)生成圖片，目前已升級(jí)到第四代模型StyleGAN-XL，其生成的高分辨率圖片人眼難以分辨真假。2019年，DeepMind發(fā)布了DVD-GAN模型用以生成連續(xù)視頻，在草地、廣場(chǎng)等明確場(chǎng)景下表現(xiàn)突出。2021年，OpenAI推出了DALL-E并于一年后推出了升級(jí)版本DALL-E-2,主要應(yīng)用于文本與圖像的交互生成內(nèi)容，用戶(hù)只需輸入簡(jiǎn)短的描述性文字，DALL-E-2即可創(chuàng)作出相應(yīng)極高質(zhì)量的卡通、寫(xiě)實(shí)、抽象等風(fēng)格的繪畫(huà)作品。AIGC的概念與內(nèi)涵

目前，對(duì)AIGC這一概念的界定，尚無(wú)統(tǒng)一規(guī)范的定義。

國(guó)內(nèi)產(chǎn)學(xué)研各界對(duì)于AIGC的理解是“繼專(zhuān)業(yè)生成內(nèi)容（ProfessionalGeneratedContent,PGC）和用戶(hù)生成內(nèi)容（UserGeneratedContent,UGC）之后，利用人工智能技術(shù)自動(dòng)生成內(nèi)容的新型生產(chǎn)方式”。在國(guó)際上對(duì)應(yīng)的術(shù)語(yǔ)是“人工智能合成媒體（AI-generatedMedia或SyntheticMedia）”，其定義是“通過(guò)人工智能算法對(duì)數(shù)據(jù)或媒體進(jìn)行生產(chǎn)、操控和修改的統(tǒng)稱(chēng)”。綜上所述，我們認(rèn)為AIGC既是從內(nèi)容生產(chǎn)者視角進(jìn)行分類(lèi)的一類(lèi)內(nèi)容，又是一種內(nèi)容生產(chǎn)方式，還是用于內(nèi)容自動(dòng)化生成的一類(lèi)技術(shù)集合。從發(fā)展背景方面來(lái)看，AIGC的興起源于深度學(xué)習(xí)技術(shù)的快速突破和日益增長(zhǎng)的數(shù)字內(nèi)容供給需求。一方面，技術(shù)進(jìn)步驅(qū)動(dòng)AIGC可用性不斷增強(qiáng)。另一方面，海量需求牽引AIGC應(yīng)用落地。隨著數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)融合程度不斷加深，以及Meta、微軟、字節(jié)跳動(dòng)等平臺(tái)型巨頭的數(shù)字化場(chǎng)景向元宇宙轉(zhuǎn)型，人類(lèi)對(duì)數(shù)字內(nèi)容總量和豐富程度的整體需求不斷提高。

技術(shù)能力從技術(shù)能力方面來(lái)看，AIGC根據(jù)面向?qū)ο蟆?shí)現(xiàn)功能的不同可分為三個(gè)層次。一是智能數(shù)字內(nèi)容孿生其主要目標(biāo)是建立現(xiàn)實(shí)世界到數(shù)字世界的映射，將現(xiàn)實(shí)世界中的物理屬性（如物體的大小、紋理、顏色等）和社會(huì)屬性（如主體行為、主體關(guān)系等）高效、可感知地進(jìn)二是智能數(shù)字內(nèi)容編輯其主要目的是建立數(shù)字世界與現(xiàn)實(shí)世界的雙向交互。在數(shù)字內(nèi)容孿生的基礎(chǔ)上，從現(xiàn)實(shí)世界實(shí)現(xiàn)對(duì)虛擬數(shù)字世界中內(nèi)容的控制和修改，同時(shí)利用數(shù)字世界高效率仿真和低成本試錯(cuò)的優(yōu)勢(shì)，為現(xiàn)實(shí)世界的應(yīng)用提供快速迭代能力。三是智能數(shù)字內(nèi)容創(chuàng)作其主要目標(biāo)是讓人工智能算法具備內(nèi)容創(chuàng)作和自我演化的能力，形成的AIGC產(chǎn)品具備類(lèi)似甚至超越人的創(chuàng)作能力。以上三個(gè)層面的能力共同構(gòu)成AIGC的能力閉環(huán)。

應(yīng)用價(jià)值從應(yīng)用價(jià)值方面來(lái)看，AIGC將有望成為數(shù)字內(nèi)容創(chuàng)新發(fā)展的新引擎，為數(shù)字經(jīng)濟(jì)發(fā)展注入全新動(dòng)能。一方面，AIGC能夠以?xún)?yōu)于人類(lèi)的制造能力和知識(shí)水平承擔(dān)信息挖掘、素材調(diào)用、復(fù)刻編輯等基礎(chǔ)性機(jī)械勞動(dòng)，從技術(shù)層面實(shí)現(xiàn)以低邊際成本、高效率的方式滿(mǎn)足海量個(gè)性化需求；同時(shí)能夠創(chuàng)新內(nèi)容生產(chǎn)的流程和范式，為更具想象力的內(nèi)容、更加多樣化的傳播方式提供可能性，推動(dòng)內(nèi)容生產(chǎn)向更有創(chuàng)造力的方向發(fā)展。另一方面，AIGC能夠通過(guò)支持?jǐn)?shù)字內(nèi)容與其他產(chǎn)業(yè)的多維互動(dòng)、融合滲透從而孕育新業(yè)態(tài)新模式，打造經(jīng)濟(jì)發(fā)展新增長(zhǎng)點(diǎn)，為千行百業(yè)發(fā)展提供新動(dòng)能。2021年以來(lái)，“元宇宙”呈現(xiàn)出超出想象的發(fā)展爆發(fā)力；作為數(shù)實(shí)融合的“終極”數(shù)字載體，元宇宙將具備持續(xù)性、實(shí)時(shí)性、可創(chuàng)造性等特征，也將通過(guò)AIGC加速?gòu)?fù)刻物理世界、進(jìn)行無(wú)限內(nèi)容創(chuàng)作，從而實(shí)現(xiàn)自發(fā)有機(jī)生長(zhǎng)。人工智能生成內(nèi)容的技術(shù)體系及其演進(jìn)方向

AIGC技術(shù)升級(jí)步入深化階段人工智能算法的不斷迭代是AIGC發(fā)展進(jìn)步的源動(dòng)力，從技術(shù)演進(jìn)的角度出發(fā)，可將AIGC技術(shù)可大致劃分為傳統(tǒng)基于模板或規(guī)則的前深度學(xué)習(xí)階段和深度神經(jīng)網(wǎng)絡(luò)快速發(fā)展的深度學(xué)習(xí)階段。AIGC大模型架構(gòu)潛力凸顯超級(jí)深度學(xué)習(xí)近年來(lái)的快速發(fā)展帶來(lái)了深度神經(jīng)網(wǎng)絡(luò)技術(shù)在大模型和多模態(tài)兩個(gè)方向上的不斷突破，并為AIGC技術(shù)能力的升級(jí)提供了強(qiáng)力的支撐和全新的可能性。AIGC技術(shù)演化出三大前沿能力AIGC技術(shù)被廣泛應(yīng)用于音頻、文本、視覺(jué)等不同模態(tài)數(shù)據(jù)，并構(gòu)成了豐富多樣的技術(shù)應(yīng)用。分別是智能數(shù)字內(nèi)容孿生能力，智能數(shù)字內(nèi)容編輯能力和智能數(shù)字內(nèi)容創(chuàng)作能力。除了對(duì)各種模態(tài)數(shù)據(jù)內(nèi)容的修復(fù)和增強(qiáng)，近年間，數(shù)字內(nèi)容孿生中智能增強(qiáng)技術(shù)在三維視覺(jué)領(lǐng)域取得了快速地發(fā)展。在數(shù)字內(nèi)容孿生技術(shù)的基礎(chǔ)上，智能數(shù)字內(nèi)容編輯的相關(guān)技術(shù)構(gòu)建了虛擬數(shù)字世界與現(xiàn)實(shí)物理世界間的交互通道。從技術(shù)角度看，智能數(shù)字內(nèi)容編輯主要通過(guò)數(shù)字內(nèi)容的語(yǔ)義理解和屬性控制兩類(lèi)技術(shù)來(lái)實(shí)現(xiàn)對(duì)內(nèi)容的修改和控制。資料來(lái)源：京東探索研究院人工智能生成內(nèi)容的應(yīng)用場(chǎng)景1.AIGC+傳媒：人機(jī)協(xié)同生產(chǎn)，推動(dòng)媒體融合。在采編環(huán)節(jié)，一是實(shí)現(xiàn)采訪錄音語(yǔ)音轉(zhuǎn)寫(xiě)，提升傳媒工作者的工作體驗(yàn)。2022年冬奧會(huì)期間，科大訊飛的智能錄音筆通過(guò)跨語(yǔ)種的語(yǔ)音轉(zhuǎn)寫(xiě)助力記者2分鐘快速出稿。二是實(shí)現(xiàn)智能新聞寫(xiě)作，提升新聞資訊的時(shí)效。三是實(shí)現(xiàn)智能視頻剪輯，提升視頻內(nèi)容的價(jià)值。2022年冬奧會(huì)期間，央視視頻通過(guò)使用AI智能內(nèi)容生產(chǎn)剪輯系統(tǒng)，高效生產(chǎn)與發(fā)布冬奧冰雪項(xiàng)目的視頻集錦內(nèi)容，為深度開(kāi)發(fā)體育媒體版權(quán)內(nèi)容價(jià)值，創(chuàng)造了更多的可能性。在傳播環(huán)節(jié)，AIGC應(yīng)用主要集中于以AI合成主播為核心的新聞播報(bào)等領(lǐng)域。AI合成主播開(kāi)創(chuàng)了新聞?lì)I(lǐng)域?qū)崟r(shí)語(yǔ)音及人物動(dòng)畫(huà)合成的先河，只需要輸入所需要播發(fā)的文本內(nèi)容，計(jì)算機(jī)就會(huì)生成相應(yīng)的AI合成主播播報(bào)的新聞視頻，并確保視頻中人物音頻和表情、唇動(dòng)保持自然一致，展現(xiàn)與真人主播無(wú)異的信息傳達(dá)效果。2.AIGC+電商：推進(jìn)虛實(shí)交融，營(yíng)造沉浸體驗(yàn)。隨著數(shù)字技術(shù)的發(fā)展和應(yīng)用、消費(fèi)的升級(jí)和加快，購(gòu)物體驗(yàn)沉浸化成為電商領(lǐng)域發(fā)展的方向。AIGC正加速商品3D模型、虛擬主播乃至虛擬貨場(chǎng)的構(gòu)建，通過(guò)和AR、VR等新技術(shù)的結(jié)合，實(shí)現(xiàn)視聽(tīng)等多感官交互的沉浸式購(gòu)物體驗(yàn)。3.AIGC+影視：拓展創(chuàng)作空間，提升作品質(zhì)量。隨著影視行業(yè)的快速發(fā)展，從前期創(chuàng)作、中期拍攝到后期制作的過(guò)程性問(wèn)題也隨之顯露，存在高質(zhì)量劇本相對(duì)缺乏、制作成本高昂以及部分作品質(zhì)量有待提升等發(fā)展痛點(diǎn)，亟待進(jìn)行結(jié)構(gòu)升級(jí)。

運(yùn)用AIGC技術(shù)能激發(fā)影視劇本創(chuàng)作思路，擴(kuò)展影視角色和場(chǎng)景創(chuàng)作空間，極大地提升影視產(chǎn)品的后期制作質(zhì)量，幫助實(shí)現(xiàn)影視作品的文化價(jià)值與經(jīng)濟(jì)價(jià)值最大化。4.AIGC+娛樂(lè)：擴(kuò)展輻射邊界，獲得發(fā)展動(dòng)能在數(shù)字經(jīng)濟(jì)時(shí)代，娛樂(lè)不僅拉近了產(chǎn)品服務(wù)與消費(fèi)者之間的距離，而且間接滿(mǎn)足了現(xiàn)代人對(duì)歸屬感的渴望，重要性與日俱增。

借助于AIGC技術(shù)，通過(guò)趣味性圖像或音視頻生成、打造虛擬偶像、開(kāi)發(fā)C端用戶(hù)數(shù)字化身等方式，娛樂(lè)行業(yè)可以迅速擴(kuò)展自身的輻射邊界，以更加容易被消費(fèi)者所接納的方式，獲得新的發(fā)展動(dòng)能。5.AIGC+其他：推進(jìn)數(shù)實(shí)融合，加快產(chǎn)業(yè)升級(jí)除以上行業(yè)之外，教育、金融、醫(yī)療、工業(yè)等各行各業(yè)的AIGC應(yīng)用也都在快速發(fā)展。教育領(lǐng)域，AIGC賦予教育材料新活力。金融領(lǐng)域，AIGC助力實(shí)現(xiàn)降本增效。醫(yī)療領(lǐng)域，AIGC賦能診療全過(guò)程。工業(yè)領(lǐng)域，AIGC提升產(chǎn)業(yè)效率和價(jià)值。總體來(lái)看，AIGC正在發(fā)展成與其他各類(lèi)產(chǎn)業(yè)深度融合的橫向結(jié)合體，其相關(guān)應(yīng)用正加速滲透到經(jīng)濟(jì)社會(huì)的方方面面。人工智能生成內(nèi)容發(fā)展面臨的問(wèn)題

隨著人工智能技術(shù)發(fā)展步入快車(chē)道，AIGC因?yàn)槠淇焖俚姆磻?yīng)能力、生動(dòng)的知識(shí)輸出、豐富的應(yīng)用場(chǎng)景，在社會(huì)生產(chǎn)和生活的方方面面發(fā)揮著重要的作用。

但與此同時(shí)，AIGC的關(guān)鍵技術(shù)、企業(yè)核心能力和相關(guān)法律法規(guī)尚未完善，圍繞公平、責(zé)任、安全的爭(zhēng)議日益增多。關(guān)鍵技術(shù)不夠完全成熟，大規(guī)模推廣落地尚存痛點(diǎn)、難點(diǎn)。

目前，AIGC技術(shù)不斷升級(jí)，進(jìn)一步釋放內(nèi)容生產(chǎn)力，但其在人工智能關(guān)鍵技術(shù)方面尚存在局限，掣肘產(chǎn)業(yè)發(fā)展進(jìn)程。一是人工智能算法存在固有缺陷；二是AIGC內(nèi)容編輯與創(chuàng)作技術(shù)不夠完善；三是企業(yè)風(fēng)險(xiǎn)治理能力尚未完善。2022年5月，最新出臺(tái)的《關(guān)于推進(jìn)實(shí)施國(guó)家文化數(shù)字化戰(zhàn)略的意見(jiàn)》，要求研究制定扶持文化數(shù)字化建設(shè)的產(chǎn)業(yè)政策，強(qiáng)調(diào)各地要因地制宜制定具體實(shí)施方案，相關(guān)部門(mén)要細(xì)化政策措施。未來(lái)，各地、各部門(mén)政策的支持力度、推進(jìn)落實(shí)和動(dòng)態(tài)調(diào)整情況將決定著技術(shù)與社會(huì)的相互建構(gòu)程度，將對(duì)AIGC技術(shù)在社會(huì)情境中的發(fā)展起到重要作用。未來(lái)展望

從真實(shí)可控向多樣組合發(fā)展從技術(shù)層面上看，目前AIGC的相關(guān)算法已經(jīng)具備了真實(shí)復(fù)刻和創(chuàng)造某類(lèi)既定內(nèi)容的能力，同時(shí)相關(guān)模型對(duì)簡(jiǎn)單場(chǎng)景的內(nèi)容生成也取得了較好成果，但面對(duì)多樣性變化和復(fù)雜場(chǎng)景內(nèi)容生成的挑戰(zhàn)，現(xiàn)有AIGC的算法能力仍需進(jìn)一步提升。從本地化集中式向大規(guī)模分布式發(fā)展作為數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)深度融合的新模式，AIGC通過(guò)應(yīng)用大量新型人工智能技術(shù)來(lái)創(chuàng)造和制作豐富的創(chuàng)新型、高質(zhì)量、可交互的數(shù)字內(nèi)容，這給當(dāng)前人工智能技術(shù)的研究帶來(lái)了全新的挑戰(zhàn)，針對(duì)大規(guī)模分布式AIGC交互算法的研究是時(shí)下緊迫且熱門(mén)的主題，也是AIGC技術(shù)未來(lái)的發(fā)展方向之一。隨著AIGC核心技術(shù)的不斷發(fā)展，其內(nèi)容孿生、內(nèi)容編輯、內(nèi)容創(chuàng)作三大基礎(chǔ)能力將顯著增強(qiáng)。目前，AIGC已經(jīng)在多個(gè)領(lǐng)域得到廣泛應(yīng)用，如金融、傳媒、文娛、電商等，未來(lái)應(yīng)用場(chǎng)景會(huì)進(jìn)一步多元化生態(tài)建設(shè)日

人人文庫(kù)> 全部分類(lèi)> 應(yīng)用文書(shū) > 研究報(bào)告

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

AIGC（人工智能生成內(nèi)容）白皮書(shū)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

AIGC（人工智能生成內(nèi)容）白皮書(shū)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔