




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICS35.240CCSL67CAPTRequirementsforpracticaloflarge-scalepre-trainedlanguagemodelsinnewsIT/CAPT010—2024 2規(guī)范性引用文件 3術(shù)語和定義 4使用場(chǎng)景要求 4.1概述 4.2媒體文本創(chuàng)作 4.3媒體文本編輯 34.4媒體文本理解 64.5媒體數(shù)據(jù)增強(qiáng) 75效果要求 5.1專業(yè)性要求 5.2可靠性要求 5.3適用性要求 6產(chǎn)品化要求 6.1模型部署的要求 6.2模型數(shù)據(jù)庫(kù)的要求 6.3模型界面的要求 6.4模型產(chǎn)品的數(shù)據(jù)保護(hù)和隱私保護(hù)要求 6.5模型的性能和效率要求 6.6模型的可擴(kuò)展性和可維護(hù)性要求 T/CAPT010—2024本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請(qǐng)注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別專利的責(zé)任。本文件由中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)新聞信息標(biāo)準(zhǔn)化分會(huì)秘書處和新華通訊社通信技術(shù)局聯(lián)合提本文件由中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)歸口。本文件起草單位:新華通訊社通信技術(shù)局、新華社媒體融合生產(chǎn)技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室(新華融合媒體科技發(fā)展(北京)有限公司)、上海算法創(chuàng)新研究院、傳播大腦科技(浙江)股份有限公司、上海交通大學(xué)媒傳學(xué)院、北京北大方正電子有限公司、大眾報(bào)業(yè)集團(tuán)(大眾日?qǐng)?bào)社)、海南廣播電視總臺(tái)、北京中科聞歌科技股份有限公司、中國(guó)互聯(lián)網(wǎng)新聞中心、北京智途云天科技有限公司、中聯(lián)超清(北京)科技有限公司、中國(guó)傳媒大學(xué)、深圳市創(chuàng)意智慧港科技有限責(zé)任公司(深圳報(bào)業(yè)集團(tuán)技術(shù)公司)、福建理工大學(xué)。本文件主要起草人:路海燕、王仲豪、鄧海瀅、余鈺、唐波、劉麗芳、張健、陳夢(mèng)、劉可、鄭偉、賈艾婧、湯代祿、張震、李夢(mèng)瑤、彭佳柱、王一剛、王建平、丁峰、羅毅、林波、成鵬、王峰、王付生、王熠、熊立波、王慕維、孫心桐、王宇琦、劉瓊、張鵬洲、曹娟、鄭創(chuàng)偉、瞿曦、黃菁、孫天一、付蓉、王志民。T/CAPT010—2024《新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型》系列標(biāo)準(zhǔn)由語言模型實(shí)用性要求、語言模型評(píng)測(cè)要求、語言模型安全性要求和研發(fā)數(shù)據(jù)要求、多模態(tài)要求5部分組成。分別從實(shí)用性、評(píng)測(cè)、安全性、研發(fā)數(shù)據(jù)和多模態(tài)等多個(gè)角度出發(fā),構(gòu)建了一個(gè)完整的標(biāo)準(zhǔn)體系,確保大規(guī)模預(yù)訓(xùn)練模型在新聞行業(yè)中的有效、安全和規(guī)范使用。旨在為新聞?lì)I(lǐng)域大規(guī)模預(yù)訓(xùn)練模型的研發(fā)、應(yīng)用和評(píng)估提供全面而系統(tǒng)的指導(dǎo)?!缎侣勑袠I(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型實(shí)用性要求》明確了預(yù)訓(xùn)練語言模型在完成新聞任務(wù)時(shí)的使用場(chǎng)景要求、效果要求以及產(chǎn)品化要求。該標(biāo)準(zhǔn)為模型的實(shí)際應(yīng)用提供了具體指導(dǎo),確保模型在真實(shí)新聞生產(chǎn)過程中具備足夠的實(shí)用性和效果?!缎侣勑袠I(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型評(píng)測(cè)要求》為評(píng)估這些預(yù)訓(xùn)練語言模型提供了詳盡的方法和指標(biāo)。該標(biāo)準(zhǔn)規(guī)定了新聞行業(yè)預(yù)訓(xùn)練語言模型的評(píng)測(cè)指標(biāo)和評(píng)測(cè)方法要求,并給出了具體的評(píng)測(cè)示例,以確保評(píng)測(cè)過程的科學(xué)性和規(guī)范性?!缎侣勑袠I(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型安全性要求》詳細(xì)規(guī)定了在內(nèi)容、數(shù)據(jù)、合規(guī)和技術(shù)等環(huán)節(jié)中所涉及的安全性要求。該標(biāo)準(zhǔn)旨在保障預(yù)訓(xùn)練模型在新聞?lì)I(lǐng)域的應(yīng)用中,能夠遵守相關(guān)法律法規(guī),確保數(shù)據(jù)安全、內(nèi)容合規(guī)?!缎侣勑袠I(yè)大規(guī)模預(yù)訓(xùn)練模型研發(fā)數(shù)據(jù)要求》針對(duì)用于訓(xùn)練、微調(diào)和評(píng)估預(yù)訓(xùn)練模型的所有數(shù)據(jù),提出了技術(shù)要求。該標(biāo)準(zhǔn)確保了在預(yù)訓(xùn)練模型研發(fā)過程中,數(shù)據(jù)的質(zhì)量和規(guī)范性,從而提升模型的性能和可靠性?!缎侣勑袠I(yè)大規(guī)模預(yù)訓(xùn)練模型多模態(tài)要求》規(guī)定了預(yù)訓(xùn)練模型在研發(fā)、應(yīng)用、評(píng)測(cè)和安全性等方面的要求,特別是在處理多模態(tài)數(shù)據(jù)時(shí)的技術(shù)標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)的制定,進(jìn)一步拓展了預(yù)訓(xùn)練模型的應(yīng)用范圍,使其在多模態(tài)新聞內(nèi)容生成和處理方面也能高效、可靠地發(fā)揮作用。5個(gè)標(biāo)準(zhǔn)的緊密銜接和相互配合,為新聞行業(yè)的大規(guī)模預(yù)訓(xùn)練模型構(gòu)建了一個(gè)全面而系統(tǒng)的框架,為新聞?lì)I(lǐng)域大規(guī)模預(yù)訓(xùn)練模型的開發(fā)和應(yīng)用提供了堅(jiān)實(shí)的基礎(chǔ)和有力的保障。1T/CAPT010—2024新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型實(shí)用性要求本文件規(guī)定了新聞行業(yè)中大規(guī)模預(yù)訓(xùn)練模型的語言模型實(shí)用性要求。本文件適用于開發(fā)人員、使用人員、監(jiān)管人員進(jìn)行大規(guī)模預(yù)訓(xùn)練模型語言模型在新聞媒體行業(yè)中的實(shí)用性分析。本文件的使用對(duì)象包括報(bào)刊、廣播、電視、通訊社、新聞網(wǎng)站、自媒體等新聞媒體內(nèi)容提供商及媒體應(yīng)用與研究機(jī)構(gòu)。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T7714信息與文獻(xiàn)參考文獻(xiàn)著錄規(guī)則GB/T20093中文新聞信息分類與代碼3術(shù)語和定義下列術(shù)語和定義適用于本文件。3.1大規(guī)模預(yù)訓(xùn)練語言模型large-scalepre-trainedlanguagemodels一種通過在海量文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練而構(gòu)建的自然語言處理模型,通?;谏疃葘W(xué)習(xí)框架,通過自監(jiān)督學(xué)習(xí)從無標(biāo)注的數(shù)據(jù)中學(xué)習(xí)語法、語言和知識(shí)等,可通過零樣本(zero-shot)方式進(jìn)行交互、并可以通過微調(diào)(finetune)進(jìn)行特定任務(wù)加強(qiáng)。3.2大規(guī)模預(yù)訓(xùn)練模型large-scalepre-trainedmodel一種具有大規(guī)模參數(shù)和復(fù)雜計(jì)算結(jié)構(gòu)的超大型機(jī)器學(xué)習(xí)模型(一般超過10億個(gè)參數(shù)通常由深度神經(jīng)網(wǎng)絡(luò)構(gòu)建,對(duì)海量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練處理。3.3指令/提示詞prompt給預(yù)訓(xùn)練模型提示輸入模型的參數(shù)信息,描述問題需求類型,幫助模型更好地理解輸入的意圖,并作出相應(yīng)的響應(yīng)。4使用場(chǎng)景要求4.1概述新聞行業(yè)中大規(guī)模預(yù)訓(xùn)練模型的語言模型實(shí)用性要求的使用場(chǎng)景根據(jù)新聞業(yè)務(wù)場(chǎng)景進(jìn)行設(shè)計(jì),分為媒體文本創(chuàng)作、媒體文本編輯、媒體文本理解、媒體數(shù)據(jù)增強(qiáng)四個(gè)類別進(jìn)行要求。4.2媒體文本創(chuàng)作4.2.1經(jīng)典新聞創(chuàng)作類新聞行業(yè)大規(guī)模預(yù)訓(xùn)練語言模型應(yīng)當(dāng)能夠適應(yīng)并處理多種類型的經(jīng)典新聞創(chuàng)作任務(wù)。這些任務(wù)包括但不限于簡(jiǎn)訊、消息、通訊、特寫、專訪、公文公報(bào)、社論、評(píng)論員文章、專欄評(píng)論、短評(píng)和述評(píng)。模型需要具備生成不同類型新聞文本的能力,具體要求應(yīng)符合表1的規(guī)定。2T/CAPT010—2024表1經(jīng)典新聞創(chuàng)作類的不同文體類型要求指令:規(guī)定任務(wù)長(zhǎng)度、時(shí)效性、語言風(fēng)格、核要求:生成通過標(biāo)題、導(dǎo)語、主體三層報(bào)道事情概貌的消息,500~800結(jié)果:內(nèi)容真實(shí),全面準(zhǔn)確,具備完整的標(biāo)題要求:生成運(yùn)用敘述、描寫、抒情、議論等手法反映新指令:規(guī)定核心主題、新聞要素、語言風(fēng)格,并要求:生成政策文章、領(lǐng)導(dǎo)人講話稿、公報(bào)等指令:規(guī)定核心主題、寫作主體、格式、語指令:規(guī)定核心主題、篇幅、核心觀點(diǎn)、語指令:規(guī)定核心主題、觀點(diǎn)立場(chǎng)、語言風(fēng)格4.2.2新媒體創(chuàng)作類本章節(jié)規(guī)定了新聞行業(yè)大規(guī)模預(yù)訓(xùn)練語言模型在新媒體創(chuàng)作類應(yīng)用中的算法能力要求。新媒體創(chuàng)作不僅要求內(nèi)容的及時(shí)性和準(zhǔn)確性,還需注重內(nèi)容的創(chuàng)新性和互動(dòng)性,以滿足多樣化的用戶需求和不斷變化的媒體環(huán)境。模型對(duì)于新媒體創(chuàng)作類任務(wù)的具體要求應(yīng)符合表2的規(guī)定。表2新媒體創(chuàng)作類的不同類型要求腳本應(yīng)緊湊有趣,適合短時(shí)間內(nèi)傳達(dá)信息。需具備簡(jiǎn)潔的場(chǎng)景文案應(yīng)實(shí)時(shí)反映直播內(nèi)容,具備互動(dòng)性,能夠引導(dǎo)觀眾生成內(nèi)容應(yīng)圖文結(jié)合,直觀易懂。需具備簡(jiǎn)潔的文字描3T/CAPT010—2024表2新媒體創(chuàng)作類的不同類型要求(續(xù))文案應(yīng)富有創(chuàng)意,具備互動(dòng)性。需具備吸引眼球的標(biāo)題4.3媒體文本編輯4.3.1新聞翻譯新聞翻譯功能要求新聞翻譯功能要求包括:a)多語言處理能力,模型需要支持多種語言的翻譯,包括主流語言和小語種,以滿足全球范圍內(nèi)的新聞翻譯需求。模型應(yīng)能夠處理不同語言之間的語法、詞匯和語義差異,確保翻譯的準(zhǔn)確性和流暢性;b)模態(tài)翻譯技術(shù),能夠處理圖像、音頻轉(zhuǎn)文本后再翻譯,或者直接處理帶有圖像信息的圖文混排新聞內(nèi)容;c)領(lǐng)域適應(yīng)性,新聞翻譯涉及多個(gè)領(lǐng)域,如政治、經(jīng)濟(jì)、科技、體育等,模型需要具備跨領(lǐng)域的翻譯能力。通過引入領(lǐng)域特定的語料庫(kù)和知識(shí)庫(kù),模型可以更好地理解和翻譯特定領(lǐng)域的術(shù)語和概念;d)上下文感知能力,新聞文本通常具有復(fù)雜的上下文關(guān)系,模型需要能夠理解和捕捉這些關(guān)系,以進(jìn)行準(zhǔn)確的翻譯。通過引入注意力機(jī)制、記憶網(wǎng)絡(luò)等技術(shù),模型可以更好地利用上下文信息進(jìn)行翻譯;e)實(shí)時(shí)性與效率,新聞翻譯通常需要實(shí)時(shí)進(jìn)行,模型需要具備高效的處理速度和低延遲。通過優(yōu)化模型結(jié)構(gòu)和算法,以及利用并行計(jì)算和分布式處理等技術(shù),可以提高模型的翻譯速度和效率;f)數(shù)據(jù)驅(qū)動(dòng)與可訓(xùn)練性,模型的設(shè)計(jì)應(yīng)便于利用大量新聞翻譯數(shù)據(jù)進(jìn)行訓(xùn)練和優(yōu)化,以提高翻譯性能。采用合適的模型架構(gòu)和學(xué)習(xí)算法,確保模型能夠從數(shù)據(jù)中學(xué)習(xí)到有效的翻譯規(guī)則和模式;g)可解釋性與可控性,為了增強(qiáng)用戶對(duì)翻譯結(jié)果的信任度,模型應(yīng)具備一定程度的可解釋性,能夠解釋翻譯決策的依據(jù)。通過引入可視化工具、解釋性算法等技術(shù),可以幫助用戶更好地理解模型的翻譯過程;h)魯棒性與穩(wěn)定性,新聞文本中可能包含噪聲、錯(cuò)別字、不規(guī)范表達(dá)等,模型需要具備一定的魯棒性,能夠檢測(cè)并修正翻譯過程中可能出現(xiàn)的錯(cuò)誤,如語法錯(cuò)誤、拼寫錯(cuò)誤等;i)自適應(yīng)學(xué)習(xí)與優(yōu)化,模型應(yīng)能持續(xù)從用戶反饋和新數(shù)據(jù)中學(xué)習(xí),不斷優(yōu)化翻譯效果,提供友好的用戶界面,允許用戶對(duì)翻譯進(jìn)行反饋和校正,以便模型能夠根據(jù)用戶的需求進(jìn)行調(diào)整。新聞翻譯結(jié)果的要求新聞翻譯結(jié)果的要求包括:a)翻譯準(zhǔn)確性:文本內(nèi)容忠實(shí)度,模型應(yīng)確保翻譯后的新聞內(nèi)容準(zhǔn)確反映原文含義,不遺漏重要信息,不產(chǎn)生誤導(dǎo)性內(nèi)容;專業(yè)術(shù)語翻譯,針對(duì)新聞報(bào)道中的特定領(lǐng)域術(shù)語和專有名詞,模型應(yīng)具備準(zhǔn)確識(shí)別與翻譯的能力;語法結(jié)構(gòu)正確性,翻譯后文本應(yīng)遵循目標(biāo)語言的語法規(guī)則,保持句式結(jié)構(gòu)完整且符合新聞寫作規(guī)范;b)風(fēng)格一致性:新聞文體保持,模型需保證翻譯后的新聞稿風(fēng)格與原文一致,即保持新聞報(bào)道應(yīng)有的客觀、正式和簡(jiǎn)潔;語境適應(yīng)性,能夠根據(jù)新聞?lì)悇e和受眾定位調(diào)整翻譯策略,確保譯文符合相應(yīng)文化和社會(huì)背景;4T/CAPT010—2024c)實(shí)時(shí)性與效率:快速響應(yīng),模型應(yīng)具備快速翻譯大量新聞稿件的能力,滿足新聞發(fā)布時(shí)效要求。自動(dòng)更新與優(yōu)化,具備持續(xù)學(xué)習(xí)和自我優(yōu)化機(jī)制,隨新詞匯、短語的出現(xiàn)及時(shí)更新翻譯效果;d)安全與合規(guī)性:數(shù)據(jù)安全,在處理新聞翻譯的過程中,嚴(yán)格遵守國(guó)家信息安全法律法規(guī),保護(hù)新聞數(shù)據(jù)隱私;內(nèi)容審查,翻譯輸出應(yīng)避免不良信息傳播,支持可配置的內(nèi)容過濾與審查機(jī)制;e)可維護(hù)性與擴(kuò)展性:模型更新與升級(jí),允許模型進(jìn)行定期更新與優(yōu)化,并能無縫集成到現(xiàn)有新聞翻譯工作流程中;多語言支持,支持多種源語言到多種目標(biāo)語言的新聞翻譯服務(wù),且易于添加新的語言對(duì)。4.3.2新聞改寫新聞行業(yè)大規(guī)模預(yù)訓(xùn)練語言模型進(jìn)行新聞改寫應(yīng)遵循包括但不限于內(nèi)容補(bǔ)全、結(jié)構(gòu)調(diào)整、精煉語言、突出重點(diǎn)、呈現(xiàn)細(xì)節(jié)、增加引用等對(duì)內(nèi)容進(jìn)行增加、刪除或調(diào)整等操作,具體要求如下:a)內(nèi)容補(bǔ)全設(shè)計(jì)提示詞令模型根據(jù)原文和指令,補(bǔ)充完善相關(guān)信息,為讀者提供更詳盡的細(xì)節(jié),使文章更具理解性。指令應(yīng)明確補(bǔ)全內(nèi)容方向,如人物背景、事件細(xì)節(jié)、相關(guān)數(shù)據(jù)等,確保內(nèi)容與原文風(fēng)格和情感一致。補(bǔ)全后的內(nèi)容應(yīng)緊密連結(jié)原文核心信息,提供有價(jià)值的補(bǔ)充,增強(qiáng)文章的全面性和吸引力;b)結(jié)構(gòu)調(diào)整設(shè)計(jì)提示詞令模型調(diào)整文章結(jié)構(gòu),提高閱讀體驗(yàn)。指令應(yīng)明確結(jié)構(gòu)調(diào)整的要求,如總分結(jié)構(gòu)等,并可提供參考文章。生成結(jié)果應(yīng)保持原文連貫性和一致性,使文章更具可讀性和邏輯性,不改變?cè)男畔?;c)精煉語言設(shè)計(jì)提示詞令模型優(yōu)化語言,通過簡(jiǎn)化句子、刪減冗詞、提煉核心信息,使文章簡(jiǎn)潔明了。指令應(yīng)明確優(yōu)化內(nèi)容部分。生成結(jié)果應(yīng)保留原文核心信息,簡(jiǎn)潔清晰,不影響流暢性和可讀d)突出重點(diǎn)設(shè)計(jì)提示詞令模型突出關(guān)鍵信息,通過強(qiáng)調(diào)核心觀點(diǎn)、重要細(xì)節(jié),使文章更凝練有力。指令應(yīng)明確突出重點(diǎn)部分。生成結(jié)果應(yīng)準(zhǔn)確傳達(dá)原文核心意思,邏輯連貫,吸引讀者注意;e)呈現(xiàn)細(xì)節(jié)設(shè)計(jì)提示詞令模型優(yōu)化細(xì)節(jié),通過添加具體細(xì)節(jié)、豐富描述、提供背景信息,使文章生動(dòng)具體。指令應(yīng)明確添加細(xì)節(jié)部分并提供相關(guān)信息。生成結(jié)果應(yīng)豐富文章內(nèi)容,與原文主題一致,描述具體生動(dòng),背景信息全面,信息準(zhǔn)確;f)增加引用設(shè)計(jì)提示詞令模型添加引用,通過引用相關(guān)資料、專家觀點(diǎn)、研究成果等,增加文章權(quán)威性和可信度。指令應(yīng)明確引用內(nèi)容部分并提供相關(guān)資料。生成結(jié)果應(yīng)與原文主題相關(guān),引用可靠來源,進(jìn)一步豐富和深化文章內(nèi)容。4.3.3風(fēng)格轉(zhuǎn)換新聞行業(yè)大規(guī)模預(yù)訓(xùn)練語言模型進(jìn)行風(fēng)格轉(zhuǎn)換應(yīng)遵循包括但不限于通俗易懂、專業(yè)嚴(yán)謹(jǐn)、批判思維、增加網(wǎng)感、理論增強(qiáng)、情感共鳴等要求:a)通俗易懂設(shè)計(jì)模型使用簡(jiǎn)潔明了的語言闡述原內(nèi)容,降低閱讀難度,使更多讀者輕松理解。明確要求模型避免專業(yè)術(shù)語和復(fù)雜句子,保持核心信息不變。語言簡(jiǎn)潔,避免冗長(zhǎng)和難懂的術(shù)語,保留核心信息,確保普通讀者易懂,不簡(jiǎn)化到失去意義;b)專業(yè)嚴(yán)謹(jǐn)設(shè)計(jì)模型使用專業(yè)精確的語言闡述原內(nèi)容,提升文章專業(yè)性和權(quán)威性。明確要求模型使用專業(yè)術(shù)語和嚴(yán)謹(jǐn)結(jié)構(gòu),保持核心信息不變。語言精確,適當(dāng)使用專業(yè)術(shù)語,確保專業(yè)讀者準(zhǔn)確理解,不過度復(fù)雜化;c)批判思維5T/CAPT010—2024設(shè)計(jì)模型在理解原文后,提出批判性觀點(diǎn)和深度分析,增加文章深度和思辨性,明確指定批判內(nèi)容和方向。觀點(diǎn)客觀公正,基于充分論據(jù),清晰闡述邏輯,增強(qiáng)文章深度,引發(fā)讀者思考和討論,連貫且不矛盾;d)增加網(wǎng)感設(shè)計(jì)模型使用網(wǎng)絡(luò)文化和流行語言,貼近網(wǎng)民閱讀習(xí)慣和偏好。明確要求在保持專業(yè)性的同時(shí),加入網(wǎng)絡(luò)流行語,保持核心信息不變。語言貼近網(wǎng)絡(luò)文化,使用流行語和網(wǎng)絡(luò)梗,結(jié)合網(wǎng)絡(luò)熱點(diǎn),提高吸引力和傳播力,不過度娛樂化,保持專業(yè)性;e)理論增強(qiáng)設(shè)計(jì)模型對(duì)原內(nèi)容進(jìn)行理論補(bǔ)充,引用權(quán)威資料,提升文章專業(yè)性和可信度。明確指定補(bǔ)充內(nèi)容和理論框架。補(bǔ)充理論應(yīng)與主題相關(guān),深化理解,來源可靠,保持風(fēng)格和情感一致,連貫且不矛盾,提升專業(yè)性和可信度;f)情感共鳴設(shè)計(jì)模型使用富有情感的語言闡述原內(nèi)容,通過感人故事、情感描寫等引起共鳴。明確要求使用富有情感的語言,保持核心信息和深層意義不變。語言引起共鳴,情感表達(dá)真實(shí)自然,避免過度煽情,增強(qiáng)感染力和說服力。4.3.4擴(kuò)寫擴(kuò)寫要求包括:a)設(shè)計(jì)相應(yīng)提示詞令模型進(jìn)行符合“在原有內(nèi)容的基礎(chǔ)上,通過增加信息、細(xì)節(jié)、描述、背景等,使文章更加豐富和完整,以增強(qiáng)讀者的理解和參與感”要求的“擴(kuò)寫”工作。擴(kuò)寫旨在保持原文的風(fēng)格和情感,同時(shí)豐富內(nèi)容,使之更具吸引力和深度;b)提示詞需要包括但不限于規(guī)定擴(kuò)寫的主題、方向、語言風(fēng)格、篇幅的要求,并可以提供相關(guān)的事實(shí)素材;c)“擴(kuò)寫”類生成結(jié)果需要保證就新內(nèi)容合理性而言,擴(kuò)寫內(nèi)容在邏輯上應(yīng)與原文一致,不引入矛盾或不相關(guān)信息;就文章流暢度而言,擴(kuò)寫后的文章應(yīng)各部分之間過渡自然,讀者可以輕松跟隨故事的發(fā)展;就內(nèi)容的易讀性而言,添加的內(nèi)容應(yīng)能夠加深讀者對(duì)新聞事件或相關(guān)主題信息的理解,提供足夠的背景信息;就信息的準(zhǔn)確性而言,新增內(nèi)容應(yīng)準(zhǔn)確,不涉及錯(cuò)誤、臆測(cè)或誤導(dǎo)性陳述。4.3.5摘要摘要要求包括:a)設(shè)計(jì)相應(yīng)提示詞令模型進(jìn)行符合“對(duì)原文中的關(guān)鍵信息和主要內(nèi)容進(jìn)行精簡(jiǎn)提煉,生成符合以簡(jiǎn)潔明了的語言表達(dá),幫助讀者迅速了解文章的核心觀點(diǎn)、事件和重要數(shù)據(jù)”要求的“摘要”工作。摘要旨在在盡量減少文字量的情況下,保持原文的主旨和邏輯結(jié)構(gòu);b)提示詞指令需要包括但不限于規(guī)定“摘要”的核心主題、篇幅、原文遵從度的要求;c)“摘要”類生成結(jié)果需要保證關(guān)鍵信息概括度,摘要中應(yīng)包含了原文中的主要事件、觀點(diǎn)和數(shù)據(jù)等關(guān)鍵信息;就簡(jiǎn)潔而言,摘要應(yīng)用簡(jiǎn)明扼要的表達(dá)方式,使讀者能在短時(shí)間內(nèi)獲取主要內(nèi)容;就意義的保持度而言,摘要應(yīng)保持原文的主題、情感和重要細(xì)節(jié),不偏離原文核心;就信息的準(zhǔn)確性而言,摘要中提供的信息應(yīng)準(zhǔn)確,不得捏造、省略或曲解。4.3.6潤(rùn)色潤(rùn)色要求包括:a)設(shè)計(jì)相應(yīng)提示詞令模型進(jìn)行符合“修飾文章語言、風(fēng)格、結(jié)構(gòu),提升文章表達(dá)效果和可讀性”要求的“潤(rùn)色”任務(wù);b)提示詞指令需要包括但不限于規(guī)定“潤(rùn)色”的修改方式、修改方向、語言風(fēng)格的要求;c)“潤(rùn)色”類生成結(jié)果需要保證語法和拼寫,潤(rùn)色后文章中應(yīng)不存在拼寫和語法錯(cuò)誤;就表達(dá)的清晰度而言,修飾后的文章應(yīng)句子結(jié)構(gòu)清晰,邏輯連貫;就語言風(fēng)格而言,潤(rùn)色后的文章應(yīng)能根據(jù)原文的風(fēng)格,保持適當(dāng)?shù)男侣?、專業(yè)或通俗風(fēng)格;就表達(dá)的精練度而言,修飾后的文章應(yīng)用詞精準(zhǔn),不出現(xiàn)啰嗦或冗長(zhǎng)表達(dá)。6T/CAPT010—20244.3.7續(xù)寫續(xù)寫要求包括:a)設(shè)計(jì)相應(yīng)提示詞令模型進(jìn)行符合“在原文的基礎(chǔ)上,進(jìn)一步延伸事件、主題或觀點(diǎn),補(bǔ)充額外的信息、分析或展望,以豐富內(nèi)容并引發(fā)讀者的興趣”要求的“續(xù)寫”任務(wù)。續(xù)寫要求與原文保持一致的風(fēng)格和立場(chǎng),同時(shí)為讀者提供更深入的理解和更全面的信息;b)提示詞指令需要包括但不限于規(guī)定“續(xù)寫”的核心主題、續(xù)寫方向、表達(dá)方式、語言風(fēng)格的要求;c)“續(xù)寫”類生成結(jié)果需要保證主題的延伸性,續(xù)寫內(nèi)容在邏輯上應(yīng)與原文一致,延伸了事件或主題的發(fā)展;就信息的補(bǔ)充而言,添加后的內(nèi)容能夠提供額外的背景、數(shù)據(jù)、專家觀點(diǎn)等與原來的新聞文本相一致的信息;就邏輯的連貫性而言,續(xù)寫的內(nèi)容與原文之間應(yīng)過渡自然,不引發(fā)信息不匹配問題;就信息的準(zhǔn)確性而言,新增信息應(yīng)準(zhǔn)確,不引入錯(cuò)誤或不實(shí)陳述。4.3.8核校核校要求包括:a)設(shè)計(jì)相應(yīng)提示詞令模型進(jìn)行符合“對(duì)文章進(jìn)行仔細(xì)的校對(duì)和檢查,以確保內(nèi)容的準(zhǔn)確性、一致性和規(guī)范性”要求的“核?!惫ぷ?。核校包括拼寫、語法、標(biāo)點(diǎn)、事實(shí)核實(shí)、引用規(guī)范等方面的檢查,以確保文章在發(fā)布之前沒有錯(cuò)誤,同時(shí)滿足行業(yè)標(biāo)準(zhǔn)和讀者的期望;b)提示詞指令需要包括但不限于規(guī)定“核?!钡囊?guī)則、效果要求;c)“核?!鳖惿山Y(jié)果需要保證事實(shí)核實(shí),核校內(nèi)容需要經(jīng)過事實(shí)核實(shí),文章中提到的信息應(yīng)準(zhǔn)確無誤;就信息的一致性而言,核校后的文章內(nèi)部信息在邏輯上保持一致,避免矛盾;就格式的規(guī)范度而言,核校后的文章應(yīng)在排版、標(biāo)點(diǎn)和引用等方面符合規(guī)范標(biāo)準(zhǔn);就語言使用的正確性而言,核校后的文章中應(yīng)不存在拼寫、語法錯(cuò)誤或標(biāo)點(diǎn)符號(hào)使用問題。4.4媒體文本理解4.4.1新聞內(nèi)容標(biāo)簽提取新聞內(nèi)容標(biāo)簽提取要求包括:a)設(shè)計(jì)相應(yīng)提示詞令大模型理解新聞內(nèi)容,并準(zhǔn)確提煉文章的內(nèi)容標(biāo)簽,符合以下要求:提取文章的標(biāo)題、摘要、時(shí)間、涉及人物、事件地點(diǎn)、起因、經(jīng)過和結(jié)果,同時(shí)提煉文章的情感傾向、領(lǐng)域主題和主要觀點(diǎn);b)大模型應(yīng)當(dāng)可以提取覆蓋新聞文章各方面的內(nèi)容標(biāo)簽,包括但不限于:標(biāo)題、摘要、時(shí)間等基本要素,到人物關(guān)系、事件細(xì)節(jié),以及文章的情感和主題觀點(diǎn);c)生成的內(nèi)容標(biāo)簽提取結(jié)果應(yīng)嚴(yán)格基于原文。無論是直接引用的信息還是基于原文理解的總結(jié),都應(yīng)確保準(zhǔn)確性和相關(guān)性。提取的情感和觀點(diǎn)應(yīng)與原文邏輯一致,不產(chǎn)生矛盾或不相關(guān)信息。為滿足后續(xù)應(yīng)用需求,這些關(guān)鍵信息需以標(biāo)準(zhǔn)化格式(如JSON等)穩(wěn)定輸出,確保數(shù)據(jù)的可用性和可讀性。4.4.2新聞要素識(shí)別新聞要素識(shí)別要求包括:a)設(shè)計(jì)提示詞令模型完成“從新聞中提取出六要素時(shí)間、地點(diǎn)、人物、事件的起因、經(jīng)過、結(jié)果”的工作;b)提示詞指令需要包括但不限于規(guī)定模型提取的要素類型、提取范圍的要求,并應(yīng)提供需要模型理解的新聞文本;c)“新聞要素識(shí)別”類結(jié)果需要保證識(shí)別出的要素完整、真實(shí)、準(zhǔn)確。4.4.3新聞?lì)愋团袆e新聞?lì)愋团袆e要求包括:a)設(shè)計(jì)提示詞令模型進(jìn)行以下三種方式的判別任務(wù):1)體裁:根據(jù)新聞的手法、口吻和組織材料結(jié)構(gòu)來判斷新聞體裁,包括消息、通訊、評(píng)論、公文公報(bào)等;7T/CAPT010—20242)范圍:基于新聞發(fā)生的地區(qū)與影響范圍進(jìn)行分類,可分為國(guó)際新聞和國(guó)內(nèi)新聞。在此,港澳臺(tái)被歸類為國(guó)內(nèi)新聞;3)主題:基于新聞的主題進(jìn)行分類,應(yīng)符合GB/T20093的要求。b)提示詞指令需要包括但不限于規(guī)定模型判別的任務(wù)類型,并應(yīng)提供需要模型判別的新聞文本;c)“新聞?lì)愋团袆e”類生成結(jié)果需要保證從三種分類方式準(zhǔn)確判斷新聞?lì)愋汀?.4.4新聞核心信息提取新聞核心信息提取要求包括:a)設(shè)計(jì)提示詞令模型完成“從新聞中提取關(guān)鍵詞或摘要”的工作:1)關(guān)鍵詞:新聞報(bào)道中的關(guān)鍵性內(nèi)容,包括實(shí)體詞、謂詞、具有關(guān)鍵信息的詞語;2)摘要:最關(guān)鍵的新聞元素,時(shí)間、地點(diǎn)、主要人物/組織、發(fā)生的事件等,以完整的句段表述。b)提示詞指令需要包括但不限于規(guī)定模型提取信息的任務(wù)類型及具體篇幅或個(gè)數(shù)要求,并應(yīng)提供需要模型提取信息的新聞文本;c)“新聞核心信息提取”類生成結(jié)果需要保證關(guān)鍵詞要求選擇具有檢索意義的詞匯,有較特殊意義的詞、詞組、縮略語,不宜拆開。若新聞中有其他類別的詞、短語甚至熟語也能夠提示文章的關(guān)鍵內(nèi)容,也應(yīng)作為關(guān)鍵詞處理。摘要要求言簡(jiǎn)意賅,能體現(xiàn)新聞主要內(nèi)容,字?jǐn)?shù)在100~150字左右。4.4.5新聞傾向判斷新聞傾向判斷要求包括:a)設(shè)計(jì)提示詞令模型完成“判斷新聞報(bào)道中新聞主要人物或機(jī)構(gòu)對(duì)事件的感情、態(tài)度、意向或立場(chǎng)”的工作。感情傾向可分為正面、負(fù)面、中性;b)提示詞指令需要包括但不限于規(guī)定模型提取信息的任務(wù)類型,并應(yīng)提供具有較明顯情感傾向的新聞文本;c)“新聞傾向判斷”類生成結(jié)果需要保證通過文本可觀測(cè)明顯情感傾向,分析準(zhǔn)確、合理。4.5媒體數(shù)據(jù)增強(qiáng)4.5.1媒體創(chuàng)意/熱點(diǎn)推薦媒體創(chuàng)意/熱點(diǎn)推薦包括但不限于熱點(diǎn)推薦、脈絡(luò)梳理、主題擴(kuò)散、內(nèi)容創(chuàng)作建議、傳播效果預(yù)測(cè)5個(gè)子類別,其中:a)熱點(diǎn)推薦:1)通過檢索當(dāng)前的社交媒體討論、新聞?lì)^條、搜索引擎趨勢(shì)等,收集當(dāng)前的熱點(diǎn)事件和話題,再設(shè)計(jì)相應(yīng)提示詞引導(dǎo)模型分析當(dāng)前社會(huì)、文化、經(jīng)濟(jì)、政治等領(lǐng)域中的流行趨勢(shì)和事件,篩選出具有廣泛關(guān)注度和討論價(jià)值的熱點(diǎn)事件;2)提示詞指令需要明確要求模型根據(jù)收集的數(shù)據(jù),綜合考慮話題的時(shí)效性、社會(huì)影響力,以及可能引起的公眾興趣和參與度,推薦當(dāng)前最受關(guān)注的熱點(diǎn)事件;3)“熱點(diǎn)推薦”類生成結(jié)果應(yīng)能夠清晰展示當(dāng)前最受關(guān)注的熱點(diǎn)事件,并提供簡(jiǎn)要的背景信息和討論點(diǎn)。b)脈絡(luò)梳理:1)通過聯(lián)網(wǎng)搜索,獲取與熱點(diǎn)事件相關(guān)的新聞報(bào)道、社交媒體討論和各類公開權(quán)威信息。根據(jù)這些信息,設(shè)計(jì)相應(yīng)提示詞使模型針對(duì)熱點(diǎn)事件清晰地梳理其來龍去脈,包括事件的起因、發(fā)展、關(guān)鍵的轉(zhuǎn)折點(diǎn)和影響事件進(jìn)程的主要因素、當(dāng)前狀態(tài)以及參與推動(dòng)或影響事件發(fā)展的關(guān)鍵個(gè)人、團(tuán)體或組織;2)提示詞指令需要明確要求模型獲取數(shù)據(jù)的范圍和方式,確保數(shù)據(jù)的準(zhǔn)確性和全面性。指導(dǎo)模型如何根據(jù)收集的數(shù)據(jù)進(jìn)行脈絡(luò)梳理的要點(diǎn),并確定相應(yīng)的呈現(xiàn)方式,以詳盡、直觀地展示事件的整個(gè)發(fā)展脈絡(luò);3)“脈絡(luò)梳理”類生成結(jié)果應(yīng)全面、直觀地反映出事件從起始到當(dāng)前狀態(tài)的整體發(fā)展路徑,以全面地了解事件的全貌,而不僅僅是表面的現(xiàn)象。8T/CAPT010—2024c)主題擴(kuò)散:1)基于熱點(diǎn)事件和關(guān)聯(lián)數(shù)據(jù),設(shè)計(jì)相應(yīng)提示詞引導(dǎo)模型分析和挖掘出與熱點(diǎn)事件緊密相關(guān)或由此引申出的其他主題、話題和觀點(diǎn),并圍繞這些新發(fā)現(xiàn)的主題或話題進(jìn)行廣泛的聯(lián)想和擴(kuò)展,生成一系列與這些主題緊密相關(guān)的概念、創(chuàng)新想法、深入探討的問題以及具有啟發(fā)性的討論點(diǎn);2)提示詞指令需要明確要求模型從給定的熱點(diǎn)事件中提煉出核心主題,并根據(jù)這些核心主題,從社會(huì)、文化、經(jīng)濟(jì)、技術(shù)等多個(gè)角度和層面進(jìn)行發(fā)散性思考,以產(chǎn)生新的、有趣且深入的觀點(diǎn)和討論點(diǎn);3)“主題擴(kuò)散”類生成結(jié)果應(yīng)能夠提供與原始熱點(diǎn)事件主題緊密相關(guān)的多元化視角和深入探討,從而豐富內(nèi)容的層次和深度,提供更加全面、多維度的信息解讀和觀點(diǎn)闡述。d)內(nèi)容創(chuàng)作建議:1)根據(jù)熱點(diǎn)事件及其相關(guān)聯(lián)的主題,設(shè)計(jì)相應(yīng)提示詞引導(dǎo)模型從不同角度和層面提供內(nèi)容創(chuàng)作的靈感和實(shí)用的建議,包括文章標(biāo)題的構(gòu)思、內(nèi)容框架的搭建、觀點(diǎn)的深度闡述,以及精選案例的引用等多個(gè)方面,以輔助內(nèi)容創(chuàng)作者打造出高質(zhì)量的內(nèi)容作品;2)提示詞指令需要明確要求模型結(jié)合熱點(diǎn)事件和關(guān)聯(lián)主題,給出具有針對(duì)性、新穎性和吸引力的內(nèi)容創(chuàng)作建議,以提升內(nèi)容的吸引力和傳播力;3)“內(nèi)容創(chuàng)作建議”類生成結(jié)果應(yīng)能夠?yàn)閮?nèi)容創(chuàng)作者提供具體、實(shí)用且具有高度可操作性的建議和靈感,幫助創(chuàng)作出更加引人入勝、觀點(diǎn)鮮明、結(jié)構(gòu)清晰的高質(zhì)量?jī)?nèi)容。e)傳播效果預(yù)測(cè):1)結(jié)合歷史數(shù)據(jù)和當(dāng)前媒體報(bào)道聲量,設(shè)計(jì)相應(yīng)提示詞引導(dǎo)模型分析預(yù)測(cè)該熱點(diǎn)內(nèi)容在媒體平臺(tái)上的傳播效果,包括可能的閱讀量、轉(zhuǎn)發(fā)量、討論熱度等;2)提示詞指令需要明確要求模型依據(jù)已有的相關(guān)數(shù)據(jù)和數(shù)據(jù)分析方法,對(duì)熱點(diǎn)事件及其相關(guān)內(nèi)容的傳播效果進(jìn)行合理預(yù)測(cè),并提供相應(yīng)的數(shù)據(jù)支持和解釋,確保預(yù)測(cè)結(jié)果的可解釋性和可信度;3)“傳播效果預(yù)測(cè)”類生成結(jié)果應(yīng)能夠提供客觀、科學(xué)的傳播效果預(yù)測(cè)和分析,以幫助內(nèi)容創(chuàng)作者和發(fā)布者更好地制定發(fā)布和推廣策略,最大限度地提升內(nèi)容的曝光度和影響力。4.5.2輿情分析輿情分析要求包括:a)新聞媒體文章觀點(diǎn)分析:1)設(shè)計(jì)相應(yīng)提示詞令模型生成符合指定級(jí)別的新聞媒體傾向的觀點(diǎn)自聚類分析內(nèi)容;2)提示詞指令需要包括但不限于規(guī)定新聞媒體級(jí)別的要求,建議新聞媒體級(jí)別按照中央媒體、省級(jí)媒體、市級(jí)媒體和商業(yè)媒體進(jìn)行劃分;3)觀點(diǎn)自聚類分析生成結(jié)果需要保證內(nèi)容上,只分析指定級(jí)別的新聞媒體;在觀點(diǎn)上,應(yīng)當(dāng)根據(jù)文章內(nèi)容,高度自聚類,建議以三至四個(gè)觀點(diǎn)為宜;在分析上,應(yīng)當(dāng)言簡(jiǎn)意概,突出主要觀點(diǎn)指向;4)支持批量數(shù)據(jù)的導(dǎo)入分析,數(shù)據(jù)宜包括新聞媒體級(jí)別、新聞媒體名稱、新聞標(biāo)題、新聞?wù)?,建議支持?jǐn)?shù)量在100條左右。b)自媒體文章內(nèi)容分析:1)設(shè)計(jì)相應(yīng)提示詞令模型生成符合指定平臺(tái)的自媒體文章自聚類分析內(nèi)容;2)提示詞指令需要包括但不限于規(guī)定分析文章內(nèi)容的意見、態(tài)度、情感等多維度指標(biāo);3)文章自聚類分析生成結(jié)果需要保證在內(nèi)容上,應(yīng)當(dāng)與輸入的待分析文章數(shù)據(jù)一致,不得有虛構(gòu)、幻想的成分;在結(jié)果上,應(yīng)當(dāng)準(zhǔn)確反映針對(duì)具體事件或話題的思想動(dòng)向,能夠挖掘出對(duì)事件或話題的興趣點(diǎn);4)支持批量數(shù)據(jù)的導(dǎo)入分析,數(shù)據(jù)宜包括平臺(tái)名稱、自媒體文章標(biāo)題、自媒體文章正文,建議支持?jǐn)?shù)量在100條左右。c)商業(yè)平臺(tái)文章評(píng)論分析:1)設(shè)計(jì)相應(yīng)提示詞令模型生成符合指定平臺(tái)的文章評(píng)論觀點(diǎn)聚類分析內(nèi)容;2)提示詞指令需要包括但不限于規(guī)定評(píng)論觀點(diǎn)的立場(chǎng)屬性為正面、中性和負(fù)面;9T/CAPT010—20243)文章評(píng)論觀點(diǎn)聚類生成結(jié)果需要保證在對(duì)待文章中所討論事件的觀點(diǎn)立場(chǎng)判定準(zhǔn)確;在評(píng)論內(nèi)容情緒判斷上精準(zhǔn),建議將情緒具體劃分為8類:高興、悲傷、大笑、憤怒、討厭、震驚、擔(dān)心和平和;在內(nèi)容上,應(yīng)當(dāng)能夠提煉出每種觀點(diǎn)的核心要素,洞察出評(píng)論者普遍心態(tài);4)支持批量數(shù)據(jù)的導(dǎo)入分析,數(shù)據(jù)宜包括平臺(tái)名稱、文章評(píng)論正文,建議支持?jǐn)?shù)量在500條左右。d)歷史事件回溯:1)設(shè)計(jì)相應(yīng)提示詞令模型生成符合準(zhǔn)確描述的突發(fā)事件,回溯出歷史相似事件的詳細(xì)內(nèi)容;2)提示詞指令需要包括但不限于規(guī)定事件主體,回溯時(shí)間段,事件發(fā)生的地域以及事件相似性程度等屬性;3)歷史事件回溯生成結(jié)果需要保證在內(nèi)容上包括簡(jiǎn)要的事件概括、發(fā)展過程和最后的結(jié)果;在順序上,按照時(shí)間線依次列出;在相關(guān)性上,應(yīng)當(dāng)能夠根據(jù)指定的事件相關(guān)度,增減回溯的歷史事件數(shù)量。e)熱搜詞條生成:1)設(shè)計(jì)相應(yīng)提示詞令模型生成符合準(zhǔn)確描述的突發(fā)事件詳情,符合不同平臺(tái)熱搜榜特征的熱搜詞條;2)提示詞指令需要包括但不限于規(guī)定平臺(tái)名稱;3)熱搜詞條生成結(jié)果需要保證在內(nèi)容上能準(zhǔn)確反映突發(fā)事件核心要素;在形式上,符合指定平臺(tái)的熱搜詞條特征;在邏輯上,應(yīng)當(dāng)能夠反映社會(huì)公眾興趣所在。4.5.3新聞事實(shí)核查新聞事實(shí)核查是指新聞采編人員通過多種方式,對(duì)已公開的新聞、聲明、公告、報(bào)告、統(tǒng)計(jì)數(shù)據(jù)及其他公共言論或信息的真實(shí)性和準(zhǔn)確性進(jìn)行系統(tǒng)評(píng)估的活動(dòng)。大模型應(yīng)當(dāng)能輔助或代替人工完成新聞事實(shí)核查的各項(xiàng)任務(wù),包括:信息篩選、資料收集、驗(yàn)證來源、檢查事實(shí)、分析證據(jù)、撰寫報(bào)告和發(fā)布結(jié)果。在信息篩選環(huán)節(jié),大模型應(yīng)當(dāng)可以迅速篩選出具有公共關(guān)注度和重要性的新聞主題或內(nèi)容。在資料收集階段,模型能夠快速查找并整理相關(guān)的原始來源、背景信息和佐證資料。在驗(yàn)證來源和檢查事實(shí)過程中,大模型可以高效地核實(shí)信息來源的可靠性和權(quán)威性,并對(duì)涉及的事實(shí)和數(shù)據(jù)進(jìn)行多方比對(duì)和驗(yàn)證。通過分析證據(jù),模型應(yīng)當(dāng)可以綜合多來源證據(jù)資料,識(shí)別新聞的準(zhǔn)確性和真實(shí)性,減少人為主觀偏差。大模型應(yīng)當(dāng)能夠生成清晰簡(jiǎn)明的事實(shí)核查報(bào)告,準(zhǔn)確展示核查過程和結(jié)論。模型還應(yīng)當(dāng)可以協(xié)助發(fā)布和傳播核查結(jié)果,及時(shí)向公眾提供準(zhǔn)確的信息,減少虛假信息的傳播和影響。4.5.4優(yōu)先采用可信數(shù)據(jù)源可信數(shù)據(jù)源是指具有權(quán)威性、準(zhǔn)確性和時(shí)效性的數(shù)據(jù)信息來源。通常包括專業(yè)新聞機(jī)構(gòu)、官方媒體、政府?dāng)?shù)據(jù)庫(kù)、研究機(jī)構(gòu)或經(jīng)驗(yàn)證的第三方數(shù)據(jù)服務(wù)機(jī)構(gòu)。可信數(shù)據(jù)源應(yīng)滿足以下條件:——權(quán)威性:數(shù)據(jù)源應(yīng)來自政府機(jī)關(guān)、知名新聞機(jī)構(gòu)、國(guó)際認(rèn)可的非營(yíng)利組織或行業(yè)權(quán)威研究機(jī)——準(zhǔn)確性:數(shù)據(jù)源提供的信息應(yīng)經(jīng)過核實(shí),準(zhǔn)確無誤,不傳播未經(jīng)證實(shí)的消息或謠言?!皶r(shí)性:數(shù)據(jù)源應(yīng)能提供最新信息,保證內(nèi)容時(shí)效性?!该餍裕簲?shù)據(jù)源應(yīng)公開原始信息來源、采集方法和時(shí)間,便于驗(yàn)證和追溯,如公布調(diào)查研究的抽樣方法和樣本數(shù)量,指明數(shù)據(jù)可能存在的偏差與局限?!暾裕簲?shù)據(jù)源提供的信息應(yīng)全面,不應(yīng)有故意的遺漏或剪輯,避免誤導(dǎo)讀者。——在新聞?wù)Z言大模型的數(shù)據(jù)增強(qiáng)過程中,應(yīng)遵循以下原則:.優(yōu)先采用原則:在使用媒體數(shù)據(jù)進(jìn)行語言模型訓(xùn)練或增強(qiáng)時(shí),應(yīng)優(yōu)先考慮符合上述標(biāo)準(zhǔn)的數(shù)據(jù)源,確保模型的準(zhǔn)確性和可靠性。.多元化和平衡:應(yīng)注意數(shù)據(jù)源的多元化和平衡,避免依賴單一數(shù)據(jù)源,結(jié)合多個(gè)高質(zhì)量數(shù)據(jù)源,以獲得全面和客觀的數(shù)據(jù)輸入。.持續(xù)監(jiān)控與評(píng)估:對(duì)選定的數(shù)據(jù)源實(shí)施持續(xù)監(jiān)控和評(píng)估,定期審查其信息的準(zhǔn)確性和可靠性,并根據(jù)需要更新可信數(shù)據(jù)源名單。T/CAPT010—2024.數(shù)據(jù)更新:追蹤可靠數(shù)據(jù)源提供的最新數(shù)據(jù),保證模型接收和提供的信息不過時(shí),能反映最新情況。——建議的可信數(shù)據(jù)源包括:政府官方數(shù)據(jù)庫(kù):如國(guó)家統(tǒng)計(jì)局網(wǎng)站提供的《中國(guó)統(tǒng)計(jì)年鑒》、地區(qū)數(shù)據(jù)、普查數(shù)據(jù),美國(guó)食品藥品管理局提供的藥品數(shù)據(jù)等?!侣剻C(jī)構(gòu):可信的新聞機(jī)構(gòu)數(shù)據(jù)源參考網(wǎng)信辦互聯(lián)網(wǎng)新聞信息稿源。——研究機(jī)構(gòu):包括高校研究所驗(yàn)證的報(bào)告與文獻(xiàn)、聯(lián)合國(guó)與世界衛(wèi)生組織等國(guó)際非營(yíng)利組織、行業(yè)內(nèi)權(quán)威研究機(jī)構(gòu)的資料。4.5.5使用外部數(shù)據(jù)的輸出需要提供引證素材來源在使用外部數(shù)據(jù)進(jìn)行內(nèi)容輸出時(shí),引證素材應(yīng)增強(qiáng)內(nèi)容的可靠性、可驗(yàn)證性和可追溯性。具體要求如下:a)引證來源的靈活性與可控性:靈活選擇不同的外部數(shù)據(jù)源作為引證素材。若外部數(shù)據(jù)無相關(guān)內(nèi)容,需拒絕回答,確保引證準(zhǔn)確有效;b)數(shù)據(jù)來源的明確性:所有引文應(yīng)明確標(biāo)注引用來源,精確到原文中的具體數(shù)據(jù)片段,包括作者、出版物名稱、出版日期等,以便快速準(zhǔn)確定位參考內(nèi)容;c)引證數(shù)據(jù)的適當(dāng)性:生成內(nèi)容應(yīng)與引文緊密相關(guān),具備邏輯關(guān)聯(lián),避免無關(guān)引文;d)引證內(nèi)容的完整性:引證內(nèi)容應(yīng)完整、可讀,不遺漏關(guān)鍵信息或截取部分。需對(duì)每個(gè)觀點(diǎn)標(biāo)注支持的引文,確保所有引用信息完整呈現(xiàn)。同一觀點(diǎn)的相關(guān)引文應(yīng)并排標(biāo)注,便于全面了解信息來源。e)引證來源的可回溯:提供引證信息的元數(shù)據(jù),確??烧业皆模灰呐c原文一致,不進(jìn)行改寫或修改,保證內(nèi)容可追溯。f)引證格式的標(biāo)準(zhǔn)性:引文標(biāo)注應(yīng)清晰易懂,避免歧義或混淆。采用阿拉伯?dāng)?shù)字順序夾注法關(guān)聯(lián)引證來源,方便讀者查閱。元數(shù)據(jù)標(biāo)注根據(jù)數(shù)據(jù)類型不同進(jìn)行區(qū)分。參考文獻(xiàn)按引用順序排序,提高邏輯性和可讀性。遵循GB/T7714要求,確保引證格式規(guī)范統(tǒng)一。根據(jù)指定格式自動(dòng)生成引用,提升操作便捷性和準(zhǔn)確性。表3數(shù)據(jù)類型和引文所需字段枚舉頁面標(biāo)題(PageTitle)、網(wǎng)站名稱(WebsiteName)、發(fā)布Publication)、URL、訪問日期(AccessDate)、引文段落(Quota作者(Author)、文檔標(biāo)題(DocumentTitle)、頁碼范圍(Page5效果要求5.1專業(yè)性要求專業(yè)性要求旨在判斷大模型生成結(jié)果的新聞行業(yè)專業(yè)標(biāo)準(zhǔn)和價(jià)值取向體現(xiàn)情況。5.1.1內(nèi)容專業(yè)模型生成的新聞信息內(nèi)容質(zhì)量能夠匹配新聞行業(yè)中的主要應(yīng)用場(chǎng)景下的需求,保證模型生成新聞信息的真實(shí)、準(zhǔn)確。T/CAPT010—20245.1.2結(jié)構(gòu)專業(yè)模型生成的新聞信息結(jié)構(gòu)符合新聞專業(yè)標(biāo)準(zhǔn),保證模型生成新聞信息符合新聞體裁規(guī)范。5.1.3語言專業(yè)大模型生成的新聞信息的語言應(yīng)符合新聞傳播場(chǎng)景的風(fēng)格需求,保證模型生成新聞信息的語言風(fēng)格不含違禁詞、并符合媒體、欄目風(fēng)格定位。5.1.4準(zhǔn)確專業(yè)大模型生成的內(nèi)容應(yīng)基于事實(shí)和數(shù)據(jù),避免虛假信息和不實(shí)報(bào)道;在處理新聞報(bào)道時(shí),模型應(yīng)能夠識(shí)別和引用權(quán)威的信息源,如官方發(fā)布、專業(yè)研究報(bào)告等;對(duì)于歷史事件、數(shù)據(jù)統(tǒng)計(jì)、人物言論等,模型應(yīng)確保引用信息的時(shí)間、地點(diǎn)、背景和上下文的準(zhǔn)確無誤。5.1.5可信專業(yè)模型生成的新聞內(nèi)容應(yīng)具備一定的可信度,模型應(yīng)能夠解釋其生成新聞內(nèi)容的過程和依據(jù),從而保證讀者或用戶能夠信賴該內(nèi)容的真實(shí)性和有效性;應(yīng)定期對(duì)模型進(jìn)行校準(zhǔn)和更新,以適應(yīng)不斷變化的新聞環(huán)境和信息準(zhǔn)確性的要求;當(dāng)模型出現(xiàn)錯(cuò)誤時(shí),應(yīng)能夠識(shí)別錯(cuò)誤類型并給出合理解釋,以便用戶或開發(fā)者進(jìn)行修正。5.1.6客觀專業(yè)模型處理和生成多樣的文本時(shí)保持新聞客觀性的能力,以提供更加廣泛的視角和代表性;數(shù)據(jù)預(yù)訓(xùn)練階段要引入內(nèi)容過濾機(jī)制,避免由于數(shù)據(jù)選擇、數(shù)據(jù)清洗等過程中的不當(dāng)操作而引入歧視,應(yīng)使用不同類型的可靠數(shù)據(jù)類信源以保證數(shù)據(jù)質(zhì)量;生成內(nèi)容時(shí)應(yīng)通過算法保證信息來源的多樣性和獨(dú)立性,避免偏見和誤導(dǎo)性信息。5.2可靠性要求可靠性要求應(yīng)保證大模型在新聞行業(yè)使用過程中的安全、合法、可信賴,減少、防止大模型的不良輸出或侵權(quán)行為。5.2.1安全性大模型生成內(nèi)容應(yīng)符合國(guó)家法律法規(guī)和行業(yè)規(guī)范,尊重知識(shí)產(chǎn)權(quán)和個(gè)人隱私,遵守道德和公序良俗,符合社會(huì)主義核心價(jià)值觀,可參考法律法規(guī)等相關(guān)文件對(duì)前述要求作出具體規(guī)定和建立負(fù)面清單,具體要求可參考《新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型安全性要求》。5.2.2可控性大模型在進(jìn)行媒體工作時(shí),應(yīng)當(dāng)滿足指令提示詞內(nèi)的限制性、傾向性需求,保證大模型的輸出是可被輸入控制的,且專業(yè)性不發(fā)生明顯衰減。建立健全的內(nèi)容審查機(jī)制,對(duì)大語言模型產(chǎn)出的內(nèi)容進(jìn)行人工審核,確保內(nèi)容的生成結(jié)果安全能夠由用戶掌控;對(duì)于發(fā)現(xiàn)的不適合產(chǎn)出的內(nèi)容,應(yīng)及時(shí)進(jìn)行修改或刪除,防止其傳播,并從技術(shù)層面判斷根源,盡量杜絕類似內(nèi)容的再生產(chǎn);可識(shí)別具有不良誘導(dǎo)性內(nèi)容的提示詞并給出正向提示和拒絕,并額外建立預(yù)警機(jī)制,讓用戶可知可控。5.2.3可解釋性大模型在進(jìn)行媒體工作時(shí),應(yīng)能夠清楚地說明其在新聞行業(yè)中的工作原理和邏輯推理過程,以便用戶進(jìn)行核查檢驗(yàn),從而提高大模型的可信度。5.2.4保護(hù)數(shù)據(jù)隱私大模型在預(yù)訓(xùn)練集和實(shí)際應(yīng)用中均應(yīng)遵循、符合對(duì)個(gè)人隱私數(shù)據(jù)保護(hù)和機(jī)構(gòu)內(nèi)部或敏感數(shù)據(jù)保護(hù)的相關(guān)要求。對(duì)于處于不同國(guó)家和地區(qū)的具體情況,應(yīng)遵照并符合當(dāng)?shù)叵嚓P(guān)法律法規(guī)的要求;對(duì)于涉及個(gè)人隱私或個(gè)人隱私數(shù)據(jù)的新聞報(bào)道或輸出,應(yīng)遵循個(gè)人隱私數(shù)據(jù)保護(hù)的要求,對(duì)個(gè)人隱私數(shù)據(jù)進(jìn)行匿名處理或模糊化處理,包括但不限于:姓名、身份證號(hào)、家庭住址、通訊地址、電話號(hào)碼、DNA數(shù)據(jù)、銀T/CAPT010—2024行賬號(hào)、個(gè)人病歷、照片、視頻等。建立中央監(jiān)管系統(tǒng),通過人力和各種人工智能檢測(cè)機(jī)制的輔助,發(fā)現(xiàn)和記錄隱私泄露或違規(guī)使用的行為。5.2.5保證數(shù)據(jù)可信加強(qiáng)對(duì)新聞內(nèi)容的真實(shí)性審核,如引入專業(yè)的新聞編輯和審核團(tuán)隊(duì)進(jìn)行把關(guān),確保其真實(shí)性和準(zhǔn)確性。同時(shí),也可以借助自然語言處理等技術(shù),對(duì)新聞內(nèi)容進(jìn)行自動(dòng)化分析和驗(yàn)證,確保不產(chǎn)出虛假新聞或誤導(dǎo)性信息,對(duì)于未經(jīng)證實(shí)的信息,應(yīng)明確標(biāo)注其未經(jīng)驗(yàn)證,避免誤導(dǎo)讀者;建立可信度評(píng)級(jí)體系,度量輸出內(nèi)容的可信度,供讀者判斷;提供用戶反饋渠道,鼓勵(lì)用戶對(duì)不適宜及真實(shí)性存疑的內(nèi)容進(jìn)行舉報(bào)和提示;對(duì)用戶反饋的內(nèi)容進(jìn)行快速響應(yīng)和處理,必要時(shí)進(jìn)行公開澄清或道歉。5.2.6尊重?cái)?shù)據(jù)版權(quán)尊重知識(shí)產(chǎn)權(quán),嚴(yán)格遵守《中華人民共和國(guó)著作權(quán)法》,未經(jīng)著作權(quán)人許可,大模型不得以復(fù)制、通過信息網(wǎng)絡(luò)向公眾傳播其作品等形式侵害著作權(quán)人權(quán)利;建立版權(quán)信息的查詢功能:訓(xùn)練過程中不僅僅要學(xué)習(xí)數(shù)據(jù)本身,還需要將數(shù)據(jù)的來源以及產(chǎn)權(quán)信息送入;對(duì)于引用或轉(zhuǎn)載的內(nèi)容,應(yīng)明確標(biāo)注來源,并確保符合版權(quán)法規(guī)定的合理使用范圍;使用開源數(shù)據(jù)集時(shí),應(yīng)取得開源授權(quán)協(xié)議。5.3適用性要求適用性要求大模型應(yīng)適應(yīng)新聞行業(yè)的領(lǐng)域多樣性和用戶需求多樣化,反映大模型在新聞行業(yè)中的實(shí)際效果和用戶體驗(yàn)。5.3.1靈活適用大模型在進(jìn)行不同領(lǐng)域的媒體工作時(shí),應(yīng)當(dāng)對(duì)于差異性領(lǐng)域的新聞需求、多樣性的新聞素材輸入,均能給出符合領(lǐng)域?qū)I(yè)性的回答。5.3.2兼容適用大模型在進(jìn)行媒體工作時(shí),對(duì)于同樣需求、不同風(fēng)格描述語言的提示詞輸入,應(yīng)當(dāng)都能給出符合需求的回答。生成的內(nèi)容在模型內(nèi)部需要保持一致,不包含自相矛盾的信息,模型應(yīng)保持持續(xù)穩(wěn)定的性能,不因數(shù)據(jù)量增大或計(jì)算資源變化而影響生成速度和質(zhì)量。5.3.3創(chuàng)新適用大模型在媒體行業(yè)中的應(yīng)用也應(yīng)當(dāng)顯示自身的創(chuàng)新能力和價(jià)值貢獻(xiàn),尤其是對(duì)于開放性生成任務(wù),如用戶有需要,則大模型應(yīng)有創(chuàng)新性或出彩性的生成結(jié)果,如生成多樣性、內(nèi)容新穎性等。6產(chǎn)品化要求6.1模型部署的要求6.1.1云服務(wù)的要求云服務(wù)需要保證服務(wù)的穩(wěn)定性。大模型的云服務(wù)應(yīng)具備高可用性架構(gòu),保證7x24小時(shí)可靠,或根據(jù)使用單位工作時(shí)間具體確定,同時(shí)確保系統(tǒng)能夠在高并發(fā)訪問情況下依然保持穩(wěn)定運(yùn)行,避免因服務(wù)中斷導(dǎo)致的新聞事故。此外,云服務(wù)需要具備良好的擴(kuò)展性,以應(yīng)對(duì)新聞行業(yè)中突發(fā)事件和重大新聞報(bào)道期間的流量高峰。服務(wù)商還應(yīng)提供全天候技術(shù)支持和快速響應(yīng)機(jī)制,及時(shí)解決用戶在使用過程中遇到的問題,確保新聞行業(yè)大規(guī)模預(yù)訓(xùn)練語言模型的部署和運(yùn)行過程平穩(wěn)順利。6.1.2私有化服務(wù)的要求能私有化部署的,要保證部署方案的可用性和推理效率。私有化部署需要確保在不同的硬件環(huán)境下都能夠穩(wěn)定運(yùn)行,并且具備良好的可擴(kuò)展性和靈活性,以適應(yīng)新聞機(jī)構(gòu)不同規(guī)模和需求的變化。在部署過程中,需要考慮數(shù)據(jù)安全和隱私保護(hù),確保新聞數(shù)據(jù)不會(huì)在傳輸和存儲(chǔ)過程中泄露。此外,私有化部署的模型應(yīng)具備高效的推理能力,能夠快速響應(yīng)用戶的查詢和請(qǐng)求,確保新聞內(nèi)容的實(shí)時(shí)性和準(zhǔn)確性,為新聞工作者提供高效的工具支持。T/CAPT010—20246.2模型數(shù)據(jù)庫(kù)的要求6.2.1數(shù)據(jù)庫(kù)的上游數(shù)據(jù)可靠性新聞行業(yè)要求事實(shí),因此新聞行業(yè)大模型所采用的數(shù)據(jù)庫(kù)應(yīng)當(dāng)具備可靠的上游數(shù)據(jù)來源。具體而言,數(shù)據(jù)庫(kù)中的數(shù)據(jù)應(yīng)當(dāng)來自權(quán)威、可信的新聞機(jī)構(gòu)和信息源,經(jīng)過嚴(yán)格的驗(yàn)證和篩選,以確保數(shù)據(jù)的真實(shí)性和可靠性。此外,數(shù)據(jù)庫(kù)還應(yīng)保持實(shí)時(shí)更新,及時(shí)收錄最新的新聞事件和動(dòng)態(tài),確保模型生成的內(nèi)容具有時(shí)效性和準(zhǔn)確性。對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行定期審核和清洗,剔除過時(shí)、錯(cuò)誤或不可靠的信息,也是確保數(shù)據(jù)質(zhì)量的重要措施
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度快餐外賣平臺(tái)店鋪?zhàn)赓U與運(yùn)營(yíng)管理合同
- 二零二五年度個(gè)人房屋裝修貸款融資服務(wù)合同
- 二零二五年度智能化資產(chǎn)抵押合同協(xié)議書含數(shù)據(jù)共享?xiàng)l款
- 2025年精準(zhǔn)備考試題及答案一覽
- 2025年度附生效條件贈(zèng)與知識(shí)產(chǎn)權(quán)合同
- 2025年度金融科技公司首席技術(shù)官聘用協(xié)議書
- 二零二五年度體育賽事合同管理制度與執(zhí)行規(guī)范
- 2025年度環(huán)保產(chǎn)業(yè)用地土地使用權(quán)互換合同
- 職業(yè)素養(yǎng)與茶藝師考試試題及答案
- 二零二五年度個(gè)人技術(shù)合作協(xié)議書:智能翻譯技術(shù)合作開發(fā)合同
- 《影視鑒賞(第二版)》課件2-0故事片引子
- 青島版科學(xué)一年級(jí)下冊(cè)《塑料》教學(xué)設(shè)計(jì)
- 城市管理綜合執(zhí)法局城管執(zhí)法與執(zhí)法程序PPT模板
- 專利文件撰寫殷紅梅課件
- 鉛酸蓄電池維護(hù)規(guī)程
- 中鐵集團(tuán)工程有限公司人力資源績(jī)效考核暫行辦法
- 部編版七年級(jí)語文下學(xué)期木蘭詩(shī)對(duì)比閱讀練習(xí)題(含解析答案)
- 海上風(fēng)電場(chǎng)+風(fēng)機(jī)基礎(chǔ)介紹
- 耐堿玻纖網(wǎng)格布檢測(cè)報(bào)告
- 小兒頭皮靜脈穿刺技術(shù)操作評(píng)分標(biāo)準(zhǔn).docx
- GB T 20219-2015 絕熱用噴涂硬質(zhì)聚氨酯泡沫塑料(高清版)
評(píng)論
0/150
提交評(píng)論