2024年AI代碼平臺(tái)及產(chǎn)品發(fā)展簡(jiǎn)報(bào)_第1頁(yè)
2024年AI代碼平臺(tái)及產(chǎn)品發(fā)展簡(jiǎn)報(bào)_第2頁(yè)
2024年AI代碼平臺(tái)及產(chǎn)品發(fā)展簡(jiǎn)報(bào)_第3頁(yè)
2024年AI代碼平臺(tái)及產(chǎn)品發(fā)展簡(jiǎn)報(bào)_第4頁(yè)
2024年AI代碼平臺(tái)及產(chǎn)品發(fā)展簡(jiǎn)報(bào)_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

前言:生成式AI爆發(fā)后迎來(lái)商業(yè)加速,代碼領(lǐng)域迎來(lái)創(chuàng)新及變革契機(jī)隨著人工智能技術(shù)的飛速發(fā)展,大模型(包括開(kāi)源模型及閉源模型)的數(shù)量和能力都在顯著增長(zhǎng),為生成式AI應(yīng)用的爆發(fā)提供了堅(jiān)實(shí)的技術(shù)基礎(chǔ)。代碼及開(kāi)發(fā)領(lǐng)域具備廣泛的高質(zhì)量數(shù)據(jù)、豐富的應(yīng)用場(chǎng)景及多樣的用戶人群,因此生成式AI為代表的技術(shù)提供了生產(chǎn)力的創(chuàng)新空間和發(fā)展?jié)摿?。Llama370b

InstructQwen1.5-32B-ChatGPT-4Claude1GPT-3.5

TurboGPT-4Claude2GPT-3.5

TurboGPT-4GPT-4Gemini

ProClaude3

OpusGPT-4

TurboClaude3

SonnetClaude3

HaikuMistral

LargeVicuna

33BLlama-2-70b-chatLlama-2-13b-chatMPT-30B-chatVicuna-13B-v1.5Llama-2-7b-chatWizardLM

70bYi-34BSOLAR-10.7B-Instruct-v1.0OpenHermes-2.5-Mistral-7BDeepSeek-LLM-67B-ChatMistralMediumMixtralInstruct

8x7BOpenChat-3.5Gemma-1.1-7B-itDBRX

InstructStarling-LM-7B-betaLlama38b

Instruct105011001150120012502023.32023.52023.72023.92023.11 2024.12024.32024.5閉源模型開(kāi)源模型Arena

ELO大模型的數(shù)量及能力均不斷上升,AIGC應(yīng)用爆發(fā)具有技術(shù)基礎(chǔ)數(shù)據(jù)截止2024年5月模型技術(shù)的蓬勃發(fā)展為“AI+”領(lǐng)域/場(chǎng)景/行業(yè)的發(fā)展提供堅(jiān)實(shí)的基礎(chǔ)及發(fā)展Zephy-orpo-141b

創(chuàng)新的土壤代碼結(jié)合AI迎來(lái)創(chuàng)新機(jī)會(huì)開(kāi)發(fā)領(lǐng)域亟待生產(chǎn)力升級(jí)高質(zhì)量的數(shù)據(jù)通用性的需求廣泛的使用人群……目

錄Part

01機(jī)遇:AIGC引發(fā)的數(shù)字生產(chǎn)變化Part

02 價(jià)值:重新構(gòu)建代碼開(kāi)發(fā)的應(yīng)用范式Part

04展望:人工智能普惠時(shí)代的期待Part

03落地:智能時(shí)代AI+代碼的先行者需求破局:“AI+”的工作方式成為首選,釋放代碼工程的生產(chǎn)力編寫(xiě)代碼,理解代碼及互聯(lián)網(wǎng)搜索、調(diào)試、寫(xiě)注釋、寫(xiě)測(cè)試等工作是開(kāi)發(fā)者的高頻工作需求,因此解決圍繞代碼解決問(wèn)題實(shí)際上解決開(kāi)發(fā)者最高頻剛需問(wèn)題,隨著生成式AI技術(shù)能力提升,更多的開(kāi)發(fā)者都在嘗試使用AI解決問(wèn)題。79%47%31%30%29%21%16%12%9%9%開(kāi)發(fā)者最耗時(shí)的活動(dòng)編寫(xiě)代碼理解代碼互聯(lián)網(wǎng)搜索調(diào)試編寫(xiě)代碼注釋或代碼文件編寫(xiě)測(cè)試執(zhí)行代碼審查重構(gòu)在代碼庫(kù)中搜索代碼段了解最近的代碼更改編寫(xiě)提交消息 6%在CLI中執(zhí)行操作 6%JetBrains,StateofDeveloperEcosystem

Report(2023)開(kāi)發(fā)者使用AI編程工具的比例92%70%開(kāi)發(fā)者認(rèn)可AI的比例57%53%51%41%提高編程技能變得更有效率創(chuàng)造性工作防止倦怠開(kāi)發(fā)者使用AI代碼生成可提升工作效果開(kāi)發(fā)者會(huì)選擇嘗試AI編碼提升自身的效率及技能水平GitHub(2023)

代碼及開(kāi)發(fā)工作不僅僅是“腦力活”,也是“體力活”編寫(xiě) 修改 注釋 測(cè)試 ……“AI+代碼”的技術(shù)歷程簡(jiǎn)述技術(shù)升級(jí):大模型賦予了“AI+代碼”更多的創(chuàng)新空間AI生成代碼的應(yīng)用思路可以追溯到AI技術(shù)應(yīng)用初期,但往往受限于當(dāng)時(shí)的AI技術(shù)所體現(xiàn)的智能化水平。大型語(yǔ)言模型(LLMs)的出現(xiàn)為深度學(xué)習(xí)帶來(lái)了新的范式,尤其是針對(duì)語(yǔ)言類型的數(shù)字內(nèi)容生成能力提升,因此也為“AI+代碼”

進(jìn)一步發(fā)展帶來(lái)了更多創(chuàng)新空間。基于知識(shí)工程/專家系統(tǒng)基于統(tǒng)計(jì)學(xué)習(xí)/數(shù)據(jù)驅(qū)動(dòng)基于深度學(xué)習(xí)(中小模型)大模型為代碼生成帶來(lái)了“質(zhì)”的改變LLMs給“AI+代碼”

提供了一個(gè)突破性技術(shù)方案:LLM帶來(lái)了深度學(xué)習(xí)新范式,思維鏈和強(qiáng)大的自然語(yǔ)言理解能力,從而理解程序員的需求和意圖,自動(dòng)生成符合規(guī)范或者采納率更高的代碼片段或完整功能模塊,從而讓創(chuàng)建廣泛應(yīng)用且實(shí)用的AI代碼平臺(tái)成為可能。并且推動(dòng)了開(kāi)發(fā)者的編程習(xí)慣和開(kāi)發(fā)方式發(fā)生轉(zhuǎn)變,雖然工作重心依然在代碼編寫(xiě)上,但與AI的互動(dòng)逐漸增多,編程習(xí)慣和開(kāi)發(fā)方式開(kāi)始發(fā)生轉(zhuǎn)變。未來(lái),開(kāi)發(fā)者可能開(kāi)始從代碼的具體實(shí)現(xiàn)轉(zhuǎn)向更高層次的任務(wù)管理和決策。長(zhǎng)期以來(lái),研究者們一直利用當(dāng)下人工智能能力結(jié)合代碼開(kāi)發(fā)工具,實(shí)現(xiàn)AI技術(shù)在開(kāi)發(fā)領(lǐng)域的實(shí)踐。但受限于AI技術(shù)的發(fā)展水平,AI編程的實(shí)踐往往面臨智能化水平不高、編碼效率低下等問(wèn)題。這些輔助編程工具基于預(yù)定義規(guī)則和模式,幫助程序員快速生成常見(jiàn)代碼結(jié)構(gòu)。過(guò)往的工作主要集中在代碼生成及搜索的特定能力,更加注重算法設(shè)計(jì)和訓(xùn)練策略。事實(shí)證明,增強(qiáng)模型固有能力是推動(dòng)智能代理進(jìn)一步發(fā)展的關(guān)鍵因素。因此大模型對(duì)于泛語(yǔ)言形式的數(shù)字內(nèi)容智能化水平的提升,成為推動(dòng)AI輔助代碼生成的關(guān)鍵。Copilot模式/IDE插件作為主導(dǎo):AI通過(guò)自動(dòng)補(bǔ)全代碼、生成代碼片段等方式幫助開(kāi)發(fā)者完成繁瑣的編程任務(wù)。開(kāi)發(fā)者依然在整個(gè)開(kāi)發(fā)流程中起主導(dǎo)作用,AI的角色主要是提高編程效率和降低重復(fù)勞動(dòng)。Agent模式逐步被采納,與Copilot模式/IDE插件共同組成豐富的產(chǎn)品功能:AI不僅僅是代碼生成的助手,還能夠自主處理一些開(kāi)發(fā)任務(wù)。AI在這一階段表現(xiàn)出更高的自主性,可以減少人工干預(yù)。開(kāi)發(fā)者的角色從編寫(xiě)代碼逐步向監(jiān)督和管理AI輸出轉(zhuǎn)變。AI的作用從簡(jiǎn)單的助手?jǐn)U展到可以獨(dú)立完成特定任務(wù)的合作者。產(chǎn)品形態(tài)的改變產(chǎn)品紅利:圍繞開(kāi)發(fā)項(xiàng)目的全環(huán)節(jié)和需求進(jìn)行展開(kāi)應(yīng)用場(chǎng)景金融

泛互聯(lián)網(wǎng)

運(yùn)營(yíng)商

國(guó)央企

科技服務(wù)商

汽車(chē)

零售

工業(yè)企業(yè)級(jí)開(kāi)發(fā)能力DevOps(需求分析、代碼編寫(xiě)、調(diào)優(yōu)對(duì)齊、數(shù)據(jù)回流)企業(yè)看板 知識(shí)增強(qiáng) 插件管理用戶管理 安全保護(hù) 多Agent管理API管理 訓(xùn)練調(diào)優(yōu) 成果共享云服務(wù)/終端部署算力異構(gòu)調(diào)度數(shù)據(jù)存儲(chǔ)、算力、網(wǎng)絡(luò)等產(chǎn)品支撐網(wǎng)絡(luò)調(diào)度數(shù)據(jù)存儲(chǔ)/管理產(chǎn)品核心能力代碼修復(fù)代碼注釋智能推薦代碼翻譯代碼解釋智能問(wèn)答代碼生成知識(shí)管理注釋生成單元測(cè)試風(fēng)格檢查用戶體驗(yàn)服務(wù)生態(tài)自然交互自動(dòng)/手動(dòng)功能喚醒自定義風(fēng)格學(xué)習(xí)邏輯理解多語(yǔ)言插件管理Agent開(kāi)發(fā)低代碼/高代碼多模型管理多產(chǎn)品集成……AI代碼平臺(tái)的產(chǎn)品功能架構(gòu)圖示例廣義的AI代碼平除了核心的產(chǎn)品功能外包括企業(yè)級(jí)開(kāi)發(fā)能力(和個(gè)人開(kāi)發(fā)能力做對(duì)應(yīng),強(qiáng)調(diào)其系統(tǒng)性的開(kāi)發(fā)能力),另外包括用戶體驗(yàn)的設(shè)計(jì),服務(wù)生態(tài)的建設(shè),另外包括與算力、數(shù)據(jù)存儲(chǔ)、環(huán)境部署的適配。狹義的AI代碼平臺(tái)往往指代的是核心產(chǎn)品的功能,也會(huì)被稱為AI編程助手,主要指在代碼開(kāi)發(fā)過(guò)程中輔助編寫(xiě)代碼的功能。產(chǎn)品功能類型主要類型可以概括如下:生成與搜索修改與重構(gòu)注釋與解釋審查與測(cè)試AI代碼平臺(tái)的功能?chē)@具體的開(kāi)發(fā)環(huán)節(jié)及場(chǎng)景展開(kāi),AI技術(shù)是代碼平臺(tái)的能力,當(dāng)具體的產(chǎn)品功能服務(wù)依然圍繞項(xiàng)目提質(zhì)增效展開(kāi)。功能簡(jiǎn)析:技術(shù)能力和交互模式的融合升級(jí)產(chǎn)品功能簡(jiǎn)析-解決貫穿開(kāi)發(fā)環(huán)節(jié)的典型問(wèn)題(1/3)提高了代碼的質(zhì)量和穩(wěn)定性:通過(guò)實(shí)時(shí)代碼生成和補(bǔ)全,AI代碼平臺(tái)減少了開(kāi)發(fā)者在編寫(xiě)代碼時(shí)的手動(dòng)輸入,使得他們能夠更快地實(shí)現(xiàn)功能。這種自動(dòng)化不僅提高了編碼效率,還減少了因手動(dòng)輸入而導(dǎo)致的錯(cuò)誤。減少重復(fù)性的瑣碎工作:使他們能夠?qū)W⒂诟刑魬?zhàn)性和創(chuàng)造性的任務(wù)。AI代碼平臺(tái)通過(guò)智能搜索和代碼預(yù)測(cè)功能,幫助開(kāi)發(fā)者快速找到所需的信息和解決方案,從而節(jié)省了大量搜索和調(diào)試的時(shí)間。這使得開(kāi)發(fā)者可以將更多的精力投入到創(chuàng)新和優(yōu)化代碼結(jié)構(gòu)上,推動(dòng)項(xiàng)目的創(chuàng)新和發(fā)展。更自然的交付體驗(yàn):“對(duì)話式”的調(diào)試方式,使得開(kāi)發(fā)者能夠以更直觀和自然的方式與代碼進(jìn)行“對(duì)話”,從而更迅速地理解和解決問(wèn)題。這種及時(shí)的反饋機(jī)制,尤其在軟件開(kāi)發(fā)的早期階段,能夠及時(shí)修復(fù)錯(cuò)誤,避免后續(xù)的連鎖反應(yīng),從而提升代碼的整體質(zhì)量和穩(wěn)定性。優(yōu)化和升級(jí)變得更加快速和高效:智能化的重構(gòu)不僅減少了人工重構(gòu)的工作量,還降低了重構(gòu)過(guò)程中引入錯(cuò)誤的風(fēng)險(xiǎn)。自動(dòng)化重構(gòu)的實(shí)現(xiàn),使得代碼結(jié)構(gòu)的優(yōu)化和升級(jí)變得更加快速和高效。提升代碼可讀性:幫助開(kāi)發(fā)者更快地理解和掌握復(fù)雜和陌生的代碼。這種能力對(duì)于處理大型項(xiàng)目或維護(hù)遺留系統(tǒng)尤為重要,因?yàn)樗鼫p少了開(kāi)發(fā)者在理解代碼邏輯上的時(shí)間消耗,從而提高了開(kāi)發(fā)效率。幫助開(kāi)發(fā)者理解軟件程序的結(jié)果和語(yǔ)義:確保產(chǎn)出的代碼符合企業(yè)的設(shè)計(jì)原則。這一功能對(duì)于保證軟件質(zhì)量和一致性至關(guān)重要,因?yàn)樗鼫p少了因誤解設(shè)計(jì)意圖而導(dǎo)致的錯(cuò)誤和返工。優(yōu)化現(xiàn)有代碼的可移植性:提高了代碼的適應(yīng)性和可維護(hù)性,還為企業(yè)節(jié)省了時(shí)間和資源,因?yàn)榇a轉(zhuǎn)換通常比從頭開(kāi)始編寫(xiě)新程序更加高效。提升單元測(cè)試的效率:AI代碼平臺(tái)通過(guò)自動(dòng)化功能,極大地提高了單元測(cè)試環(huán)節(jié)的效率。它能夠輔助開(kāi)發(fā)人員編寫(xiě)更多的測(cè)試用例,確保軟件程序的有效運(yùn)行。這種自動(dòng)化不僅提高了測(cè)試的覆蓋率和質(zhì)量,還減少了開(kāi)發(fā)人員在編寫(xiě)和維護(hù)單元測(cè)試上的時(shí)間和精力。這使得開(kāi)發(fā)人員可以將更多的注意力投入到軟件的設(shè)計(jì)和創(chuàng)新上,從而提高軟件的整體質(zhì)量和用戶體驗(yàn)。人工驅(qū)動(dòng)轉(zhuǎn)為數(shù)據(jù)驅(qū)動(dòng):通過(guò)收集和分析大量的代碼數(shù)據(jù),AI代碼平臺(tái)能夠提供更加精準(zhǔn)的測(cè)試建議和代碼優(yōu)化方案。這種數(shù)據(jù)驅(qū)動(dòng)的方法,不僅提高了開(kāi)發(fā)效率,還降低了軟件缺陷的風(fēng)險(xiǎn)。生成與搜索修改與重構(gòu)注釋與解釋審查與測(cè)試代碼補(bǔ)全/生成智能搜索……代碼修復(fù)代碼重構(gòu)……添加注釋代碼解釋代碼翻譯……代碼審查性能檢查單元測(cè)試……產(chǎn)品場(chǎng)景及功能類型示例AI代碼開(kāi)發(fā)平臺(tái)的產(chǎn)品價(jià)值功能簡(jiǎn)析:技術(shù)能力和交互模式的融合升級(jí)產(chǎn)品功能簡(jiǎn)析-解決貫穿開(kāi)發(fā)環(huán)節(jié)的典型問(wèn)題(2/3)ⅹ

手動(dòng)記憶:程序員需要記住大量的函數(shù)、方法和庫(kù)的名稱及其參數(shù),這在面對(duì)龐大的代碼庫(kù)或復(fù)雜的編程語(yǔ)言時(shí)尤為困難。ⅹ

信息過(guò)載:在沒(méi)有智能搜索的情況下,程序員可能需要在大量的文檔、論壇和代碼庫(kù)中手動(dòng)搜索解決方案,這既耗時(shí)又容易出錯(cuò)。ⅹ

定位問(wèn)題:在沒(méi)有智能輔助的情況下,程序員需要手動(dòng)分析和定位代碼中的錯(cuò)誤,這可能非常耗時(shí),尤其是在大型項(xiàng)目中。ⅹ

識(shí)別重構(gòu)機(jī)會(huì):確定哪些部分的代碼需要重構(gòu),以及如何重構(gòu),通常需要深厚的經(jīng)驗(yàn)和對(duì)代碼結(jié)構(gòu)的深入理解。ⅹ

時(shí)間消耗:編寫(xiě)清晰的注釋需要額外的時(shí)間,程序員可能因?yàn)轫?xiàng)目進(jìn)度壓力而忽視這一步驟。ⅹ

理解差異:不同程序員對(duì)同一代碼的理解可能存在差異,這可能導(dǎo)致溝通上的障礙。ⅹ

語(yǔ)義保留:代碼翻譯不僅僅是文字的轉(zhuǎn)換,更重要的是保留代碼的語(yǔ)義和邏輯,這在自動(dòng)翻譯中很難實(shí)現(xiàn)。ⅹ

主觀性:代碼審查很大程度上依賴于審查者的個(gè)人經(jīng)驗(yàn)和偏好,這可能導(dǎo)致不一致的審查標(biāo)準(zhǔn)和結(jié)果。ⅹ

難以預(yù)測(cè):在沒(méi)有工具輔助的情況下,預(yù)測(cè)代碼的性能表現(xiàn)可能非常困難,尤其是在復(fù)雜的系統(tǒng)或多線程環(huán)境中。ⅹ

測(cè)試成本:編寫(xiě)單元測(cè)試需要額外的時(shí)間和努力,隨著代碼的更新和迭代,維護(hù)相應(yīng)的單元測(cè)試也變得復(fù)雜和耗時(shí)。代碼補(bǔ)全:在用戶輸入按鍵后自動(dòng)提供后續(xù)代碼的建議。用戶可以將其當(dāng)作參考,也可以采納其為正式代碼。智能搜索:可將對(duì)話問(wèn)答功能與

IDE

進(jìn)行了集成打通,其中的聊天互動(dòng)界面可以讓開(kāi)發(fā)者通過(guò)自然語(yǔ)言來(lái)做提示詞,探索和生成大段新代碼,甚至是整個(gè)程序。并支持一鍵插入到編輯器中。代碼修復(fù):針對(duì)編碼過(guò)程中出現(xiàn)的代碼問(wèn)題,可以一鍵給出修復(fù)建議,助力開(kāi)發(fā)者快速解決代碼問(wèn)題。代碼重構(gòu):在不改變軟件功能的前提下,主動(dòng)提出建議給出選擇,對(duì)代碼進(jìn)行結(jié)構(gòu)上的調(diào)整。添加注釋:支持多種編程語(yǔ)言生成注釋,只要選中代碼段落,用按鍵選擇生成注釋,AI

編程助手就能一鍵生成方法注釋及行內(nèi)注釋。代碼解釋:支持開(kāi)發(fā)者將代碼片段粘貼到聊天界面,并獲得自然語(yǔ)言解釋,還可以在

IDE

環(huán)境中突出顯示需要解釋的代碼片段。代碼翻譯:將代碼從一種編程語(yǔ)言翻譯成另外一種編程語(yǔ)言,節(jié)省相應(yīng)的時(shí)間。代碼審查:自動(dòng)審查用戶代碼,支持對(duì)代碼進(jìn)行函數(shù)級(jí)檢查功能,審查代碼的可讀性、可維護(hù)性、一致性以及是否遵循編碼規(guī)范。性能檢查:支持對(duì)代碼進(jìn)行函數(shù)級(jí)檢查功能,可以對(duì)大篇幅代碼做檢測(cè),檢測(cè)代碼性能,評(píng)估代碼在運(yùn)行時(shí)的性能,如處理速度、內(nèi)存使用等。單元測(cè)試:根據(jù)自然語(yǔ)言提示或按鍵選擇,為指定范圍內(nèi)的代碼自動(dòng)生成單元測(cè)試。生成與搜索修改與重構(gòu)注釋與解釋審查與測(cè)試AI代碼開(kāi)發(fā)平臺(tái)常見(jiàn)產(chǎn)品功能特點(diǎn)未使用AI代碼可能面對(duì)的問(wèn)題功能簡(jiǎn)析:技術(shù)能力和交互模式的融合升級(jí)產(chǎn)品功能簡(jiǎn)析-解決貫穿開(kāi)發(fā)環(huán)節(jié)的典型問(wèn)題(3/3)生成式AI技術(shù)的出現(xiàn),除了可以極大地支撐代碼生成、重構(gòu)、補(bǔ)全等非常典型的開(kāi)發(fā)工作。此外于完整的AI技術(shù)開(kāi)發(fā)平臺(tái)及產(chǎn)品也應(yīng)該提供相應(yīng)的審查及測(cè)試類產(chǎn)品技術(shù)支持,以保證軟件開(kāi)發(fā)全鏈路功能的覆蓋。80%17%在項(xiàng)目中有單元測(cè)試的受訪者不自己編寫(xiě)測(cè)試。的受訪者表示測(cè)試在其軟件開(kāi)發(fā)項(xiàng)目中發(fā)揮著不可或缺的作用。58%參與測(cè)試活動(dòng)的受訪者開(kāi)發(fā)自動(dòng)化測(cè)試。46%的受訪者將測(cè)試用例設(shè)計(jì)作為測(cè)試過(guò)程的一部分。47%34%32%1%15%63%其他無(wú)3%12%19%17%24%34%38%48%時(shí)間限制工作量大團(tuán)隊(duì)/組織中的代碼質(zhì)量準(zhǔn)則不一致員工太少缺少先進(jìn)的工具工具過(guò)于昂貴我沒(méi)有此類問(wèn)題其他71%我運(yùn)行手動(dòng)代碼審查我會(huì)時(shí)常運(yùn)行自動(dòng)代碼分析/靜態(tài)分析我在每次提交時(shí)運(yùn)行自動(dòng)代碼分析/靜態(tài)分析2%其他問(wèn)題:您使用那種(哪些)工具進(jìn)行自動(dòng)化代碼分析/靜態(tài)分析?問(wèn)題:您的項(xiàng)目/組織保持高質(zhì)量代碼的最大阻礙是什么?JetBrains,StateofDeveloperEcosystem

Report(2023)單元 集成 端到端 性能問(wèn)題:您的項(xiàng)目中有什么類型的測(cè)試?圖:測(cè)試類工作在代碼開(kāi)發(fā)中的關(guān)鍵需求JetBrains,StateofDeveloperEcosystem

Report(2023)圖:審查類工作在代碼開(kāi)發(fā)中的時(shí)間精力消耗33% 33%開(kāi)發(fā)者使用AI助手的最常見(jiàn)方式之一是使用自然語(yǔ)言詢問(wèn)軟件開(kāi)發(fā)相關(guān)的一般問(wèn)題功能簡(jiǎn)析:技術(shù)能力和交互模式的融合升級(jí)交互模式的創(chuàng)新-基于問(wèn)答與上下文補(bǔ)全的需求問(wèn)答式交互(也可理解為問(wèn)答式的交付):AI代碼生成通過(guò)整合代碼交互模型與聊天界面,實(shí)現(xiàn)了用戶與AI模型間的自然語(yǔ)言交流,用戶能提出跟進(jìn)問(wèn)題,模型則基于先前對(duì)話及代碼上下文提供相關(guān)回應(yīng),確保交互的連貫性。同樣,生成式AI的技術(shù)為該項(xiàng)功能提供了更好的完成度。補(bǔ)全與問(wèn)答代碼采納分布問(wèn)答功能使用分布73%27%補(bǔ)全采納代碼行數(shù)問(wèn)答采納代碼行數(shù)76%4%10%5%

1%4%研發(fā)問(wèn)答代碼優(yōu)化解釋代碼生成注釋生成單測(cè)錯(cuò)誤排查26%33%17%24%24%37%24%15%19%26%22%33%18%26%21%36%14%27%22%37%12%21%24%42%11%21%19%48%9%17%21%53%9%16%19%55%9%20%23%47%9%17%20%54%6%12%20%62%相當(dāng)頻繁 有時(shí) 極少 從不使用自然語(yǔ)言進(jìn)行問(wèn)答生成代碼生成代碼注釋或代碼文檔解釋bug并提供修正解釋代碼生成測(cè)試使用自然語(yǔ)言查詢搜索代碼段執(zhí)行代碼審查總結(jié)近期代碼修改以了解代碼內(nèi)容重構(gòu)代碼通過(guò)自然語(yǔ)言描述生成CLI命令生成提交信息問(wèn)題:您使用以下現(xiàn)有AI助手功能進(jìn)行編碼的頻率如何?JetBrains,StateofDeveloperEcosystem

Report(2023)通義靈碼根據(jù)線上調(diào)研數(shù)據(jù),《通義靈碼,軟件開(kāi)發(fā)新范式》目

錄Part

01機(jī)遇:AIGC引發(fā)的數(shù)字生產(chǎn)變化Part

02價(jià)值:重新構(gòu)建代碼開(kāi)發(fā)的應(yīng)用范式Part

04展望:人工智能普惠時(shí)代的期待Part

03落地:智能時(shí)代AI+代碼的先行者顯性價(jià)值:AI代碼平臺(tái)產(chǎn)品競(jìng)爭(zhēng)力維度分析評(píng)價(jià)維度模型效果交互體驗(yàn)開(kāi)發(fā)支持大模型帶來(lái)的核心突破是生成代碼的質(zhì)量,提升了其有效性(生成和效果的提升),其次是帶來(lái)了更準(zhǔn)確的代碼理解、重構(gòu)、智能搜索等一系列功能實(shí)質(zhì)效果的提升,因此模型的效果非常值得關(guān)注,在實(shí)際工作中,其代碼的采納率既是明確的體驗(yàn)感受,可以作為通用型的評(píng)價(jià)標(biāo)準(zhǔn)。AI代碼開(kāi)發(fā)平臺(tái)直接向用戶提供的仍然是產(chǎn)品形態(tài),因此產(chǎn)品的UI設(shè)計(jì)、用戶交互方式,甚至是與他軟件的兼容性,都會(huì)直接影響用戶的“爽”感,也是在日益激烈的產(chǎn)品競(jìng)爭(zhēng)中值得關(guān)注的維度。代碼的編寫(xiě)是整個(gè)軟件開(kāi)發(fā)過(guò)程中的一部分,軟件開(kāi)發(fā)則是系統(tǒng)化、復(fù)雜性的工程,產(chǎn)品的效果仍然要與整個(gè)工程效能有關(guān)。環(huán)境部署方式、數(shù)據(jù)處理效率,通信延時(shí)等具體產(chǎn)品設(shè)計(jì)細(xì)節(jié)最終都會(huì)影響實(shí)際效果。廣義的評(píng)級(jí)維度代碼采納率產(chǎn)品體驗(yàn)滿意度開(kāi)發(fā)效能提升率隱形價(jià)值:重構(gòu)智能時(shí)代的開(kāi)發(fā)模式需求階段編碼開(kāi)發(fā)集成和測(cè)試發(fā)布部署咨詢和學(xué)習(xí)效能管理需求:信息轉(zhuǎn)需求輔助需求:相關(guān)性需求整合需求:需求澄清可視化輔助設(shè)計(jì):產(chǎn)品文檔生成輔助計(jì)劃:排期/計(jì)劃輔助協(xié)同:需求拆分輔助效率:代碼生成/補(bǔ)全效率:代碼理解和建議效率:SDK/API使用建議質(zhì)量:代碼問(wèn)題和修復(fù)建議質(zhì)量:?jiǎn)螠y(cè)生成質(zhì)量:CR

輔助(掃描、內(nèi)容生成)流程編排輔助掃描和修復(fù)建議測(cè)試用例生成輔助缺陷創(chuàng)建輔助問(wèn)題排查和修復(fù)輔助變更配置輔助應(yīng)用編排輔助發(fā)布日志生成代碼/代碼庫(kù)理解跨文檔知識(shí)查詢技術(shù)文檔問(wèn)答問(wèn)題咨詢問(wèn)答平臺(tái)使用輔助效能分析報(bào)告生成決策建議輔助異常告知和建議組織效能分析決策一線工作人員高效高質(zhì)量完成交付,將需求發(fā)布上線管理者問(wèn)題咨詢學(xué)習(xí)提升需求收集需求整合設(shè)計(jì)澄清需求排期發(fā)布上線測(cè)試與驗(yàn)收集成構(gòu)建問(wèn)題排查編碼與合并AI代碼平臺(tái)可應(yīng)用的場(chǎng)景示例開(kāi)發(fā)階段從需求協(xié)作到軟件發(fā)布,完成整個(gè)體系的智能化升級(jí),賦能軟件開(kāi)發(fā)全生命周期AI代碼平臺(tái)及產(chǎn)品提供的功能可以在需求階段、編碼階段、集成測(cè)試階段、發(fā)布部署階段、咨詢學(xué)習(xí)階段、效能管理階段等各個(gè)階段實(shí)現(xiàn)智能化升級(jí),意味著AI代碼平臺(tái)能力不僅僅局限在某一點(diǎn),而是逐步的向橫向擴(kuò)展,會(huì)貫穿到

DevOps

的整個(gè)鏈路,為整個(gè)軟件工程開(kāi)發(fā)提供新的范式思路。圖:AI代碼平臺(tái)在整個(gè)開(kāi)發(fā)周期應(yīng)用場(chǎng)景圖隱形價(jià)值:重構(gòu)智能時(shí)代的開(kāi)發(fā)模式效能指標(biāo)指標(biāo)含義指標(biāo)對(duì)應(yīng)的計(jì)算思路響應(yīng)速度能夠快速響應(yīng)新的需求或變更請(qǐng)求代碼提交頻率:衡量團(tuán)隊(duì)提交代碼的頻率公式:代碼提交次數(shù)

/

時(shí)間單位代碼審查速度:衡量團(tuán)隊(duì)審查代碼的速度公式:代碼審查完成時(shí)間

/

代碼提交次數(shù)交付速度能夠在較短時(shí)間內(nèi)將需求轉(zhuǎn)化為可上線的產(chǎn)品或功能構(gòu)建成功率:衡量團(tuán)隊(duì)構(gòu)建代碼的成功率公式:成功構(gòu)建次數(shù)

/

總構(gòu)建次數(shù)測(cè)試覆蓋率:衡量團(tuán)隊(duì)測(cè)試代碼的覆蓋率公式:測(cè)試通過(guò)的代碼行數(shù)

/

總代碼行數(shù))部署頻率:衡量團(tuán)隊(duì)部署代碼的頻率

公式:部署次數(shù)

/

時(shí)間單位持續(xù)改進(jìn)隨著時(shí)間推移,團(tuán)隊(duì)能夠不斷提高交付速度,實(shí)現(xiàn)"越來(lái)越快"的目標(biāo)代碼提交頻率(同上)構(gòu)建成功率(同上)測(cè)試覆蓋率(同上)質(zhì)量保證追求速度的同時(shí),確保交付的產(chǎn)品或功能質(zhì)量可靠構(gòu)建成功率(同上)測(cè)試覆蓋率(同上)問(wèn)題解決能力快速發(fā)現(xiàn)問(wèn)題、定位問(wèn)題和修復(fù)問(wèn)題的能力平均故障恢復(fù)時(shí)間:衡量團(tuán)隊(duì)恢復(fù)故障的速度公式:故障恢復(fù)時(shí)間

/

故障次數(shù)平均故障間隔時(shí)間:衡量團(tuán)隊(duì)故障發(fā)生的頻率公式:故障間隔時(shí)間

/

故障次數(shù)適應(yīng)性靈活應(yīng)對(duì)不同類型的需求和技術(shù)挑戰(zhàn)代碼提交頻率(同上)代碼審查速度(同上)大模型帶來(lái)的價(jià)值提升效率編程速度提高專注核心創(chuàng)新自動(dòng)化繁瑣任務(wù),專注研究和創(chuàng)新降低技術(shù)門(mén)檻為非專業(yè)程序員提供支持追求理想工程效能快速響應(yīng)業(yè)務(wù)需求持續(xù)提升交付速度隱性需求:代碼數(shù)字知識(shí)資產(chǎn)的管理與傳承、創(chuàng)新能力提升、跨領(lǐng)域協(xié)作等提升“工程效能”,快速響應(yīng)需求并持續(xù)提升交付速度生成式AI的大模型技術(shù)提升了代碼生成的效率、質(zhì)量,從而讓團(tuán)隊(duì)更關(guān)注創(chuàng)新,并且降低了更多業(yè)務(wù)人員的參與開(kāi)發(fā)的難度,從而提升整體工程效能。表:工程效能的指標(biāo)拆解顯性需求:提高開(kāi)發(fā)效率、代碼質(zhì)量改進(jìn)、自動(dòng)化測(cè)試等隱形價(jià)值:重構(gòu)智能時(shí)代的開(kāi)發(fā)模式研發(fā)知識(shí)傳遞形態(tài)的改變,個(gè)人/企業(yè)軟件開(kāi)發(fā)工作知識(shí)資產(chǎn)的建立隨著企業(yè)研發(fā)工作開(kāi)展,內(nèi)部有很多優(yōu)質(zhì)的代碼、框架、規(guī)范需要逐步積累,但往往這些數(shù)據(jù)的價(jià)值卻很難得到釋放,對(duì)于開(kāi)發(fā)者而言的使用成本很高。大模型時(shí)代的AI代碼開(kāi)發(fā)平臺(tái)則可以借助大模型不斷完善積累企業(yè)的代碼數(shù)字資產(chǎn),形成正向循環(huán)。軟件研發(fā)全生命周期智能中心DevOps工具鏈模型代碼/文檔資產(chǎn)R企業(yè)數(shù)字資產(chǎn)用戶大模型文檔源代碼文件更新的源代碼文件用戶大模型文檔源代碼文件更新的源代碼文件提出編程需求檢索相關(guān)文檔獲取源代碼文件處理并生成建議更新源代碼文件返回更新后的代碼形成正向循環(huán),開(kāi)發(fā)者在開(kāi)發(fā)過(guò)程中享受到“資產(chǎn)紅利”隱形價(jià)值:重構(gòu)智能時(shí)代的開(kāi)發(fā)模式提高整體研發(fā)效率,降低開(kāi)發(fā)工程的復(fù)雜度,賦予更多企業(yè)智能化的機(jī)會(huì)軟件本質(zhì)的復(fù)雜性是現(xiàn)在軟件系統(tǒng)中無(wú)法

規(guī)避的內(nèi)在特性,比如復(fù)雜度、一致性、可變性和不可見(jiàn)性——《人月神話》的作者。可以看出軟件工程是大規(guī)模的集體智力的協(xié)作活動(dòng),本身具有極強(qiáng)的復(fù)雜性。在大模型時(shí)代,當(dāng)

AI

逐步地去替代事務(wù)性工作,并且形成了

AI

為主、人為輔的編程模式的時(shí)候,個(gè)體和寫(xiě)作中的效率豎井就可以逐步打破。提升整體的協(xié)同研發(fā)效果及效率。研發(fā)效率人員技能成本控制協(xié)同消耗人員技能是效能的基石,也是效能破局點(diǎn)能力提升

彌補(bǔ)能力短板成本是效能優(yōu)化的目的,同時(shí)也是約束條件工具賦能

事務(wù)性工作替代軟件架構(gòu)和組織復(fù)雜度正相關(guān),并決定協(xié)同消耗的大小流程規(guī)范

打造超級(jí)個(gè)體協(xié)作效率個(gè)體效率“需求來(lái)了上線快,而且隨著時(shí)間越來(lái)越快”工程能力和工程效能的雙效提升提升方向“工程效能”是本質(zhì),快速響應(yīng)需求并持續(xù)提升交付速度是關(guān)鍵技術(shù)支撐:基于項(xiàng)目開(kāi)發(fā)“Know-How”的“AI+”技術(shù)RAG:致力于解決生成式AI“幻覺(jué)”,高效提升代碼準(zhǔn)確性RAG技術(shù)不斷涌現(xiàn),推動(dòng)了模型性能的邊界不斷擴(kuò)展。這些技術(shù)進(jìn)步不僅限于提升檢索效率和生成文本的流暢度,更涵蓋了對(duì)上下文理解的深度增強(qiáng)、對(duì)復(fù)雜查詢的精細(xì)處理能力,以及對(duì)多樣化數(shù)據(jù)源的高效集成。通常依賴于自身的參數(shù)和訓(xùn)練數(shù)據(jù)來(lái)生成文本。部分AI技術(shù)生成代碼痛點(diǎn)幻覺(jué)問(wèn)題效率低缺乏上下文生成的代碼不準(zhǔn)確、通用過(guò)時(shí)、虛假,不符合預(yù)期需求或含有錯(cuò)誤。生成代碼速度慢,影響開(kāi)發(fā)進(jìn)度。從非權(quán)威來(lái)源創(chuàng)建響應(yīng),無(wú)法理解特定項(xiàng)目業(yè)務(wù)的背景信息,導(dǎo)致生成結(jié)果不相關(guān)或不完善。對(duì)比方面不使用RAG技術(shù)的AI代碼平臺(tái)實(shí)施RAG技術(shù)的AI代碼平臺(tái)知識(shí)更新與深度需要周期性訓(xùn)練以集成新知識(shí);知識(shí)庫(kù)更新滯后實(shí)時(shí)檢索最新代碼庫(kù)和文檔,快速更新知識(shí)庫(kù);深度通過(guò)外部知識(shí)庫(kù)增強(qiáng)可解釋性與定制性黑盒模型,生成代碼的邏輯不透明;定制性受限于模型預(yù)設(shè)生成代碼基于檢索結(jié)果,可解釋;易于根據(jù)特定編程需求定制訓(xùn)練與應(yīng)用成本高成本訓(xùn)練模型;每次更新知識(shí)庫(kù)需要額外訓(xùn)練知識(shí)庫(kù)更新無(wú)需重新訓(xùn)練模型;降低長(zhǎng)期成本;提高應(yīng)用效率通用性與推理能力通常針對(duì)特定編程任務(wù)優(yōu)化,在其他任務(wù)上表現(xiàn)不佳強(qiáng)大的跨任務(wù)通用性;通過(guò)檢索增強(qiáng)上下文和邏輯推理能力實(shí)時(shí)性與多模態(tài)更新周期導(dǎo)致知識(shí)過(guò)時(shí);通常處理單一數(shù)據(jù)類型實(shí)時(shí)檢索和應(yīng)用最新信息;有潛力處理代碼、文檔、issue等多模態(tài)數(shù)據(jù)安全性與隱私訓(xùn)練數(shù)據(jù)包含敏感信息,存在泄露風(fēng)險(xiǎn);模型透明度低通過(guò)限制知識(shí)庫(kù)訪問(wèn)和生成策略提高安全性;模型生成過(guò)程更透明實(shí)施RAG技術(shù)的AI代碼平臺(tái)技術(shù)由來(lái)工作原理應(yīng)用效果由Facebook

AI

Research(FAIR)團(tuán)隊(duì)提出。為解決傳統(tǒng)生成模型的局限性而發(fā)展起來(lái)。檢索:從外部知識(shí)庫(kù)獲取信息。生成:結(jié)合信息生成輸出。提高生成準(zhǔn)確性和效率。提供上下文支持。RAG=

檢索+生成,利用外部知識(shí)庫(kù)來(lái)增強(qiáng)AI生成能力。技術(shù)支撐:基于項(xiàng)目開(kāi)發(fā)“Know-How”的“AI+”技術(shù)數(shù)據(jù)準(zhǔn)備檢索LLM

查詢基本RAG架構(gòu)檢索到的信息被用于為L(zhǎng)LM提供上下文,語(yǔ)言模型通過(guò)將上下文與問(wèn)題相結(jié)合來(lái)準(zhǔn)備最終的提示。結(jié)果是根據(jù)所提供的豐富的上下文數(shù)據(jù)生成答案。一旦提出問(wèn)題,系統(tǒng)就會(huì)利用矢量搜索技術(shù)對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行挖掘,找出相關(guān)信息。1首先是用戶上傳數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行分塊并用嵌入式技術(shù)存儲(chǔ),為檢索奠定基礎(chǔ)。23輸出最終答案用戶輸入編程問(wèn)題大語(yǔ)言模型檢索組件知識(shí)庫(kù)檢索相關(guān)信息生成答案、確保答案質(zhì)量結(jié)合檢索信息②③階段①加載索引存儲(chǔ)查詢?cè)u(píng)估數(shù)據(jù)管理與智能查詢相結(jié)合,以提高AI代碼生成響應(yīng)精度,提升企業(yè)級(jí)個(gè)性化開(kāi)發(fā)能力RAG對(duì)大型語(yǔ)言模型(LLM)輸出進(jìn)行優(yōu)化,使其能夠在生成響應(yīng)之前引用訓(xùn)練數(shù)據(jù)來(lái)源之外的權(quán)威知識(shí)庫(kù)。RAG通過(guò)將用戶數(shù)據(jù)整合進(jìn)LLM已有的數(shù)據(jù)中來(lái)解決用戶提問(wèn)。是目前生成式AI應(yīng)用中一種高效的改進(jìn)思路,保證其輸出結(jié)果在各種情境下都能盡可能體現(xiàn)其相關(guān)性、準(zhǔn)確性和實(shí)用性——在AI代碼生成的技術(shù)中,保證最大程度提升代碼生成的質(zhì)量。圖:RAG的技術(shù)架構(gòu)示例 圖:RAG解決編程問(wèn)題的過(guò)程圖AI支持企業(yè)級(jí)個(gè)性化的項(xiàng)目開(kāi)發(fā),解決企業(yè)代碼生成的“知我所想”——理解企業(yè)開(kāi)發(fā)需求和“為我所屬”——符合企業(yè)規(guī)范④技術(shù)支撐:基于項(xiàng)目開(kāi)發(fā)“Know-How”的“AI+”技術(shù)RAG依賴于高質(zhì)量的知識(shí)資產(chǎn)管理及數(shù)據(jù)處理能力,企業(yè)代碼庫(kù)的數(shù)據(jù)質(zhì)量需關(guān)注中期準(zhǔn)備>問(wèn)題定義與需求分析數(shù)據(jù)處理與知識(shí)庫(kù)優(yōu)化模型選擇與優(yōu)化部署與監(jiān)控反饋與迭代提供基礎(chǔ)提供優(yōu)化結(jié)果前期準(zhǔn)備>計(jì)算資源與管理模型訓(xùn)練與驗(yàn)證保障計(jì)算資源后期準(zhǔn)備>實(shí)際應(yīng)用提供反饋優(yōu)化數(shù)據(jù)庫(kù)*備注:在RAG系統(tǒng)中,"chunk-size"是指將文本或數(shù)據(jù)分成較小的塊,以便更高效地處理和檢索。調(diào)整chunk-size有助于在信息量和檢索效率之間找到最佳平衡。較小的塊可以提高檢索準(zhǔn)確性,但可能丟失上下文;較大的塊保留更多上下文,但可能增加冗余。通常,chunk大小在100到300詞之間,需根據(jù)應(yīng)用場(chǎng)景調(diào)整。通過(guò)調(diào)整chunk-size參數(shù),可以優(yōu)化RAG模型的檢索效果,提高效率和準(zhǔn)確性。針對(duì)生成效果評(píng)估方法的全流程優(yōu)化知識(shí)庫(kù)處于流程循環(huán)首尾的銜接,其質(zhì)量控制是優(yōu)化策略核心1.

數(shù)據(jù)處理與知識(shí)庫(kù)優(yōu)化知識(shí)庫(kù):優(yōu)化知識(shí)庫(kù)的結(jié)構(gòu)和內(nèi)容,以提高檢索效率和質(zhì)量。數(shù)據(jù):需要重新考慮數(shù)據(jù)的收集、清洗和標(biāo)注,以適應(yīng)新的模型或策略。數(shù)據(jù)切片:將大塊數(shù)據(jù)分割成更小,更合理的部分,以便更好地進(jìn)行處理和分析,有助于提高檢索和生成的準(zhǔn)確性。數(shù)據(jù)庫(kù)打標(biāo)準(zhǔn)確性:確保數(shù)據(jù)庫(kù)中的信息準(zhǔn)確無(wú)誤、通過(guò)標(biāo)準(zhǔn)化過(guò)程提高數(shù)據(jù)的一致性和可靠性。2.

模型選擇與優(yōu)化選擇更大的模型:現(xiàn)有模型的生成效果不理想,可以使用更大的預(yù)訓(xùn)練模型,帶來(lái)更好的生成質(zhì)量和上下文理解能力。使用不同的embedding模型:根據(jù)實(shí)際應(yīng)用場(chǎng)景和數(shù)據(jù)特點(diǎn),使用不同的embedding模型,以找到最適合的模型來(lái)提高檢索精度。調(diào)整chunk-size*:重新評(píng)估和調(diào)整chunk的大小,以找到信息量和檢索效率之間的最佳平衡點(diǎn)。4.

計(jì)算資源管理如果需要更大的模型或更復(fù)雜的embedding模型,需要更多的計(jì)算資源。這涉及到模型訓(xùn)練和優(yōu)化階段的資源分配和管理。5.

部署與監(jiān)控優(yōu)化后的模型需要部署到實(shí)際環(huán)境中,并持續(xù)監(jiān)控其效果,以便進(jìn)行進(jìn)一步的調(diào)整。3.

模型訓(xùn)練與驗(yàn)證對(duì)于新的模型和參數(shù)設(shè)置,需要進(jìn)行訓(xùn)練和驗(yàn)證,以評(píng)估其性能。圖:RAG的數(shù)據(jù)處理、反饋及優(yōu)化的過(guò)程技術(shù)支撐:基于項(xiàng)目開(kāi)發(fā)“Know-How”的“AI+”技術(shù)RAG知識(shí)庫(kù)痛點(diǎn)解決方法示例

1解決方法示例

2解決方法示例

3建立者孤立地建立和發(fā)展信息滯后、錯(cuò)誤將用戶查詢與知識(shí)庫(kù)內(nèi)容進(jìn)行比較不合邏輯數(shù)據(jù)組織形式不易被檢索不以用戶為中心數(shù)據(jù)工程功能按不確

定性對(duì)孤立問(wèn)題排序 較高的不確定性分?jǐn)?shù)表

示知識(shí)庫(kù)內(nèi)容存在差距 查詢驅(qū)動(dòng)的知識(shí)庫(kù)補(bǔ)全按主題對(duì)真實(shí)用

戶問(wèn)題進(jìn)行分組 查看哪些缺失主題

有最多的用戶查詢

用戶問(wèn)題組準(zhǔn)確地

顯示需要涵蓋的內(nèi)容

同類比較,查詢驅(qū)動(dòng)的檢查持續(xù)知識(shí)庫(kù)維護(hù)通過(guò)知識(shí)庫(kù)維護(hù)改進(jìn)孤立問(wèn)題是指通過(guò)將用戶查詢與知識(shí)庫(kù)內(nèi)容進(jìn)行比較,識(shí)別出知識(shí)庫(kù)中未能充分覆蓋或存在內(nèi)容差距的用戶問(wèn)題。企業(yè)級(jí)的AI代碼平臺(tái)及開(kāi)發(fā)解決方案建立在企業(yè)個(gè)性化數(shù)據(jù)的運(yùn)營(yíng)完善能力之上由于RAG高度依賴其知識(shí)庫(kù)的信息質(zhì)量,因此企業(yè)級(jí)的代碼知識(shí)庫(kù)的完善是保證其技術(shù)效果的關(guān)鍵舉措,具體如代碼應(yīng)該怎么處理,文檔應(yīng)該怎么處理,代碼過(guò)來(lái)要進(jìn)行過(guò)濾、清洗、結(jié)構(gòu)化等等細(xì)節(jié)的工作是非常值得關(guān)注和尊重的,可保證代碼知識(shí)庫(kù)的不斷完善,如下示例保證代碼知識(shí)庫(kù)數(shù)據(jù)的質(zhì)量:建立確保知識(shí)庫(kù)中信息的數(shù)據(jù)質(zhì)量、相關(guān)度。動(dòng)態(tài)更新代碼知識(shí)庫(kù)的數(shù)據(jù):數(shù)據(jù)動(dòng)態(tài)變化,保持知識(shí)庫(kù)的時(shí)效性可確保RAG的響應(yīng)符合當(dāng)下需求。高效組織數(shù)據(jù):通過(guò)使用索引、分類或標(biāo)記來(lái)優(yōu)化代碼知識(shí)庫(kù)的檢索過(guò)程,

以合乎邏輯且易于檢索的方式組織數(shù)據(jù)是關(guān)鍵。圖:RAG的企業(yè)級(jí)代碼知識(shí)庫(kù)痛點(diǎn)及解決方案示例技術(shù)支撐:基于項(xiàng)目開(kāi)發(fā)“Know-How”的“AI+”技術(shù)在特定代碼任務(wù)中優(yōu)化和微調(diào)的AI核心核心特征架構(gòu)解析Agent基于LLM的組件,和交互兩個(gè)層面AI代碼平臺(tái)AIAgent記憶能力行動(dòng)能力工具能力規(guī)劃能力人類用戶(指令者)用戶通過(guò)平臺(tái)界面的輸入框、按鈕等,使用特定的命令、指令等方式與其交互,將自己的需求傳遞給AI

Agent,是引導(dǎo)其生成定制化代碼解決方案的關(guān)鍵,直接影響代碼功能和輸出結(jié)果。外界環(huán)境(影響者)AI代碼平臺(tái)中的Agent能夠感知并響應(yīng)其所處環(huán)境(虛擬或物理世界)的變化,與環(huán)境的互動(dòng)進(jìn)一步塑造代碼生成的輸出,確保代碼能夠適應(yīng)并解決實(shí)際問(wèn)題。Agents(執(zhí)行者)通過(guò)多個(gè)Agent協(xié)作機(jī)制,各Agent能夠共享信息、資源和任務(wù)結(jié)果,實(shí)現(xiàn)復(fù)雜問(wèn)題的高效解決,從而構(gòu)建起強(qiáng)大的群體智能體系。系統(tǒng)開(kāi)發(fā)者(創(chuàng)造者)精心設(shè)計(jì)和編程,賦予AI代碼平臺(tái)的Agent特定的功能和組件,從而確保它們能夠高效地生成符合用戶需求的代碼。人機(jī)交互設(shè)計(jì)開(kāi)發(fā)感知反饋群體協(xié)作代碼規(guī)劃:智能分析和設(shè)計(jì)代碼結(jié)構(gòu),優(yōu)化開(kāi)發(fā)流程知識(shí)記憶:存儲(chǔ)和檢索相關(guān)信息,支持連續(xù)性和上下文理解自主執(zhí)行:自主完成代碼生成和測(cè)試等任務(wù),實(shí)現(xiàn)自動(dòng)化操作工具集成:連接和使用外部軟件工具,提高開(kāi)發(fā)效率Agent是推動(dòng)工作流程自動(dòng)化的關(guān)鍵組件,提高整體開(kāi)發(fā)效能AI代碼平臺(tái)中AI

Agent的核心邏輯:通過(guò)將經(jīng)過(guò)特定訓(xùn)練的大模型作為“大腦”,利用其推理和規(guī)劃能力,并調(diào)用外部工具來(lái)完成復(fù)雜任務(wù),從而優(yōu)化代碼開(kāi)發(fā)過(guò)程。圖:Agent

的特征和架構(gòu)解析AI代碼平臺(tái)的AI

Agent 特定訓(xùn)練的大模型 (代碼規(guī)劃+知識(shí)記憶+工具集成+自動(dòng)執(zhí)行)技術(shù)支撐:基于項(xiàng)目開(kāi)發(fā)“Know-How”的“AI+”技術(shù)通過(guò)模擬軟件開(kāi)發(fā)角色,實(shí)現(xiàn)高效協(xié)作,確保從需求分析到代碼上線的流程順暢系統(tǒng)模擬團(tuán)隊(duì)中的不同軟件開(kāi)發(fā)角色(如執(zhí)行官、產(chǎn)品官、程序員、測(cè)試員等)來(lái)協(xié)同工作完成項(xiàng)目,平臺(tái)依賴事件驅(qū)動(dòng)架構(gòu)、標(biāo)準(zhǔn)化接口、沙盒環(huán)境、協(xié)調(diào)代理和CI/CD等技術(shù)實(shí)現(xiàn)協(xié)作。對(duì)應(yīng)角色作用工作形式/原理產(chǎn)品經(jīng)理Agent與用戶溝通(交互),分析并轉(zhuǎn)化用戶需求為功能需求通過(guò)自然語(yǔ)言處理與用戶對(duì)話,提取關(guān)鍵信息,生成需求文檔或任務(wù)列表項(xiàng)目經(jīng)理Agent促進(jìn)不同代理之間的協(xié)作,確保信息流通和任務(wù)協(xié)調(diào)通過(guò)多代理委派機(jī)制,協(xié)調(diào)各個(gè)代理的工作開(kāi)發(fā)工程師Agent將復(fù)雜功能需求分解為更小的、可管理的代碼模塊或任務(wù)利用機(jī)器學(xué)習(xí)模型分析需求,自動(dòng)生成代碼結(jié)構(gòu)和模塊劃分測(cè)試與支持Agent負(fù)責(zé)自動(dòng)化測(cè)試,確保代碼正確性和穩(wěn)定性監(jiān)控系統(tǒng)狀態(tài),收集用戶反饋生成測(cè)試用例,執(zhí)行單元測(cè)試和集成測(cè)試,實(shí)時(shí)監(jiān)控應(yīng)用性能,收集用戶使用數(shù)據(jù),分析測(cè)試結(jié)果并反饋多代理協(xié)同工作流程圖開(kāi)始?

開(kāi)始節(jié)點(diǎn)代理任務(wù)分配將子任務(wù)分配給不同的代理每個(gè)代理根據(jù)其特長(zhǎng)執(zhí)行任務(wù)代理間通信代理之間共享信息和進(jìn)度發(fā)送請(qǐng)求和接收反饋代碼開(kāi)發(fā)各代理獨(dú)立開(kāi)發(fā)代碼進(jìn)行單元測(cè)試和調(diào)試集成與測(cè)試將各代理的代碼集成到主代碼庫(kù)進(jìn)行系統(tǒng)測(cè)試和集成測(cè)試結(jié)果評(píng)估評(píng)估集成后的系統(tǒng)性能收集反饋信息優(yōu)化與迭代根據(jù)反饋進(jìn)行代碼優(yōu)化迭代開(kāi)發(fā),重復(fù)以上步驟結(jié)束?

結(jié)束節(jié)點(diǎn)需求分析?

收集用戶需求標(biāo)準(zhǔn)化接口:定義清晰的API和接口,便于數(shù)據(jù)交換?

確定功能模塊任務(wù)分解?

將需求分解為具體的子任務(wù)?

確定每個(gè)子任務(wù)的負(fù)責(zé)人代理事件驅(qū)動(dòng)架構(gòu):通過(guò)事件流實(shí)現(xiàn)代理之間的通信和協(xié)調(diào)沙盒環(huán)境:提供安全的執(zhí)行環(huán)境,支持獨(dú)立和協(xié)作任務(wù)協(xié)調(diào)代理:管理任務(wù)分配、進(jìn)度跟蹤和資源管理持續(xù)集成/持續(xù)部署:自動(dòng)化集成和部署流程,提高開(kāi)發(fā)效率協(xié)同所需要的技術(shù)用戶需求細(xì)化需求用戶故事需求優(yōu)先級(jí)產(chǎn)品經(jīng)理Agent細(xì)分任務(wù)任務(wù)優(yōu)先級(jí)任務(wù)約束項(xiàng)目經(jīng)理Agent生成代碼代碼評(píng)審修復(fù)缺陷工程師Agent生成單測(cè)單測(cè)執(zhí)行收集缺陷測(cè)試Agent............目

錄Part

01機(jī)遇:AIGC引發(fā)的數(shù)字生產(chǎn)變化Part

02 價(jià)值:重新構(gòu)建代碼開(kāi)發(fā)的應(yīng)用范式Part

04展望:人工智能普惠時(shí)代的期待Part

03落地:智能時(shí)代AI+代碼的先行者AI代碼平臺(tái)領(lǐng)域成為生成式AI的重要落地領(lǐng)域,不同類型企業(yè)各顯身手中國(guó)當(dāng)下的AI+代碼平臺(tái)市場(chǎng)已經(jīng)迎來(lái)豐富的參與者,這些企業(yè)依據(jù)自身技術(shù)或行業(yè)know-how迅速切入市場(chǎng),通過(guò)先手占據(jù)更好的生態(tài)占位;并且越來(lái)越多的企業(yè)正在進(jìn)行產(chǎn)品打磨與場(chǎng)景探索。AI代碼平臺(tái)圖譜V1.0圖譜1.0版數(shù)據(jù)截至2024年10月,順序不分先后通用模型算力、數(shù)據(jù)及其他基礎(chǔ)支持AI

編碼助手類注:隨著產(chǎn)品逐步落地,未來(lái)將有更多類型企業(yè)切入AI代碼平臺(tái)領(lǐng)域,以下為企業(yè)類型說(shuō)明AI模型*代碼型:一般具備通用大模型能力,提供基于生成式AI的編程產(chǎn)品/插件業(yè)務(wù)*AI代碼型:基于自身業(yè)務(wù)及開(kāi)發(fā)能力,提供基于生成式AI的IT開(kāi)發(fā)平臺(tái)AI代碼創(chuàng)業(yè)型:基于代碼領(lǐng)域的垂類模型及產(chǎn)品能力,提供相應(yīng)的AI代碼平臺(tái)服務(wù)代碼社區(qū)型:基于社區(qū)代碼的數(shù)據(jù)積累,提供相應(yīng)產(chǎn)品智能體*開(kāi)發(fā):利用多智能體能力,提供代碼開(kāi)發(fā)服務(wù)低/無(wú)代碼+AI:在自身低無(wú)代碼基礎(chǔ)上進(jìn)行AIGC技術(shù)的結(jié)合AI模型*代碼型

……業(yè)務(wù)*AI代碼型AI代碼創(chuàng)業(yè)型AI代碼社區(qū)型……………………智能體*開(kāi)發(fā)類低/無(wú)代碼+AI……圖形化編程語(yǔ)言(可包括IDE)+AI……7)圖形化編程語(yǔ)言(可包括IDE)+AI:在圖形化編程語(yǔ)言及開(kāi)發(fā)平臺(tái)及生態(tài)基礎(chǔ)上進(jìn)行AI技術(shù)的結(jié)合值得關(guān)注的互聯(lián)網(wǎng)大廠產(chǎn)品及服務(wù)動(dòng)態(tài)——百度智能云【文心快碼】“幫你改”測(cè)試和發(fā)布智能評(píng)審智能安全監(jiān)測(cè)智能Debug智能漏洞修復(fù)智能缺陷修復(fù)發(fā)布流程管控CI

錯(cuò)誤診斷“幫你想”編寫(xiě)代碼智能代碼補(bǔ)全智能生成描述描述生成代碼自動(dòng)發(fā)現(xiàn)漏洞生成安全代碼自動(dòng)修復(fù)漏洞API生成代碼單測(cè)智能體“幫你寫(xiě)”調(diào)研和設(shè)計(jì)私域知識(shí)增強(qiáng)需求澄清研發(fā)規(guī)范架構(gòu)解讀安全規(guī)范任務(wù)分解專家模式問(wèn)答客戶示例……文心快碼(Baidu

Comate)是基于文心大模型,結(jié)合百度積累多年的編程現(xiàn)場(chǎng)大數(shù)據(jù)和外部?jī)?yōu)秀開(kāi)源數(shù)據(jù),打造的新一代編碼輔助工具。擁有代碼智能、場(chǎng)景豐富、創(chuàng)造價(jià)值、廣泛應(yīng)用等多重產(chǎn)品優(yōu)勢(shì),可實(shí)現(xiàn)“幫你想、幫你寫(xiě)、幫你改”的場(chǎng)景應(yīng)用形態(tài)。提升編碼效率,釋放“十倍”軟件生產(chǎn)力。產(chǎn)品功能 優(yōu)勢(shì)亮點(diǎn)更懂研發(fā)知識(shí)

開(kāi)發(fā)速度快構(gòu)建研發(fā)領(lǐng)域知識(shí)體系,滿足多場(chǎng)景訴求,實(shí)現(xiàn)高效交付更懂研發(fā)全流程業(yè)務(wù)迭代快文心快碼無(wú)縫集成研發(fā)各環(huán)節(jié),加速研發(fā)全流程提效更懂行業(yè)客戶

企業(yè)落地快直擊行業(yè)難點(diǎn),提供最佳落地實(shí)踐,助力客戶提效支持私有化、混合云部署讓大模型以更安全的方式學(xué)習(xí)企業(yè)業(yè)務(wù)代碼和流程,更契合行業(yè)與業(yè)務(wù)的需求全方位支持多種主流IDE與編程語(yǔ)言支持

100

多種主流語(yǔ)言和

VSCode、JetBrains

全系列等主流

IDE百度每天新增的代碼中,有30%由文心快碼生成,整體采納率達(dá)46%,這一提效工具的應(yīng)用令工程師整體提效達(dá)到12%,顯著提升了單位時(shí)間內(nèi)的代碼提交數(shù)量和業(yè)務(wù)迭代速度。更重要的是,智能編碼提效工具使工程師得以從繁雜、重復(fù)的工作中釋放出來(lái),專注于更有價(jià)值和創(chuàng)造性的工作。積極構(gòu)建開(kāi)源社區(qū):眾安開(kāi)源戰(zhàn)略的核心聚焦于構(gòu)建開(kāi)發(fā)者與用戶緊密聯(lián)結(jié)的社區(qū)生態(tài),旨在通過(guò)協(xié)作打造共贏共創(chuàng)的行業(yè)技術(shù)環(huán)境。國(guó)內(nèi)重點(diǎn)廠商產(chǎn)品及服務(wù)能力分析——眾安保險(xiǎn)DevPilot自主研發(fā)AIGC平臺(tái)結(jié)合業(yè)務(wù)經(jīng)驗(yàn)沉淀,提供企業(yè)級(jí)高質(zhì)量AI+代碼開(kāi)發(fā)能力眾安保險(xiǎn)是中國(guó)首家互聯(lián)網(wǎng)保險(xiǎn)公司。作為國(guó)內(nèi)首個(gè)核心系統(tǒng)搭建在云上的金融機(jī)構(gòu),眾安基于云服務(wù)平臺(tái)搭建開(kāi)放、靈活、可擴(kuò)展的核心系統(tǒng),與此同時(shí),眾安不斷開(kāi)拓人工智能、區(qū)塊鏈、大數(shù)據(jù)等前沿技術(shù),并深度應(yīng)用于產(chǎn)品研發(fā),提升體驗(yàn),改善經(jīng)營(yíng)效率。DevPilot

是眾安保險(xiǎn)技術(shù)團(tuán)隊(duì)開(kāi)發(fā)的AI代碼助手,結(jié)合私有化部署的或是通用三方代碼模型,帶來(lái)一套輕量高效的全棧代碼助手開(kāi)源解決方案,使

AI

成為開(kāi)發(fā)者工具的標(biāo)準(zhǔn)組成部分。外部開(kāi)發(fā)者積極參與開(kāi)源社區(qū)的構(gòu)建開(kāi)源社區(qū)的反饋可以做到當(dāng)天響應(yīng)及修復(fù)眾安自主研發(fā)的AIGC中臺(tái)“眾有靈犀”,為AI應(yīng)用提供安全可靠的大模型能力,提示工程、知識(shí)工程等中臺(tái)能力為AI場(chǎng)景研發(fā)更加敏捷,在此之上落地實(shí)現(xiàn)了智能產(chǎn)研、營(yíng)銷(xiāo)、運(yùn)營(yíng)、客服等多場(chǎng)景應(yīng)用。通過(guò)實(shí)踐不斷解鎖AI驅(qū)動(dòng)下AI+保險(xiǎn)的新場(chǎng)景眾安保險(xiǎn)憑借海量的保險(xiǎn)數(shù)據(jù)以及豐富的保險(xiǎn)知識(shí),在大模型上進(jìn)行深度的場(chǎng)景應(yīng)用,通過(guò)AI中臺(tái)化的能力持續(xù)釋放生成式AI能力。基于

IDE

AI代碼助手“眾有靈犀”為DevPilot提供了一個(gè)功能豐富的平臺(tái),作為DevPilot的中臺(tái)提供了大模型集成、提示編排、檢索增強(qiáng)生成等能力,使得DevPilot在各種運(yùn)行代碼生成的場(chǎng)景需求都能夠在這個(gè)平臺(tái)上得到實(shí)現(xiàn)和構(gòu)建。作為一款強(qiáng)大的中臺(tái)系統(tǒng),眾有靈犀能夠集成多種大型語(yǔ)言模型,并且對(duì)外提供統(tǒng)一的接口,從而有效地屏蔽了不同模型之間的差異性和復(fù)雜性。眾有靈犀還為DevPilot的使用提供一系列針對(duì)大語(yǔ)言模型安全性的策略和措施,其中包括了對(duì)敏感數(shù)據(jù)的檢測(cè)機(jī)制等,以及防止生成具有政治敏感性內(nèi)容及敏感代碼外泄的技術(shù)手段,以此來(lái)保障平臺(tái)上的內(nèi)容生產(chǎn)和交互活動(dòng)能夠在符合安全規(guī)范的前提下進(jìn)行。DevPilot的定位是“代碼輔助生成助手”,可參與開(kāi)發(fā)者需求開(kāi)發(fā)的全流程,致力于解決開(kāi)發(fā)態(tài)的問(wèn)題。從自動(dòng)化日常開(kāi)發(fā)任務(wù)到提供富有洞察力的代碼建議,讓開(kāi)發(fā)人員能夠更智能、更快速、更少錯(cuò)誤地進(jìn)行編碼。DevPilot通過(guò)結(jié)合私有化部署方案或是利用通用的代碼模型,為開(kāi)發(fā)者提供了一套輕量且高效的全棧代碼助手開(kāi)源解決方案。讓AI技術(shù)成為開(kāi)發(fā)者工具的標(biāo)準(zhǔn)組成部分,顯著提升開(kāi)發(fā)效率。國(guó)內(nèi)重點(diǎn)廠商產(chǎn)品及服務(wù)能力分析——眾安保險(xiǎn)DevPilot

(產(chǎn)品特點(diǎn)1/2)DevPilot通過(guò)結(jié)合私有化部署方案或是利用通用的代碼模型,為開(kāi)發(fā)者提供了一套輕量且高效的全棧代碼助手開(kāi)源解決方案。DevPilot的設(shè)計(jì)初衷是讓AI技術(shù)成為開(kāi)發(fā)者工具的標(biāo)準(zhǔn)組成部分,不僅能夠幫助開(kāi)發(fā)者自動(dòng)生成代碼片段或模塊,還能通過(guò)智能化的代碼補(bǔ)全、重構(gòu)建議等功能,顯著提升開(kāi)發(fā)效率。DevPilot的產(chǎn)品功能一覽:豐富功能充分滿足企業(yè)級(jí)開(kāi)發(fā)需求智能搜索自動(dòng)注釋 代碼生成代碼審查 代碼解釋DevPilot性能檢查 代碼補(bǔ)全日志生成 單元測(cè)試錯(cuò)誤檢測(cè) 代碼修復(fù)……DevPilot獨(dú)特的產(chǎn)品設(shè)計(jì):結(jié)合開(kāi)發(fā)經(jīng)驗(yàn),打磨產(chǎn)品細(xì)節(jié)代碼生成DevPilot可以基于倉(cāng)庫(kù)代碼相似邏輯,按需求生成新的功能代碼,尤其可基于企業(yè)倉(cāng)庫(kù)代碼生成最佳編碼方案,提高編碼效率。用戶可用這款A(yù)I助手與機(jī)器進(jìn)行對(duì)話生成代碼。代碼補(bǔ)全在補(bǔ)全場(chǎng)景,DevPilot從單純的純模型補(bǔ)全演進(jìn)到基于提示詞的補(bǔ)全,再到補(bǔ)全后接受交互行為的處理,站在開(kāi)發(fā)者的角度不斷的打磨補(bǔ)全的效果,盡量減少代碼修改率,避免出現(xiàn)網(wǎng)傳的“助手代碼生成越多,錯(cuò)誤越多,修改越多”的問(wèn)題。DevPilot著重提升上下文邏輯的理解能力,提升其企業(yè)級(jí)開(kāi)發(fā)項(xiàng)目中的代碼采納率。單元測(cè)試DevPilot不僅可以幫用戶對(duì)大篇幅代碼做Code

Review,檢測(cè)代碼性能,還能快速生成單測(cè)案例,針對(duì)類、方法級(jí)提供多種單元測(cè)試生成能力,也可以用提示詞生成符合特定框架要求的單元測(cè)試。該場(chǎng)景下,DevPilot不斷的豐富要生成單測(cè)的內(nèi)容上下文,通過(guò)提示詞讓模型更加專注在邏輯分支上,識(shí)別所有可能的執(zhí)行路徑,確保分支覆蓋率?!?1靈活的模型切換模型可切換DevPilot允許開(kāi)發(fā)者或企業(yè)切換合適的大模型,可使用本地模型或三方通用模型,這就使得DevPilot能夠更快跟進(jìn)先進(jìn)模型,并且可以符合企業(yè)大模型需求。04符合企業(yè)級(jí)開(kāi)發(fā)需求DevPilot的產(chǎn)品能力效果來(lái)自其獨(dú)特定位:專注于企業(yè)級(jí)應(yīng)用領(lǐng)域。

DevPilot的的核心理念在于實(shí)現(xiàn)與企業(yè)內(nèi)部復(fù)雜業(yè)務(wù)邏輯的高度融合,它不僅僅是一個(gè)簡(jiǎn)單的代碼生成器,而是致力于根據(jù)企業(yè)的特定業(yè)務(wù)需求來(lái)直接生成相應(yīng)的代碼片段或模塊。02優(yōu)質(zhì)的交互體驗(yàn)IDE原生DevPilot基于VSCode、JetbrainIDEA

等主流IDE構(gòu)建,使用IDE原生交互,不改變開(kāi)發(fā)者的編程習(xí)慣。同時(shí)提供chat、diff視圖,以及代碼插入時(shí)自動(dòng)尋找目標(biāo)文件等的細(xì)節(jié)交互,為開(kāi)發(fā)者帶來(lái)更加絲滑的編程體驗(yàn)。03工程級(jí)的上下文能力相較于一些同類產(chǎn)品生成代碼時(shí)只能感知當(dāng)前文件或者打開(kāi)文件的代碼,DevPilot廣泛使用工程文件索引以及檢索增強(qiáng)生成(RAG)技術(shù),在生成代碼時(shí)可獲得需求相關(guān)的工程范圍甚至是企業(yè)倉(cāng)庫(kù)里的代碼作為參考片段,使生成的代碼更加符合工程需要,有效提升代碼采納率。靈活的模型切換工程級(jí)的上下文能力優(yōu)質(zhì)的交付體驗(yàn)滿足企業(yè)級(jí)開(kāi)發(fā)需求國(guó)內(nèi)重點(diǎn)廠商產(chǎn)品及服務(wù)能力分析——眾安保險(xiǎn)DevPilot

(產(chǎn)品特點(diǎn)2/2)DevPilot產(chǎn)品功能亮點(diǎn)國(guó)內(nèi)重點(diǎn)廠商產(chǎn)品及服務(wù)能力分析——眾安保險(xiǎn)DevPilot項(xiàng)目效果代碼質(zhì)量代碼質(zhì)量參差不齊,難以保證產(chǎn)品穩(wěn)定性和可維護(hù)性團(tuán)隊(duì)協(xié)作團(tuán)隊(duì)協(xié)作中溝通成本高,版本控制復(fù)雜,影響項(xiàng)目進(jìn)度DevPilot在軟件項(xiàng)目開(kāi)發(fā)過(guò)程中實(shí)現(xiàn)難點(diǎn)、痛點(diǎn)的解決編碼效率重復(fù)性任務(wù)多,導(dǎo)致開(kāi)發(fā)周期延長(zhǎng)20%15%效果實(shí)現(xiàn)研發(fā)團(tuán)隊(duì)整體研發(fā)速度提升AI代碼生成在整體項(xiàng)目的貢獻(xiàn)度DevPilot顯著提升開(kāi)發(fā)效率與產(chǎn)品質(zhì)量,優(yōu)化團(tuán)隊(duì)協(xié)作,加速市場(chǎng)響應(yīng)項(xiàng)目實(shí)踐能力解析:致力于解決企業(yè)在軟件開(kāi)發(fā)過(guò)程中所面臨的特定挑戰(zhàn)定位企業(yè)級(jí)開(kāi)發(fā)符合企業(yè)架構(gòu)標(biāo)準(zhǔn)以企業(yè)為中心推動(dòng)數(shù)字化轉(zhuǎn)型DevPilot將企業(yè)內(nèi)部常用的通用技術(shù)組件與業(yè)務(wù)組件的訪問(wèn)代碼,以及企業(yè)特有的應(yīng)用框架代碼進(jìn)行嵌入式整合。通過(guò)這種方式,在代碼生成的時(shí)刻,這些預(yù)嵌入的代碼片段會(huì)被智能召回并加以利用,確保生成的代碼能夠更好地遵循企業(yè)的架構(gòu)標(biāo)準(zhǔn)和技術(shù)規(guī)范。DevPilot的設(shè)計(jì)目的之一是為了更好地服務(wù)于企業(yè)的軟件開(kāi)發(fā)流程。它能夠通過(guò)深入理解企業(yè)特有的業(yè)務(wù)流程和技術(shù)框架,識(shí)別并適應(yīng)企業(yè)已有的技術(shù)棧和業(yè)務(wù)規(guī)則,從而提供更加精準(zhǔn)和實(shí)用的代碼支持,幫助企業(yè)維護(hù)一致性的代碼標(biāo)準(zhǔn),降低錯(cuò)誤率,增強(qiáng)企業(yè)軟件開(kāi)發(fā)工程的可靠性和穩(wěn)定性。DevPilot

能夠使AI技術(shù)無(wú)縫地集成到企業(yè)的日常軟件開(kāi)發(fā)流程中,從而真正意義上實(shí)現(xiàn)從前沿技術(shù)向?qū)嶋H生產(chǎn)力的轉(zhuǎn)變。這意味著DevPilot成為了一個(gè)能夠?yàn)槠鋷?lái)切實(shí)利益的解決方案,它可以推動(dòng)企業(yè)自身的數(shù)字化轉(zhuǎn)型過(guò)程,提升市場(chǎng)競(jìng)爭(zhēng)力,同時(shí)也能更好地應(yīng)對(duì)不斷變化的技術(shù)挑戰(zhàn),為未來(lái)的持續(xù)發(fā)展奠定堅(jiān)實(shí)的基礎(chǔ)。重點(diǎn)廠商產(chǎn)品及服務(wù)能力分析——aiXcoder致力于將前沿人工智能技術(shù)應(yīng)用于軟件工程,聚焦代碼大模型的私有化落地和應(yīng)用大模型訓(xùn)練及微調(diào)企業(yè)智能化軟件開(kāi)發(fā)提供商核心技術(shù)產(chǎn)品航空航天通信金融 軍工IT智能制造交通 科研……應(yīng)用場(chǎng)景緊密結(jié)合具體業(yè)務(wù),持續(xù)深入各垂直細(xì)分領(lǐng)域智能知識(shí)庫(kù)系統(tǒng)智能化軟件開(kāi)發(fā)一體機(jī)智能化軟件開(kāi)發(fā)系統(tǒng)智能化測(cè)試生成系統(tǒng)aiXcoder系列大模型軟件工程AgentRAG企業(yè)服務(wù)私有化部署咨詢服務(wù)定制化開(kāi)發(fā)領(lǐng)域化大模型落地2018aiXcoder1.02024aiXcoder7B發(fā)布并開(kāi)源即將推出aiXcoder76B持續(xù)深耕AIGC

for

Code,多次版本不斷迭代,助力企業(yè)級(jí)智能軟件開(kāi)發(fā)aiXcoder將技術(shù)轉(zhuǎn)化為實(shí)際應(yīng)用落地,讓代碼大模型在智能編程領(lǐng)域廣泛實(shí)用,為此,aiXcoder推出個(gè)人/企業(yè)訂閱模式、私有化解決方案、深度咨詢服務(wù)三種商業(yè)模式,更貼合實(shí)際軟件開(kāi)發(fā)任務(wù),與企業(yè)應(yīng)用場(chǎng)景深度融合,更適合部署應(yīng)用。aiXcoder孵化自北京大學(xué)軟件工程研究所,創(chuàng)始團(tuán)隊(duì)均來(lái)自北京大學(xué),是全球最早將深度學(xué)習(xí)技術(shù)應(yīng)用于代碼生成與代碼理解領(lǐng)域的團(tuán)隊(duì),也是最早將深度學(xué)習(xí)應(yīng)用在編程產(chǎn)品的團(tuán)隊(duì)。公司專注于AIGC

for

Code領(lǐng)域,致力于將前沿人工智能技術(shù)應(yīng)用于軟件工程,聚焦代碼大模型的私有化落地和應(yīng)用,與企業(yè)領(lǐng)域知識(shí)融合,助力企業(yè)實(shí)現(xiàn)智能化研發(fā)。aiXcoder為企業(yè)提供完備的基于代碼大模型的智能化軟件開(kāi)發(fā)解決方案,包含私有化部署、企業(yè)個(gè)性化代碼大模型及定制化開(kāi)發(fā)等服務(wù),現(xiàn)已在金融、軍工、航空航天、通信、高科技等行業(yè)頭部企業(yè)部署實(shí)施,成功實(shí)現(xiàn)了代碼大模型的多場(chǎng)景應(yīng)用和實(shí)際效果驗(yàn)證,獲得廣泛行業(yè)認(rèn)可。2022aiXcoder

XL發(fā)布實(shí)現(xiàn)在線版代碼智能補(bǔ)全與搜索國(guó)內(nèi)首個(gè)支持方法級(jí)代碼生成的百億級(jí)參數(shù)量代碼大模型(13B參數(shù)量)7B模型性能達(dá)到百億級(jí)參數(shù)量代碼大模型SOTA,降低使用門(mén)檻易部署*以上版本為部分版本說(shuō)明aiXcoder于2018年開(kāi)始深耕AIGC

for

Code領(lǐng)域,2023年已獲得A+輪融資2024年同時(shí)發(fā)布智能化軟件研發(fā)一體機(jī),基于Agent的aiXcoder智能化軟件開(kāi)發(fā)系統(tǒng)2.0。團(tuán)隊(duì)在國(guó)際頂級(jí)期刊和會(huì)議累計(jì)發(fā)表論文100余篇,其中多篇是智能化軟件工程領(lǐng)域的首篇論文和引用率最高的論文。并且通過(guò)中國(guó)信息通信研究院可信AI智能編碼工具首輪評(píng)估。在智能編碼、代碼質(zhì)量檢查等維度的177項(xiàng)能力評(píng)估中表現(xiàn)優(yōu)秀,榮獲4+級(jí)最高級(jí)別,成為國(guó)內(nèi)首批通過(guò)該項(xiàng)評(píng)估的企業(yè)之一。重點(diǎn)廠商產(chǎn)品及服務(wù)能力分析——aiXcoder關(guān)鍵技術(shù)點(diǎn)代碼大模型的構(gòu)建通過(guò)敏感信息去除、刪除無(wú)效代碼、自動(dòng)生成代碼去除等多重篩選,剔除163種Bug和197種常見(jiàn)代碼缺陷。注入正確編程知識(shí),行成獨(dú)有的高質(zhì)量訓(xùn)練數(shù)據(jù)集。結(jié)合軟件工程工具,構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)結(jié)合程序語(yǔ)言特性,aiXcoder在模型訓(xùn)練時(shí)融入代碼抽象語(yǔ)法樹(shù)結(jié)構(gòu)信息,增強(qiáng)模型對(duì)語(yǔ)義和邏輯的理解能力采用結(jié)構(gòu)化Span方式,使生成的代碼更準(zhǔn)確,更符合代碼結(jié)構(gòu)。同時(shí)采用了FIM(Fill

Inthe

Middle)和跨文件的訓(xùn)練方式,更貼近真實(shí)開(kāi)發(fā)場(chǎng)景。結(jié)合代碼結(jié)構(gòu)化特征的訓(xùn)練方法基于Agent的新一代智能軟件開(kāi)發(fā)支持、適配生成式AI技術(shù)與大語(yǔ)言模型的應(yīng)用發(fā)展,基于大模型的智能化軟件開(kāi)發(fā)具有行業(yè)領(lǐng)域知識(shí)缺乏、軟件開(kāi)發(fā)專業(yè)技能欠缺、復(fù)雜問(wèn)題難以處理、無(wú)法進(jìn)行多角色協(xié)作等局限性。基于Agent的智能化軟件開(kāi)發(fā)系統(tǒng),通過(guò)大模型與軟件工具的調(diào)用相結(jié)合,調(diào)用外掛知識(shí),以多角色扮演的方式,實(shí)現(xiàn)項(xiàng)目級(jí)代碼生成、項(xiàng)目研發(fā)問(wèn)答、issue自動(dòng)處理等更復(fù)雜的真實(shí)軟件開(kāi)發(fā)任務(wù)。在基于大模型的Agent框架中,開(kāi)發(fā)者與大模型圍繞更復(fù)雜的項(xiàng)目級(jí)代碼生成展開(kāi)持續(xù)互動(dòng)和工具調(diào)用,人機(jī)協(xié)同,推動(dòng)軟件產(chǎn)品的快速迭代與持續(xù)優(yōu)化。通過(guò)個(gè)性化訓(xùn)練,aiXcoder可幫助企業(yè)實(shí)現(xiàn)更高質(zhì)量的代碼生成以及研發(fā)全流程的能力提升。經(jīng)過(guò)個(gè)性化訓(xùn)練的模型可以學(xué)習(xí)到行業(yè)或企業(yè)內(nèi)部的代碼邏輯、代碼風(fēng)格和業(yè)務(wù)知識(shí)等領(lǐng)域知識(shí),提高代碼生成的準(zhǔn)確率?;诖竽P偷膫€(gè)性化訓(xùn)練自動(dòng)化構(gòu)建企業(yè)專屬評(píng)測(cè)集提供定制化數(shù)據(jù)治理工具涵蓋模型預(yù)訓(xùn)練、微調(diào)、RAG、Agent等技術(shù)的一整套解決方案根據(jù)企業(yè)已有代碼和文檔、計(jì)算資源,提供定制化解決方案在保證主模型效果的情況下進(jìn)行增量訓(xùn)練,大大降低過(guò)擬合風(fēng)險(xiǎn)結(jié)合代碼結(jié)構(gòu)化特征和軟件工程的方法與工具,從訓(xùn)練數(shù)據(jù)處理、訓(xùn)練任務(wù)構(gòu)造再到模型結(jié)構(gòu)優(yōu)化等方面,強(qiáng)化大語(yǔ)言模型在軟件開(kāi)發(fā)場(chǎng)景下的性能與效果。在基座代碼大模型基礎(chǔ)上,通過(guò)指令微調(diào),讓大模型具有更多功能,如單元測(cè)試用例自動(dòng)生成、代碼解釋、研發(fā)問(wèn)答等。通過(guò)大模型與軟件工具的調(diào)用相結(jié)合,調(diào)用外掛知識(shí),以多角色扮演的方式,實(shí)現(xiàn)項(xiàng)目級(jí)代碼生成、項(xiàng)目研發(fā)問(wèn)答、issue自動(dòng)處理等更復(fù)雜的真實(shí)軟件開(kāi)發(fā)任務(wù)。結(jié)合企業(yè)領(lǐng)域知識(shí),對(duì)代碼大模型進(jìn)行個(gè)性化訓(xùn)練和微調(diào),幫助企業(yè)實(shí)現(xiàn)更高質(zhì)量的代碼生成以及研發(fā)全流程的能力提升。多功能代碼大模型構(gòu)建基于Agent的智能化軟件開(kāi)發(fā)系統(tǒng)企業(yè)個(gè)性化代碼大模型構(gòu)建高質(zhì)量基座代碼大模型的構(gòu)建aiXcoder主要通過(guò)大模型、Agent技術(shù)與軟件工具相結(jié)合的方式,實(shí)現(xiàn)軟件開(kāi)發(fā)全流程的智能化開(kāi)發(fā)輔助,提升開(kāi)發(fā)效率和代碼質(zhì)量。同時(shí)通過(guò)大模型微調(diào)、領(lǐng)域知識(shí)庫(kù)、RAG等技術(shù),解決企業(yè)領(lǐng)域化知識(shí)與大模型相融合的問(wèn)題,為每個(gè)企業(yè)打造專屬軟件工程大模型。重點(diǎn)廠商產(chǎn)品及服務(wù)能力分析——aiXcoder信華信是一家面向全球客戶提供領(lǐng)先的應(yīng)用軟件產(chǎn)品、解決方案和數(shù)智技術(shù)服務(wù)的集團(tuán)公司,面向產(chǎn)業(yè)、金融、政府公共等領(lǐng)域客戶,提供咨詢、軟件開(kāi)發(fā)、運(yùn)行維護(hù)、云基礎(chǔ)設(shè)施等一站式服務(wù)及行業(yè)、業(yè)務(wù)和技術(shù)解決方案。客戶背景AI設(shè)計(jì)助手 AI編碼助手 AI測(cè)試助手AI安全助手 AI知識(shí)助手“信華信軟件工程大模型”基于信華信近30年軟件工程領(lǐng)域沉淀,聯(lián)合aiXcoder等AI生態(tài)合作伙伴,打造符合軟件工程標(biāo)準(zhǔn)流程的五大應(yīng)用域。

項(xiàng)目難點(diǎn)

搭建思路項(xiàng)目效果基于自研模型工具鏈,“信華信軟件工程大模型”支持企業(yè)引入行業(yè)數(shù)據(jù),進(jìn)行領(lǐng)域微調(diào),為企業(yè)構(gòu)建符合自身需求的軟件工程大模型。目前信華信軟件工程大模型已在應(yīng)急領(lǐng)域?qū)崿F(xiàn)共創(chuàng)應(yīng)用,帶動(dòng)該領(lǐng)域軟件實(shí)踐項(xiàng)目缺陷數(shù)量降低33.35%,通用業(yè)務(wù)邏輯代碼采納率平均47%,開(kāi)發(fā)效率提升8.38%。數(shù)據(jù)隱私與安全算法可解釋技術(shù)標(biāo)準(zhǔn)缺乏高性能計(jì)算資源人才短缺開(kāi)發(fā)成本高系統(tǒng)集成兼容性用戶接受度認(rèn)知及倫理影響智能化軟件開(kāi)發(fā)面臨諸多難點(diǎn),需要通過(guò)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論