版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
人工智能開源與標(biāo)準(zhǔn)化研究報(bào)告國家人工智能標(biāo)準(zhǔn)化總體組二零一九年四月編寫單位(排名不分先后)中國電子技術(shù)標(biāo)準(zhǔn)化研究院華為技術(shù)有限公司騰訊計(jì)算機(jī)系統(tǒng)有限公司京東數(shù)字科技控股有限公司威麟信息技術(shù)開發(fā)(上海)有限公司深圳前海微眾銀行股份有限公司浪潮軟件集團(tuán)有限公司重慶郵電大學(xué)
中國科學(xué)院自動(dòng)化研究所北京深睿博聯(lián)科技有限責(zé)任公司成都四方偉業(yè)股份有限公司英特爾(中國)有限公司國際商業(yè)機(jī)器(中國)投資有限公司機(jī)械工業(yè)第六設(shè)計(jì)研究院有限公司深圳市商湯科技有限公司華夏芯(北京)通用處理器技術(shù)有限公司南京云問網(wǎng)絡(luò)技術(shù)有限公司
?西門子(中國)有限公司中國電力科學(xué)研究院有限公司深圳云天勵(lì)飛技術(shù)有限公司重慶中科云從科技有限公司
金稅信息技術(shù)服務(wù)股份有限公司上海智能制造系統(tǒng)創(chuàng)新中心有限公司天津天大康博科技有限公司蘇州蘇相機(jī)器人智能裝備有限公司編寫人員(排名不分先后)侯培新堵俊平戴東東代紅董建張群馬珊珊汪小娟王燕妮關(guān)賀符海芳孟繁亮張文杰楊曉光付會(huì)文安耀祖翁家良朱兆穎李斌盧麗珊王功明龐宇杜振東楊萌沈盛宇劉鵬劉斌張大偉章謙一霍欣王偉才易明田忠李海杰顏深根葉安華劉軍陳江寧張英麗秦湘軍王彤鄭文先陳斌代翔梅軍王飛李軍鄭晨光瞿衛(wèi)新楊品目錄第一章概述11.1背景及目的11.2本報(bào)告的價(jià)值21.3本報(bào)告的脈絡(luò)梳理與導(dǎo)讀3第二章AI產(chǎn)業(yè)現(xiàn)狀及開源面臨的宏觀問題42.1AI產(chǎn)業(yè)現(xiàn)狀及產(chǎn)業(yè)鏈42.1.1基礎(chǔ)層52.1.2技術(shù)層62.1.3行業(yè)應(yīng)用層72.2AI開源所存在的問題92.2.1法律道德問題92.2.2潛在鎖定風(fēng)險(xiǎn)102.2.3安全問題102.2.4標(biāo)準(zhǔn)統(tǒng)一問題102.2.5版本兼容性問題112.2.6行業(yè)問題11第三章AI開源生態(tài)現(xiàn)狀123.1AI開源全棧(聚焦機(jī)器學(xué)習(xí)及深度學(xué)習(xí))123.1.1芯片使能133.1.2分布式集群153.1.3大數(shù)據(jù)支撐163.1.4數(shù)據(jù)管理173.1.5模型格式183.1.6深度學(xué)習(xí)框架183.1.7機(jī)器學(xué)習(xí)框架193.1.8知識(shí)圖譜(知識(shí)庫)203.1.9強(qiáng)化學(xué)習(xí)20I3.1.10模型中間表示層IR 213.1.11端側(cè)推理框架 223.1.12高級(jí)API 233.1.13開放數(shù)據(jù)集 243.1.14分布式調(diào)度 263.1.15可視化工具 273.1.16模型市場 273.1.17應(yīng)用類項(xiàng)目 283.2開源組織 323.2.1開源中國 323.2.2開源社 333.2.3OpenI啟智開源開放平臺(tái) 353.2.4Linux基金會(huì) 363.2.5OpenStack基金會(huì) 373.2.6Apache基金會(huì) 383.3組織/機(jī)構(gòu)參與開源的角色及目的 39第四章AI開源技術(shù)目前在落地中存在的問題與差距 404.1AI在應(yīng)用時(shí)的總體工作流 414.1.1概述 414.1.2經(jīng)過抽象的工作流實(shí)現(xiàn) 444.1.3實(shí)際應(yīng)用的AI工作流應(yīng)具備的特點(diǎn) 474.2當(dāng)前AI技術(shù)在行業(yè)應(yīng)用中的現(xiàn)狀及問題 484.2.1交通領(lǐng)域 484.2.2油氣領(lǐng)域 504.2.3公共安全領(lǐng)域 524.2.4工業(yè)領(lǐng)域 554.2.5電力領(lǐng)域 584.2.6金融領(lǐng)域 604.2.7醫(yī)療領(lǐng)域 62II4.3問題總結(jié)及應(yīng)對(duì)思路644.3.1AI開源軟件的數(shù)據(jù)支持654.3.2AI開源軟件的算法664.3.3AI開源軟件的分布式基礎(chǔ)設(shè)施67第五章AI數(shù)據(jù)開放及協(xié)同695.1AI數(shù)據(jù)的關(guān)系和需求695.1.1面對(duì)的挑戰(zhàn)695.1.2AI數(shù)據(jù)開放和協(xié)同中的相關(guān)方715.2AI數(shù)據(jù)開放和協(xié)同中相關(guān)行業(yè)分析725.2.1政府角度分析735.2.2醫(yī)療行業(yè)分析745.2.3金融行業(yè)分析765.2.4交通行業(yè)分析775.2.5物流行業(yè)分析785.2.6制造行業(yè)分析805.2.7教育行業(yè)分析815.2.8石油行業(yè)分析825.3AI數(shù)據(jù)開放和協(xié)同的可行性835.3.1頂層設(shè)計(jì)835.3.2法律法規(guī)845.3.3數(shù)據(jù)治理855.3.4開源數(shù)據(jù)平臺(tái)建設(shè)855.4潛在解決方案865.4.1中心化模式875.4.2混合型模式895.4.3去中心化模式905.4.4沒有初始數(shù)據(jù)的模式92第六章AI領(lǐng)域開源與標(biāo)準(zhǔn)的關(guān)系936.1開源與標(biāo)準(zhǔn)聯(lián)動(dòng)的案例93III6.1.1容器936.1.2大數(shù)據(jù)文件格式946.1.3OPNFV(網(wǎng)絡(luò)功能虛擬化)956.2AI領(lǐng)域開源與標(biāo)準(zhǔn)聯(lián)動(dòng)的思考966.3本次標(biāo)準(zhǔn)機(jī)遇研究的范圍與內(nèi)容976.3.1行業(yè)應(yīng)用標(biāo)準(zhǔn)986.3.2AI平臺(tái)標(biāo)準(zhǔn)986.3.3安全標(biāo)準(zhǔn)1046.3.4應(yīng)用智能化水平評(píng)估1056.4制定人工智能標(biāo)準(zhǔn)中要考慮的因素1066.4.1倫理與社會(huì)關(guān)注1066.4.2監(jiān)管與治理因素1076.4.3把握開源與標(biāo)準(zhǔn)平衡,促進(jìn)創(chuàng)新與產(chǎn)業(yè)發(fā)展108109110表A.1AI開源項(xiàng)目社區(qū)活躍度指標(biāo)統(tǒng)計(jì)110113表B.1第五章技術(shù)術(shù)語表113表B.2第六章技術(shù)術(shù)語表115IV第一章概述1.1 背景及目的2013年以來,隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,引發(fā)了新一輪人工智能熱潮,諸如:AlphaGo、刷臉支付、無人駕駛、AR、無人超市等應(yīng)用層出不窮。大量資本和并購的涌入,加速了人工智能和產(chǎn)業(yè)的結(jié)合,人工智能甚至有可能成為是繼蒸汽機(jī)、電力和計(jì)算機(jī)之后,人類社會(huì)的第四次革命。人工智能(Artificialintelligence,AI)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。在歷史上,人工智能有過很多個(gè)定義,但是迄今為止沒有一個(gè)官方的、統(tǒng)一的、正式的定義。人工智能最早由麻省理工學(xué)院的JohnMcCarthy在1956年的達(dá)特矛斯會(huì)議上提出的:人工智能就是要讓機(jī)器的行為看起來就像是人所表現(xiàn)出的智能行為一樣。世界各國紛紛將發(fā)展人工智能作為搶抓下一輪科技革命先機(jī)的重要舉措。隨著人工智能領(lǐng)域國際競爭的日益激烈,2017年國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,提出我國新一代人工智能發(fā)展的指導(dǎo)思想、戰(zhàn)略目標(biāo)、重點(diǎn)任務(wù)和保障措施,為部署構(gòu)筑我國人工智能發(fā)展的先發(fā)優(yōu)勢,加快建設(shè)創(chuàng)新型國家和世界科技強(qiáng)國構(gòu)建了基礎(chǔ)。本報(bào)告中的開源指源碼公開、源數(shù)據(jù)公開及其他成果形式(如軟件、系統(tǒng)或平臺(tái)架構(gòu)等)的公開。近年來開源技術(shù)蓬勃發(fā)展,諸如計(jì)算機(jī)視覺開源社區(qū)OpenCV、開源數(shù)據(jù)集ImageNet、開源智能終端操作系統(tǒng)Android和其他大量開源工具及平臺(tái),無不表明開源創(chuàng)新與協(xié)同有力推動(dòng)了產(chǎn)業(yè)進(jìn)程。同理,人工智能尤其是深度學(xué)習(xí)相關(guān)的開源蓬勃發(fā)展,也將對(duì)我國人工智能相關(guān)產(chǎn)業(yè)產(chǎn)生積極影響。第一,人工智能開源有助于支撐人工智能領(lǐng)域形成高端產(chǎn)業(yè)集群優(yōu)勢,逐步引領(lǐng)世界前沿技術(shù)的發(fā)展。第二,人工智能開源有助于吸引更多人才進(jìn)入人工智能產(chǎn)業(yè),建設(shè)多層次人才培養(yǎng)體系。第三,人工智能開源有助于推動(dòng)人工智能廣泛應(yīng)用,加快推動(dòng)人工智能與各1行業(yè)的融合創(chuàng)新和賦能。1.2 本報(bào)告的價(jià)值本報(bào)告旨在為政府及行業(yè)的政策制定者、企業(yè)業(yè)務(wù)決策者、技術(shù)決策者提供參考,促進(jìn)經(jīng)濟(jì)社會(huì)各領(lǐng)域智能化轉(zhuǎn)型,加速人工智能技術(shù)在全行業(yè)應(yīng)用落地。(1)促進(jìn)人工智能產(chǎn)業(yè)的發(fā)展提升報(bào)告集成了各行各業(yè)在人工智能領(lǐng)域的經(jīng)典案例,提供了豐富的知識(shí)積累和發(fā)展經(jīng)驗(yàn),可以幫助決策者快速形成發(fā)展思路(包括實(shí)現(xiàn)方法和風(fēng)險(xiǎn)評(píng)估),促進(jìn)行業(yè)的發(fā)展提升。(2)加速人工智能技術(shù)的應(yīng)用落地報(bào)告描述了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)開源技術(shù)全棧,通過介紹開源工具平臺(tái)及基準(zhǔn)的方法論,降低行業(yè)人員學(xué)習(xí)和應(yīng)用人工智能的技術(shù)門檻,提升研發(fā)速度,降低研發(fā)和運(yùn)維管理成本,使前沿技術(shù)和新興算法能快速運(yùn)用到具體領(lǐng)域業(yè)務(wù)中并創(chuàng)造價(jià)值。(3)推動(dòng)人工智能生態(tài)圈建設(shè)報(bào)告所描述的人工智能領(lǐng)域的經(jīng)驗(yàn)和需求能夠促進(jìn)人工智能生態(tài)圈的良性發(fā)展,促進(jìn)企業(yè)的技術(shù)創(chuàng)新。標(biāo)準(zhǔn)與開源的聯(lián)動(dòng)能使產(chǎn)業(yè)發(fā)展更加健康。(4)推動(dòng)產(chǎn)業(yè)以更開放的心態(tài)進(jìn)行協(xié)同創(chuàng)新報(bào)告所倡導(dǎo)的開源開放的業(yè)態(tài)有助于推動(dòng)中國人工智能開源走向更深層次,例如數(shù)據(jù)開放協(xié)同的文化及平臺(tái)建設(shè)、開源分享思維和隱私保密需求的平衡等。報(bào)告會(huì)給出開放數(shù)據(jù)平臺(tái)的構(gòu)建思路及四種可供參考的方案。2圖1本報(bào)告的四大價(jià)值1.3 本報(bào)告的脈絡(luò)梳理與導(dǎo)讀本次報(bào)告分為如下幾個(gè)部分:第二章對(duì)AI的產(chǎn)業(yè)現(xiàn)狀及人工智能開源落地行業(yè)的宏觀問題進(jìn)行描述。首先分析了國際國內(nèi)當(dāng)前AI產(chǎn)業(yè)集聚情況,從基礎(chǔ)層、技術(shù)層和行業(yè)應(yīng)用層等三個(gè)層次深入描述了AI產(chǎn)業(yè)鏈現(xiàn)狀,提及了工業(yè)、醫(yī)療、電商等典型領(lǐng)域的應(yīng)用場景,然后對(duì)AI開源面對(duì)的法律道德、壟斷風(fēng)險(xiǎn)、標(biāo)準(zhǔn)統(tǒng)一等系列問題進(jìn)行了深入探討。第三章主要對(duì)人工智能開源現(xiàn)狀及相關(guān)生態(tài)做一個(gè)全面的分析,包括人工智能開源項(xiàng)目(聚焦機(jī)器學(xué)習(xí)、深度學(xué)習(xí))的全棧圖,并給出全棧各層的定義。其次從各層挑選一些典型的項(xiàng)目來分析其技術(shù)及生態(tài)特點(diǎn)、主要的發(fā)起及參與的公司及個(gè)人。此外也介紹相關(guān)的開源組織,包括國內(nèi)的組織如開源中國、國際組織Linux基金會(huì)及Apache軟件基金會(huì),然后分析各組織、公司在重要開源項(xiàng)目中的角色及目的。第四章首先介紹了AI在應(yīng)用時(shí)的總體工作流,然后系統(tǒng)化地分析當(dāng)前基于開源的人工智能技術(shù)在解決行業(yè)具體問題時(shí)還有哪些不足、開源起了什么作用、還有哪些短板、在全棧中還有哪些缺失等,試圖從技術(shù)生產(chǎn)者及技術(shù)消費(fèi)者兩個(gè)緯度來闡述人工智能開源技術(shù)是否可以解決所有問題。第五章主要闡述新一代數(shù)據(jù)驅(qū)動(dòng)的人工智能將給傳統(tǒng)以代碼為核心的開源3理念帶來哪些挑戰(zhàn),從政府角度以及一些典型行業(yè)出發(fā)分析AI數(shù)據(jù)開放和協(xié)同中存在的問題,從頂層設(shè)計(jì)、法律規(guī)范、數(shù)據(jù)治理、開源數(shù)據(jù)平臺(tái)建設(shè)說明AI數(shù)據(jù)開放和協(xié)同的可行性,最后給出四種可行性技術(shù)架構(gòu)推動(dòng)新一代開源運(yùn)動(dòng)(OpenSourceMovement)的升級(jí),實(shí)現(xiàn)“開放生態(tài)圈平臺(tái)”(OpenEcosystemPlatform)的愿景。第六章將著重闡述人工智能領(lǐng)域開源與標(biāo)準(zhǔn)的關(guān)系和相互促進(jìn)。首先介紹在云計(jì)算、大數(shù)據(jù)、電信網(wǎng)絡(luò)等幾個(gè)成功的開源與標(biāo)準(zhǔn)聯(lián)動(dòng)的案例,隨后闡述人工智能領(lǐng)域開源與標(biāo)準(zhǔn)的相互關(guān)系和聯(lián)動(dòng)建議,并針對(duì)人工智能落地過程中的問題梳理出標(biāo)準(zhǔn)的機(jī)會(huì),最后闡述在標(biāo)準(zhǔn)制定中可能遇到的問題以及相關(guān)思考。第二章AI產(chǎn)業(yè)現(xiàn)狀及開源面臨的宏觀問題2.1 AI產(chǎn)業(yè)現(xiàn)狀及產(chǎn)業(yè)鏈現(xiàn)有AI開源產(chǎn)品在行業(yè)中的應(yīng)用越來越多,一些企業(yè)利用自身的技術(shù)優(yōu)勢,重點(diǎn)打造AI應(yīng)用開放平臺(tái),提供語音引擎、視覺引擎、自然語言處理引擎等眾AI基礎(chǔ)技術(shù);圍繞開放平臺(tái),構(gòu)建人才生態(tài)和行業(yè)生態(tài),全面覆蓋教育、金融、家電、醫(yī)療、手機(jī)、汽車、安防等領(lǐng)域,在內(nèi)業(yè)已產(chǎn)生巨大的經(jīng)濟(jì)價(jià)值和社會(huì)價(jià)值。伴隨著應(yīng)用場景的快速發(fā)展,數(shù)據(jù)開源會(huì)成為新的趨勢,數(shù)據(jù)收集和標(biāo)注的標(biāo)準(zhǔn)化需求也會(huì)越來越迫切,業(yè)內(nèi)也產(chǎn)生了一批從事數(shù)據(jù)收集和標(biāo)注的初創(chuàng)公司和平臺(tái)。目前,全球涉及人工智能的企業(yè)集中分布在美國、中國、加拿大、德國等少數(shù)國家或地區(qū),且在美國和中國的企業(yè)數(shù)量已占全球的半數(shù)以上。美國和中國依靠其卓越的技術(shù)研發(fā)機(jī)構(gòu)及融合豐富應(yīng)用場景的各類實(shí)驗(yàn)室,協(xié)同領(lǐng)銜全球人工智能的發(fā)展,奠定了雄厚的技術(shù)基礎(chǔ)。中國當(dāng)前具有多個(gè)人工智能聚集中心和地方特色人工智能發(fā)展產(chǎn)業(yè),其中以北京與天津、上海與杭州、深圳與廣州為重點(diǎn)城市群抱團(tuán)發(fā)展的產(chǎn)業(yè)格局逐步顯現(xiàn),形成三大人工智能聚集中心。2是我們制定的人工智能參考框架圖,圖3是人工智能領(lǐng)域目前在產(chǎn)業(yè)界應(yīng)用的全景圖。在產(chǎn)業(yè)全景圖中的“基礎(chǔ)設(shè)施”層對(duì)應(yīng)了參考框架中的“數(shù)據(jù)”與“算力”,產(chǎn)業(yè)全景圖中的“關(guān)鍵技術(shù)”層對(duì)應(yīng)了參考框架中的“算法”,產(chǎn)4業(yè)全景圖中的“智能系統(tǒng)”及“行業(yè)應(yīng)用”對(duì)應(yīng)了參考框架中的“產(chǎn)品與服務(wù)”。圖2人工智能參考框架圖圖3人工智能產(chǎn)業(yè)生態(tài)圈全景圖人工智能產(chǎn)業(yè)鏈宏觀上由基礎(chǔ)層、技術(shù)層和應(yīng)用層等三個(gè)層次組成,其中基礎(chǔ)與核心技術(shù)的研究主要分布在大企業(yè)及科研機(jī)構(gòu),而應(yīng)用層的研究測試在大中小企業(yè)均有涉及,形成了全面開花、全行業(yè)覆蓋的局面。2.1.1基礎(chǔ)層芯片研發(fā)作為基礎(chǔ)層的核心,已成為人工智能發(fā)展的關(guān)鍵因素。芯片在技術(shù)架構(gòu)方面可分為通用類芯片(如CPU、GPU等)、半定制化芯片(如FPGA等)、5全定制化芯片(如ASIC等)和類腦計(jì)算芯片。目前GPU是深度學(xué)習(xí)訓(xùn)練平臺(tái)的主流配置,而FPGA的靈活可編程特點(diǎn)可以使得在算法未完全成熟時(shí)切入市場,同時(shí)其低功耗特性也被大型數(shù)據(jù)中心所青睞。在專用人工智能芯片領(lǐng)域,自2016Google發(fā)布了TPU芯片后,這一市場熱潮不斷。國內(nèi)如寒武紀(jì)、地平線、華為海思等公司也紛紛研發(fā)出可規(guī)模商用的人工智能專用計(jì)算芯片。隨著物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,傳感、計(jì)算、通訊、AI等功能的集成變得尤為重要,若每個(gè)功能均依靠單一芯片,不但效率低下,而且能耗和成本都很高,因此將不同的功能整合在一起,構(gòu)建異構(gòu)芯片,會(huì)極大緩解上述問題。由AMD、ARM、華為、HXGPT、高通、IMAGINATION和三星等公司組成的全球異構(gòu)系統(tǒng)架構(gòu)(HSA)聯(lián)盟在2017年成立了中國區(qū)域委員會(huì)(CRC)。CRC的任務(wù)是以構(gòu)建HSA生態(tài)系統(tǒng)為側(cè)重點(diǎn),提高對(duì)異構(gòu)計(jì)算的意識(shí)認(rèn)知,并促進(jìn)HSA在中國的標(biāo)準(zhǔn)化進(jìn)程。新一代人工智能依賴于海量數(shù)據(jù)的處理、存儲(chǔ)、傳輸,因此離不開云計(jì)算。云計(jì)算是把大量的計(jì)算資源封裝抽象為IT資源池,用于創(chuàng)建高度虛擬化的資源供用戶使用。通過動(dòng)態(tài)整合、共享硬件設(shè)備供應(yīng)來實(shí)現(xiàn)IT投資的利用率最大化,降低了使用計(jì)算的單位成本及IT運(yùn)維成本,促進(jìn)了人工智能產(chǎn)業(yè)的商業(yè)化進(jìn)程。2.1.2技術(shù)層目前技術(shù)層中的核心技術(shù)主要由科技巨頭企業(yè)掌控,如微軟、亞馬遜、Google、Facebook、百度、阿里、騰訊、京東、小米、商湯等。此外,一大批初創(chuàng)企業(yè)和開源組織也陸續(xù)加入其中。它們共同探索和推進(jìn)AI技術(shù)的發(fā)展,催生出了一批在業(yè)內(nèi)有深遠(yuǎn)影響力的開源項(xiàng)目,如TensorFlow、PaddlePaddle、Caffe、CNTK、Deeplearning4j、PyTorch、Mahout、MLlib。這些科技企業(yè),通過招募AI高端人才及組建實(shí)驗(yàn)室等方式加快關(guān)鍵技術(shù)研發(fā),并通過開源技術(shù)平臺(tái)構(gòu)建生態(tài)體系。技術(shù)層面,包含機(jī)器學(xué)習(xí)、知識(shí)圖譜、自然語言處理、虛擬現(xiàn)實(shí)或增強(qiáng)現(xiàn)實(shí)、計(jì)算機(jī)視覺、生物特征識(shí)別、人機(jī)交互等技術(shù)與應(yīng)用場景相結(jié)合,從而衍生出大量的智能化產(chǎn)品與服務(wù),包括智能家居、智能機(jī)器人、智能搜索引擎、智能問答系統(tǒng)、一體機(jī)VR、無人駕駛汽車、人臉識(shí)別系統(tǒng)、智能客服等。62.1.3行業(yè)應(yīng)用層人工智能是制造業(yè)數(shù)字化、網(wǎng)絡(luò)化、智能化轉(zhuǎn)型發(fā)展的關(guān)鍵引擎,是促進(jìn)實(shí)體經(jīng)濟(jì)發(fā)展的重點(diǎn)方向。近年來各國政府和產(chǎn)業(yè)界紛紛采取行動(dòng)推進(jìn)基礎(chǔ)性研究及產(chǎn)業(yè)實(shí)踐部署,人工智能的各種應(yīng)用如機(jī)器人、無人駕駛、智能客服等百花齊放,大中小企業(yè)均有涉及,形成了全行業(yè)全覆蓋的局面。本次報(bào)告的寫作單位涉及了如下行業(yè):工業(yè)制造、醫(yī)療、電商、公安、金融、消費(fèi)電子、交通、物流、航空、能源、政務(wù)等,因此下面報(bào)告中不論是行業(yè)案例還是痛點(diǎn)分析等主要以它們?yōu)橹鳌M瑫r(shí)這些行業(yè)也是在AI應(yīng)用中訴求比較明確的領(lǐng)域。 工業(yè)人工智能在工業(yè)領(lǐng)域深度融合新一代信息通信技術(shù)與先進(jìn)制造技術(shù),貫穿于設(shè)計(jì)、生產(chǎn)、管理、服務(wù)等制造活動(dòng)的各個(gè)環(huán)節(jié),引導(dǎo)具有自感知、自學(xué)習(xí)、自決策、自執(zhí)行、自適應(yīng)等功能的新型生產(chǎn)方式。人工智能在工業(yè)領(lǐng)域進(jìn)一步融合拓展的應(yīng)用方向還有機(jī)器視覺檢測分揀、人機(jī)交互、可視化及AR/VR、行業(yè)知識(shí)圖譜及知識(shí)自動(dòng)化等,支持工業(yè)設(shè)備能耗預(yù)測與優(yōu)化,增強(qiáng)工業(yè)設(shè)備預(yù)測性維護(hù)和智能故障診斷,為企業(yè)生產(chǎn)個(gè)性化需求、企業(yè)運(yùn)行優(yōu)化及產(chǎn)品生命周期控制提供輔助決策,進(jìn)而提升制造質(zhì)量水平和企業(yè)經(jīng)濟(jì)效益。 醫(yī)療基于圖像分析技術(shù)的影像輔助診斷和醫(yī)學(xué)病理分析相結(jié)合,提供了更準(zhǔn)確的臨床診斷,同時(shí)提升了醫(yī)療服務(wù)的效率。在健康趨勢分析、疾病預(yù)測、影像輔助診斷等領(lǐng)域引入人工智能技術(shù),可以有效預(yù)測疫情并防止其進(jìn)一步擴(kuò)散和發(fā)展,提供患者預(yù)前和預(yù)后診斷和治療的評(píng)估方法和精準(zhǔn)診療決策,有效提高醫(yī)護(hù)人員工作效率和診斷水平,從而在整體上為醫(yī)療健康領(lǐng)域向更高的智能化方向發(fā)展提供了非常有利的技術(shù)條件。 電商在電商領(lǐng)域,無人店、無人貨架紛紛引入人臉識(shí)別、貨物識(shí)別等先進(jìn)技術(shù),實(shí)現(xiàn)無人值守,融合人工智能的倉儲(chǔ)機(jī)器人,實(shí)現(xiàn)了貨物的識(shí)別、揀選和自動(dòng)搬運(yùn)等功能,極大解放了生產(chǎn)力。通過對(duì)消費(fèi)者歷史購買行為的深入分析,提供了更精準(zhǔn)的目標(biāo)客戶營銷和商品推薦。 公共安全在安防領(lǐng)域,通過支持前端提取信息,如采用在復(fù)雜場景下的人車混合多特征結(jié)構(gòu)化信息技術(shù),提取人臉屬性、人臉軌跡、車牌車型等特征屬性,利用人工智能對(duì)視頻、圖像進(jìn)行存儲(chǔ)和圖像比對(duì)分析,建立危險(xiǎn)人數(shù)圖像庫,從而識(shí)別危險(xiǎn)隱患并進(jìn)行安全處理,是構(gòu)建未來智慧城市安防體系的基礎(chǔ),在反恐維穩(wěn)、犯罪預(yù)警、案件偵破和網(wǎng)絡(luò)音視頻監(jiān)管等領(lǐng)域具有重要應(yīng)用價(jià)值和廣泛的應(yīng)用前景。 金融在金融領(lǐng)域可以借助大數(shù)據(jù),以人工智能為內(nèi)核支持金融行業(yè)的用戶畫像識(shí)別、資產(chǎn)信息標(biāo)簽化、智能獲客、身份認(rèn)證、智能化運(yùn)維、智能投顧、智能理賠、反欺詐與智能風(fēng)控、大數(shù)據(jù)征信、網(wǎng)點(diǎn)機(jī)器人服務(wù)等應(yīng)用場景,對(duì)于提高金融系統(tǒng)管理效率、拓展金融新業(yè)務(wù)、防范金融風(fēng)險(xiǎn)等方面意義重大。 智能終端/個(gè)人助理以住宅為平臺(tái),基于物聯(lián)網(wǎng)技術(shù),由硬件、軟件系統(tǒng)、云計(jì)算平臺(tái)構(gòu)成的家居生態(tài)圈,實(shí)現(xiàn)遠(yuǎn)程控制設(shè)備、設(shè)備間互聯(lián)互通、設(shè)備自我學(xué)習(xí)等功能,并通過收集、分析用戶行為數(shù)據(jù)為用戶提供個(gè)性化生活服務(wù)。通過人機(jī)交互應(yīng)用在多種服務(wù)行業(yè)的咨詢、指引、查詢、講解和業(yè)務(wù)辦理等應(yīng)用場景;與APP連接,實(shí)現(xiàn)硬件控制、日程管理、信息查詢、生活服務(wù)、情感陪伴等。 交通借助移動(dòng)通信、寬帶網(wǎng)、射頻識(shí)別、傳感器、云計(jì)算等新一代信息技術(shù)作支撐,利用攝像頭監(jiān)測交通路況和車輛信息,聯(lián)通各個(gè)核心交通元素,廣泛應(yīng)用人工智能技術(shù)、統(tǒng)計(jì)分析技術(shù)、數(shù)據(jù)融合技術(shù)、并行計(jì)算技術(shù)等處理海量交通信息數(shù)據(jù),實(shí)現(xiàn)信息互通與共享,以及交通元素間彼此協(xié)調(diào)、優(yōu)化配置和高效使用,形成人、車和交通的一個(gè)高效協(xié)同環(huán)境。 物流利用智能搜索、推理規(guī)劃、計(jì)算機(jī)視覺、智能機(jī)器人、大數(shù)據(jù)分析以及射頻識(shí)別、自動(dòng)感知、全球定位系統(tǒng)等先進(jìn)的物聯(lián)網(wǎng)技術(shù),應(yīng)用于物流業(yè)運(yùn)輸、倉儲(chǔ)、配送、包裝、裝卸等基本活動(dòng)環(huán)節(jié),實(shí)現(xiàn)智能物流系統(tǒng)的線路規(guī)劃、人車資源調(diào)配、自動(dòng)化運(yùn)作和高效率優(yōu)化管理,提高物流效率,提升物流行業(yè)的服務(wù)水平,降低成本,減少自然資源和社會(huì)資源消耗。 航空利用機(jī)器學(xué)習(xí)、知識(shí)圖譜、自然語言處理、人機(jī)交互、計(jì)算機(jī)視覺、生物特征識(shí)別、AR/VR為基礎(chǔ)的感知與認(rèn)知、決策執(zhí)行與控制、交互與協(xié)同、檢測與維護(hù)等內(nèi)容,應(yīng)用于人臉識(shí)別安檢、智慧航顯、航空發(fā)動(dòng)機(jī)預(yù)測健康管理及航空大數(shù)據(jù)分析、路徑規(guī)劃、任務(wù)規(guī)劃、集群管理、目標(biāo)識(shí)別、戰(zhàn)術(shù)決策、毀傷評(píng)估、質(zhì)量評(píng)估和可靠性實(shí)驗(yàn)檢測等方面。不論民用還是軍用航空領(lǐng)域,AI可以實(shí)現(xiàn)人與機(jī)器智能的結(jié)合,全面提升觀察-調(diào)整-決策-行動(dòng)(OODA)環(huán)的運(yùn)行速度和運(yùn)行質(zhì)量。2.2 AI開源所存在的問題2.2.1法律道德問題隨著人工智能的發(fā)展,其已經(jīng)逐漸涉及到違法犯罪的黑色領(lǐng)域,被大肆用于9詐騙、色情、犯罪、甚至未來的戰(zhàn)爭中。例如,無人車、無人機(jī)等設(shè)備可以在不依賴人的情況下自主做出決策,做出危及人身安全的動(dòng)作。這些新的情況將會(huì)帶來倫理、道德和法律上的一系列危機(jī),亟待相關(guān)專家給出合適的解決方案。高質(zhì)量、大規(guī)模的數(shù)據(jù)一般會(huì)認(rèn)為是企業(yè)的重要資產(chǎn),開源或開放后可能導(dǎo)致喪失競爭優(yōu)勢,缺少讓數(shù)據(jù)開源貢獻(xiàn)者獲得合理回報(bào)的機(jī)制。另外,數(shù)據(jù)和模型很難保護(hù)自身知識(shí)產(chǎn)品不被競爭對(duì)手抄襲,甚至直接使用,這對(duì)企業(yè)進(jìn)行數(shù)據(jù)開源形成了很大阻力,因此需要建立合適的政策保護(hù)機(jī)制。2.2.2潛在鎖定風(fēng)險(xiǎn)目前雖然有大量的開源技術(shù)和軟件可以使用,但是背后的廠商如谷歌、Facebook、亞馬遜、蘋果對(duì)這些開源技術(shù)也掌握著絕對(duì)話語權(quán)。一旦使用開源軟件的某些廠商利益跟上述公司相沖突,不排除被取消軟件授權(quán)或者相關(guān)軟件不再更新的可能性。企業(yè)基于自身的相關(guān)考慮,將相關(guān)項(xiàng)目進(jìn)行開源,然而由于企業(yè)自身存在大量業(yè)務(wù)開展,因此導(dǎo)致其開源的相關(guān)項(xiàng)目的維護(hù)不及時(shí),一旦項(xiàng)目停止維護(hù),項(xiàng)目的使用者則面臨進(jìn)退兩難的困境,平臺(tái)遷移成本太高,但若不遷移平臺(tái),業(yè)務(wù)也無法得到平臺(tái)新的支持。2.2.3安全問題AI開源工具雖有開放、共享、自由等特性,企業(yè)在享受開源技術(shù)帶來的便利的同時(shí),也存在巨大的安全風(fēng)險(xiǎn)。由于源代碼公開,所有發(fā)現(xiàn)的漏洞都會(huì)被第一時(shí)間公布,因此也容易被攻擊者利用;由AI開源技術(shù)形成的軟件,其最終使用用戶往往得不到最及時(shí)的更新,并且在軟件開發(fā)和驗(yàn)收過程中,不易準(zhǔn)確判斷軟件里包含哪些開源組件,容易造成安全隱患。另一方面,AI開源代碼在社區(qū)中一般由相應(yīng)的團(tuán)隊(duì)或個(gè)人開展維護(hù)工作,缺乏對(duì)應(yīng)的激勵(lì)機(jī)制保障代碼查找漏洞或及時(shí)更新,也會(huì)導(dǎo)致用戶疑慮,降低AI開源技術(shù)及產(chǎn)品的推廣使用。2.2.4標(biāo)準(zhǔn)統(tǒng)一問題不同于其他開源軟件,當(dāng)前AI開源模式不夠充分,僅限于開源AI框架,數(shù)10據(jù)開源力度不足,對(duì)AI技術(shù)的應(yīng)用形成了壁壘。深度學(xué)習(xí)方面,AI已開源框架、工具缺乏基本的統(tǒng)一標(biāo)準(zhǔn),造成不同框架下的模型算法兼容困難;硬件優(yōu)化方面,AI開源軟件大多在X86和GPU上進(jìn)行優(yōu)化,很少有在其他體系結(jié)構(gòu)上進(jìn)行優(yōu)化的項(xiàng)目;數(shù)據(jù)格式方面,AI開源目前多是針對(duì)深度學(xué)習(xí)的開源項(xiàng)目,而深度學(xué)習(xí)需要大量的訓(xùn)練數(shù)據(jù),數(shù)據(jù)問題將許多公司卡在門外;模型算法方面,從數(shù)據(jù)和模型研究到形成產(chǎn)品方案之間存在明顯差距。很多開源的AI算法,僅在所限定的理想條件下有效,難以適應(yīng)復(fù)雜的實(shí)際應(yīng)用環(huán)境,且在大規(guī)模分布式計(jì)算與存儲(chǔ)環(huán)境下效果不佳。2.2.5版本兼容性問題不同開源工具的兼容性問題導(dǎo)致整合困難,同一開源工具的不同版本之間也存在兼容性問題。開源社區(qū)涌現(xiàn)了一批以Caffe、MxNet、TensorFlow、Torch等為代表的熱門AI開源開發(fā)框架,這些框架簡化了AI技術(shù)的工程實(shí)現(xiàn)難度,但是每個(gè)框架之間接口不統(tǒng)一,模型格式不一致,在一定程度上造成了在各個(gè)框架之間遷移成本較高的問題,使得模型的復(fù)用較為困難,同時(shí)也增加了用戶的學(xué)習(xí)成本,為在不同場景下使用不同開發(fā)工具造成了一定的障礙。即使對(duì)同一AI開發(fā)框架,接口調(diào)整較頻繁,每次升級(jí)都會(huì)導(dǎo)致不少額外工作量;變化內(nèi)容較為激進(jìn),項(xiàng)目自身向上兼容能力較差,導(dǎo)致企業(yè)/個(gè)人在更新開源軟件時(shí)帶來極大風(fēng)險(xiǎn),同時(shí)也增加了用戶的學(xué)習(xí)成本。2.2.6行業(yè)問題雖然當(dāng)前AI已開始逐步應(yīng)用,但各行業(yè)因?yàn)樽陨淼膶傩?,均面臨一些棘手的難題,制約著AI朝更深入、更廣泛的方向應(yīng)用。由于前期研發(fā)周期較長,相關(guān)領(lǐng)域技術(shù)人才缺乏,且雇傭成本較高,實(shí)際經(jīng)濟(jì)回報(bào)難以預(yù)估,許多企業(yè)不敢冒險(xiǎn)嘗試。另外,智能制造領(lǐng)域中的人工智能標(biāo)準(zhǔn)及開源代碼仍然相對(duì)較少,無法滿足當(dāng)前人工智能技術(shù)的標(biāo)準(zhǔn)化需求,并制約著我國人工智能應(yīng)用的有序、規(guī)范、健康發(fā)展。傳統(tǒng)金融機(jī)構(gòu)歷史包袱重,多數(shù)核心系統(tǒng)難以迅速采用開源AI技術(shù);金融行業(yè)注重客戶的數(shù)據(jù)隱私保護(hù),數(shù)據(jù)的使用制約限制了人工智能相關(guān)模型的有效11性;既懂金融業(yè)務(wù)、又懂開源AI技術(shù)的人才也極度稀缺。航空航天行業(yè)背景特殊,需要有針對(duì)性地進(jìn)行開源。目前完全出于航空航天領(lǐng)域考慮的AI框架少,技術(shù)架構(gòu)不明晰,且軍事領(lǐng)域由于出于安全問題考慮,公共技術(shù)移植也較少;此外,在民用領(lǐng)域,從飛控系統(tǒng)的開源開始,就不斷打開了無人機(jī)的進(jìn)入門檻,但是對(duì)于開源的安全性和穩(wěn)定性還有待考慮,對(duì)于開源的質(zhì)量評(píng)定等還處在探索階段。第三章AI開源生態(tài)現(xiàn)狀3.1 AI開源全棧(聚焦機(jī)器學(xué)習(xí)及深度學(xué)習(xí))《人工智能標(biāo)準(zhǔn)化白皮書(2018版)》中對(duì)AI技術(shù)棧分為:智能芯片、智能傳感器、機(jī)器學(xué)習(xí)、知識(shí)圖譜、自然語言處理、人機(jī)交互、計(jì)算機(jī)視覺、生物特征識(shí)別及虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)等??紤]到目前AI領(lǐng)域開源主要是在機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí)領(lǐng)域,而且這也是目前AI技術(shù)創(chuàng)新與落地的主要領(lǐng)域,本報(bào)告總體上聚焦分析深度學(xué)習(xí)中的開源技術(shù)、所面臨的問題以及相關(guān)的技術(shù)創(chuàng)新、標(biāo)準(zhǔn)化的機(jī)遇等?;谌缟峡紤],后續(xù)除非特別指出,在本報(bào)告的語境中,AI主要對(duì)應(yīng)的是機(jī)器學(xué)習(xí)/深度學(xué)習(xí)這一領(lǐng)域。圖4 AI開源全棧示意圖12上圖是目前比較活躍的機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的開源社區(qū)及項(xiàng)目所形成的開源全棧示意圖,整個(gè)開源全棧被分為四個(gè)層次:(1)基礎(chǔ)設(shè)施AI芯片是為AI計(jì)算設(shè)計(jì)的高性能芯片,業(yè)界有AI芯片設(shè)計(jì)、指令集、編程框架等開源芯片使能項(xiàng)目;同時(shí)AI工作負(fù)載(訓(xùn)練、推理、數(shù)據(jù)準(zhǔn)備與治理、生命周期管理等)計(jì)算量大,對(duì)存儲(chǔ)、網(wǎng)絡(luò)傳輸?shù)纫蟾?,需要依賴分布式部署和承載的軟件平臺(tái)。這兩部分構(gòu)成了AI框架的基礎(chǔ)設(shè)施層。(2)深度學(xué)習(xí)/機(jī)器學(xué)習(xí)(DL/ML)引擎深度學(xué)習(xí)/機(jī)器學(xué)習(xí)(DL/ML)引擎主要指深度學(xué)習(xí)/機(jī)器學(xué)習(xí)框架,包括訓(xùn)練與推理,以及與二者相關(guān)的模型格式、框架內(nèi)數(shù)據(jù)格式等,同時(shí)也包括訓(xùn)練及推理之前的數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)管理。(3)應(yīng)用使能應(yīng)用使能包括數(shù)據(jù)科學(xué)家、AI算法工程師在準(zhǔn)備數(shù)據(jù)與使用訓(xùn)練框架之外的所有周邊工作,主要包括任務(wù)視角的集群管理、數(shù)據(jù)可視化、框架易用性,以及模型/數(shù)據(jù)市場及端到端的生命周期管理。(4)AI業(yè)務(wù)AI業(yè)務(wù)主要指基于AI基礎(chǔ)及通用能力之上構(gòu)建的領(lǐng)域AI服務(wù),涵蓋視頻、語音、圖像文本等。以下是各組成部分的主要分類、描述和相關(guān)項(xiàng)目(按圖中數(shù)字標(biāo)識(shí)順序):3.1.1芯片使能深度學(xué)習(xí)需要大量重復(fù)執(zhí)行矩陣乘法、激活函數(shù)(如sigmoid、tanh)等計(jì)算過程。通用CPU執(zhí)行上述計(jì)算的性價(jià)比較低,需要采用專用的計(jì)算芯片。適AI計(jì)算的芯片包括GPU、FPGA或者ASIC方案,它們通過把AI中常用函數(shù)計(jì)算硬件化來提升硬件計(jì)算速度、降低功耗。其中熱門的開源技術(shù)包括開源的指令集、開源硬件實(shí)現(xiàn)方案、異構(gòu)計(jì)算框架和編譯器等。DLA是NVIDIA基于XavierSoC的一個(gè)深度學(xué)習(xí)開源加速平臺(tái),適合于端側(cè)推理場景的芯片SoC。DLA是一個(gè)卷積神經(jīng)網(wǎng)絡(luò)加速器(只能推理,并不能進(jìn)行訓(xùn)練),它還需要外部的CPU和內(nèi)存單元才能完整驅(qū)動(dòng)整個(gè)加速器,CPU通過13中斷和CSB總線控制NVDLA加速器。鏈接:/RISC-V是基于精簡指令集計(jì)算(RISC)原理建立的開放指令集架構(gòu)(ISA)。RISC-V是開源的指令集,可以免費(fèi)地用于所希望的設(shè)備中,允許任何人設(shè)計(jì)、制造和銷RISC-V芯片和軟件?;赗ISC-V指令集架構(gòu)可以設(shè)計(jì)服務(wù)器計(jì)算芯片、家用電器計(jì)算芯片、工控計(jì)算芯片和比指頭小的傳感器計(jì)算芯片。鏈接:/LLVM是構(gòu)架編譯器(compiler)的框架系統(tǒng),用C++編寫而成。項(xiàng)目啟動(dòng)于2000年,最初由美國UIUC大學(xué)主持開展發(fā)起的一個(gè)開源項(xiàng)目,目前LLVM已經(jīng)被蘋IOS開發(fā)工具、XilinxVivado、Facebook、Google等各大公司采用。鏈接:/OpenCL當(dāng)前由Khronos集團(tuán)管理,是一個(gè)為異構(gòu)平臺(tái)編寫程序的框架。此異構(gòu)平臺(tái)可由CPU、GPU或其它類型的處理器組成。OpenCL由一種用于編寫kernels(在OpenCL設(shè)備上運(yùn)行的函數(shù))的語言(基于C99)和一組用于定義并控制平臺(tái)的API組成。鏈接:/opencl/Vulkan?也由Khronos集團(tuán)開發(fā),使軟件開發(fā)人員能夠全面獲取Radeon?GPU與多核CPU的性能、效率和功能,大幅降低了CPU在提供重要特性、性能和影像質(zhì)量時(shí)的“API開銷”,而且可以使用通過OpenGL無法訪問的GPU硬件特性。鏈接:/vulkan/Cyborg是OpenStack社區(qū)中的一個(gè)官方項(xiàng)目,能夠提供異構(gòu)加速硬件通用管理框架。Cyborg提供面向異構(gòu)加速硬件的基礎(chǔ)生命周期管理能力(CRUD操作),通過抽象通用的數(shù)據(jù)模型與統(tǒng)一的管理操作API,為用戶提供統(tǒng)一的異構(gòu)計(jì)算資源使用體驗(yàn),而無需針對(duì)每一種異構(gòu)加速硬件特別構(gòu)建管理模塊。同時(shí),Cyborg提供異構(gòu)加速硬件管理元數(shù)據(jù)的標(biāo)準(zhǔn)化,使得資源描述和業(yè)務(wù)需求之間的映射關(guān)系更加準(zhǔn)確,在調(diào)度上可以更加通用與便捷。作為通用的異構(gòu)計(jì)算資源管理框架,Cyborg提供了如下標(biāo)準(zhǔn)化接口:掛載與卸載異構(gòu)計(jì)算設(shè)備創(chuàng)建異構(gòu)計(jì)算設(shè)備刪除異構(gòu)計(jì)算設(shè)備更改異構(gòu)計(jì)算設(shè)備14查詢異構(gòu)計(jì)算設(shè)備可編程異構(gòu)計(jì)算設(shè)備的燒寫異構(gòu)計(jì)算設(shè)備的租戶配額控制基于以上的標(biāo)準(zhǔn)化接口,用戶可以通過云計(jì)算基礎(chǔ)設(shè)施平臺(tái)為其AI業(yè)務(wù)分配合適的異構(gòu)計(jì)算資源,從而避免GPU資源調(diào)度不均、新的異構(gòu)計(jì)算設(shè)備(如ASIC等)接入困難等平臺(tái)相關(guān)的難題。鏈接:/wiki/Cyborg3.1.2分布式集群云計(jì)算平臺(tái)對(duì)人工智能的基礎(chǔ)支撐包括異構(gòu)計(jì)算的部署和開發(fā)工具兩個(gè)方面。在異構(gòu)計(jì)算方面,GPU已成為深度學(xué)習(xí)訓(xùn)練平臺(tái)的主流配置;FPGA的靈活可編程特點(diǎn)可以使得在算法未完全成熟時(shí)切入市場并方便地進(jìn)行迭代,同時(shí)其低功耗特性也被大型數(shù)據(jù)中心所青睞;2016年Google發(fā)布了TPU芯片,為機(jī)器學(xué)習(xí)提供定制化加速。在開發(fā)工具方面,現(xiàn)階段業(yè)界有很多機(jī)器學(xué)習(xí)開發(fā)框架,云平臺(tái)將這些框架服務(wù)化并進(jìn)行針對(duì)性的優(yōu)化,極大降低了人工智能開發(fā)的準(zhǔn)入門檻。當(dāng)前,AI訓(xùn)練平臺(tái)的部署已經(jīng)形成以容器技術(shù)為基礎(chǔ)的自動(dòng)化部署趨勢。各種AI公司或者互聯(lián)網(wǎng)公司的AI部門都在嘗試如何在Kubernetes(K8s)上運(yùn)行TensorFlow、Caffe/2+PyTorch、MXNet等分布式學(xué)習(xí)任務(wù)。不同的AI平臺(tái)對(duì)集群分布式部署有不同的需求,也帶來了配置難題。針對(duì)這些問題,各種部署工具也應(yīng)運(yùn)而生。GoogleKubeFlow正在不斷完善TensorFlow在K8s集群上的部署、運(yùn)維、參數(shù)調(diào)優(yōu)等功能支持,并且已經(jīng)有TNN等公司向KubeFlow貢獻(xiàn)特性。鏈接:/kubeflow/kubeflowIBM發(fā)起的FfDL是針對(duì)TensorFlow、Caffe、PyTorch等多個(gè)AI平臺(tái)在K8S行部署的工具,目前只實(shí)現(xiàn)了基本的部署功能。鏈接:/IBM/FfDL百度Paddle非常推崇在K8S上進(jìn)行AI平臺(tái)的部署,PaddleEDL項(xiàng)目在K8S上提供了資源利用率、彈性調(diào)度、容錯(cuò)等部署能力。鏈接:/OpenStack社區(qū)也加強(qiáng)對(duì)GPU等硬件的支持,同時(shí)也出現(xiàn)了一些支持AI平15臺(tái)部署的項(xiàng)目。鏈接:/3.1.3大數(shù)據(jù)支撐ApacheHadoop已經(jīng)成為大數(shù)據(jù)處理領(lǐng)域事實(shí)上的標(biāo)準(zhǔn)。Hadoop作為一個(gè)完整的大數(shù)據(jù)處理生態(tài)圈,包括多個(gè)組件:分布式文件系統(tǒng)HDFS、并行化計(jì)算框架MapReduce、非關(guān)系型數(shù)據(jù)庫HBase、分布式協(xié)調(diào)系統(tǒng)Zookeeper等。國內(nèi)外知名的IT公司,例如Yahoo、亞馬遜、百度、阿里巴巴等,都利用Hadoop集群批量處理上PB級(jí)別的數(shù)據(jù)。鏈接:/Hadoop技術(shù)為大數(shù)據(jù)技術(shù)的應(yīng)用提供了很好的支撐環(huán)境,優(yōu)勢主要體現(xiàn)在以下幾處:Hadoop本身是開源社區(qū),方便定制;擴(kuò)展性好,安全性高;社區(qū)活躍,得到多個(gè)大公司的支持;成本低,開發(fā)周期短,技術(shù)成熟。ApacheSpark是一個(gè)快速、通用、開源的集群計(jì)算系統(tǒng),是適用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一引擎。它可提供Java、Scala、Python、R語言的高級(jí)API,能夠高性能執(zhí)行圖計(jì)算,支持諸如SparkSQL、結(jié)構(gòu)數(shù)據(jù)處理、機(jī)器學(xué)習(xí)、圖計(jì)算、流計(jì)算等多種高級(jí)工具。Spark既可以單機(jī)方式運(yùn)行,也可通過YARN在Hadoop集群上運(yùn)行,它可兼容Hadoop數(shù)據(jù),能夠處理任何HDFS、HBase、Cassandra、Hive以及其它HadoopInputFormat的數(shù)據(jù)。Spark既可運(yùn)行批處理作業(yè),又可處理流計(jì)算、交互查詢、機(jī)器學(xué)習(xí)等新型作業(yè)。ApacheHadoopYARN(YetAnotherResourceNegotiator,又一種資源協(xié)調(diào)者),作為一個(gè)開源的通用資源管理系統(tǒng),是一種新的Hadoop資源管理器,為上層應(yīng)用提供統(tǒng)一的資源管理和調(diào)度,為集群在利用率、資源統(tǒng)一管理和數(shù)據(jù)共享等方面帶來巨大好處。YARN的基本思想是將資源管理、任務(wù)調(diào)度與監(jiān)測分散到不同的進(jìn)程中。資源管理器(RM)掌控全局,每個(gè)應(yīng)用有自己的應(yīng)用主控器(AM),應(yīng)用要么是單獨(dú)作業(yè),要么是有向無環(huán)圖作業(yè)。YARN是Hadoop的擴(kuò)展,它不僅可以支持MapReduce計(jì)算,還能管理諸如Hive、Hbase、Pig、Spark/Shark等應(yīng)用,從而使得各種類型的應(yīng)用互不干擾地運(yùn)行在同一個(gè)Hadoop上面,并通過16YARN從系統(tǒng)層面進(jìn)行統(tǒng)一管理,共享整個(gè)集群資源。鏈接:/3.1.4數(shù)據(jù)管理作為AI訓(xùn)練的前置需求,數(shù)據(jù)發(fā)現(xiàn)一直是企業(yè)在實(shí)施AI過程中消耗資源最為巨大的部分。DataCatalog作為解決數(shù)據(jù)發(fā)現(xiàn)難題的手段,被主流廠商和社區(qū)所重視。DataCatalog旨在通過對(duì)復(fù)雜場景下的多數(shù)據(jù)中心、多種數(shù)據(jù)源進(jìn)行元數(shù)據(jù)(MetaData)統(tǒng)一管理來解決數(shù)據(jù)邏輯統(tǒng)一、物理分布的數(shù)據(jù)共享問題。在開源社區(qū)領(lǐng)域,作為大數(shù)據(jù)端到端的數(shù)據(jù)治理方案包括:ApacheAtlas(元數(shù)據(jù)治理)、Avro(統(tǒng)一數(shù)據(jù)交換格式)。伯克利大學(xué)的RISELabGround項(xiàng)目也是專注于BigMetaData管理,通過管理數(shù)據(jù)上下文,解決數(shù)據(jù)使用效率低下、治理困難等問題。ApacheAtlas(元數(shù)據(jù)治理)是一個(gè)可擴(kuò)展核心數(shù)據(jù)治理服務(wù)集,支持?jǐn)?shù)據(jù)分類、集中策略引擎、數(shù)據(jù)血緣、安全和生命周期管理,該項(xiàng)目支持管理共享元數(shù)據(jù)、數(shù)據(jù)分級(jí)&分類、審計(jì)、安全性以及數(shù)據(jù)保護(hù)。使企業(yè)能夠有效地和高效地滿足數(shù)據(jù)的合規(guī)性要求。鏈接:/ApacheAvro可以將數(shù)據(jù)結(jié)構(gòu)或?qū)ο筠D(zhuǎn)化成便于存儲(chǔ)或傳輸?shù)母袷健vro設(shè)計(jì)之初就用來支持?jǐn)?shù)據(jù)密集型應(yīng)用,適合于遠(yuǎn)程或本地大規(guī)模數(shù)據(jù)的存儲(chǔ)和交換。avro支持跨編程語言實(shí)現(xiàn)(C,C++,C#,Java,Python,Ruby,PHP)。avro依賴于一套可定義的Schema,通過動(dòng)態(tài)加載相關(guān)數(shù)據(jù)的Schema,可以有效減少寫入數(shù)據(jù)的開銷,使得序列化快速輕巧。鏈接:/RISELabGround是一個(gè)數(shù)據(jù)湖(datalake)context管理系統(tǒng)。它提供了一個(gè)RESTful服務(wù)的機(jī)制,讓用戶去推論他們擁有什么數(shù)據(jù),數(shù)據(jù)從哪里來向哪里去,誰在使用數(shù)據(jù),數(shù)據(jù)何時(shí)變化,為什么會(huì)有這種變化等。通過管理數(shù)據(jù)上下文,解決數(shù)據(jù)使用效率低下、治理困難等問題。Ground提供了一個(gè)通用API和追蹤信息的元模型,可以和很多數(shù)據(jù)儲(chǔ)存庫一起工作。鏈接:/projects/ground/173.1.5模型格式ONNX是微軟、Facebook為聯(lián)手打造AI生態(tài)系統(tǒng),推出的OpenNeuralNetworkExchange(ONNX,開放神經(jīng)網(wǎng)絡(luò)交換)格式。這是一個(gè)用于表示深度學(xué)習(xí)模型的標(biāo)準(zhǔn),可使模型在不同框架之間進(jìn)行轉(zhuǎn)移。ONNX是邁向開放生態(tài)系統(tǒng)的第一步,AI開發(fā)人員可以輕松地在工具之間轉(zhuǎn)換,選擇最適合他們的組合?,F(xiàn)在支持ONNX的框架有Caffe2、PyTorch、CognitiveToolkit、MXNet。谷歌的TensorFlow尚不支持ONNX。鏈接:/onnx/onnxNNEF是由Khronos集團(tuán)主導(dǎo)的跨廠商神經(jīng)網(wǎng)絡(luò)文件格式,定義了壓縮網(wǎng)絡(luò)正式語義、結(jié)構(gòu)、數(shù)據(jù)格式、通用操作(例如卷積、池化、正則化等),解決神經(jīng)網(wǎng)絡(luò)分裂化等問題。NNEF計(jì)劃支持包括Torch、Caffe、TensorFlow、Theano、Chainer、Caffe2、PyTorch、MXNet等幾乎所有AI框架的模型格式轉(zhuǎn)換。目前,已經(jīng)有30多家芯片企業(yè)參與其中。鏈接:/nnef3.1.6深度學(xué)習(xí)框架TensorFlow在GoogleBrain團(tuán)隊(duì)支持下,已經(jīng)成為最大的活躍社區(qū)。它支持在多GPU上運(yùn)行深度學(xué)習(xí)模型,為高效的數(shù)據(jù)流水線提供使用程序,并具有用于模型檢查、可視化、序列化的配套模塊。TensorFlow今年對(duì)生態(tài)系統(tǒng)進(jìn)行了大量的擴(kuò)充,將TensorFlow的觸角延伸到更多領(lǐng)域:支持Keras高級(jí)API封裝,提高了開發(fā)效率;構(gòu)建模型集,構(gòu)建完善的常用模型庫,方便數(shù)據(jù)科學(xué)家使用;發(fā)TensorFlowHub,為再訓(xùn)練和遷移學(xué)習(xí)提供常用模型算法,共享多種精度預(yù)先訓(xùn)練好的模型;通過TensorFlow.js占據(jù)瀏覽器端深度學(xué)習(xí)生態(tài),成為TensorFlow當(dāng)前一個(gè)重要的發(fā)展方向。鏈接/MXNet是亞馬遜(Amazon)主導(dǎo)的深度學(xué)習(xí)平臺(tái),性能優(yōu)良,目前是Apache孵化器項(xiàng)目。MXNet可以在任何硬件上運(yùn)行(包括手機(jī)),支持多種編程語言:Python、R、Julia、C++、Scala、Matlab、Javascript等。為了減低學(xué)習(xí)和使用的難度,MXNet推出了Gluon高級(jí)API封裝。鏈接:/Caffe/2+PyTorch是Facebook主導(dǎo)的深度學(xué)習(xí)平臺(tái),目前已合并到PyTorch進(jìn)行統(tǒng)一維護(hù)。在圖像處理領(lǐng)域,Caffe有著深厚的生態(tài)積累,同時(shí)PyTorch作為一18個(gè)易用性很強(qiáng)的框架,受到越來越多數(shù)據(jù)科學(xué)家的喜愛。在國內(nèi),很多AI圖像處理團(tuán)隊(duì)在試用PyTorch、TensorFlow、MXNet后,往往選擇PyTorch作為其主要工作平臺(tái)。鏈接:/PaddlePaddle是百度旗下深度學(xué)習(xí)開源平臺(tái),Paddle(ParallelDistributedDeepLearning)表示并行分布式深度學(xué)習(xí)。其前身是百度于2013年自主研發(fā)的深度學(xué)習(xí)平臺(tái),且一直供百度內(nèi)部工程師研發(fā)使用。PaddlePaddle是一個(gè)功能相對(duì)全面、易于使用的深度學(xué)習(xí)框架,一些算法封裝良好,如果僅僅只需要使用現(xiàn)成的算法(VGG、ResNet、LSTM、GRU等),那么直接執(zhí)行命令,替換數(shù)據(jù)進(jìn)行訓(xùn)練。PaddlePaddle的設(shè)計(jì)和Caffe類似,按照功能來構(gòu)造整個(gè)框架,二次開發(fā)要從C++底層寫起,因此適用于使用成熟穩(wěn)定模型處理新數(shù)據(jù)的情況。它的分布式部署做得很好,支持Kubernetes的部署。鏈接:/BigDL是一種面向ApacheSpark的分布式深度學(xué)習(xí)庫。用戶可以通過BigDL將深度學(xué)習(xí)應(yīng)用編寫為標(biāo)準(zhǔn)的Spark程序,這些程序可以直接在SparksheduHadoop集群上運(yùn)行。BigDL提供了豐富的深度學(xué)習(xí)支持,結(jié)合英特爾MKL和多線程應(yīng)用,因此有極高的性能,可以實(shí)現(xiàn)高效的橫向擴(kuò)展,執(zhí)行大規(guī)模數(shù)據(jù)分析。鏈接:https://bigdl-project.github.io/0.6.0/AnalyticsZoo是一個(gè)基于Spark和BigDL的端到端智能分析流水線,通過提供高水平的流水線API、內(nèi)置深度學(xué)習(xí)模型、參考用例等,可以輕松地在SparkBigDL上構(gòu)建和生成深度學(xué)習(xí)應(yīng)用程序,特別適合大數(shù)據(jù)集群分析和深度學(xué)習(xí)。鏈接:/intel-analytics/analytics-zoo3.1.7機(jī)器學(xué)習(xí)框架Scikit-learn是BSD證書下開源基于Python,構(gòu)建于現(xiàn)有的NumPy(基礎(chǔ)n維數(shù)組包)、SciPy(科學(xué)計(jì)算基礎(chǔ)包)、matplotlib(全面的2D/3D畫圖)、IPython(加強(qiáng)的交互解釋器)、Sympy(Symbolicmathematics)、Pandas(數(shù)據(jù)結(jié)構(gòu)和分析)之上,做了易用性的封裝。Scikit-learn提供一系列特征工程能力:降維(DimensionalityReduction)、特征提取(Featureextraction)、特征篩選(Featureselection)能力等,同時(shí)對(duì)分類、回歸、聚類、交叉驗(yàn)證、流型計(jì)算等機(jī)器學(xué)習(xí)算法和模型提供了標(biāo)準(zhǔn)實(shí)現(xiàn)。作為簡單且高效的數(shù)據(jù)挖掘、數(shù)據(jù)分析的工具,被廣泛應(yīng)用在ML領(lǐng)域。19鏈接:/Mahout是ApacheSoftwareFoundation(ASF)旗下的一個(gè)開源項(xiàng)目,主要關(guān)注協(xié)同過濾(CollaborativeFiltering,簡稱CF)領(lǐng)域的推薦引擎(協(xié)同過濾)、聚類和分類支持。Mahout初期使用Hadoop的MapReduce作為計(jì)算框架實(shí)現(xiàn),目前已經(jīng)遷移到Spark和Flink為主的平臺(tái)實(shí)現(xiàn)。鏈接:/3.1.8知識(shí)圖譜(知識(shí)庫)Freebase,Yago2作為CuratedKBs(CuratedKBs知識(shí)庫是由結(jié)構(gòu)化的三元組(entity,relation/property,entity)所表達(dá)的知識(shí)組成的知識(shí)庫,如果把這個(gè)三元組用起點(diǎn)-邊-終點(diǎn)來表示,這個(gè)知識(shí)庫就可以被表示為指示圖)的代表,從維基百科和WordNet等知識(shí)庫中抽取大量的實(shí)體及實(shí)體關(guān)系,可以把它們理解為是一種結(jié)構(gòu)化的維基百科,被google收購的Freebase中包含了上千萬個(gè)實(shí)體,共19億條triple。像維基百科這樣的知識(shí)庫,與整個(gè)互聯(lián)網(wǎng)相比,仍然數(shù)據(jù)量太小。OpenInformationExtraction(OpenIE),Never-EndingLanguageLearning(NELL)作為ExtractedKBs的代表,直接從上億個(gè)網(wǎng)頁中抽取實(shí)體關(guān)系三元組,涉及到entitylinking和relationextraction兩大關(guān)鍵技術(shù)。與Freebase相比,這樣得到的知識(shí)更加具有多樣性,而它們的實(shí)體關(guān)系和實(shí)體更多的則是自然語言的形式,當(dāng)然,直接從網(wǎng)頁中抽取出來的知識(shí),其精確度要低于CuratedKBs。3.1.9強(qiáng)化學(xué)習(xí)其他許多機(jī)器學(xué)習(xí)算法中學(xué)習(xí)器都是學(xué)怎樣做,而強(qiáng)化學(xué)習(xí)(RL,ReinforcementLearning)是在嘗試的過程中學(xué)習(xí)到在特定的情境下選擇哪種行動(dòng)可以得到最大的回報(bào)。RL最重要的3個(gè)特點(diǎn)在于:基本是以一種閉環(huán)的形式;不會(huì)直接指示選擇哪種行動(dòng);一系列的行動(dòng)和獎(jiǎng)勵(lì)信號(hào)都會(huì)影響之后較長的時(shí)間。其核心就是運(yùn)用馬爾可夫決策過程(MarkovDecisionProcesses,MDPs)。MDPs就是一個(gè)智能體采取行動(dòng)從而改變自己的狀態(tài)獲得獎(jiǎng)勵(lì)與環(huán)境發(fā)生交互的循環(huán)20過程。OpenAIGym是OpenAI的一個(gè)開源項(xiàng)目。OpenAI成立于2015年底,是一個(gè)非營利組織,它的目的是“建立安全的人工通用智能(AGI),并確保AGI的福利被盡可能廣泛和均勻地分布”。除了探索關(guān)于AGI的諸多問題之外,OpenAI對(duì)機(jī)器學(xué)習(xí)世界的一個(gè)主要貢獻(xiàn)是開發(fā)了Gym和Universe軟件平臺(tái)。Gym是為測試和開發(fā)RL算法而設(shè)計(jì)的環(huán)境/任務(wù)的集合。Gym讓用戶不必再創(chuàng)建復(fù)雜的環(huán)境,Gym用Python編寫,它有很多的環(huán)境,比如機(jī)器人模擬或Atari游戲。Gym還提供了一個(gè)在線排行榜,供人們比較結(jié)果和代碼。同時(shí)OpenAI還開源了與Gym配套的高質(zhì)量強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)項(xiàng)目Baseline。鏈接:/DeepMindLab類似于3D游戲的平臺(tái),它的研發(fā)工作都基于智能體,透過仿真智能體的眼睛以第一人稱的視角觀察周圍環(huán)境。智能體可以采集果實(shí)、走出迷宮、穿越危險(xiǎn)的懸崖峭壁、玩激光游戲、快速學(xué)習(xí)和記憶隨機(jī)變化的環(huán)境。同時(shí)DeepMind聯(lián)合暴雪推出的星際爭霸2開發(fā)環(huán)境PySC2,封裝了暴雪提供的機(jī)器學(xué)習(xí)API,為通過DeepMindLab實(shí)驗(yàn)強(qiáng)化學(xué)習(xí)提供了很大的方便。同時(shí)DeepMind還開源了ControlSuite,基于MoJoCo物理引擎設(shè)計(jì)了一組有著標(biāo)準(zhǔn)化結(jié)構(gòu)、可解釋獎(jiǎng)勵(lì)的連續(xù)控制任務(wù),還為強(qiáng)化學(xué)習(xí)Agent提供一組性能測試指標(biāo)。鏈接:/3.1.10 模型中間表示層IR在深度神經(jīng)網(wǎng)絡(luò)中,中間層IR的覆蓋范圍比較廣泛,其核心思想借鑒了LLVM。IR是為解決在不同硬件平臺(tái)編譯運(yùn)行而產(chǎn)生的中間層表示形式,它是解決模型推理側(cè)運(yùn)行在不同硬件平臺(tái)的重要描述方法,主要包括NNVM/TVM和TensorFlowXLA兩大陣營。但實(shí)際上類似ONNX、NNEF,模型交換格式的核心是對(duì)各種中間層表示的定義。中間表示層IR是打通在深度學(xué)習(xí)中多種不同前端訓(xùn)練框架與多種不同后端的表達(dá)橋梁,從而更有效實(shí)現(xiàn)它們之間的優(yōu)化和映射。目前業(yè)界的中間表示層都一致地采用了GraphIR+TensorIR兩層優(yōu)化結(jié)構(gòu),IntelnGraph、ApacheSystemML等都是如此。按照目前業(yè)界的共識(shí),“IR”的競爭將是未來Framework之爭的重要一環(huán)。213.1.11 端側(cè)推理框架Caffe2go是最早出現(xiàn)的移動(dòng)端推理框架,讓深層神經(jīng)網(wǎng)絡(luò)在手機(jī)上高效運(yùn)行。由于端側(cè)的CPU配置差異、設(shè)備性能有限,因此優(yōu)化是非常重要的,Caffe2go是基于CPU的優(yōu)化進(jìn)行設(shè)計(jì)。鏈接:/caffe2TensorFlowLite是運(yùn)行在Android和iOS平臺(tái)的計(jì)算框架,結(jié)合Android生態(tài)NNRuntime,能夠?qū)崿F(xiàn)較為高效的AI移動(dòng)端應(yīng)用速度,支持根據(jù)硬件情況自動(dòng)切換CPU或GPU。鏈接:/lite/NCNN是騰訊開源的移動(dòng)端AI執(zhí)行框架,支持多種訓(xùn)練框架的模型轉(zhuǎn)換,包括Caffe、PyTorch、MXNet、ONNX。NCNN主要面向CPU的AI模型應(yīng)用,無第三方依賴,因此具有較高的通用性。在CPU領(lǐng)域,其AI模型運(yùn)行速度明顯強(qiáng)于TensorFlowLite,是國內(nèi)目前較為廣泛使用的移動(dòng)端AI框架。鏈接:/Tencent/ncnnCoreML是蘋果公司的iOSAI組件,能夠?qū)覥affe、PyTorch、MXNet、TensorFlow等絕大部分AI模型,并且自身提供了常用的各種手機(jī)端AI模型組件。鏈接:/machine-learning/paddle-mobile是百度自研的移動(dòng)端深度學(xué)習(xí)框架,將paddle模型部署在手機(jī)端。目前,在iOS系統(tǒng)中支持GPU計(jì)算,在Android系統(tǒng)中僅支持CPU計(jì)算。從社區(qū)的整體評(píng)價(jià)來看,功能比較單一,支持比較有限。鏈接:/PaddlePaddle/paddle-mobile對(duì)于計(jì)算量需求龐大的CNN,需要通過壓縮神經(jīng)網(wǎng)絡(luò)來提高效率,神經(jīng)網(wǎng)絡(luò)壓縮最關(guān)鍵的方法是剪枝和量化。TensorRT使用量化的方法,將FP32位權(quán)值數(shù)據(jù)優(yōu)化為FP16或者INT8,而推理精度沒有明顯的降低。關(guān)于TensorRT,需要明確以下幾點(diǎn):TensorRT是NVIDIA開發(fā)的深度學(xué)習(xí)推理工具,只支持推理,不支持訓(xùn)練。目前TensorRT3已經(jīng)支持Caffe、Caffe2、TensorFlow、MXNet、PyTorch等主流深度學(xué)習(xí)庫。TensorRT底層針對(duì)NVIDIA顯卡做了多方面的優(yōu)化,不僅支持量化,還可以和CUDACODECSDK結(jié)合使用。TensorRT獨(dú)立于深度學(xué)習(xí)框架,通過解析框架文件來實(shí)現(xiàn),不需要額外22安裝DL庫。5C++或PythonAPI運(yùn)行界面如果模型在ONNX格式或其它流行框架上訓(xùn)練,如TensorFlow和Matlab,則很容易導(dǎo)入模型到TensorRT中進(jìn)行推理。鏈接:/tensorrt3.1.12 高級(jí)API為降低AI技術(shù)的使用難度、吸引更多的開發(fā)者,需要將TensorFlow、Caffe/2、MXNet等主流框架封裝成高級(jí)API,也稱為AI前端框架。在設(shè)計(jì)上,此類高級(jí)API的實(shí)現(xiàn)方式、風(fēng)格都很類似,支持不同領(lǐng)域的差異性。Keras是一個(gè)極簡的、高度模塊化的神經(jīng)網(wǎng)絡(luò)庫,采用Python開發(fā),能夠運(yùn)行在TensorFlow和Theano任一平臺(tái),可以在此平臺(tái)上完成深度學(xué)習(xí)的快速開發(fā)。鏈接:https://keras.io/Gluon是Amazon開源以易用性為主的可以同時(shí)支持靜態(tài)圖和動(dòng)態(tài)圖AI平臺(tái),在靈活性和速度上都有優(yōu)勢,彌補(bǔ)了MXNet難于使用的短板。鏈接:/gluon-api/gluon-apiPyTorch由Facebook提出,是接近AI的高級(jí)API定義,并與Caffe/2進(jìn)行合并。同時(shí)由于其強(qiáng)大的可調(diào)試性和易于開發(fā)性,以及對(duì)caffe/2的良好支持,PyTorch在AI圖像視頻領(lǐng)域一直有很高的占有率。鏈接:/Sonnet是被google收購的deepmind團(tuán)隊(duì)開源、支持?jǐn)?shù)據(jù)科學(xué)家基于23TensorFlow搭建復(fù)雜的神經(jīng)網(wǎng)絡(luò)。鏈接:/deepmind/sonnetTensorLayer來自英國帝國理工大學(xué)以華裔為主要核心人員的開源項(xiàng)目。從實(shí)用角度出發(fā),TensorLayer封裝了基于TensorFlow的常規(guī)神經(jīng)網(wǎng)絡(luò)各部分實(shí)際功能需求(神經(jīng)網(wǎng)絡(luò)層、損失函數(shù)、數(shù)據(jù)預(yù)處理、迭代函數(shù)、實(shí)用函數(shù)、自然語言處理、強(qiáng)化學(xué)習(xí)、文件、可視化、激活函數(shù)、預(yù)訓(xùn)練模型、分布式),獲得了2017ACMMultimedia年度最佳
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度二零二五年度高端公寓簡易租房合同
- 2025年度知識(shí)產(chǎn)權(quán)股權(quán)分配及合作開發(fā)合同
- 2025年度新能源電池組裝與銷售合同4篇
- 二零二五年度電商直播帶貨合作服務(wù)合同
- 2025年度礦業(yè)公司鐵礦粉精煉與市場開拓合同3篇
- 2025年度測繪項(xiàng)目合同履行監(jiān)督合同4篇
- 二零二四商場綜合物業(yè)管理承包合同3篇
- 個(gè)人臨時(shí)工合同2024:基于特定項(xiàng)目的短期工作協(xié)議3篇
- 2025年消防設(shè)施設(shè)備租賃與運(yùn)營維護(hù)合同2篇
- 2025年度智能家居環(huán)境監(jiān)測系統(tǒng)試用買賣合同范本4篇
- 2025年生產(chǎn)主管年度工作計(jì)劃
- 2025年急診科護(hù)理工作計(jì)劃
- 高中家長會(huì) 高二寒假線上家長會(huì)課件
- 2024-2025學(xué)年山東省聊城市高一上學(xué)期期末數(shù)學(xué)教學(xué)質(zhì)量檢測試題(附解析)
- 違規(guī)行為與處罰管理制度
- 個(gè)人教師述職報(bào)告錦集10篇
- 四川省等八省2025年普通高中學(xué)業(yè)水平選擇性考試適應(yīng)性演練歷史試題(含答案)
- 《內(nèi)部培訓(xùn)師培訓(xùn)》課件
- 《雷達(dá)原理》課件-3.3.3教學(xué)課件:相控陣?yán)走_(dá)
- 西方史學(xué)史課件3教學(xué)
- 2024年中國醫(yī)藥研發(fā)藍(lán)皮書
評(píng)論
0/150
提交評(píng)論