版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
7>7>、識》westernDigital.2作為新一輪科技革命和產(chǎn)業(yè)變革的核心力量,人工智能技術(shù)正在推動傳統(tǒng)產(chǎn)業(yè)升級換代,驅(qū)動“數(shù)字經(jīng)濟(jì)”快速發(fā)安防,是人工智能應(yīng)用較為成熟的行業(yè)之一。從最初的視頻分析,到現(xiàn)在全產(chǎn)業(yè)鏈的技術(shù)賦能,“安防+AI”已經(jīng)在深圳市安全防范行業(yè)協(xié)會(以下簡稱“深安協(xié)”)、CPS中安網(wǎng)通過現(xiàn)場訪談、電話采訪、郵件采訪等形式和全國近百家與“安防+AI”業(yè)務(wù)相關(guān)的公司進(jìn)行了交流,并對“安防+AI”產(chǎn)業(yè)的發(fā)展動態(tài)、技術(shù)變革、市場行情等信息進(jìn)行持續(xù)地觀察追蹤,并制作了《2023中國安防人工智深圳市安全深圳市安全營利性社會團(tuán)體、社會法人,成立于1995年9月,2017年獲評為5A級社會組織,2020年獲目前,深安協(xié)擁有來自全國的2663家會員從事安全防范行業(yè)的企事業(yè)單位和安防專家、學(xué)者等團(tuán)體組成。深安協(xié)由黨委、CPS中安網(wǎng)會其中CPSE安博會是全球第一大安防展,其展出面積、參展商、人流量均為行業(yè)第一。3CPSCPS中安網(wǎng)成立于1999年,立足安防,放眼不斷衍生的AIoT,是國內(nèi)智慧安防和AIoTCPS中安網(wǎng)可提供推廣、會議、咨詢、報告等服務(wù),產(chǎn)品涵蓋門戶網(wǎng)站、新媒體、APP、中國安防論壇、中國安防賦能大會、百城會等。CPS中安網(wǎng)積極致力于推動行業(yè)發(fā)展,運(yùn)用互01牌經(jīng)模型01牌經(jīng)模型學(xué)互學(xué)互"識別廠>》4人工智能作為國家戰(zhàn)略的重要組成部分,是未來國際競爭的焦點和經(jīng)濟(jì)發(fā)展的新引擎。近年來,隨目前,人工智能行業(yè)受到國家及各級政府的高度一、國家級層面政策《數(shù)字中國建設(shè)整體布局規(guī)劃》(簡稱:《規(guī)劃》)提出系統(tǒng)優(yōu)化算力基礎(chǔ)設(shè)施布局,促進(jìn)東西部2023年4月28日,中共中央政治局召開會議,分析研究當(dāng)前經(jīng)濟(jì)形勢和經(jīng)濟(jì)工作,會議內(nèi)容提及2023年6月8日,國務(wù)院發(fā)布2023年度立法工作計劃,人工智能法草案等預(yù)備提請全國人大常國務(wù)院辦公廳近日印發(fā)《國務(wù)院2023年度立法工作計劃》,其中提到,預(yù)備提請全國人大常委會包括語音、文字、圖像、音頻生成與交互技術(shù),場景包括智能客服、即時通訊、視頻剪輯與文字、圖像5自2015年以來,國家發(fā)改委、科技部、工信部、教育部等多部門都陸續(xù)印發(fā)了支持、規(guī)范、監(jiān)督人工智能行業(yè)的政策,內(nèi)容涉及人工智能基礎(chǔ)設(shè)施建設(shè)、技術(shù)研發(fā)、人才培養(yǎng)及引進(jìn)、倫理規(guī)范和法律二、地方級層面政策為了響應(yīng)國家號召,全國各省市積極推動人工智能產(chǎn)業(yè)發(fā)展,如北京、上海、深圳等地相繼發(fā)布支持人工智能產(chǎn)業(yè)發(fā)展的政策文件,圍繞打造拓展人工智能應(yīng)用場景、加強(qiáng)相關(guān)領(lǐng)域人才高地建設(shè)等方面2023年5月30日,北京市發(fā)布《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實施方案施》)。文件提到,到2025年,人工智能核心產(chǎn)業(yè)規(guī)模達(dá)到3000億元,持續(xù)保持10%以上增長,輻射產(chǎn)提出要完善人工智能數(shù)據(jù)標(biāo)準(zhǔn)庫,探索打造數(shù)據(jù)訓(xùn)練基地,促進(jìn)研發(fā)自然語言、多模態(tài)、認(rèn)知等超大規(guī)模智能模型,力爭到2030年,北京市數(shù)據(jù)要素市場規(guī)模達(dá)到20002023年5月30日,上海市發(fā)布《上海市加大力度支持民間投資發(fā)展若干政策措施》提出,充分發(fā)2023年6月15日,上海市人民政府辦公廳印發(fā)《上海市推動制造業(yè)高質(zhì)量發(fā)展三年行動計劃(2023-2025年)》,引導(dǎo)更多資源要素向先進(jìn)制造業(yè)集聚。提出將瞄準(zhǔn)人工智能技術(shù)前沿,構(gòu)建通用《深圳市加快推動人工智能高質(zhì)量發(fā)展水平應(yīng)用行動方案(2023~2024)》于5月31日出爐,該統(tǒng)籌整合基金資源,形成規(guī)模1000億元的人工智能基金群。”6提到到2025年,基本建成全身應(yīng)用場景一體化大市場。圍繞特色研究領(lǐng)域打造一批可示范、可體驗、可推廣的科技首用場景樣板,探索場景驅(qū)動的科技創(chuàng)新范式。下一代人工智能領(lǐng)域優(yōu)先探索深度學(xué)習(xí)、2023年6月1日,成都市經(jīng)濟(jì)和信息化局對《成都市關(guān)于進(jìn)一步促進(jìn)人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策(征求意見稿)》公開征求意見,征求意見稿給出了多條資金補(bǔ)貼和獎勵措施。對取得國家科技重大專項(含科技創(chuàng)新2030-重大項目)、國家重點研發(fā)計劃立項項目成果或國家科學(xué)獎獲獎成果在2023年6月16日,廣東省委、省政府出臺《廣東省質(zhì)量強(qiáng)省建設(shè)綱要》支持人工智能、區(qū)塊鏈、不難看出,當(dāng)人工智能新一輪產(chǎn)業(yè)競賽持續(xù)升溫之時,各地鼓勵支持人工智能發(fā)展的利好政策也將三、總結(jié)目前,中央及各地方政府出臺的相關(guān)人工智能政策已超百部,從這些出臺的政策文件當(dāng)中看出,當(dāng)前人工智能政策較為強(qiáng)調(diào)人工智能技術(shù)在各個行業(yè)場景的應(yīng)用。一方面體現(xiàn)出AI技術(shù)的普及率逐漸提高,另一方面也彰顯了AI的活力,能為行業(yè)發(fā)展增添新的動能。未來,隨著數(shù)字經(jīng)濟(jì)的快速發(fā)展和全近年來,在數(shù)字經(jīng)濟(jì)發(fā)展浪潮的推動下,學(xué)界圍繞人工智能的經(jīng)濟(jì)發(fā)展豐富的研究,從多方位強(qiáng)調(diào)了實施“智能+”、數(shù)智融合、智能產(chǎn)業(yè)價值創(chuàng)造與獲取的重要意義,為社702O02O77廠>》8近年來,在數(shù)字經(jīng)濟(jì)發(fā)展浪潮的推動下,學(xué)界圍繞人工智能的經(jīng)濟(jì)發(fā)展效應(yīng)從不同角度開展了較為豐富的研究,從多方位強(qiáng)調(diào)了實施“智能+”、數(shù)智融合、智能產(chǎn)業(yè)價值創(chuàng)造與獲取的重要意義,為社一、人工智能技術(shù)分析但在數(shù)據(jù)量過于龐大時,單純依靠大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)的處理和分析則顯得較為困難,此時就需要將大數(shù)據(jù)技術(shù)與人工智能技術(shù)進(jìn)行高效結(jié)合,以充分運(yùn)用機(jī)器學(xué)習(xí)技術(shù)來完成相關(guān)工作任務(wù)。機(jī)器學(xué)習(xí)簡言之就是以計算機(jī)為基礎(chǔ)來對人類的學(xué)習(xí)進(jìn)行模擬,通過模擬的方式來完成相關(guān)任務(wù)。目前較為常見的機(jī)器學(xué)習(xí)方式包括概率學(xué)習(xí)和決策樹訓(xùn)練。該項技術(shù)的優(yōu)勢在于能夠高效地對數(shù)據(jù)進(jìn)行處理,同時能夠通過學(xué)習(xí)和訓(xùn)練來形成新的處理模型用以對多種不同類型的數(shù)據(jù)進(jìn)行處理,尤其是在對一些海量數(shù)據(jù)進(jìn)行人工智能技術(shù)的知識與數(shù)據(jù)智能化處理能夠在專家系統(tǒng)上得到充分的體現(xiàn)。專家系統(tǒng)是智能化極高的計算機(jī)系統(tǒng),能夠?qū)⒛骋活I(lǐng)域的知識進(jìn)行全面集合,再通過前期的程序設(shè)定來完成相應(yīng)的系統(tǒng)架構(gòu)構(gòu)建,后續(xù)在解決問題時則可以利用該系統(tǒng)的程序進(jìn)行高效解決。專家系統(tǒng)最為重要的兩個組成部分是數(shù)據(jù)庫和推理系統(tǒng),數(shù)據(jù)庫主要是包含某一領(lǐng)域的專業(yè)知識和相關(guān)經(jīng)驗,而推理系統(tǒng)主要是模擬人類的智慧推理過程,再以數(shù)據(jù)庫為基礎(chǔ)對問題進(jìn)行解決,通過數(shù)據(jù)庫和推理系統(tǒng)的結(jié)合能夠快速得到問題的答人機(jī)交互技術(shù)是將用戶和系統(tǒng)進(jìn)行有效連接的技術(shù)。用戶在使用相關(guān)軟件時可以通過交互界面完成指定操作。而人機(jī)交互技術(shù)主要是以機(jī)器人的學(xué)習(xí)和模式識別技術(shù)為基礎(chǔ),該項技術(shù)需要依靠相應(yīng)的輸出設(shè)備和指定軟件系統(tǒng)實現(xiàn)。想要對現(xiàn)有的人機(jī)交互技術(shù)進(jìn)行提升,則必須對硬件系統(tǒng)和軟件系統(tǒng)進(jìn)行同時優(yōu)化。此外,在技術(shù)研發(fā)過程中還需要對傳統(tǒng)人機(jī)交互技術(shù)存在的不足進(jìn)行優(yōu)化和調(diào)整,轉(zhuǎn)變原有其中,機(jī)器學(xué)習(xí)作為人工智能非常重要的基礎(chǔ),主要有判別式和生成式兩類模型。其中,判別式模型主要是給定一個數(shù)據(jù),估計一個條件概率進(jìn)行分類、判決;生成式模型則是直接估計一個分布,然后92016年AlphaGo戰(zhàn)勝李世石第一次點燃AI的討論浪潮。隨著AI基礎(chǔ)設(shè)施逐步完善,深度學(xué)習(xí)技術(shù)不斷進(jìn)步,人工智能應(yīng)用場景逐漸增多,過去模型參數(shù)規(guī)模和數(shù)據(jù)量也實現(xiàn)了大幅度增長,為NLP、CV等領(lǐng)域帶來更強(qiáng)大的表達(dá)能力和性能,顯而易見,現(xiàn)今已進(jìn)入了以AGI為代表的新里程碑階段。ChatGPT讓大家意識到,AI發(fā)展步入全新階段即生成式AI(AIGC)。較此前的最大突破是形成了內(nèi)容生成,交互式體驗對應(yīng)用前景和商業(yè)模式的落地帶來了新的想象空間。例如,2015年Transformer模型發(fā)布以來,NLP大模型發(fā)展開始提速,OpenAI2018、2019、2020年分別推出的AI得以通過文字、視頻、圖像等與外界產(chǎn)生“交互”,2022年底殺手級應(yīng)用ChatGPT橫空出世。二、AIGC(生成式人工智能)概念梳理與發(fā)展歷程的試驗方法(Turing,2009),即機(jī)器是否能夠模仿人類的思維方式來“生成”內(nèi)容,實現(xiàn)人機(jī)交互。因此,人工智能從圖靈開始就被寄予了用于內(nèi)容創(chuàng)造的期許。經(jīng)過半個多世紀(jì)發(fā)展,數(shù)據(jù)快速積累、算力性能提升和算法效力增強(qiáng),如今人工智能不僅實現(xiàn)了人機(jī)互動,還能夠進(jìn)行寫作、編曲、繪畫、視頻制作等創(chuàng)意工作。2018年,由人工智能創(chuàng)作的人類歷史上首次拍賣的AI藝術(shù)品,引發(fā)各界關(guān)注。隨著人工智能越來越多地被應(yīng)用于內(nèi)容創(chuàng)作,AIGC目前,對AIGC的定義,尚無統(tǒng)一規(guī)范的界定。國內(nèi)產(chǎn)學(xué)研各界對于AIGC的理解是“繼專業(yè)生成內(nèi)容(ProfessionalGeneratedContent,PGC)和用戶生成內(nèi)容(UserGeneratedContent,UGC)之后,利用人工智能技術(shù)自動生成內(nèi)容的新型生產(chǎn)方式”。在國際上對應(yīng)的術(shù)語是“人工智能合成媒體(AI-generatedMedia或SyntheticMedia)”,其定義是“通過人工智能算法對數(shù)據(jù)或媒體梳理人工智能的發(fā)展演進(jìn),AIGC的發(fā)展基本可以劃分為三個時期:醞釀萌芽階段(20世紀(jì)50年代至20世紀(jì)90年代中期)、穩(wěn)步推進(jìn)階段(20世紀(jì)90年代中期至21世紀(jì)1·醞釀萌芽階段20世紀(jì)50年代至20世紀(jì)90年代中期,受限于技術(shù)水平,AIGC僅局限于小范圍實驗。1950年,圖靈提出“圖靈測試”能夠判定機(jī)器是否“智能”;1957年,計算機(jī)首次創(chuàng)作完成弦樂四重奏《依利亞克組曲》;1966年,世界上第一款可人機(jī)對話的機(jī)器人“伊莉莎(Eliza)”問世,主要通過關(guān)鍵字掃描與重組完成交互任務(wù)。20世紀(jì)80年代中期,國際商業(yè)機(jī)器公司(InternationalBusinessMachinesCorporation,IBM)創(chuàng)造了語音控制打字機(jī)“坦戈拉(Tangora)”,約能處理20000個單詞。20世紀(jì)80年代末至90年代中,由于高昂的研發(fā)投入沒有實現(xiàn)預(yù)期的商業(yè)變現(xiàn),因此,世界各國開始減少人工智能領(lǐng)域的投入,AIGC沒有實現(xiàn)重大突破。但在此期間,圖靈測試、對話機(jī)器人以及語控打字機(jī)已經(jīng)孕育了AIGC的雛形。·穩(wěn)步推進(jìn)階段20世紀(jì)90年代中期至21世紀(jì)10年代中期,AIGC逐漸從前期的技術(shù)實驗性向商業(yè)實用性轉(zhuǎn)變。2006年起,一方面,圖形處理器和張量處理器等算力設(shè)備性能大幅提升,深度學(xué)習(xí)算力增強(qiáng),深度學(xué)習(xí)算法取得重大突破;另一方面,互聯(lián)網(wǎng)的推廣普及使得數(shù)據(jù)規(guī)模劇增,這為各類人工智能算法提供了創(chuàng)作任務(wù)依然沒有取得重大突破,應(yīng)用場景有限,應(yīng)用效果有待提升。2007年,紐約大學(xué)的人工智能系統(tǒng)撰寫小說《1TheRoad》——世界第一部完全由人工智能創(chuàng)作的小說,雖然小說可讀性不強(qiáng)、存在拼寫錯誤、邏輯混亂,但從AIGC整個發(fā)展歷程來看,其突破性意義遠(yuǎn)高于實際意義。2012年,微軟推出全自動同聲傳譯系統(tǒng),計算機(jī)能夠自動完成語音識別、英中機(jī)器翻譯,以及中文語音合成,效果非常流暢,這標(biāo)志著深度神經(jīng)網(wǎng)絡(luò)模型在語音識別和音頻生成領(lǐng)域獲得了巨大的成功,為AIGC進(jìn)一步發(fā)·迅猛發(fā)展階段21世紀(jì)10年代中期至今,AIGC迎來新發(fā)展,生成內(nèi)容更加多元,生成效果更加逼真。自2014年起,Goodfellow等(2020)提出以生成式對抗網(wǎng)絡(luò)(GenerativeAdversarialNetwork,GAN)為代表的深度學(xué)習(xí)算法,并不斷迭代更新,為AIGC提供了強(qiáng)大的技術(shù)支撐。此后,2017年,微軟人工智能少女“小冰”完成了世界首部完全由人工智能創(chuàng)作的詩集——《陽光失了玻璃窗》。2018年,英偉達(dá)發(fā)布可以實現(xiàn)自動生成圖片的模型——StyleGAN(Karras等,2020),該模型目前已升級到第四代—StyleGAN-XL(Sauer等,2022),其生成圖片的分辨率極高,人眼難以分辨真假。2019年,DeepMind發(fā)布DVD-GAN模型(Clark等,2019)可以生成高度逼真且連貫的視頻,該模型能夠通過學(xué)習(xí)和理解人類的語言,進(jìn)行對話、聊天互動。2021年,OpenAI推出DALL-E,主要用于文本與圖像的交互生成內(nèi)容,并于一年后推出升級版本DALL-E-2(Marcus等,2022)。DALL-E-2基于對主題、風(fēng)格、調(diào)色板和所需概念意義的“理解”,可以生成相應(yīng)的圖像,同時該模型還能夠根據(jù)原圖像進(jìn)行二次創(chuàng)作。至此,AIGC技術(shù)基本成熟,有望成為改變商業(yè)模式和產(chǎn)業(yè)發(fā)展范式的重要驅(qū)動力。以ChatGPT的發(fā)布為里程碑事件,AI的發(fā)展進(jìn)入到了繼突破工業(yè)紅線之后的,以AGI為發(fā)展目標(biāo)的全新通用智能時代。生成式AI成為大模型能力應(yīng)用的爆發(fā)點,以文生文、文生圖等內(nèi)容生成為代習(xí)近平總書記指出,“把新一代人工智能作為推動科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的驅(qū)動力量,努力實現(xiàn)高質(zhì)量發(fā)展”。在深度學(xué)習(xí)算法不斷突破和算力不斷提高的背景下,人工智能生成內(nèi)容(ArtificialIntelligenceGeneratedContent,AIGC)技術(shù)迎來加速發(fā)展,正在催生全新產(chǎn)當(dāng)前,人工智能技術(shù)正在各行業(yè)全面鋪開,終端產(chǎn)品種類、解決方案及應(yīng)用場景等日益豐富,如何人工智能已成為科技創(chuàng)新的關(guān)鍵領(lǐng)域和數(shù)字經(jīng)濟(jì)時代的重要支柱。據(jù)IDC最新發(fā)布的數(shù)據(jù),2022年全球人工智能收入預(yù)計同比增長19.6%,達(dá)到4328億美元,包括軟件、硬件和服務(wù)。預(yù)計2023年可一、中國AI產(chǎn)業(yè)發(fā)展“三大”戰(zhàn)略自1956年達(dá)特茅斯會議以來,人工智能聚焦我國人工智能產(chǎn)業(yè)的發(fā)展,2017年發(fā)布了第一個涉及人工智能領(lǐng)域系統(tǒng)戰(zhàn)略部署的文件《新一代人工智能發(fā)展規(guī)劃》后,陸續(xù)發(fā)布《新一代人工智能發(fā)展白皮書(2017版)》、《人工智能標(biāo)準(zhǔn)化白皮書(2018版)》、《高等學(xué)校人工智能創(chuàng)新行動計劃》、《國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)近年來,在眾多規(guī)劃政策的支持下,我國人工智能產(chǎn)業(yè)發(fā)展明確了“三大”戰(zhàn)略,為整個產(chǎn)業(yè)的發(fā)培育若干全球領(lǐng)先的人工智能優(yōu)質(zhì)企業(yè),預(yù)計人工智能核心產(chǎn)業(yè)規(guī)模超過1500億元,帶動相關(guān)產(chǎn)業(yè)規(guī)到2025年,人工智能基礎(chǔ)理論實現(xiàn)重大突破,部分技術(shù)與應(yīng)用達(dá)到世界領(lǐng)先水平,人工智能核心產(chǎn)業(yè)規(guī)模超4000億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過5萬億元,初步建立人工智能法律法規(guī)、倫理規(guī)范和政人工智能核心產(chǎn)業(yè)規(guī)模超過1萬億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超10萬億元,形成一批全球領(lǐng)先的人工智能二、中國AI產(chǎn)業(yè)融資/IPO事件回溯人工智能產(chǎn)業(yè)融資的節(jié)點,2018年是投融資的頂峰期,至2020年持續(xù)下滑。與此相對的是,融資金額在2020年出現(xiàn)明顯增長,可見一部分A據(jù)Wind數(shù)據(jù)顯示,目前港交所通過聆訊排隊等候上市的企業(yè)一共有106家,涉及AI或數(shù)字化的公司達(dá)到28家,占比26%。聚焦到這28家AI公司,有19家截至2022年度的經(jīng)營狀態(tài)為虧損,7家實現(xiàn)微盈利,凈利潤在1由此可見,在AI大潮之下,產(chǎn)業(yè)鏈相關(guān)廠商的存活狀態(tài)并不如意。據(jù)CPS中安網(wǎng)不完全統(tǒng)計,目前安防行業(yè)的AI廠商2023年上半年的業(yè)績情況依舊慘淡因而,在AIGC技術(shù)和大模型的支撐下,AI廠商想挽救危局,最直接的方式還是融資上市。2023年4月24日,AI獨(dú)角獸企業(yè)第四范式于2023年4月24日更新招股書,繼續(xù)推進(jìn)港交所主2023年6月30日,自動駕駛計算芯片第一股黑芝麻智能向港交所提交上市申請書,計劃在港交所·致瓴科技完成兩輪融資致瓴科技作為家庭安防科技產(chǎn)品研發(fā)商,在今年2月和6月完成兩輪融資,致力于在產(chǎn)品研發(fā)和技2月,致瓴科技獲得5000萬人民幣的Pre-A輪融資,投資方為琮碧秋實、云時資本。6月,致瓴科技又完成了數(shù)千萬元人民幣A輪融資,本輪融資由堅果資本領(lǐng)投,合創(chuàng)資本和老股東云時資本跟投,資·澎思科技完成兩輪融資高捷資本、上古資本、洪泰基金跟投。4月,澎思科技宣布完成1.5億元A輪融資,此次融資由360、據(jù)了解,澎思科技創(chuàng)始人和核心團(tuán)隊擁有多年豐富的AI+安防行業(yè)落地服務(wù)經(jīng)驗。此輪融資將用于繼續(xù)夯實算法、軟硬件產(chǎn)品研發(fā),打造更豐富的產(chǎn)品線,針對智能安防、智能制造等垂直行業(yè)進(jìn)行全系1月6日,蘇州國芯科技股份有限公司(股票代碼:688262)正式在科創(chuàng)板掛牌上市。國芯科技成立于2001年,是一家從事國產(chǎn)自主可控嵌入式CPU技術(shù)研發(fā)和產(chǎn)業(yè)化應(yīng)用的芯片設(shè)計公司,處于集成該公司最終募集資金凈額比原計劃多16.60億元,擬分別用于云-端信息安全芯片設(shè)計及產(chǎn)業(yè)化項目、基于C*CoreCPU核的SoC芯片設(shè)計平臺設(shè)計及產(chǎn)業(yè)化項目、基于RISC-V架構(gòu)的CPU內(nèi)核設(shè)計項目。1月14日,翱捷科技股份有限公司(股票代碼:688220)在科創(chuàng)板掛牌上市。翱捷科技作為一家提供無線通信、超大規(guī)模芯片的平臺型芯片的企業(yè),自2015年成立后一直專注于無線通信芯片的研發(fā)和技術(shù)創(chuàng)新,同時擁有全制式蜂窩基帶芯片及多協(xié)議非蜂窩物聯(lián)網(wǎng)芯片研發(fā)設(shè)計實力,且具備提供超大規(guī)模高速SoC芯片定制及半導(dǎo)體IP授權(quán)服務(wù)能力。據(jù)悉,翱捷科技IPO原本計劃募資23.80億元,后來,公司將計劃募資額度上調(diào)至27.17億元。用于商用5G增強(qiáng)移動寬帶終端芯片平臺研發(fā)、5G工業(yè)物聯(lián)網(wǎng)芯片項目、商業(yè)WiFi6芯片項目、智能IPC芯片設(shè)計項目、多種無線協(xié)議融合、多場域下高精度導(dǎo)航定位整體解決方案及平臺項目、研發(fā)中心3月17日,北京格靈深瞳信息技術(shù)股份有限公司(股票代碼:688207)在上交所科創(chuàng)板上市。格靈深瞳是北京代表性人工智能企業(yè)之一,也是國內(nèi)領(lǐng)先的人工智能科技公司之一,其主要技術(shù)落地方向據(jù)悉,格靈深瞳擬募集資金約10億元,主要用于人工智能算法平臺升級項目、人工智能創(chuàng)新應(yīng)用4月20日,杰創(chuàng)智能科技股份有限公司(股票代碼:301248)在深圳證券交易所創(chuàng)業(yè)板上市。杰創(chuàng)智能致力于推進(jìn)物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、人工智能等新一代信息技術(shù)在智慧城市、智慧安全領(lǐng)域的產(chǎn)業(yè)化應(yīng)用,為客戶提供涵蓋業(yè)務(wù)咨詢、方案設(shè)計、設(shè)備采購、產(chǎn)品研發(fā)、系統(tǒng)集成及運(yùn)營維護(hù)的全周據(jù)悉,杰創(chuàng)智能IPO募集資金將用于智慧城市平臺升級及產(chǎn)業(yè)化項目、智慧安全產(chǎn)品升級及產(chǎn)業(yè)化思特威作為安防CIS龍頭,2017年成立于上海,是一家從事CMOS圖像傳感器芯片產(chǎn)品研發(fā)、設(shè)計和據(jù)悉,思特威披露的招股說明書顯示,公司擬募集資金28.20億元,分別用于研發(fā)中心設(shè)備與系統(tǒng)建設(shè)項目、思特威(昆山)電子科技有限公司圖像傳感器芯片測試項目、CMOS圖像傳感器芯片升級及5月27日,云從科技集團(tuán)股份有限公司(股票代碼:688327)正式在上交所科創(chuàng)板上市。國內(nèi)AI獨(dú)角獸云從科技自主研發(fā)的跨鏡追蹤、3D結(jié)構(gòu)光人臉識別、雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)和對抗性神經(jīng)網(wǎng)絡(luò)聚焦機(jī)器視覺業(yè)務(wù),自研形成了光學(xué)成像、智能軟件、智能算法與精密控制四大技術(shù)平臺,為客戶提供奧比中光公開募集資金12.39億元,將繼續(xù)加大對3D視覺感知技術(shù)的創(chuàng)新投入,開展3D視覺感知技術(shù)升級研發(fā)和應(yīng)用拓展,進(jìn)一步推動3D視覺感知技術(shù)的科技創(chuàng)新。8月5日,深圳市江波龍電子股份有限公司在深圳證券交易所創(chuàng)業(yè)板上市。江波龍電子是國內(nèi)主要存儲企業(yè)之一,自成立以來一直專注于Flash及DRAM存儲器的研發(fā)、設(shè)計和銷售。多年來,公司打造了嵌入式存儲、固態(tài)硬盤、移動存儲和內(nèi)存條四大產(chǎn)品線,擁有FORESEE和Lexar兩大存儲品牌。8月8日,廣東魅視科技股份有限公司在深圳證券交易所主板上市。魅視科技是國內(nèi)領(lǐng)先的分布式視聽產(chǎn)品及解決方案提供商,致力于不斷提升圖像應(yīng)用技術(shù)和視音頻聯(lián)結(jié)能力,為視音頻信號的接入采據(jù)悉,魅視科技IPO擬募集資金約5.4領(lǐng)頭羊地位,公司已研發(fā)推出包括“指紋+人臉識別”技術(shù)、“人臉+掌靜脈識別”技術(shù)、“指紋+指靜脈識別”技術(shù)、“人臉+虹膜識別”技術(shù)和“指紋+手掌+人臉識別”技術(shù)等在內(nèi)的多模態(tài)生物識別·依圖科技數(shù)億元新一輪融資完成首次交割依圖科技聯(lián)合創(chuàng)始人林晨曦也表示:“期待本次與博約攜手,加速依圖科技在深圳及粵港澳大灣區(qū)的產(chǎn)業(yè)布局,推進(jìn)城市智能化基礎(chǔ)設(shè)施建設(shè),助力依圖的世界級人工智能公司的發(fā)展進(jìn)程。”據(jù)了解,依圖科技是中國人工智能行業(yè)的頭部企業(yè),主要從事AI算法軟件及芯片、服務(wù)器等超高·暗物智能完成B輪融資廣州金控、南沙科金控股五家國企簽署《暗物智能投資協(xié)議》,由五家國企聯(lián)合對暗物智能進(jìn)行戰(zhàn)略性暗物智能由著名計算機(jī)視覺專家朱松純于2017年創(chuàng)辦,2020年年中獲5億元A輪融資?!鞍滴镏菍?qiáng)大的人才優(yōu)勢與先進(jìn)的科研實力轉(zhuǎn)化為產(chǎn)業(yè)轉(zhuǎn)型發(fā)展的新引擎、新動能,智能社會治理的新思路、2022年8月18日瑞為技術(shù)獲數(shù)億元D輪融資,由招商局資本、泓宇資本領(lǐng)投資、賽富資本跟投。本輪融資資金將主要用于深化AI算法及產(chǎn)品研發(fā),增強(qiáng)在各個社會公共安全場景·極視角完成戰(zhàn)略輪融資2022年10月13日完成由山東陸海聯(lián)動投資基金領(lǐng)投、青島海創(chuàng)智鏈工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)投資基金共極視角此前曾獲得華潤創(chuàng)新基金、高通創(chuàng)投、北高峰資本、經(jīng)控金融投資集團(tuán)、蘭馨亞洲、青島國極視角成立于2015年,是專業(yè)的人工智能與計算機(jī)視覺算法提供商,開創(chuàng)了國內(nèi)首家計算機(jī)視覺算法商城。經(jīng)過7年多的發(fā)展,公司在青島、深圳、三、總結(jié)眾所周知,目前人工智能已廣泛賦能于千行百業(yè),人工智能工具的迭代也為中國數(shù)字經(jīng)濟(jì)發(fā)展帶來同時,在產(chǎn)業(yè)智能化轉(zhuǎn)型升級的進(jìn)程中,傳統(tǒng)行業(yè)的參與度越來越深入,為AI提供海量的數(shù)據(jù)和更豐富的應(yīng)用場景,如互聯(lián)網(wǎng)、教育、機(jī)器人、醫(yī)療、自動駕駛、交通、制造、智慧城市、金融等多個當(dāng)前,各國都出臺了政策和相關(guān)標(biāo)準(zhǔn),致力于深化人工智能技術(shù)在行業(yè)應(yīng)用場景中的創(chuàng)新和融合。與此同時,在實現(xiàn)技術(shù)迭代和創(chuàng)新之外,還需要聚焦可落地的場景實踐和數(shù)據(jù)的安全可信,推動人工智一、人臉識別安防+AI是傳統(tǒng)安防行業(yè)借助計算機(jī)視覺與知識圖譜技術(shù)在城市級和行業(yè)級安防場景中的實際落地應(yīng)用,不僅僅局限于由公安部門、司法部門、政法部門等采購使用的人工智能相關(guān)商品、服務(wù)及工程類項目的狹義安防+AI,同時也涵蓋安防在社區(qū)樓宇人臉識別利用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉圖像進(jìn)行一系列的相關(guān)應(yīng)用操作。技術(shù)上包括圖像采集、特征定位、身份的確認(rèn)和查人臉與人體的其它生物特征(指紋、虹膜等)一樣與生俱來,它的唯一性和不易被復(fù)制的良好特性非強(qiáng)制性:用戶不需要專門配合人臉采集設(shè)備,幾乎可以在無意識的狀態(tài)下就可獲取人臉圖像,這據(jù)公開的資料顯示,人臉識別的發(fā)展歷程大體上分為四個階段,包括機(jī)械識別、半自動化識別、非與其他生物識別方式相比,人臉識別優(yōu)勢在于自然性、不被察覺性等特點。自然性即該識別方式同人類進(jìn)行個體識別時所利用的生物特征相同。指紋識別、虹膜識別等均不具有自然性。不被察覺的特點使該識別方法不易使人抵觸,而指紋識別或虹膜識別需利用電子壓力傳感器或紅外線采集指紋、虹膜圖總體而言,相比指紋識別、虹膜識別等傳統(tǒng)的生物識別方式,伴隨著后期人臉識別精度問題得到解刷臉支付、找回密碼、安全登錄考勤打卡、登機(jī)安檢、考試身份刷臉支付、找回密碼、安全登錄考勤打卡、登機(jī)安檢、考試身份人臉識別技術(shù)可以幫助警察對犯罪嫌疑人進(jìn)行快速識別和逮捕。在高清晰度影像監(jiān)控系統(tǒng)中,人臉識別在生物識別技術(shù)發(fā)展中,人臉識別技術(shù)現(xiàn)已非常成熟,市場對其認(rèn)同度比較高。其主要是通過“局部特征分析”和“圖形”、“神經(jīng)識別算法”對面部各器官和特征不同的方位進(jìn)行分析、提取成數(shù)字化雖然人臉識別技術(shù)已經(jīng)取得了很大進(jìn)展,具有高度的準(zhǔn)確性和穩(wěn)定性,有效提升了安全防控水平。但人臉識別技術(shù)也面臨一些問題。例如,如何保證人臉庫的安全、如何提高人臉識別的準(zhǔn)確率、如何保在競爭方面,由于人臉識別技術(shù)的快速發(fā)展,吸引了安防巨頭企業(yè)和互聯(lián)網(wǎng)巨頭積極布局。在安防企業(yè)方面,??低曌鳛槿蝾I(lǐng)先的安防龍頭,在人臉識別領(lǐng)域有著重要地位。目前其產(chǎn)品廣泛應(yīng)用于安防、交通、金融服務(wù)和樓宇等場景。大華股份推出人臉識別門口機(jī)、通行閘機(jī)等產(chǎn)品,則多數(shù)應(yīng)用于未來,隨著科學(xué)技術(shù)不斷進(jìn)步以及政策持續(xù)推動,人臉識別技術(shù)將不斷與各行各業(yè)相互融合,深入各場景應(yīng)用。屆時,人臉識別技術(shù)維度升級也是應(yīng)市場需求而持續(xù)推進(jìn)。目前,人臉識別的研究趨勢已轉(zhuǎn)向使用3D人臉表面,但現(xiàn)對面部變化提取的準(zhǔn)確性、復(fù)雜性和穩(wěn)健性技術(shù)攻關(guān)還存在一定難度。A、隱私保護(hù)問題B、技術(shù)可靠性問題雖然人臉識別技術(shù)在可靠性和準(zhǔn)確性方面已經(jīng)取得了很大的進(jìn)展,但是在一些特殊環(huán)境下,識別的C、法律法規(guī)不完善問題在應(yīng)用人臉識別技術(shù)時,相關(guān)法規(guī)和標(biāo)準(zhǔn)的制定并不完善,導(dǎo)致了許多前沿技術(shù)的適用不夠明確和規(guī)范,在這方面需要制定完善的法規(guī)和標(biāo)準(zhǔn)。同時,還需要加強(qiáng)教育和普及,提高用戶的安全意識和防在趨勢上,人臉識別技術(shù)在硬件設(shè)備、政策法規(guī)方面有著以下演變趨勢。如硬件設(shè)備方面,隨著近些年可穿戴設(shè)備、智能家居等物聯(lián)網(wǎng)技術(shù)的發(fā)展,人臉識別技術(shù)也將不斷加強(qiáng)和應(yīng)用。未來,人臉識別政策法規(guī)方面,隨著人臉識別應(yīng)用越來越廣泛,國家政策和法規(guī)對于人臉識別技術(shù)的制約和規(guī)范也越來越重要。未來,隨著相關(guān)法律法規(guī)和標(biāo)準(zhǔn)的出臺,人臉識別技術(shù)將更加正規(guī)和規(guī)范化,同時,將更用范圍。它將可以更有效地執(zhí)行支付交易、多種聯(lián)合身份驗證程序以及安全訪問管理服務(wù)。該技術(shù)目前主要應(yīng)用于各類內(nèi)部安全監(jiān)管、支付驗證、汽車訪客識別等,此外,隨著技術(shù)的進(jìn)步,未來還可以應(yīng)用整體來看,作為我國人工智能發(fā)展的一個縮影,人臉識別技術(shù)落地的大趨勢已不可改變,就像任何二、車牌識別隨著人們生活水平的提高,使用私家車在人們的出行中占據(jù)越來越大的比重,大量的汽車出行給交通管理和停車等造成了巨大的壓力。不但在道路上有隨處可見擁堵的車流,而且隨意??康能囕v越來越車牌智能識別技術(shù)是指根據(jù)影像技術(shù)將動態(tài)的或靜態(tài)的車輛車牌與車身顏色等進(jìn)行辨別的智能管理系統(tǒng)。此套系統(tǒng)主要包括車牌定位算法、車身顏色識別系統(tǒng)等分系統(tǒng)。一般來說,車牌識別系統(tǒng)的工作第一步圖像采集,通過高清攝像抓拍主機(jī)對過往車輛進(jìn)行實時、不間斷的記錄和采集。采集在路面上行駛的車輛信息,首先獲取車輛的圖像,采集汽車的圖像數(shù)據(jù),并將圖像轉(zhuǎn)換為位圖存入內(nèi)存中的汽車圖像數(shù)據(jù)采集庫;第二步是圖像的預(yù)處理,處理過程涉及到圖像灰度化處理、灰度圖像均衡化、邊緣檢測值化、檢測候選區(qū)域并二值化這幾個步驟;第三步是車牌粗定位,具體過程是利用車牌紋理特征確定車牌區(qū)域的大概位置,對車牌進(jìn)行大概位置的判斷;第四步是車牌精確定位,是利用車牌底紋顏色特當(dāng)前的車牌識別技術(shù),主要有3個特點:一是前端嵌入式一體化,二是算法基本都是基于深度學(xué)習(xí)車牌識別起源于20世紀(jì)80年代,主要應(yīng)用在被盜車輛的檢測,但沒有形成一套完整的識別系統(tǒng)。隨后,出現(xiàn)了一些用于車牌自動識別的圖像處理方法,針對一些特定的問題采用簡單的圖像處理技術(shù)來實現(xiàn)。到了20世紀(jì)90年代,隨著計算機(jī)技術(shù)的發(fā)展以及計算性能的提高,車牌識別研究也進(jìn)入熱潮,在中國,開始車牌識別研究始于上世紀(jì)90年代末,雖然當(dāng)時的技術(shù)并不成熟,是一種既昂貴又不完善的產(chǎn)品,規(guī)模也不大,識別率一直在80-90%左右徘徊,因此應(yīng)用市場限制在高端的小眾市場里。自2005年以來,各地政府開始加速進(jìn)行智能交通系統(tǒng)建設(shè)。車牌識別作為智能交通的核心技術(shù),得到快速的發(fā)展,識別率從80%提高到97%,分辨率從模擬視頻到高清視頻,應(yīng)用平臺從PC上的軟識別到相機(jī)內(nèi)的DM642,DM648,DM8127等。2005年到2015年是車牌識別技術(shù)整整高速發(fā)展的十停車場及小區(qū)的車牌識別系統(tǒng)的運(yùn)用主要是指在小區(qū)及停車場將車牌識別系統(tǒng)運(yùn)用在進(jìn)行車輛的車牌識別、記錄進(jìn)出時間、辨別車輛是否屬于小區(qū)等,以此來規(guī)范小區(qū)的車輛管理、提高效率、降低人工管理成本。例如在小區(qū)中運(yùn)用車牌識別系統(tǒng)時車牌識別系統(tǒng)自動采集車輛的相關(guān)信息并做出判斷,對不屬于本小區(qū)的車輛進(jìn)行及時收費(fèi)。除此之外,車輛識別系統(tǒng)還能與車輛調(diào)度系統(tǒng)進(jìn)行結(jié)合,綜合對車輛進(jìn)行出入、調(diào)度等的管理。在小區(qū)及停車場安裝車牌識別系統(tǒng)可以說是一個一勞永逸的動作,小區(qū)在未安裝車牌識別系統(tǒng)時往往需要投入大量的人力及物力用來管理小區(qū)內(nèi)的車輛正常出入工作,因為在小區(qū)及停車場對車輛用人力進(jìn)行相關(guān)的記錄和管理工作是十分復(fù)雜的,如果采用人力的辦法進(jìn)行管理和疏導(dǎo)那么人工需要做的工作主要有:記錄、匯總、引導(dǎo)、收費(fèi)等,可以說是工作十分繁雜且細(xì)小的,并且時間成本與人力成本也比較高,不僅如此,在未安裝車牌識別系統(tǒng)時采用人力記錄的出錯率相比于安裝車牌識別系統(tǒng)后也比較高。在安裝車牌識別系統(tǒng)后這些問題都將得到有效的解決。車牌識別系統(tǒng)對那些遮擋車牌、掉漆斷裂、車牌模糊不清的車輛也能夠在進(jìn)行信息的分析后做出相對準(zhǔn)確的判斷,這也減輕了在改革開放后我國的經(jīng)濟(jì)保持著迅猛的增長趨勢,高速公路的發(fā)展也同經(jīng)濟(jì)一樣保持高速的增長,在短短近三十年間我國高速里程數(shù)突破十三萬公里。我國在高速公路的各個出口都設(shè)有收費(fèi)站,收費(fèi)站在進(jìn)行收費(fèi)的同時也可以作為交警的高速公路規(guī)范管理基地。在高速公路收費(fèi)站進(jìn)行車牌識別系統(tǒng)的運(yùn)用一方面有利于更好的進(jìn)行相關(guān)的管理,另外也可以對那些違法車輛進(jìn)行有效的監(jiān)管,當(dāng)在高速公路上行駛的車輛在經(jīng)過車牌識別系統(tǒng)的辨認(rèn)之后會對車輛的合法性做出有效的分辨,在車牌識別系統(tǒng)發(fā)現(xiàn)車輛違法的時候便將違法車輛信息傳輸給高速公路公安,方便公安對違法車輛的抓捕與調(diào)查。鑒于高速收費(fèi)站的特殊性,在收費(fèi)站安裝的車輛識別要求一般較高。傳統(tǒng)的車牌識別像素都是106P,這一像素的有效識別區(qū)域小、辨識度不高,因此在高速收費(fèi)站中就不適用。在現(xiàn)代技術(shù)的支持下,現(xiàn)在高速收費(fèi)站的車牌識別系統(tǒng)的攝影技術(shù)都是高清的,這為公安和交警進(jìn)行工作提供了方便和可靠的信息支持。一般來說,車輛在高速公路上行駛速度通常在90-120公里每小時之間,低分辨率的攝像頭無法很好的在如此之高的速度之下保證有效的對車輛信息進(jìn)行分辨,因此,采用高清的攝影技術(shù)作為車牌識別系統(tǒng)的支持可以很好的提高車牌識別系統(tǒng)的準(zhǔn)確度和工作效率,為公安和交警的工作提供更加有效的信息。在收費(fèi)站進(jìn)行車牌識別系統(tǒng)的運(yùn)用在有利于提高管理效率的同時還有利于對違法犯罪車輛進(jìn)行監(jiān)控,為抓捕在人民生活水平和需求逐漸提高的今天,車輛的增多帶來了許多的違法問題。車牌識別系統(tǒng)可以為違法車輛的處罰提供信息支持,在這一點最具有代表性的便是公路卡口系統(tǒng)。一個完整有效的公路卡口系統(tǒng)一般包括車輛識別系統(tǒng)、治安卡口系統(tǒng)與中心管理平臺,三者相輔相成,共同構(gòu)成公路卡口系統(tǒng)。車輛識別作為最基礎(chǔ)的檢測系統(tǒng),在公路卡口系統(tǒng)中具有重要作用。在公路卡口系統(tǒng)中車輛識別系統(tǒng)的識別速度是一個主要的參考指標(biāo)。當(dāng)車牌識別系統(tǒng)的識別速度快時系統(tǒng)的工作效率就高,識別速度不足時系統(tǒng)的工作效率就相對較低。識別車牌速度快、準(zhǔn)確,車牌識別系統(tǒng)才能有效地實現(xiàn)自動比對報警,避免出現(xiàn)大量的誤報。同高速收費(fèi)站的車牌識別系統(tǒng)一般,公路卡口系統(tǒng)也為公安交警系統(tǒng)的破案提供我國的城市化進(jìn)程正在越來越快,城市公路運(yùn)輸業(yè)也在迅速的發(fā)展著。由于基礎(chǔ)設(shè)施建設(shè)的落后,交通管理現(xiàn)狀和需求的增長之間的矛盾正在逐漸加劇,與交通有關(guān)的刑事與治安案件也在越來越多發(fā)。公安交通管理部門目前面臨的主要問題之一便是運(yùn)用何種手段對城市公路交通進(jìn)行有效的監(jiān)管、打擊各雖然車牌識別技術(shù)這些年取得了飛速的進(jìn)步,但還未達(dá)到普適化通用的程度,各個應(yīng)用場景的產(chǎn)品還是使用專用的車牌識別相機(jī)效果較好。比如高速公路的放在停車場就明顯不太適應(yīng),停車場的用在加現(xiàn)如今車牌識別技術(shù)在應(yīng)用方面已開始由交通領(lǐng)域走向了非交通領(lǐng)域,比如4S店、汽修店、汽車美容店、加油站、地磅、充電樁、工地等領(lǐng)域,這些復(fù)雜場景的識別特點、需要集成的應(yīng)用功能與交通場景存在極大的不同,所以現(xiàn)有的許多適用于動態(tài)交通或者靜態(tài)交通的車牌識別產(chǎn)品,在這些更加細(xì)分正是在這樣的背景下,專注于非交通領(lǐng)域的車牌識別技術(shù)獲得了越來越多的關(guān)注。目前針對智慧車針對場景功能需求設(shè)計了許多具備亮點的特色功能,如智慧加油站的防爆車牌識別一體機(jī)、充電樁防占可以預(yù)見,未來越來越多的細(xì)分場景都較大可能要使用場景專用智能車牌識別一體機(jī),才能讓車牌三、大模型大模型是指模型具有龐大的參數(shù)規(guī)模和復(fù)雜程度的機(jī)器學(xué)習(xí)模型。在深度學(xué)習(xí)領(lǐng)域,大模型通常是指具有數(shù)百萬到數(shù)十億參數(shù)的神經(jīng)網(wǎng)絡(luò)模型。這些模型需要大量的計算資源和存儲空間來訓(xùn)練和存儲,然而,大模型也面臨一些挑戰(zhàn)。首先是資源消耗問題,大模型需要大量的計算資源、存儲空間和能源來進(jìn)行訓(xùn)練和推理,對計算設(shè)備的要求較高。其次是訓(xùn)練時間較長,由于模型參數(shù)規(guī)模的增大,模型的訓(xùn)練過程會更加耗時。除此之外,大模型對數(shù)據(jù)集的需求也較高,如果訓(xùn)練數(shù)據(jù)不充足或不平衡,可大模型最早的關(guān)注度源于NLP領(lǐng)域,隨著多模態(tài)能力的演進(jìn),CV領(lǐng)域及多模態(tài)通用大模型也逐漸成為市場發(fā)展主流。(OpenAI在2019年發(fā)布了GPT-2大模型)AI大模型是人工智能預(yù)訓(xùn)練大模型的簡稱,包含了“預(yù)訓(xùn)練”和“大模型”兩層含義,ChatGPT的最大貢獻(xiàn)在于基本實現(xiàn)了理想LLM的接口層,能夠使LLM自主適配人的習(xí)慣命令表達(dá)方式,由此增加了LLM的易用性,提升了用戶體驗。2017年,Vaswani等提出Transformer架構(gòu),奠定了當(dāng)前大模型領(lǐng)域主流的算法架構(gòu)基礎(chǔ);Transformer結(jié)構(gòu)的提出,使深度學(xué)習(xí)模型參數(shù)達(dá)到了上億的規(guī)模。2018年,谷歌提出了大規(guī)模預(yù)訓(xùn)練語言模型BERT,該模型是基于Transformer的雙向深層預(yù)訓(xùn)練模型,其參數(shù)首次超過3億規(guī)模;同年,OpenAI提出了生成式預(yù)訓(xùn)練Transformer模型——GPT,大大地推動了自然語言處理領(lǐng)域的發(fā)展。此后,基于BERT的改進(jìn)模型、ELNet、RoBERTa、T5等大量新式預(yù)訓(xùn)練語言模型不斷涌現(xiàn),預(yù)訓(xùn)練技術(shù)在自然語2019年,OpenAI繼續(xù)推出15億參數(shù)的GPT-2,能夠生成連貫的文本段落,做到初步的閱讀理解、機(jī)器翻譯等。緊接著,英偉達(dá)推出了83億參數(shù)的Megatron-LM,谷歌推出了110億參數(shù)的T5,微軟推出了170億參數(shù)的圖靈Turing-NLG。2020年,OpenAI推出了超大規(guī)模語言訓(xùn)練模型GPT-3,其參數(shù)達(dá)到了1750億,在兩年左右的時間實現(xiàn)了模型規(guī)模從億級到上千億級的突破,并能夠?qū)崿F(xiàn)作詩、聊天、生成代碼等功能。此后,微軟和英偉達(dá)在2020年10月聯(lián)手發(fā)布了5300億參數(shù)的MegatronTuring自然語言生成模型(MT-NLG)。2021年1月,谷歌推出的SwitchTransformer模型以高達(dá)1.6萬億的參數(shù)量成為史上首個萬億級語言模型;同年12月,谷歌還提出了1.2萬億參數(shù)的通用稀疏語言模型GLaM,在7項小樣本學(xué)習(xí)領(lǐng)域的性能超過GPT-3??梢钥吹剑笮驼Z言模型的參數(shù)數(shù)量保持著指數(shù)增長勢頭。這樣高速的發(fā)展并2022年,又有一些常規(guī)業(yè)態(tài)大模型涌現(xiàn),比如StabilityAI發(fā)布的文字到圖像的創(chuàng)新模型Diffusion,以及OpenAI推出的ChatGPT,ChatGPT是由效果比GPT3更強(qiáng)大的GPT-3.5系列模型提供支持,并且這些模型使用微軟AzureAI超級計算基礎(chǔ)設(shè)施上的文本和代碼數(shù)據(jù)進(jìn)行訓(xùn)練。而在國內(nèi),超大模型研發(fā)展異常迅速,2021年成為中國AI大模型的2021年,商湯發(fā)布了書生(INTERN)大模型,擁有100億的參數(shù)量,這是一個相當(dāng)龐大的訓(xùn)練工作。在訓(xùn)練過程中,大概有10個以上的監(jiān)督信號幫助模型,適配各種不同的視覺或者NLP任務(wù),截至2021年中,商湯已建成世界上最大的計算同年4月,華為云聯(lián)合循環(huán)智能發(fā)布盤古NLP超大規(guī)模預(yù)訓(xùn)練語言模型,參數(shù)規(guī)模達(dá)1000億;聯(lián)阿里達(dá)摩院發(fā)布270億參數(shù)的中文預(yù)訓(xùn)練語言模型PLUG,聯(lián)合清華大學(xué)發(fā)布參數(shù)規(guī)模達(dá)到1000億的中文多模態(tài)預(yù)訓(xùn)練模型M6;7月,百度推出ERNIE3.0知識增強(qiáng)大模型,參數(shù)規(guī)模達(dá)到百億;ERNIE3.0Titan模型,參數(shù)規(guī)模達(dá)2600億。而達(dá)摩院的M6模型參數(shù)達(dá)到10萬億,將大模型參數(shù)直2022年,基于清華大學(xué)、阿里達(dá)摩院等研究成果以及超算基礎(chǔ)實現(xiàn)的“腦級人工智能模型”八卦爐(BAGUALU)完成建立,其模型參數(shù)模型突破了174萬億個,完全可以與人腦中的突觸數(shù)量相媲美。大模型未來發(fā)展將趨于通用化與專用化并行、平臺化與簡易化并進(jìn)。同時,MaaS模式將成為AI宇視“梧桐”:CV行業(yè)大模型、NLP行業(yè)大模型及MM多模態(tài)行業(yè)大模型CV(計算機(jī)視覺)行業(yè)大模型:提供AI訓(xùn)練、AI在線學(xué)習(xí)等服務(wù),預(yù)計將在7月底上線。NLP(自然語言處理)行業(yè)大模型:提供資料中心、大數(shù)據(jù)平臺、代碼開發(fā)等服務(wù),這是一款自用MM(多模態(tài))行業(yè)大模型:提供Vlog等服務(wù),目前已應(yīng)用在樂園、景區(qū)、鄉(xiāng)村振興等場景。宇視旅游景區(qū)梧桐Vlog解決方案“梧桐”算法經(jīng)10年以上積累,覆蓋素材采集、數(shù)據(jù)生產(chǎn)、算法設(shè)計、模型訓(xùn)練、產(chǎn)品化、測試AI體態(tài)分析:動作識別范圍從人體軀干、四肢到手指的精細(xì)動作、面部的精細(xì)表情,精準(zhǔn)捕捉游客的“精彩POSE”瞬間。特效算法:視頻剪輯階段,基于“梧桐”行業(yè)大模型多模態(tài)技術(shù)對各場景和動作進(jìn)行分析,自動疊360智慧生活:360智腦4.0“360智腦4.0”融合千億參數(shù),是基于十億級互聯(lián)網(wǎng)圖文數(shù)據(jù)進(jìn)行清洗訓(xùn)練,并針對安防場景在技術(shù)層面,“360智腦4.0”已具備生成與創(chuàng)作、多輪對話、代碼能力、文本分類、文本改寫、閱讀理解、邏輯與推理、知識問答、多模態(tài)、翻譯等十大核心能力,維度涵蓋數(shù)百項細(xì)分功能,在多個而在應(yīng)用場景上?!?60智腦4.0”可覆蓋大模型全部應(yīng)用場景,并可接入瀏覽器、搜索、安全衛(wèi)士等360全端產(chǎn)品,實現(xiàn)全面智能化重塑。下一步,360還將計劃發(fā)布插件平臺,進(jìn)一步推動大模型產(chǎn)此外,數(shù)字安全技術(shù)是360手握的核心技術(shù),在市面大模型普遍存在網(wǎng)絡(luò)安全、數(shù)據(jù)安全、算法安聯(lián)匯科技:聯(lián)匯OmBot歐姆智能體、OmModelV2萬物識別、OmModelV3多模態(tài)視覺語言強(qiáng)化全場景視覺認(rèn)知和語義人機(jī)交互兩大核心能力,提供精細(xì)化視覺語言對齊,一句話生成算法、突破現(xiàn)有多模態(tài)大模型預(yù)訓(xùn)練耗費(fèi)超大規(guī)模預(yù)訓(xùn)練數(shù)據(jù)和算力的局限,提出基于復(fù)雜異構(gòu)訓(xùn)練數(shù)據(jù)的無止境多任務(wù)與訓(xùn)練算法,融合圖片描述、圖片分類、區(qū)域描述等多種視覺語言數(shù)據(jù)類型,從多角度進(jìn)行多層級的大模型預(yù)訓(xùn)練,實現(xiàn)用更高的數(shù)據(jù)效率與模型參數(shù)效率,增強(qiáng)在同等數(shù)據(jù)情況下的預(yù)訓(xùn)練效果,提高模型綜合識別能力,實現(xiàn)一個多模態(tài)大模型網(wǎng)絡(luò)結(jié)構(gòu)支撐N種任務(wù)、N種場景的針對傳統(tǒng)視覺識別模型依賴海量人工標(biāo)注數(shù)據(jù)與煙囪式訓(xùn)練的瓶頸,提出基于自然語言增強(qiáng)的多模態(tài)視覺識別模型,通過自然語言作為知識橋梁,讓視覺識別模型可以基于大規(guī)模多模態(tài)預(yù)訓(xùn)練泛化到任何全新場景當(dāng)中,實現(xiàn)高精度的零樣本新領(lǐng)域識別,突破了傳統(tǒng)視覺識別系統(tǒng)必須按照場景進(jìn)行定制的魔咒,讓用戶可以通過自然語言定義任意視覺目標(biāo),實現(xiàn)了視覺識別的冷啟動,大幅度降低了視覺識別“人在環(huán)路”多輪人機(jī)意圖對齊的新型大模型微調(diào)機(jī)制在環(huán)路”多輪人機(jī)交互式新型微調(diào)方式,通過結(jié)合人類專家的業(yè)務(wù)知識和迭代式的大模型微調(diào)方式,實通過非參數(shù)學(xué)習(xí)和提示學(xué)習(xí),減少大模型微調(diào)所需要的GPU算力需求,實現(xiàn)更加低代價的大模型行業(yè)針對現(xiàn)有多模態(tài)大模型僅強(qiáng)調(diào)識別精度,忽略推理速度,難以在大規(guī)模多模態(tài)數(shù)據(jù)匹配查詢中應(yīng)用實現(xiàn)億級多模態(tài)數(shù)據(jù)秒級匹配,匹配速度相較于傳統(tǒng)GPU向量比對算法提高5倍以上,在CPU環(huán)境提高匹配速度300倍以上;通過多專家蒸餾算法,提高多模態(tài)大模型編碼推理速度5倍以上,大幅度降低大模型使得AI落地應(yīng)用變得更容易,有效提高了其圖像識別的準(zhǔn)確度和效率,能夠更好地收集有與此同時,大模型的產(chǎn)業(yè)化也面臨諸多挑戰(zhàn):首先是數(shù)據(jù)規(guī)模大,且數(shù)據(jù)質(zhì)量參差不齊;其次是模此外,大模型研發(fā)依賴算法算力和數(shù)據(jù)的綜合支撐,大模型的成本壁壘非常高,大公司和小企業(yè)都有各自的負(fù)擔(dān),基于此,在具備通用能力的基礎(chǔ)之上,于垂直領(lǐng)域不斷訓(xùn)練、提升大模型的專業(yè)能力,四、視頻結(jié)構(gòu)化視頻結(jié)構(gòu)化技術(shù)旨在處理非結(jié)構(gòu)化數(shù)據(jù),它是一種基于視頻內(nèi)容信息提取的技術(shù)。根據(jù)語義關(guān)系,視頻結(jié)構(gòu)化技術(shù)可以將非結(jié)構(gòu)化視頻數(shù)據(jù)轉(zhuǎn)化為人和機(jī)器都能理解的結(jié)構(gòu)化或半結(jié)構(gòu)化智能信息,并進(jìn)視頻結(jié)構(gòu)化是實現(xiàn)大規(guī)模視頻信息化和視頻智能化的有效技術(shù),它已廣泛應(yīng)用于安防行業(yè),尤其是此外,對于視頻監(jiān)控中的視頻結(jié)構(gòu)化,還需要應(yīng)用視頻圖像解碼技術(shù)、智能分析技術(shù)、數(shù)據(jù)檢索技術(shù)于一體,并實現(xiàn)結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行智能檢索、以圖搜圖、視頻跨鏡追蹤等相關(guān)應(yīng)用,視頻結(jié)構(gòu)化能提在2010年當(dāng)高清成為安防行業(yè)大潮時,視頻結(jié)構(gòu)化技術(shù)開始簡單應(yīng)用。不過,當(dāng)時受限于算法的成熟度和硬件性能,早期的智能分析更多的是依靠后端的智能服務(wù)器來實現(xiàn),直到各類智能分析算法日目標(biāo)檢測是計算機(jī)視覺方向極為重要的任務(wù),是實現(xiàn)監(jiān)控視頻結(jié)構(gòu)化分析的基礎(chǔ),旨在找出圖像中目標(biāo)檢測往往需要檢測多類目標(biāo),且圖像中的目標(biāo)物體通常也會有光照影響、遮擋等問題,因此目標(biāo)檢測是具有挑戰(zhàn)性的一項任務(wù)。目標(biāo)檢測主要包含三個步驟,首先提取圖像中的候選區(qū)域,然后提取行人屬性識別任務(wù)可被當(dāng)作分類任務(wù),傳統(tǒng)的解決方案一般依托于機(jī)器學(xué)習(xí)的方法,此類方法往往近年來,研究人員更多地嘗試使用基于卷積神經(jīng)網(wǎng)絡(luò)的方法,以行人屬性信息為標(biāo)簽訓(xùn)練端到端的離線跟蹤和在線跟蹤兩種,在線跟蹤只能利用當(dāng)前幀和之前的幀實現(xiàn)目用未來圖像幀的信息,一般而言,更多的圖像幀能夠?qū)Ω櫧Y(jié)果進(jìn)行更好地校正。雖然在線跟蹤可用于4)關(guān)聯(lián)階段,主要參考計算的相似度,結(jié)合其他已知信息,實現(xiàn)對同一目標(biāo)的跟蹤與軌跡描述,在交通視頻大數(shù)據(jù)處理分析中,關(guān)于車輛結(jié)構(gòu)化的研究開始較早,相關(guān)技術(shù)發(fā)展較快,如今交通監(jiān)如何在復(fù)雜多變的場景、海量目標(biāo)群體中快速檢索或者重識別目標(biāo)車輛仍需要科研人員持續(xù)的投入和更而隨著城市管理水平的進(jìn)一步提升,行人結(jié)構(gòu)化分析的需求正在逐漸顯現(xiàn)。行人結(jié)構(gòu)化主要解析人臉或者行人的一些表觀屬性,例如年齡、性別、衣著樣式等,為后續(xù)相關(guān)任務(wù)提供更詳實的數(shù)據(jù)支撐。行人行為分析是交通視頻大數(shù)據(jù)處理分析中更為高階的任務(wù),受拍攝場景、移動攝像頭、視角和光照變另外,隨著物聯(lián)網(wǎng)技術(shù)和5G技術(shù)的發(fā)展,新技術(shù)的推動同樣在交通視頻結(jié)構(gòu)化分析研究中發(fā)揮了隨著公安信息化建設(shè)的不斷推進(jìn),我國平安城市、雪亮工程、治安防控體系戰(zhàn)略的深入發(fā)展,公安機(jī)關(guān)已經(jīng)建設(shè)了海量的視頻攝像機(jī),初步構(gòu)建起覆蓋公共區(qū)域、要害部位的“天網(wǎng)”,基本實現(xiàn)“全域覆蓋、全網(wǎng)共享、全時可用、全程可控”的公共安全視頻監(jiān)控聯(lián)網(wǎng)應(yīng)用。但大規(guī)模視頻產(chǎn)生的海量數(shù)據(jù)視頻結(jié)構(gòu)化技術(shù)的出現(xiàn)及不斷進(jìn)步,為公安部門各警種實戰(zhàn)應(yīng)用提供了有力的技術(shù)支撐,針對海量視頻分析、檢索及研判的問題,已逐步從人工分析轉(zhuǎn)向基于人工智能技術(shù)的視頻結(jié)構(gòu)化分析,并且在實視頻結(jié)構(gòu)化可以實現(xiàn)對視頻大數(shù)據(jù)的分析處理和挖掘信息,實現(xiàn)圖像信息的精細(xì)化、標(biāo)準(zhǔn)化。視頻結(jié)構(gòu)化分析能夠?qū)⒁曨l監(jiān)控中的人、車、非機(jī)動車類別等目標(biāo)進(jìn)行特征放大,實現(xiàn)對大量視頻圖片的實時化分析和特征提取,將雜亂無章的數(shù)據(jù)轉(zhuǎn)化為可視化的信息,為偵查實戰(zhàn)提供視頻圖像的結(jié)構(gòu)化解析而在偵查方面,視頻結(jié)構(gòu)化,能夠把數(shù)據(jù)變活,實現(xiàn)從人工看視頻,到機(jī)器看視頻的智能轉(zhuǎn)變,這種視頻結(jié)構(gòu)化技術(shù)通常是將人體特征和人臉特征進(jìn)行捆綁,將車輛特征與車輛信息鎖定,通過人體特征鎖定人臉特征,從而鎖定犯罪嫌疑人,通過對車輛特征的比對,鎖定車輛個體,從而獲取偵查線索。利用視頻結(jié)構(gòu)化偵查就是從經(jīng)過視頻結(jié)構(gòu)化處理過的視頻或者圖片信息中鎖定、找到犯罪嫌疑人并且尋找隨著5G通信、邊緣計算、大數(shù)據(jù)和人工智能等技術(shù)在煤炭工業(yè)生產(chǎn)場景的應(yīng)用,各類視頻設(shè)備和功能系統(tǒng)急劇增多。為提高礦山安全生產(chǎn)的協(xié)同管控能力和智能決策水平,解決礦山各業(yè)務(wù)系統(tǒng)智能化程度低、深度信息感知能力差以及決策能力弱的問題,需要對具體生產(chǎn)場景下的視頻結(jié)構(gòu)化分析相關(guān)技術(shù)進(jìn)行深入研究,構(gòu)建跨場景的態(tài)勢感知與協(xié)作、全流程的生產(chǎn)狀態(tài)監(jiān)控的智慧礦山生產(chǎn)視頻結(jié)構(gòu)化分析系統(tǒng)平臺。從人、機(jī)、料、法、環(huán)5個維度融合分析礦山視頻數(shù)據(jù),通過場景認(rèn)知和生產(chǎn)規(guī)則建模以應(yīng)對復(fù)雜作業(yè)場景下業(yè)務(wù)場景識別的需求,對礦山生產(chǎn)業(yè)務(wù)及規(guī)則進(jìn)行結(jié)構(gòu)化特征建模,從時間、空間以及語義等方面對目標(biāo)特征進(jìn)行組合分析與分級索引,在云邊協(xié)同技術(shù)架構(gòu)下,讓感知數(shù)據(jù)上行、規(guī)則模型下行,研發(fā)能夠快速進(jìn)行全系列結(jié)構(gòu)化數(shù)據(jù)傳遞、全場景語義信息融合以及全流程生產(chǎn)風(fēng)險管控的五、3D視覺3D視覺,又稱三維視覺,是一種模擬人類雙眼觀察物體時產(chǎn)生的立體效果的技術(shù),能廣泛應(yīng)用于其中,3D視覺技術(shù)的核心在于模仿人眼的立體感知原理。通過將不同角度的圖像合成,再通過專ToF的概念是扎根于深度傳感器的。這里的深度傳感器是指采用像素陣列來獲取整個場景的高分辨率深對于深度傳感器來說,一般用于測量深度的方案分別有結(jié)構(gòu)光、雙目和ToF三種,其中結(jié)構(gòu)光(iPhone目前的FaceID就是使用了基于結(jié)構(gòu)光的深度傳感器)和雙目技術(shù)都是基于幾何原理做間接深度估計,而ToF則是測量發(fā)射光和反射光之間的飛行時間并根據(jù)光速來直接估計深度。雙目立體視覺法的技術(shù)原理是通過從兩個視點觀察同一物體,從而來獲得同一物體在不同視角下的圖像。在雙目立體視覺系統(tǒng)的硬件結(jié)構(gòu)中,通常采用兩個攝像機(jī)作為視覺信號的采集設(shè)備,通過雙輸入通道圖像采集卡與計算機(jī)連接,把攝像機(jī)采集到的模擬信號經(jīng)過采樣、濾波、強(qiáng)化、模數(shù)轉(zhuǎn)換,最終向一個完整的雙目立體視覺系統(tǒng)通常可分為數(shù)字圖像采集、相機(jī)標(biāo)定、圖像預(yù)處理與特征提取、圖像校正、立體匹配、三維重建六大部分。雙目立體成像法具有高3D成像分辨率、高精度、高抗強(qiáng)光干擾但是需要通過大量的CPU/ASIC演算取得它的深度和幅度信息,其算法極為復(fù)雜較難實現(xiàn),同時該技術(shù)易受環(huán)境因素干擾,對環(huán)境光照強(qiáng)度比較敏感,且比較依賴圖像本身的特征,因而拍攝暗光場景時表現(xiàn)差。雙目立體視覺法還有另一個限制,它過度的依賴于被拍攝物體的表面紋理,如果被攝物體表面該技術(shù)是一種主動雙目視覺技術(shù),結(jié)構(gòu)光技術(shù)的基本原理是,通過近紅外激光器,將具有已知的結(jié)構(gòu)特征(比如離散光斑、條紋光、編碼結(jié)構(gòu)光等)的光線投射到被拍攝物體上,再由專門的紅外攝像頭進(jìn)行采集三維物體物理表面成像的畸變情況,再通過觀測圖案與原始圖案之前發(fā)生的形變由此來得到圖這個技術(shù)通過光學(xué)手段獲取被拍攝物體的三維結(jié)構(gòu),再將獲取到的信息進(jìn)行更深入的應(yīng)用。其工作原理可看作是另一種雙目法,紅外激光器和紅外攝像頭可當(dāng)做是雙目立體視覺法中的左右雙目的觀測原結(jié)構(gòu)光技術(shù)相較于雙目技術(shù)有一個好處,結(jié)構(gòu)光的紅外激光器發(fā)射出了光,可以照亮被掃描物體,所以它不需要像雙目結(jié)構(gòu)一樣依賴于光源,而且在較平整,沒有圖案的物體表面也可以測算出物體的三飛行時間法(ToF)ToF是TimeofFlight的縮寫,直譯為飛行時間,通過給目標(biāo)連續(xù)發(fā)送光脈沖,然后用傳感器接收從物體返回的光,通過探測這些發(fā)射和接收光脈沖的飛行(往返)時間來得到目標(biāo)物距離。傳感器通過計算光線發(fā)射和反射時間差或相位差,來換算被拍攝景物的距離,以產(chǎn)生深度信息,此外再結(jié)合傳統(tǒng)的隨著體感交互、3D識別與感知、環(huán)境感知以及AR地圖構(gòu)建等技術(shù)與應(yīng)用的發(fā)展,市場對3D視覺與識別技術(shù)的興趣日益濃厚,ToF的使用進(jìn)一步豐富了3D建模技術(shù)的應(yīng)用場景。智能交通、娛樂、3D打印和機(jī)器人等諸多領(lǐng)域都有應(yīng)用。以下將舉例ToF在不同領(lǐng)域中的實際應(yīng)用。在手機(jī)領(lǐng)域,ToF技術(shù)的主要應(yīng)用是安全(人臉識別,支付)、攝影、娛樂(增強(qiáng)現(xiàn)實,簡稱AR)。在汽車領(lǐng)域,ToF相機(jī)主要應(yīng)用在三個領(lǐng)域,一個是座艙內(nèi)部的駕駛者疲勞監(jiān)測、手勢識別、人臉識別。第二個領(lǐng)域是固態(tài)激光雷達(dá)。ToF相在醫(yī)療領(lǐng)域,ToF技術(shù)可以用于手術(shù)導(dǎo)航,通過實時獲取患者體內(nèi)的三維圖像,醫(yī)生可以準(zhǔn)確地了解手術(shù)部位的情況,從而更好地進(jìn)行手術(shù)操作。此外,ToF技術(shù)還可以用于醫(yī)學(xué)影像診斷,如乳房X線在智能家居和智能交通等領(lǐng)域,ToF技術(shù)可以用于智能家居的人機(jī)交互,通過獲取用戶的手勢和身體姿勢等信息,智能家居系統(tǒng)可以更加準(zhǔn)確地了解用戶的需求,從而提供更加智能化的服務(wù)。此外,ToF技術(shù)還可以用于車輛的自動駕駛和智能交通管理等領(lǐng)域,ToF被用于自動駕駛,防撞自動剎車、手在人臉識別和安保系統(tǒng)中,ToF技術(shù)將深度信息添加到2D圖像中可以提取有用的信息,并且可以在工業(yè)/物流領(lǐng)域,ToF也可為機(jī)器人帶來視覺效應(yīng)。ToF技術(shù)可以用于自動化制造和通過獲取工件表面的三維信息,機(jī)器人可以更加準(zhǔn)確地操作和加工工件。此外,ToF技術(shù)還可以用于生六、AI芯片1992年,全球第一顆AI芯片“ANNA”在貝爾實驗室里問世,包括64個計算單元,專門針對CNN訓(xùn)練進(jìn)行了優(yōu)化,峰值吞吐量為每秒40億次加法。2012年,在國際頂級賽事ImageNet計算機(jī)視覺挑戰(zhàn)賽,多倫多大學(xué)教授杰弗里·辛頓(GeoffreyHinton)和兩位學(xué)生用AlexNet算法一舉奪魁,讓計算機(jī)識圖準(zhǔn)確率飆升到84%。2016年,繼AlexNet算法掀起深度學(xué)習(xí)科研熱潮后,由谷歌兄弟公司DeepMind研發(fā)的AI算法AlphaGo橫空出世,讓“人工智能”概念一夜紅遍大江南北,加速了AI落地商用的進(jìn)程。值得關(guān)注的是,AlphaGo幕后的硬件功臣,是谷歌從2014年就開始秘密籌備的大招——張量處理器TPU。至此,谷歌TPU打響了專用AI芯片第一槍。2017年,谷歌的7位研究員與1位多倫多大學(xué)本科生在國際AI學(xué)術(shù)頂會NeurIPS上發(fā)表了一篇名為“AttentionisAllYouNeed”的論文,將革命性的Transformer架構(gòu)推向極致,成為大模型風(fēng)2022年,OpenAI公司開發(fā)的人工智能聊天機(jī)器人程序ChatGPT爆火,作為生成式人工智能技術(shù)(AIGC)的一種,需要依靠高性能AI芯片、服務(wù)器和數(shù)據(jù)中心提供訓(xùn)練算力支持,催生大算力芯片迎2023年,屬于大模型的一年。隨著ChatGPT的火爆,AI大模型成為人工智能領(lǐng)域的新的發(fā)展方向和研究領(lǐng)域。研究機(jī)構(gòu)、科技公司及高校等紛紛推出人工智能大模型產(chǎn)品,掀起一股百模大戰(zhàn)熱潮,對AI芯片的需求也暴漲。AI芯片是具備支撐大模型訓(xùn)練能力還是推理能力,成為芯片廠商的分水嶺。當(dāng)前,從技術(shù)角度來看,AI芯片可以分為四大類CPU、GPU、FPGA及ASIC,CPU是AI計算的基礎(chǔ),GPU、FPGA、ASIC作為加速芯片協(xié)助CPU進(jìn)行大規(guī)模計算。其中,GPU是較為成熟的通用型人工智能芯片,F(xiàn)PGA和ASIC則是針對人工智能需求特征的半定制和全定制芯片。目前AI芯片主要被國際廠商壟斷,根據(jù)Counterpoint、IDC數(shù)據(jù),Intel和AMD共計占2022年全球數(shù)據(jù)中心CPU市場收入的92.45%,Nvidia占2021年中國加速卡市場份額的80%以上。GPU是通用性芯片,特點是具備通用性、性能高、功耗高;FPGA是半定制化芯片,特點是可編程、功耗和通用性一般;ASIC是全定制化芯片,特點是不能擴(kuò)展、性能穩(wěn)定、功耗可控;類腦芯片,特點CPU:(中央處理器)是計算機(jī)中最重要的組件之一,負(fù)責(zé)執(zhí)行指令和處理數(shù)據(jù)。CPU擅長邏輯控制,在深度學(xué)習(xí)中可用于推理/預(yù)測。在深度學(xué)習(xí)中,模型的訓(xùn)練和推理是兩個不同的過程:在訓(xùn)練過程中,模型需要進(jìn)行大量的矩陣運(yùn)算,因此通常使用GPU等擅長并行計算的芯片常需要高效的邏輯控制能力和低延遲的響應(yīng)速度,這正是CPU所擅長的。目前的相關(guān)廠商有英特爾、AMD、鯤鵬、飛騰、龍芯、海光、兆芯、申威、中國科學(xué)院計算技術(shù)GPU:圖形處理器,不僅是智算中心的核心,也在超算領(lǐng)域得到廣泛的應(yīng)用。大模型的訓(xùn)練需要龐大的算力資源,GPU是大模型的最佳算力發(fā)動機(jī)。目前的相關(guān)廠商有英偉達(dá)、英特爾、AMD、瀚博、天數(shù)智芯、海飛科、壁仞科技、珠海芯動力。DPU:第三大算力芯片。2016年,美國公司Fungible提出,可進(jìn)行安全與存儲卸載功能的下一代從DPU的產(chǎn)業(yè)發(fā)展歷程來看,NVIDIA是全球先行者。2020年上半年,NVIDIA以69億美元的對價收購以色列網(wǎng)絡(luò)芯片公司MellanoxTechnologies,并于同年推出BlueField-2DPU,將其定義為繼CPU和GPU之后“第三顆主力芯片”,正式拉開DPU大發(fā)展的序幕。目前的相關(guān)廠商有,字節(jié)跳動旗下火山引擎發(fā)布自研DPU(數(shù)據(jù)處理單元)芯片;中科馭數(shù)是國內(nèi)DPU芯片研發(fā)的領(lǐng)軍企業(yè)、上海云脈芯聯(lián)初創(chuàng)企業(yè)。FPGA:可以先購買再設(shè)計的“萬能”芯片。FPGA(Field-ProgrammableGateArray)現(xiàn)場可編程門陣列,是在硅片上預(yù)先設(shè)計實現(xiàn)的具有可編程特性的集成電路,它能夠按照設(shè)計人員的需求配置為指定的電路結(jié)構(gòu),讓客戶不必依賴由芯片制造商設(shè)計和制造的ASIC芯片。目前的相關(guān)廠商有AMDXilinx、英特爾Altera、Lattice萊迪思、MiPangomicro、復(fù)旦微電子、ANLOGIC、成都華微CSMT、高云GOWIN、京微齊力。ASIC:供專門應(yīng)用的集成電路芯片技術(shù),在集成電路界被認(rèn)為是一種專門目的而設(shè)計的集成電路。相關(guān)芯片:谷歌、英特爾、英偉達(dá)、寒武紀(jì)、比特大陸、TPU:谷歌張量處理器,采用低精度計算,在幾乎不影響深度學(xué)習(xí)處理效果的前提下大幅降低了功耗、加快運(yùn)算速度。同時,TPU使用了脈動陣列等設(shè)計來優(yōu)化矩陣乘法與卷積運(yùn)算。目前公司90%以上的AI訓(xùn)練工作都是通過谷歌自主研制的第四代TPU芯片完成的。相關(guān)廠商:谷歌、瑞芯微等。額占比超過80%,且在訓(xùn)練、推理環(huán)節(jié)均保持持續(xù)領(lǐng)先;在數(shù)據(jù)中心AI加速市場,2022年英偉達(dá)市場份額達(dá)82%,AWS和Xilinx分別占比8%、4%,AMD、Intel、Google均占比2%。同時,景嘉微、燧原科技、沐曦、壁仞科技、天數(shù)智芯等GPU芯片具有一定代表性,其靈活性好、此外,以百度昆侖芯為代表的FPGA芯片,靈活性好、平均性能較高、功耗較低等,但也存在量產(chǎn)因而,AI浪潮下,云計算、智能汽車、智能機(jī)器人等人工智能產(chǎn)業(yè)快速發(fā)展,市場對AI芯片的需在安防行業(yè)四十多年的發(fā)展歷程中,新技術(shù)的滲透加速了安防產(chǎn)業(yè)的變革。自AI技術(shù)發(fā)展至今,伴隨著安防智能化和數(shù)字化的進(jìn)程,攝像頭、交換機(jī)、IPC、硬盤刻錄機(jī)、多類服務(wù)器等設(shè)備都需要芯片的支持。而近年來,隨著AI芯片的不斷升級,在存量和增量市場的需求增長顯著,成為越來越在超高清化、智能化趨勢下,安防SoC價值量不斷提升。作為視頻監(jiān)控的核心芯片,SoC芯片肩除模擬ISP芯片外,安防SoC芯片主要分為IPC、DVR、NVR三類,實現(xiàn)視頻監(jiān)控前、后端的不同功能。據(jù)集微咨詢報告顯示,安防智能化正在推動全球AISoC芯片市場規(guī)模從2020年的4億美元提升至2025年的28億美元;前端智能攝像機(jī)的滲透率也將從2020年的10.23%提升至2025年的64%,龐大的市場,正吸引一眾AISoC芯片企業(yè)入場展開爭奪。此外,除了前端IPC,端側(cè)NVR、AIBox、人臉門禁、移動終端等安防設(shè)備都對AISoC芯片有著車載攝像頭市場需求持續(xù)攀升,預(yù)計到2023年全球車載攝像頭出貨量在2.1億顆,有望成為SoC芯片>>><>>><總體來說,在多個新興技術(shù)的加持下,當(dāng)前安防SoC芯片行業(yè)也遇到新的機(jī)遇和挑戰(zhàn),我們期待安七、其他生物識別與傳統(tǒng)的密碼檢驗方式相比,生物識別技術(shù)基于人的生物特性,具有易測量、排他性以及終身不變指紋識別可以說是生物識別技術(shù)的第一種形式,涉及圖像處理、模式識別、計算機(jī)視覺、數(shù)學(xué)形態(tài)學(xué)等眾多學(xué)科。目前與人臉識別技術(shù)一樣得到了廣泛的系統(tǒng)應(yīng)用。據(jù)不完全統(tǒng)計,當(dāng)前指紋識別主要應(yīng)用在考勤、門禁、保險箱柜等領(lǐng)域。未來,隨著技術(shù)的不斷進(jìn)步,指紋識別還將應(yīng)用在身份證、機(jī)動車光學(xué)指紋識別是現(xiàn)如今比較流行的指紋解鎖技術(shù)。這種指紋識別技術(shù)相比起電容式指紋識別來說,其原理很簡單,主要是利用光的反射與折射。當(dāng)手指按壓在屏幕上時,屏幕會發(fā)出亮光照亮指紋,目前這項指紋識別技術(shù)是比較成熟的,基本所有手機(jī)廠商均會搭載使用,用戶對該項技術(shù)的滿意度也尚可。但是,與電容式指紋識別一樣,濕手的情況下很難指紋解鎖,同時貼上個別鋼化膜之后,手機(jī)這兩種情況都是由于光的折射導(dǎo)致,當(dāng)指紋通過水或鋼化膜時,加劇了光的折射程度,難免會出現(xiàn)失靈的狀況。因此,大部分手機(jī)廠商在出廠時,均會告誡用戶采用合適的手機(jī)膜,避免出現(xiàn)指紋失靈的電容式指紋識別算是最早的指紋識別技術(shù)。其主要利用硅晶圓與皮膚上的電解液接觸形成電場,傳從原理上來看,電容式指紋識別需要一種介質(zhì)來傳導(dǎo),簡單來說就是需要一個類似按鍵的東西來承載。在全面屏?xí)r代,手機(jī)廠商將其設(shè)計為后置指紋解鎖或側(cè)邊按鍵指紋解鎖。同時,這種指紋解鎖對于手指的干燥性要求比較高,濕手的情況下是無法解鎖手機(jī)的,所以如今的市面上也很少有采用該項技術(shù)D)、超聲波指紋識別技術(shù)超聲波指紋識別是比較新的指紋識別技術(shù)。其原理主要是基于皮膚反射聲波的壓力讀數(shù),從而繪制從原理來看,超聲波指紋識別技術(shù)相比起前兩項指紋解鎖技術(shù)來說,是通過三維錄入且聲波傳導(dǎo),對于手指的細(xì)節(jié)要求并不是很高。所以,即使是濕手、手指沾滿污漬甚至屏幕濕潤的情況下,都能實現(xiàn)同時,超聲波指紋及時可以很好的解決電容式指紋識別與光學(xué)指紋識別技術(shù)的通病,對手指細(xì)節(jié)的虹膜識別技術(shù)是指通過拍攝人眼的虹膜來進(jìn)行身份確認(rèn),是一項基于生物識別特征身份認(rèn)證技術(shù), >>>>其中虹膜圖像獲取是指使用特定的數(shù)字?jǐn)z像器材對人的整個眼部進(jìn)行拍攝,并將拍攝到的圖像通過圖像預(yù)處理是指由于捕獲的人眼圖像包含大量冗余信息,在清晰度等方面不能滿足要求,需要進(jìn)行圖像平滑、邊緣檢測、圖像分離等預(yù)處理操作。其預(yù)處理的過程通常包括虹膜定位、虹膜圖像歸一化和特征匹配是指將當(dāng)前獲取的虹膜圖像的特征編碼與預(yù)先存儲在數(shù)據(jù)庫中的特征編碼進(jìn)行比較驗證,隨著我國已擁有識別準(zhǔn)確率行業(yè)領(lǐng)先的虹膜識別技術(shù),虹膜識別應(yīng)用場景的不斷擴(kuò)展吸引眾多廠商目前虹膜識別技術(shù)已經(jīng)在我國煤礦工人考勤、監(jiān)獄犯人管理、銀行金庫門禁、邊境安檢通關(guān)、軍隊另外,作為基于眼睛中的虹膜進(jìn)行身份識別的一項技術(shù),現(xiàn)在我國虹膜識別兩大機(jī)遇凸顯。一是在于手機(jī)市場的求新求變。在當(dāng)前智能手機(jī)越來越普遍且同質(zhì)化、飽和的情況下,手機(jī)廠商亟需一場新技雖然,現(xiàn)在刷臉和指紋識別是智能手機(jī)市場的寵兒,但基于虹膜識別的優(yōu)勢遠(yuǎn)超兩者,虹膜識別也正成為手機(jī)廠商的又一青睞對象。尤其是疫情以來,帶口罩和無接觸需限制了人臉識別與指紋識別在手二是在動物管理方面,眾所周知,不管是畜牧業(yè)、養(yǎng)殖業(yè)還是寵物業(yè),都需要對動物的身份進(jìn)行有序管理,才能更好推動行業(yè)的健康穩(wěn)定發(fā)展?,F(xiàn)如今,我國市場上已有部分地區(qū)出現(xiàn)了采用虹膜識別管理寵物狗檔案的案例,他們在虹膜識別助力下賦予每一個狗專屬身份ID,并與寵物醫(yī)院和日常管理相靜脈識別,是生物識別的一種,也是目前最安全最便捷的生物技術(shù)。因為,指紋容易被復(fù)制,人臉通過靜脈識別儀取得手指、手掌等的靜脈分布圖,將特征值存儲,實時采取靜脈圖,提取特征值進(jìn)行匹配,從而對個人進(jìn)行身份鑒定。靜脈識別技術(shù)克服了傳統(tǒng)指紋識別速度慢,手指有污漬或手指皮膚靜脈掃描:LED在手指一方發(fā)射近紅外線,透射手指,在手指另一方,攝像頭拍攝靜脈圖像;圖像對比與匹配:將以上得到的特征圖與數(shù)據(jù)庫中的原始模版進(jìn)行比較,計算相關(guān)性。如果相匹配雖然我國對于指靜脈識別技術(shù)的研究起步較晚,但受互聯(lián)網(wǎng)、生物識別等技術(shù)的快速發(fā)展帶動,國從應(yīng)用領(lǐng)域來講,目前,靜脈識別可以廣泛應(yīng)用于安全性行業(yè),比如銀行業(yè),金融業(yè)、數(shù)字貨幣、數(shù)字人民幣支付體系等。隨著人工智能、大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)等前沿技術(shù)持續(xù)發(fā)展,指靜脈識別等如在智能家居方面,以前用的傳統(tǒng)指紋鎖是指紋加密,現(xiàn)在市場推出的的靜脈指紋鎖能夠讓居民在不久的將來感受到靜脈技術(shù)帶來的便利,使用到更安全的靜脈識別智能鎖。隨著智能家居潮流進(jìn)一步發(fā)聲紋識別指主要根據(jù)語音波包含的說話人生理(如性別、年齡)及語音特征,自動識別說話人身份無感知、成本低等特點,目前廣泛應(yīng)用在金融、公安、司法、國安等領(lǐng)域,可以核實人員身份,提高業(yè)現(xiàn)階段聲紋識別主要應(yīng)用在公安、司法以及金融領(lǐng)域。主要是因為聲紋識別直接的解決了這些行業(yè)除金融安防領(lǐng)域外,現(xiàn)階段聲紋識別在民生場景中的應(yīng)用還處于初期試水階段,如家居車載中聲紋智能語音技術(shù)的全面發(fā)展,以及智能設(shè)備的爆發(fā)式增長,為聲紋識別提供了更多的應(yīng)用端口,而與多元語音技術(shù)的融合也為聲紋識別落地更多行業(yè)場景提供了技術(shù)保障。在未來,聲紋識別將向著聲紋+步態(tài)識別技術(shù),是通過對人體行走的姿態(tài)來提取人體的體型特征、肌肉特點、頭部的形狀等對這個首先由監(jiān)控攝像機(jī)采集人的步態(tài),通過檢測與跟蹤獲得步態(tài)的視頻序列,經(jīng)過預(yù)處理分析提取該人最后,將新采集的步態(tài)特征與步態(tài)數(shù)據(jù)庫的步態(tài)特征進(jìn)行比對識別,有匹配的即進(jìn)行預(yù)/報警。無因此,一個智能視頻監(jiān)控的自動步態(tài)識別系統(tǒng),實際上主要由監(jiān)控攝像機(jī)、一臺計算機(jī)與一套好的步態(tài)視頻序列的處理與識別的軟件所組成。其中,最關(guān)鍵的是步態(tài)識別的軟件算法。所以,對智能視頻步態(tài)識別技術(shù)可以通過人的步態(tài)特征、體態(tài)、身高等諸多信息點,在海量視頻中快速進(jìn)行人物檢索在公安刑偵領(lǐng)域,利用目標(biāo)人員的身高體態(tài)、運(yùn)動模式等特征,從海量視頻中快速搜索出與樣本高度相似的目標(biāo)或視頻片段,從而達(dá)到在換裝、跨場景、面部遮擋的情況下,亦可以快速識別出嫌疑人的在智能家居領(lǐng)域,步態(tài)識別可以很好地應(yīng)用于智能家居系統(tǒng)中,賦予家電系統(tǒng)的的智能化感知,提供更加個性化的服務(wù)。對于很多用戶而言,采用智能家居系統(tǒng)是為了更好的呵護(hù)和關(guān)懷家中的老人、小目前市場上的智能家居系統(tǒng)為了增強(qiáng)和用戶的智能交互,很多采用的都是基本的人體檢測傳感器,或是人臉識別感知模塊,但這兩種方式都有一定的局限性。人體傳感器沒有辦法智能區(qū)分是老人、小孩還是寵物,人臉識別又需要強(qiáng)調(diào)配合,夜視環(huán)境下基本無法作用。而步態(tài)識別對光照環(huán)境不敏感、無需ChatGPT--ChatGenerativePreCV--ComputerVision—計算機(jī)視覺FPGA--FieldProgrammableGateArray--即現(xiàn)場可編程門陣列NLP--NaturalLanguageProcessing--自然語言處理TOA--Transformer--OpenAI發(fā)布的聊天機(jī)器人模型 > >識別7機(jī)I》OwesternDigital.微信公眾號西部數(shù)據(jù)西部數(shù)據(jù)始終致力于發(fā)掘數(shù)據(jù)價值,創(chuàng)造更多可能。憑借在閃存和HDD領(lǐng)域的整合積累,以及在內(nèi)存技術(shù)領(lǐng)域的推進(jìn)發(fā)展,西部數(shù)據(jù)持續(xù)突破創(chuàng)新,不斷推出強(qiáng)大的數(shù)據(jù)存儲解決方案,以支持全球數(shù)字化未來的遠(yuǎn)大進(jìn)程。同時,西部數(shù)據(jù)將可持續(xù)發(fā)展作為公司核心價值觀,深刻理解應(yīng)對氣候變化的緊迫性,并積極實現(xiàn)欲了解更多西部數(shù)據(jù)公司及旗下WesternDigital?(西部數(shù)據(jù))、SanDisk?(閃迪)和WD?(西數(shù))品牌的信息,請訪問:/為了支持智慧視頻的存儲系統(tǒng)的建設(shè)以及城市安全監(jiān)測體系注入新動能,存儲行業(yè)的“老將”西部數(shù)據(jù),專門推出了針對性的WDPurple存儲產(chǎn)品和解決方案。用96層3DNAND技術(shù),搭配高達(dá)1TB的廣泛容量范圍,可滿足24×7全天候頻數(shù)據(jù)捕獲和分析的需求,可擦寫次數(shù)高達(dá)500+,為城市各類監(jiān)控提供實時捕捉除此之外,WDPurple?microSD監(jiān)控存儲卡還對運(yùn)行狀況提供WDDA監(jiān)控功能和故障轉(zhuǎn)移本地存儲功能保障監(jiān)控在每一次意外發(fā)生前都能隨時解決。同時,不管天氣炎熱還是寒冷,WDPurple?microSD存在該項目中,總計使用了2400多塊WDPurple監(jiān)控紫盤來保證整個項目的平穩(wěn)高效運(yùn)行。WDPurple監(jiān)控紫盤專為不間斷運(yùn)行的DVR和NVR系統(tǒng)而設(shè)計,它們能夠承受NVR環(huán)境中的極端熱波動和設(shè)備振動。WDPurple硬盤還針對同時寫入多個并發(fā)視頻流進(jìn)行了優(yōu)化,加之AllFrame?全幀技術(shù),改進(jìn)了ATA流式傳輸,有助于減少失幀、改善整體播放效果并增加NVR中支持的硬盤盤位數(shù)量。為解決廊坊安次小區(qū)人員魚龍混雜管理難度大、安全防范設(shè)施欠缺、治安環(huán)境差等問題,西部數(shù)據(jù)構(gòu)建“守望者聯(lián)盟”。在該方案中,采用了西部數(shù)據(jù)WDPurple?microSD監(jiān)控存儲卡和WDPurple監(jiān)控存儲硬盤,保障了高質(zhì)量的視為了增加廣州商學(xué)院安全防范的全面性,西部數(shù)據(jù)助力廣州商學(xué)院打造平安校園,采用了西部數(shù)據(jù)WDPurpleSCQD101存儲卡和西部數(shù)據(jù)WDPurpleProHDD。比如,西部數(shù)據(jù)WDPurple?
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工作計劃新聞部第六屆工作計劃
- 睡美蓮紡織品創(chuàng)業(yè)計劃書創(chuàng)業(yè)計劃書
- 脫貧攻堅幫扶工作總結(jié)計劃及思路
- 初三數(shù)學(xué)教師教學(xué)工作計劃
- 2025二年級新學(xué)期數(shù)學(xué)教研組的工作計劃
- 工作計劃it行業(yè)
- 四年美術(shù)下冊教學(xué)計劃
- 實習(xí)生教學(xué)工作計劃錦集
- 《城市規(guī)劃展廳》課件
- 《大學(xué)計算機(jī)基礎(chǔ)》課件-第3章 操作系統(tǒng)與應(yīng)用
- 東南大學(xué)實驗室安全知識在線考試題庫(全)
- 云管平臺的自動化運(yùn)維與巡檢解決方案
- 新疆維吾爾喀什地區(qū)2023-2024學(xué)年四年級數(shù)學(xué)第一學(xué)期期末質(zhì)量檢測試題含答案
- 全年籃球訓(xùn)練計劃表
- Unit 5 Humans and nature Lesson 1 A sea story 課件-2023-2024學(xué)年高中英語北師大版(2019)必修第二冊
- 優(yōu)秀項目監(jiān)理部評選材料
- 新時代核心英語教程3 電子版
- 2022學(xué)年北京市高三各區(qū)語文二模古詩閱讀匯編
- 盆底功能障礙問卷(PFDI20)
- O型圈新國標(biāo)尺寸表
- 礦山施工組織設(shè)計
評論
0/150
提交評論