中國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)供需態(tài)勢(shì)、競(jìng)爭(zhēng)格局及投資前景分析報(bào)告(智研咨詢)_第1頁(yè)
中國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)供需態(tài)勢(shì)、競(jìng)爭(zhēng)格局及投資前景分析報(bào)告(智研咨詢)_第2頁(yè)
中國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)供需態(tài)勢(shì)、競(jìng)爭(zhēng)格局及投資前景分析報(bào)告(智研咨詢)_第3頁(yè)
中國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)供需態(tài)勢(shì)、競(jìng)爭(zhēng)格局及投資前景分析報(bào)告(智研咨詢)_第4頁(yè)
中國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)供需態(tài)勢(shì)、競(jìng)爭(zhēng)格局及投資前景分析報(bào)告(智研咨詢)_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)供需態(tài)勢(shì)、競(jìng)爭(zhēng)格局及投資前景分析報(bào)告(智研咨詢)核心關(guān)鍵詞:機(jī)器學(xué)習(xí)發(fā)展歷程市場(chǎng)規(guī)模競(jìng)爭(zhēng)格局產(chǎn)業(yè)鏈全景發(fā)展趨勢(shì)1、監(jiān)督學(xué)習(xí)為主流,數(shù)據(jù)標(biāo)注與審核成基石人工智能是研究如何通過(guò)機(jī)器來(lái)模擬人類認(rèn)知能力的科學(xué),機(jī)器學(xué)習(xí)是現(xiàn)階段實(shí)現(xiàn)人工智能的主要手段。機(jī)器學(xué)習(xí)的處理系統(tǒng)和算法是主要通過(guò)找出數(shù)據(jù)里隱藏的模式進(jìn)而做出預(yù)測(cè)的識(shí)別模式。機(jī)器學(xué)習(xí)是一個(gè)范圍寬闊、內(nèi)容繁多、應(yīng)用廣泛的領(lǐng)域,并不存在(至少現(xiàn)在不存在)一個(gè)統(tǒng)一的理論體系涵蓋所有內(nèi)容。根據(jù)技術(shù)的路線的不同,可以分為監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)三大類。機(jī)器學(xué)習(xí)分類資料來(lái)源:智研咨詢整理通過(guò)比較可以看出,監(jiān)督學(xué)習(xí)與其他兩類方法主要區(qū)別在于模型訓(xùn)練過(guò)程中是否需要標(biāo)注數(shù)據(jù)。監(jiān)督學(xué)習(xí)模式,需要標(biāo)注數(shù)據(jù)對(duì)學(xué)習(xí)結(jié)果進(jìn)行反饋,在大量數(shù)據(jù)訓(xùn)練下,算法錯(cuò)誤率能大大降低。自動(dòng)駕駛、藥物醫(yī)療、安防等領(lǐng)域主要采用了此種方法,因此監(jiān)督學(xué)習(xí)成為機(jī)器學(xué)習(xí)的主流,海量的標(biāo)注數(shù)據(jù)也成為機(jī)器學(xué)習(xí)蓬勃發(fā)展的基石。三類方法比較資料來(lái)源:公開(kāi)資料整理2、行業(yè)產(chǎn)業(yè)鏈及業(yè)務(wù)流程數(shù)據(jù)標(biāo)注就是對(duì)文本、圖像、語(yǔ)音、視頻等待標(biāo)注數(shù)據(jù)進(jìn)行歸類、整理、編輯、糾錯(cuò)、標(biāo)記和批注等操作,為待標(biāo)注數(shù)據(jù)增加標(biāo)簽,生成滿足機(jī)器學(xué)習(xí)訓(xùn)練要求的機(jī)器可讀數(shù)據(jù)編碼。數(shù)據(jù)標(biāo)注與審核行業(yè)產(chǎn)業(yè)鏈涉及到上游人力供給和設(shè)備供給,下游則主要應(yīng)用在智能識(shí)別的人工智能領(lǐng)域。上游產(chǎn)業(yè)包括標(biāo)注員勞動(dòng)力、計(jì)算機(jī)軟硬件設(shè)備。上游市場(chǎng)的正向發(fā)展有利于數(shù)據(jù)標(biāo)注與審核行業(yè)在業(yè)務(wù)的深度和業(yè)務(wù)能力的快速提升。下游主要以人工智能為主,下游市場(chǎng)的持續(xù)擴(kuò)張有利于數(shù)據(jù)標(biāo)注與審核行業(yè)新增市場(chǎng)空間的發(fā)展,保持?jǐn)?shù)據(jù)標(biāo)注與審核行業(yè)未來(lái)可觀的發(fā)展前景。數(shù)據(jù)標(biāo)注與審核行業(yè)產(chǎn)業(yè)鏈結(jié)構(gòu)資料來(lái)源:智研咨詢整理數(shù)據(jù)標(biāo)注的主要過(guò)程,其中包括:需求承接、標(biāo)注準(zhǔn)備、正式標(biāo)注、驗(yàn)收交付、模型訓(xùn)練、上線運(yùn)營(yíng)等。數(shù)據(jù)標(biāo)注流程架構(gòu)資料來(lái)源:智研咨詢整理3、行業(yè)高速增長(zhǎng),數(shù)據(jù)資源定制服務(wù)為主要細(xì)分市場(chǎng)十多年時(shí)間,國(guó)內(nèi)數(shù)據(jù)標(biāo)注與審核大致經(jīng)歷三個(gè)發(fā)展階段。近年來(lái)運(yùn)營(yíng)模式、標(biāo)注工具及管理工具、數(shù)據(jù)流存儲(chǔ)管理等多方面創(chuàng)新,行業(yè)進(jìn)入了新的發(fā)展階段。作為勞動(dòng)密集型產(chǎn)業(yè)以及數(shù)據(jù)產(chǎn)業(yè)的一個(gè)處理環(huán)節(jié),正好是當(dāng)前疫情形勢(shì)下解決大量就業(yè)并促進(jìn)人工智能發(fā)展的大好機(jī)會(huì),各地政府大舉投入數(shù)據(jù)標(biāo)注產(chǎn)業(yè)園區(qū)建設(shè)。我國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)發(fā)展階段資料來(lái)源:智研咨詢整理智研咨詢發(fā)布的《2022-2028年中國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)投資策略探討及市場(chǎng)規(guī)模預(yù)測(cè)報(bào)告》顯示,2015-2021年,我國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)市場(chǎng)規(guī)模保持穩(wěn)步增長(zhǎng)態(tài)勢(shì),2021年達(dá)到44.40億元。2015年以來(lái),我國(guó)AI行業(yè)尚處在啟動(dòng)期,預(yù)計(jì)在之后的幾年里,伴隨AI戰(zhàn)略被更多企業(yè)認(rèn)同,更多資金和資源的投入,以及各項(xiàng)技術(shù)的實(shí)際應(yīng)用落地,我國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)將延續(xù)高速增長(zhǎng)態(tài)勢(shì)。2015-2022年我國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)市場(chǎng)規(guī)模走勢(shì)圖資料來(lái)源:智研咨詢整理2021年,我國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)數(shù)據(jù)資源定制服務(wù)市場(chǎng)規(guī)模37.92億元,同比增長(zhǎng)19.02%;數(shù)據(jù)集產(chǎn)品市場(chǎng)規(guī)模5.92億元,同比增長(zhǎng)21.31%;其他數(shù)據(jù)資源應(yīng)用服務(wù)市場(chǎng)規(guī)模0.56億元,同比增長(zhǎng)51.35%。2015-2021年我國(guó)數(shù)據(jù)標(biāo)注與審核細(xì)分產(chǎn)品市場(chǎng)集中度資料來(lái)源:智研咨詢整理4、行業(yè)受到資本市場(chǎng)青睞人工智能的發(fā)展和興起帶動(dòng)了與其相關(guān)產(chǎn)業(yè)的發(fā)展,而數(shù)據(jù)標(biāo)注作為其中重要的一環(huán),毫無(wú)疑問(wèn)成為了新興的代表行業(yè)。對(duì)于投資方而言,之所以選擇數(shù)據(jù)標(biāo)注,一方面,AI公司在算力、算法方向投入的增量梯度逐漸下降,未來(lái)市場(chǎng)存在巨大的數(shù)據(jù)需求;另一方面,這類公司的智能標(biāo)注工具不僅提升了數(shù)據(jù)的產(chǎn)出效率,同時(shí)也在數(shù)據(jù)、輔助標(biāo)注模型的迭代中打造出了完善的AI基礎(chǔ)設(shè)施。AI的未來(lái)就是數(shù)據(jù)到模型的無(wú)縫輸出。近年來(lái)我國(guó)數(shù)據(jù)標(biāo)注與審核市場(chǎng)部分企業(yè)融資情況資料來(lái)源:公司公告5、行業(yè)外包機(jī)構(gòu)占據(jù)主導(dǎo)地位目前我國(guó)的數(shù)據(jù)標(biāo)注與審核業(yè)務(wù)的參與者主要包括兩類,一是人工智能公司內(nèi)部的標(biāo)注部門(mén),二是商務(wù)流程外包公司。隨著人工智能的持續(xù)發(fā)展,人工智能企業(yè)對(duì)數(shù)據(jù)質(zhì)量要求逐漸提升,數(shù)據(jù)標(biāo)注與審核市場(chǎng)需求持續(xù)增長(zhǎng),同時(shí)大量中小初創(chuàng)人工智能企業(yè)為了降低成本,更愿意選擇專業(yè)的第三方數(shù)據(jù)采集服務(wù)商,數(shù)據(jù)標(biāo)注與審核行業(yè)規(guī)模持續(xù)擴(kuò)大。數(shù)據(jù)標(biāo)注行業(yè)參與者類型資料來(lái)源:智研咨詢整理AI行業(yè)的蓬勃發(fā)展,對(duì)數(shù)據(jù)的需求呈井噴式增長(zhǎng),數(shù)據(jù)標(biāo)注行業(yè)是伴隨著AI的興起而產(chǎn)生的一個(gè)新興行業(yè)。目前,我國(guó)國(guó)內(nèi)市場(chǎng)越來(lái)越多的互聯(lián)網(wǎng)巨頭公司開(kāi)始組建自己的數(shù)據(jù)標(biāo)注平臺(tái),京東(京東眾智)、百度(百度眾測(cè))都已經(jīng)擁有自己的標(biāo)注平臺(tái)和工具。頭部公司之外,國(guó)內(nèi)近年興起眾多數(shù)據(jù)標(biāo)注公司,如龍貓數(shù)據(jù)、Testin云測(cè)、倍賽BasicFinder、數(shù)據(jù)堂等,這些公司僅次于第一梯隊(duì),都具有相當(dāng)?shù)囊?guī)模。數(shù)據(jù)標(biāo)注與審核行業(yè)企業(yè)格局資料來(lái)源:智研咨詢整理6、行業(yè)維持高增長(zhǎng),AI+、高精準(zhǔn)、定制為行業(yè)主要發(fā)展趨勢(shì)目前的人工智能(有監(jiān)督機(jī)器學(xué)習(xí))由標(biāo)注數(shù)據(jù)驅(qū)動(dòng),也可以說(shuō)標(biāo)注數(shù)據(jù)是人工智能的血液。隨著人工智能成為國(guó)家發(fā)展戰(zhàn)略,其勢(shì)頭銳不可擋,預(yù)計(jì)2028年我國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)市場(chǎng)規(guī)模將達(dá)262.74億元。2023-2028年數(shù)據(jù)標(biāo)注與審核行業(yè)市場(chǎng)規(guī)模預(yù)測(cè)資料來(lái)源:智研咨詢整理隨著AI技術(shù)的發(fā)展,數(shù)據(jù)標(biāo)注工具需要從只支持人工標(biāo)注逐漸轉(zhuǎn)化為人工標(biāo)注+AI輔助標(biāo)注的方法。其基本思路為:基于以往的標(biāo)注,可以通過(guò)AI模型對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后由標(biāo)注人員在此基礎(chǔ)上做一些校正。因此,數(shù)據(jù)標(biāo)注工具的發(fā)展趨勢(shì)是開(kāi)發(fā)以人工標(biāo)注為主機(jī)器標(biāo)注為輔的半自動(dòng)化標(biāo)注工具,同時(shí)減少人工標(biāo)注的比例,并逐步提高機(jī)器標(biāo)注的占比。隨著機(jī)器標(biāo)注占比提升,未來(lái)數(shù)據(jù)標(biāo)注與審核產(chǎn)品/服務(wù)價(jià)格仍然存在下降空間。數(shù)據(jù)標(biāo)注得越精準(zhǔn)、對(duì)算法模型訓(xùn)練的效果就越好。大部分算法在擁有足夠多普通標(biāo)注數(shù)據(jù)的情況下,能夠?qū)?zhǔn)確率提升到95%,但從95%再提升到99%甚至99.9%,就需要大量高質(zhì)量的標(biāo)注數(shù)據(jù)??梢哉f(shuō),高質(zhì)量的數(shù)據(jù)是制約模型和算法突破瓶頸的關(guān)鍵指標(biāo)。隨著人工智能對(duì)數(shù)據(jù)采標(biāo)的復(fù)雜度和精細(xì)度要求變高,眾包在現(xiàn)有技術(shù)條件下,很難實(shí)現(xiàn)品控。隨著人工智能產(chǎn)品進(jìn)入落地多元行業(yè)和場(chǎng)景,作為基礎(chǔ)的數(shù)據(jù)也向著場(chǎng)景化發(fā)展。在算法、算力沒(méi)有重大突破的前提下,場(chǎng)景化的數(shù)據(jù)就是核心優(yōu)勢(shì)。因此貼合度較高的定制化服務(wù)能力就顯得尤為重要。以上數(shù)據(jù)及信息可參考智研咨詢()發(fā)布的《中國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)投資策略探討及市場(chǎng)規(guī)模預(yù)測(cè)報(bào)告》。智研咨詢專注產(chǎn)業(yè)咨詢十五年,是中國(guó)產(chǎn)業(yè)咨詢領(lǐng)域?qū)I(yè)服務(wù)機(jī)構(gòu)。公司以“用信息驅(qū)動(dòng)產(chǎn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論