




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第3章人工智能數(shù)據(jù)需求目錄3.1事物、數(shù)據(jù)與信息3.2大數(shù)據(jù)基本特征3.3大數(shù)據(jù)的作用3.4人工智能依賴大數(shù)據(jù)學(xué)習(xí)目標(biāo)本章主要從人工智能處理數(shù)據(jù)的視角,圍繞數(shù)據(jù)的類型、數(shù)據(jù)的特征、數(shù)據(jù)的作用、大數(shù)據(jù)與人工智能的相互關(guān)系等問(wèn)題進(jìn)行分析和討論,希望帶領(lǐng)讀者理解不同數(shù)據(jù)的形態(tài)和價(jià)值,正確看待人工智能時(shí)代的數(shù)字世界。理解事物、數(shù)據(jù)與信息的關(guān)系理解大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別理解大數(shù)據(jù)的類型、特征和作用理解人工智能與大數(shù)據(jù)的聯(lián)系與區(qū)別目錄3.1事物、數(shù)據(jù)與信息3.1事物、數(shù)據(jù)與信息
事物即客觀存在于自然界的一切物體或現(xiàn)象。
數(shù)據(jù)是一種將客觀事物按照某種測(cè)度感知而獲取的原始記錄,是反映客觀事物屬性的記錄,也是信息的具體表現(xiàn)形式。
自然界中事物的種類和形式的多種多樣的。隨著時(shí)代的變遷,記錄和描述事物的方式也不斷變化。3.1事物、數(shù)據(jù)與信息3.1.1自然事物與數(shù)據(jù)
數(shù)據(jù)和信息是兩個(gè)不同的概念,信息具有時(shí)效性且較為宏觀,它由數(shù)據(jù)的有序排列組合而成,傳達(dá)給讀者某個(gè)概念或方法等,而數(shù)據(jù)是構(gòu)成信息的基本單位,離散且冗余的數(shù)據(jù)幾乎沒(méi)有任何實(shí)用價(jià)值。3.1.2數(shù)據(jù)與信息
數(shù)據(jù)和信息之間是相互聯(lián)系的。數(shù)據(jù)可以直接來(lái)自測(cè)量?jī)x器的實(shí)時(shí)記錄,也可以來(lái)自人的認(rèn)識(shí),但是大量的數(shù)據(jù)多是借助于數(shù)據(jù)處理系統(tǒng)自動(dòng)地從數(shù)據(jù)源進(jìn)行采集和組織的。數(shù)據(jù)源是指客觀事物發(fā)生變化的實(shí)時(shí)數(shù)據(jù)。數(shù)據(jù)經(jīng)過(guò)加工處理之后,就成為信息。3.1.3數(shù)據(jù)的類型
數(shù)據(jù)有很多種,比如數(shù)字、文字、圖像、聲音等。常見(jiàn)的數(shù)據(jù)類型包括文本、圖片、音頻、視頻等。(1)文本
文本數(shù)據(jù)是指不能參與算術(shù)運(yùn)算的任何字符,也稱為字符型數(shù)據(jù)。在計(jì)算機(jī)中,文本數(shù)據(jù)一般保存在文本文件中。文本文件是一種由若干行字符構(gòu)成的計(jì)算機(jī)文件,常見(jiàn)格式包括ASCII、MIME和TXT等。
一個(gè)英文字母一個(gè)中文漢字一本新華字典一本康熙字典一套二十四史字符數(shù)量11720000665400050000000字節(jié)12144000013308000100000000存儲(chǔ)空間1B2B1.37M6.35M95.4M不同文本數(shù)據(jù)的所占存儲(chǔ)空間(ASCII碼格式)3.1.3數(shù)據(jù)的類型(2)圖片
圖片是指由圖形、圖像等構(gòu)成的平面媒體,一般用圖片格式的文件來(lái)保存。圖片格式可分為點(diǎn)陣圖和矢量圖兩大類。jpg、bmp、gif、png、9.png等格式的圖片屬于點(diǎn)陣圖。Flash動(dòng)畫(huà)制作軟件所生成的SWF等格式的文件和Photoshop繪圖軟件所生成的PSD等格式的圖片屬于矢量圖。同一畫(huà)面、不同屬性的照片所占存儲(chǔ)空間不同3.1.3數(shù)據(jù)的類型格式j(luò)pggifpng16位bmp24位bmp32位bmp存儲(chǔ)空間1.1M1.05M2.5M3.95M5.93M7.91M(3)音頻
數(shù)字化的聲音數(shù)據(jù)就是音頻數(shù)據(jù)。在計(jì)算機(jī)中,音頻數(shù)據(jù)一般用音頻文件的格式來(lái)保存。音頻文件是指存儲(chǔ)聲音內(nèi)容的文件,把音頻文件用一定的音頻程序執(zhí)行,就可以還原以前錄下的聲音。音頻文件的格式很多,包括WAV、MP3、WMA、AMR、CD、MID、RM等。同一內(nèi)容、不同格式的音頻數(shù)據(jù)所占存儲(chǔ)空間不同3.1.3數(shù)據(jù)的類型某段20秒音頻WAVMP3WMAAMR存儲(chǔ)空間3.19M297KB324KB322KB(4)視頻
視頻數(shù)據(jù)是指連續(xù)的圖像序列。在計(jì)算機(jī)中,視頻數(shù)據(jù)一般用視頻文件的格式來(lái)保存。視頻文件常見(jiàn)的格式包括MPEG-4、AVI、WMV、FLV、DAT、RM、MOV、ASF、DivX等。同一內(nèi)容、碼率、幀率、分辨率,但不同格式的視頻數(shù)據(jù)所占存儲(chǔ)空間不同3.1.3數(shù)據(jù)的類型某段10分鐘視頻MPEG-4AVIWMVFLV存儲(chǔ)空間21M96M81M95M3.2大數(shù)據(jù)基本特征
維克托?邁爾?舍恩伯格在《大數(shù)據(jù)時(shí)代》中提出了大數(shù)據(jù)的特點(diǎn),即“4V”特征,包括:數(shù)據(jù)量大(Volume)、數(shù)據(jù)類型繁多(Variety)、處理速度快(Velocity)和價(jià)值密度低(Value)。維克托?邁爾?舍恩伯格
大數(shù)據(jù)(BigData)的中心詞是“數(shù)據(jù)”。從數(shù)據(jù)量的角度而言,大數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、智能手機(jī)等各種數(shù)字化終端設(shè)備的普及,數(shù)據(jù)呈現(xiàn)出爆炸式指數(shù)級(jí)增長(zhǎng),數(shù)字化已經(jīng)成為構(gòu)建現(xiàn)代社會(huì)的基礎(chǔ)力量,每個(gè)人時(shí)刻都在產(chǎn)生大量的數(shù)據(jù)。3.2.1數(shù)據(jù)量大大數(shù)據(jù)的數(shù)據(jù)來(lái)源眾多,科學(xué)研究、企業(yè)應(yīng)用和Web應(yīng)用等都在源源不斷地生成新的類型繁多的數(shù)據(jù)。生物大數(shù)據(jù)、交通大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、電信大數(shù)據(jù)、電力大數(shù)據(jù)、金融大數(shù)據(jù)等,都呈現(xiàn)出“井噴式”增長(zhǎng),各行各業(yè),每時(shí)每刻,都在生成各種不同類型的數(shù)據(jù)。3.2.2數(shù)據(jù)類型繁多(1)消費(fèi)者大數(shù)據(jù)(2)金融大數(shù)據(jù)(3)醫(yī)療大數(shù)據(jù)(4)城市大數(shù)據(jù)(5)工業(yè)大數(shù)據(jù)(6)其他大數(shù)據(jù)3.2.2數(shù)據(jù)類型繁多
大數(shù)據(jù)時(shí)代的數(shù)據(jù)產(chǎn)生速度非???,很多應(yīng)用都需要基于快速生成的數(shù)據(jù)給出實(shí)時(shí)分析結(jié)果,用于指導(dǎo)生產(chǎn)和生活實(shí)踐。因此,隨著科技的發(fā)展,科學(xué)計(jì)算對(duì)計(jì)算機(jī)的計(jì)算能力提出了越來(lái)越高的需求,衍生出了“超級(jí)計(jì)算機(jī)”。3.2.3處理速度快中國(guó)科學(xué)技術(shù)大學(xué)潘江偉院士團(tuán)隊(duì)構(gòu)建的量子計(jì)算原型機(jī)“九章二號(hào)”
大數(shù)據(jù)時(shí)代,數(shù)據(jù)的價(jià)值密度卻遠(yuǎn)遠(yuǎn)低于傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)中已經(jīng)存在的那些數(shù)據(jù),很多有價(jià)值的信息都是分散在海量數(shù)據(jù)中。以我國(guó)的“天網(wǎng)監(jiān)控系統(tǒng)”為例,如果沒(méi)有意外事件發(fā)生,則連續(xù)不斷產(chǎn)生的數(shù)據(jù)都是沒(méi)有任何價(jià)值的,當(dāng)發(fā)生特殊情況時(shí),也只有記錄了事件過(guò)程的那一小段視頻是有價(jià)值的。由此可見(jiàn),大數(shù)據(jù)的價(jià)值密度高低與其總量的大小成反比。3.2.4價(jià)值密度低3.3大數(shù)據(jù)的作用大數(shù)據(jù)的關(guān)鍵在于信息共享和互通,大數(shù)據(jù)的核心在于分析和決策。大數(shù)據(jù)正成為信息產(chǎn)業(yè)持續(xù)高速增長(zhǎng)的新引擎,大數(shù)據(jù)的利用正成為提高核心競(jìng)爭(zhēng)力的關(guān)鍵因素,各行各業(yè)的決策手段正在從“業(yè)務(wù)驅(qū)動(dòng)”轉(zhuǎn)變?yōu)椤皵?shù)據(jù)驅(qū)動(dòng)”。
大數(shù)據(jù)作為一種重要的戰(zhàn)略資產(chǎn),已經(jīng)不同程度地滲透到每個(gè)行業(yè)領(lǐng)域和部門,其深度應(yīng)用不僅有助于企業(yè)經(jīng)營(yíng)活動(dòng),還有利于推動(dòng)國(guó)民經(jīng)濟(jì)發(fā)展,推動(dòng)社會(huì)各個(gè)主體共同參與社會(huì)治理。3.3.1改變經(jīng)濟(jì)社會(huì)管理方式工業(yè)化時(shí)代商品和交易的快速流通催生大規(guī)模制造業(yè)發(fā)展。大數(shù)據(jù)時(shí)代,信息的大量、快速流通將伴隨著行業(yè)的融合發(fā)展,單一數(shù)據(jù)無(wú)法發(fā)揮最大效能,行業(yè)或部門之間相互交換數(shù)據(jù)已成為一種發(fā)展趨勢(shì),使經(jīng)濟(jì)形態(tài)發(fā)生大范圍變化。3.3.2促進(jìn)行業(yè)融合發(fā)展
信息消費(fèi)作為一種以信息產(chǎn)品和服務(wù)為消費(fèi)對(duì)象的活動(dòng),覆蓋多種服務(wù)形態(tài)、多種信息產(chǎn)品和多種服務(wù)模式。當(dāng)圍繞數(shù)據(jù)的業(yè)務(wù)在數(shù)據(jù)規(guī)模、類型和變化速度達(dá)到一定程度時(shí),大數(shù)據(jù)對(duì)產(chǎn)業(yè)發(fā)展的影響將隨之顯現(xiàn)。3.3.3推動(dòng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)傳統(tǒng)產(chǎn)業(yè)實(shí)現(xiàn)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)的四個(gè)階段
信息資源的開(kāi)發(fā)和利用水平,在某種程度上代表著信息時(shí)代下社會(huì)的整體發(fā)展水平和運(yùn)轉(zhuǎn)效率。大數(shù)據(jù)與智慧城市是信息化建設(shè)的內(nèi)容與平臺(tái),兩者互為推動(dòng)力量。智慧城市是大數(shù)據(jù)的源頭,大數(shù)據(jù)是智慧城市的內(nèi)核。3.3.4助力智慧城市建設(shè)
大數(shù)據(jù)時(shí)代,產(chǎn)業(yè)發(fā)展模式和格局正在發(fā)生深刻變革。圍繞著數(shù)據(jù)價(jià)值的行業(yè)創(chuàng)新發(fā)展將悄然影響各行各業(yè)的主營(yíng)業(yè)態(tài)。而隨之帶來(lái)的,則是大數(shù)據(jù)產(chǎn)業(yè)下的創(chuàng)新商業(yè)模式。3.3.5創(chuàng)新商業(yè)模式大數(shù)據(jù)時(shí)代,采集、存儲(chǔ)、傳輸和處理數(shù)據(jù)都已經(jīng)成了容易實(shí)現(xiàn)的事情。面對(duì)復(fù)雜對(duì)象,可以通過(guò)大量數(shù)據(jù)甚至海量數(shù)據(jù)來(lái)全面、完整地刻畫(huà)對(duì)象,通過(guò)處理海量數(shù)據(jù)來(lái)找到研究對(duì)象的規(guī)律和本質(zhì)。相比依賴于小數(shù)據(jù)和精確性的抽樣時(shí)代,大數(shù)據(jù)因?yàn)閺?qiáng)調(diào)數(shù)據(jù)的完整性和混雜性,突出事務(wù)的關(guān)聯(lián)性,為解決問(wèn)題提供了新的視角,幫助研究者進(jìn)一步接近事實(shí)的真相。3.3.6改變科學(xué)研究的方法論傳統(tǒng)抽樣3.4人工智能依賴大數(shù)據(jù)
人工智能與大數(shù)據(jù)是緊密相關(guān)、相輔相成的兩種技術(shù)。從某種意義上來(lái)說(shuō)人工智能本身也是一種大數(shù)據(jù)應(yīng)用,正是大數(shù)據(jù)推動(dòng)了人工智能技術(shù)的突破和產(chǎn)業(yè)落地,使其煥發(fā)出勃勃生機(jī)。人工智能三大要素
大數(shù)據(jù)時(shí)代,人工智能涉及的領(lǐng)域非常廣泛,深入人們的工作和生活各個(gè)方面,需要大量數(shù)據(jù)的應(yīng)用和積累。隨著數(shù)據(jù)的不斷增加,引發(fā)了分析的需求,而分析讓大量的數(shù)據(jù)有了價(jià)值,嵌有人工智能的機(jī)器開(kāi)始懂得用戶想要什么、需要干什么,并可以預(yù)測(cè)未來(lái)的變化或趨勢(shì)。當(dāng)硬件性能逐漸提升、算力與算法越來(lái)越強(qiáng)大時(shí),成本卻越來(lái)越低廉。在對(duì)人工智能系統(tǒng)進(jìn)行訓(xùn)練使用的數(shù)據(jù)量越大,數(shù)據(jù)質(zhì)量越好,人工智能系統(tǒng)的質(zhì)量就越高。3.4.1人工智能與大數(shù)據(jù)的聯(lián)系3.4.1人工智能與大數(shù)據(jù)的聯(lián)系(1)智能機(jī)器人(2)智能制造(3)智能農(nóng)業(yè)(4)其他
大數(shù)據(jù)將有用的數(shù)據(jù)從大量繁雜的數(shù)據(jù)中分離出來(lái);人工智能則從大數(shù)據(jù)中獲取需要的數(shù)據(jù),并且借助大數(shù)據(jù)的處理速度來(lái)實(shí)現(xiàn)更快的運(yùn)算與更好的應(yīng)用。
大數(shù)據(jù)不會(huì)根據(jù)結(jié)果采取行動(dòng),只是分析結(jié)果。而人工
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 2773-2025寧鄉(xiāng)豬
- 電力放線盤施工方案
- 渠道襯砌施工方案
- 污水管道施工方案
- 2025年度智能交通管理系統(tǒng)上班勞動(dòng)合同
- 二零二五年度商業(yè)廣場(chǎng)特色商業(yè)街區(qū)租賃與物業(yè)管理合同
- 二零二五年度文藝演出青少年藝術(shù)培訓(xùn)合作協(xié)議
- 二零二五年度金融風(fēng)險(xiǎn)評(píng)估風(fēng)險(xiǎn)承擔(dān)合同
- 二零二五年度個(gè)體飯店承包及食品安全追溯合同
- 鋼結(jié)構(gòu)工程人才培養(yǎng)與交流合同范文(2025年度)
- 中國(guó)高血壓防治指南(2024年修訂版)
- 現(xiàn)場(chǎng)物資安全管理
- 蔬菜種植基地管理手冊(cè)
- 2024解析:第二十章電與磁-講核心(解析版)
- 2023年會(huì)計(jì)基礎(chǔ)各章節(jié)習(xí)題及答案
- 《中小學(xué)教師人工智能素養(yǎng)框架與實(shí)踐路徑研究》專題講座
- DB4101T 25.2-2021 物業(yè)服務(wù)規(guī)范 第2部分:住宅
- 舞臺(tái)設(shè)計(jì)課件教學(xué)課件
- 六年級(jí)數(shù)學(xué)下冊(cè) 負(fù)數(shù)練習(xí)題(人教版)
- 2024-2030年中國(guó)康復(fù)醫(yī)院行業(yè)管理模式分析及發(fā)展規(guī)劃研究報(bào)告
- 斐訊PSG1218路由器的上網(wǎng)設(shè)置教程
評(píng)論
0/150
提交評(píng)論