版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第一章數(shù)據(jù)與信息數(shù)據(jù)來源不同,決定了數(shù)據(jù)的多樣性。大小不一、數(shù)量不同的繩結(jié)也是“數(shù)據(jù)”。數(shù)據(jù)需要經(jīng)過一定的處理,才能從中提取有意義、有價值的內(nèi)容。數(shù)據(jù)是對客觀事物的符號表示,如圖形符號、數(shù)字、字母等,其中,數(shù)字是最簡單的一種數(shù)據(jù)。單純的數(shù)據(jù)是沒有意義的,因為數(shù)據(jù)的表現(xiàn)形式還不能完全表達(dá)其內(nèi)容,經(jīng)過解釋,數(shù)據(jù)才變得有意義,數(shù)據(jù)和關(guān)于數(shù)據(jù)的解釋是密不可分的。在計算機科學(xué)中,數(shù)據(jù)是指所有能輸入到計算機并被計算機程序處理的符號總稱,是用于輸入到計算機中進(jìn)行處理,具有一定意義的數(shù)字、字母、符號和模擬量等的通稱。
6.信息自古就有,人類的生活一直與信息密切相關(guān)。7.信息的定義:信息是用來消除隨機不確定性的東西。8.信息的特征:載體依附性、時效性、共享性、可加工處理性、真?zhèn)涡浴r值性。9.信息不能獨立存在,必須依附于一定的載體。載體遭到破壞、載體上的信息也會丟失,同一信息也可以依附于不同的載體,因此人們獲取信息的途徑與方法也可以不同。信息依附于載體也體現(xiàn)了信息的可存儲性與傳遞性10.信息往往反映的是事物某一特定時間的狀態(tài),它會隨著時間的推移而變化11.信息是可以共享的,同一種信息可以同時被不同的接收者獲取,人們也可以重復(fù)利用信息。12.與物質(zhì)、能源不同的是,信息不會因為被別人獲取而發(fā)生損耗。13.信息是可以加工處理的,正是因為此性質(zhì),所以信息具有真?zhèn)涡浴?4.信息具有價值性,信息的價值包括顯性價值與隱性價值,信息的價值也是相對的,對于不同的人群、不同的時間,其價值可能有所不同。15.知識是人類在社會實踐中所獲得的認(rèn)識和經(jīng)驗的總和,也是人類在實踐中認(rèn)識客觀世界(包括人類本身)的成果,它包括對事實、信息的描述以及在教育和實踐中獲得的技能。16.知識是可以繼承和傳遞的。17.數(shù)據(jù)可以是數(shù)字、文字、圖像、符號等,單獨的數(shù)據(jù)本身沒有意義。將數(shù)據(jù)放到某個語境中,或在某個真實場景中使用,數(shù)據(jù)才有意義。18.信息是數(shù)據(jù)經(jīng)過儲存、分析及解釋后所產(chǎn)生的意義,通常在某一特定情景脈絡(luò)下的具體呈現(xiàn)。19.將萬千信息中有價值的部分沉淀下來,與已存在的人類知識體系相結(jié)合,形成知識。20.與數(shù)據(jù)和信息相比,知識更接近行動,它與決策相關(guān),人們可以通過搜索引擎獲取海量信息(不是海量知識)21.知識的獲得,是人利用自身已有的知識對信息進(jìn)行加工,進(jìn)而將新的信息納入自己的知識結(jié)構(gòu)的過程?!耙话賯€人心中有一百個哈姆雷特”即人們接收同樣的信息后,所構(gòu)建的知識也是有區(qū)別的。22.智慧是一種更高層次的綜合能力,主要表現(xiàn)為收集、加工、應(yīng)用、傳播知識的能力,以及對事物發(fā)展的前瞻性看法。它是在知識的基礎(chǔ)之上,通過認(rèn)識的積累,而形成的對事物的認(rèn)識、遠(yuǎn)見,體現(xiàn)為一種卓越的判斷力。23.數(shù)據(jù)、信息、知識、智慧的關(guān)系圖如下:傳感器是一種能感受被測量并按照一定的規(guī)律轉(zhuǎn)換成可用輸出信號的器件或裝置,通常由敏感元件和轉(zhuǎn)換元件組成。信息可用模擬信號和數(shù)字信號表達(dá)。模擬信號以連續(xù)變化的物理量存在。數(shù)字信號在取值上是離散的、不連續(xù)的信號,在信息技術(shù)中,這種信號表示的數(shù)據(jù)是指可被計算機存儲、處理的二進(jìn)制數(shù)據(jù)模擬信號和數(shù)字信號可相互轉(zhuǎn)換(將模擬信號轉(zhuǎn)為數(shù)字信號的操作稱為數(shù)字化)。如將語音通過麥克風(fēng)存儲到計算機(模擬信號轉(zhuǎn)數(shù)字信號)、將計算機中的音樂通過喇叭播放出來(數(shù)字信號轉(zhuǎn)模擬信號)。計算機內(nèi)部存儲的都是數(shù)字信號,數(shù)字信號人一般無法直接感受、需要通過設(shè)備將數(shù)字信號轉(zhuǎn)為模擬信號,人才能感受到。自然界中的信號都是模擬信號。數(shù)字化是信息社會的技術(shù)基礎(chǔ)。將模擬信號轉(zhuǎn)換為數(shù)字信號一般需要經(jīng)過采樣、量化、編碼。在信號處理領(lǐng)域,采樣是將信號從連續(xù)時間(空間)域上的模擬信號轉(zhuǎn)換到離散(空間)域上的離散信號的過程,通常通過采樣器實現(xiàn)。對于同一模擬信號,采樣的時間間隔越小,采集到的信號樣本數(shù)量越多,每秒的采樣樣本數(shù)叫做采樣頻率,單位用Hz表示?!鞠聢D為采樣的圖】將模擬信號轉(zhuǎn)為數(shù)字信號,會引起失真,影響信號保真度的一個因素是采樣頻率。一般而言,在對于模擬信號采樣時提高采樣頻率能提高保真度。在數(shù)字信號處理領(lǐng)域,量化指將信號的連續(xù)取值近似為有限個離散值的過程。連續(xù)信號經(jīng)過采樣成為離散信號,離散信號經(jīng)過量化后可用數(shù)值表示?!鞠聢D為量化的圖】采樣在橫坐標(biāo)上操作、量化在縱坐標(biāo)上操作量化就是將采樣到的信號用數(shù)字表示出來。數(shù)據(jù)在計算機內(nèi)部是以二進(jìn)制方式進(jìn)行存儲和處理的。生活中常用的是十進(jìn)制。在日常使用中,一般可以用字母來標(biāo)識進(jìn)制。【詳見下表】進(jìn)制位二進(jìn)制八進(jìn)制十進(jìn)制十六進(jìn)制標(biāo)識BODH任一進(jìn)制(R)的進(jìn)制碼為0到R1,例如:10進(jìn)制的進(jìn)制碼為09。進(jìn)制碼。進(jìn)制轉(zhuǎn)換(十進(jìn)制轉(zhuǎn)R進(jìn)制)十進(jìn)制轉(zhuǎn)為R進(jìn)制一般采用除R取余法。十進(jìn)制轉(zhuǎn)十六進(jìn)制:例如十進(jìn)制170轉(zhuǎn)換為十六進(jìn)制:采用短除法,最后將余數(shù)倒著連起來。得到結(jié)果AA十進(jìn)制轉(zhuǎn)二進(jìn)制:例如十進(jìn)制17轉(zhuǎn)換為二進(jìn)制:采用短除法,最后將余數(shù)倒著連起來。得到結(jié)果10001R進(jìn)制轉(zhuǎn)十進(jìn)制采用按權(quán)相加法二進(jìn)制轉(zhuǎn)十進(jìn)制:例如二進(jìn)制1010111轉(zhuǎn)換為十進(jìn)制:采用按權(quán)相加法,把每一位數(shù)乘以他的權(quán)值最后相加得到十進(jìn)制數(shù)得到結(jié)果:87十六進(jìn)制轉(zhuǎn)十進(jìn)制:例如十六進(jìn)制數(shù)123ABC轉(zhuǎn)換為十進(jìn)制數(shù):采用按權(quán)相加法,把每一位數(shù)乘以他的權(quán)值最后相加得到十進(jìn)制數(shù)得到結(jié)果:1194684編碼是信息按照某種規(guī)則或格式,從一種形式轉(zhuǎn)換為另一種形式的過程。解碼是編碼的逆過程。40.計算機對信息進(jìn)行存儲、加工、傳遞等處理,實際上是對信息的載體一數(shù)據(jù)進(jìn)行處理。數(shù)據(jù)的表現(xiàn)形式可以是文本、圖形、圖像、聲音、視頻等,但不管是哪種形式的數(shù)據(jù),最終存儲在計算機中的都是經(jīng)過一定規(guī)則編碼后的二進(jìn)制數(shù)字。41.常見的字符編碼有ASCII、Unicode及各種漢字編碼。42.基本的ASCII碼共有128個,用l個字節(jié)中的低7位編碼。二進(jìn)制范圍為00000000,....,01111111,即十六進(jìn)制的00~7F(即存儲用8bit、表示用7bit)43.計算機中容量最小單位為比特(bit),基本單位為字節(jié)(Byte)。8bit=1Byte,【進(jìn)制轉(zhuǎn)換表如下】8bit=1Byte1024KByte=1MByte1024GByte=1TByte1024Byte=1KByte1024MByte=1GByte44.計算機中的漢字也是采用二進(jìn)制進(jìn)行編碼的。漢字編碼分為外碼、交換碼、機內(nèi)碼和字形碼。其中外碼也叫輸入碼,是用來將漢字輸入到計算機中的一組鍵盤符號。常用的輸入碼有拼音碼、五筆字形碼等,計算機的輸入碼不是唯一的。45.每一個漢字都有確定的二進(jìn)制代碼,在計算機內(nèi)部漢字代碼都用機內(nèi)碼,在磁盤上記錄漢字代碼也使用機內(nèi)碼.46.計算機中一個漢字占用兩個字節(jié)例如:”中”字的內(nèi)碼是D6D0一個AscII碼字符占用1字節(jié),例如:”a”的內(nèi)碼為6147條形碼(barcode)是將寬度不等的多個黑條和白條,按照一定的編碼規(guī)則排列,用以表達(dá)一組信息的圖形標(biāo)識符。我國普遍采用的EAN13條形碼。Base64編碼是計算機中常見的一種編碼方式,規(guī)則是把3個字節(jié)(24位)的數(shù)據(jù)按6位1組分成4組(24/6=4),然后將每組數(shù)據(jù)分別轉(zhuǎn)換為十進(jìn)制,將這些十進(jìn)制數(shù)所對應(yīng)的字符連接,即為Base64編碼。如下圖二維條碼/二維碼(2dimensionalbarcode)是用某種特定的幾何圖形按一定規(guī)律在平面上(二維方向)分布的黑白相間的圖形記錄數(shù)據(jù)符號信息。相對于一維的條形碼,二維碼的信息存儲量更大,功能也更加強大。不隨意掃描非官方的二維碼或安裝未經(jīng)驗證的應(yīng)用,是信息社會的基本常識。音頻信號數(shù)字化過程中,聲音的保真度不僅受到采樣頻率的影響,也依賴于量化值。量化值一般用二進(jìn)制數(shù)表示,其二進(jìn)制位數(shù)決定了量化的精度,也稱作量化位數(shù)。量化位數(shù)越大,量化精度也越高。Wave格式音頻文件的存儲容量可以通過下面的公式進(jìn)行計算:存儲容量=采樣頻率(Hz)x量化位數(shù)(bit)X聲道數(shù)x時長(s)/8(單位:Byte)其他壓縮后的音頻文件(mp3、aac)等容量計算公式:存儲容量=采樣頻率(Hz)x量化位數(shù)(bit)X聲道數(shù)x時長(s)/8x壓縮比(單位:位)數(shù)字圖像包括矢量圖形與位圖圖像。矢量圖形保存的文件大小一般比位圖要小,并且文件大小與圖形的大小無關(guān),在圖像處理軟件中任意放大矢量圖形,不會失真。位圖圖像又稱柵格圖或點陣圖,像素是組成位圖圖像的基本單位。點越多,圖像越真實,越能體現(xiàn)細(xì)節(jié),同時也需要更多的存儲空間。位圖放大后會失真圖像的量化是指要使用多大范圍的數(shù)值來表示圖像采樣之后每個像素的顏色信息。一般用二進(jìn)制數(shù)來表示其長度也稱為顏色的位深度。如256種顏色的圖像,它的位深度為8位。(顏色位數(shù)具體詳見第7頁第82條)圖像容量計算(BMP格式):存儲容量=總像素(水平像素*垂直像素)x顏色位深度/8(單位:Byte)視頻容量計算(AVI格式):存儲容量=單圖片容量*幀頻*時長(s)(單位:Byte)靜態(tài)的圖像連續(xù)播放就形成視頻。PAL制式的視頻每秒播放25幀圖像,而NTSC制式的視頻每秒播放30幀圖像。數(shù)據(jù)管理是利用計算機硬件和軟件技術(shù)對數(shù)據(jù)進(jìn)行有效收集、存儲、處理和應(yīng)用的過程。計算機數(shù)據(jù)的管理已經(jīng)經(jīng)歷了人工管理、文件管理和數(shù)據(jù)庫管理三個階段。日常使用的計算機中,數(shù)據(jù)一般以文件的形式存儲。根據(jù)編碼規(guī)則的不同,文件的格式也不相同,用以區(qū)分不同類型的存儲數(shù)據(jù),如文本、圖像、音頻等。計算機一般采用樹形目錄結(jié)構(gòu)來管理文件結(jié)構(gòu)化數(shù)據(jù),也稱作行數(shù)據(jù),是由二維表結(jié)構(gòu)來進(jìn)行邏輯表達(dá)和實現(xiàn)的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù),是數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù)模型,是不方便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)。如:辦公文檔、文本、圖片、XML、HTML、各類報表、圖像、音頻、視頻等。半結(jié)構(gòu)化數(shù)據(jù),就是介于結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),具有一定的結(jié)構(gòu)性。(大數(shù)據(jù)分析的是結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化共存的數(shù)據(jù))威脅數(shù)據(jù)安全的因素有很多,如硬盤驅(qū)動器損壞、操作失誤、黑客入侵、感染計算機病毒、遭受自然災(zāi)害等,都有可能造成計算機中數(shù)據(jù)的損壞。數(shù)據(jù)存儲在特定的介質(zhì)上,保護數(shù)據(jù)的安全也需要保護存儲數(shù)據(jù)的介質(zhì)。對于政府和企業(yè)的數(shù)據(jù),目前主要采用主動防護的手段,如通過磁盤陣列、數(shù)據(jù)備份、異地容災(zāi)等手段,保證數(shù)據(jù)的安全。數(shù)據(jù)加密:是指通過加密算法和加密密鑰將明文轉(zhuǎn)變?yōu)槊芪模饷軇t是通過解密算法和解密密鑰將密文恢復(fù)為明文。數(shù)據(jù)校驗:是為了保證數(shù)據(jù)的完整性進(jìn)行的一種驗證操作。常見的數(shù)據(jù)校驗方法有MD5、CRC、SHA1等。文件可以通過MD5校驗方法判斷的文件是否完整容災(zāi)系統(tǒng)是指在相隔較遠(yuǎn)的異地,建立兩套或多套功能相同的IT系統(tǒng),互相之間可以進(jìn)行健康狀態(tài)監(jiān)視和功能切換,當(dāng)一處系統(tǒng)因意外(如火災(zāi)、地震等)停止工作時,整個應(yīng)用系統(tǒng)可以切換到另一處,使得該系統(tǒng)可以繼續(xù)正常工作。數(shù)據(jù)量大并不一定就是大數(shù)據(jù),用傳統(tǒng)算法和數(shù)據(jù)庫系統(tǒng)可以處理的海量數(shù)據(jù)不能算大數(shù)據(jù)。大數(shù)據(jù)概念的數(shù)據(jù)一般具有數(shù)據(jù)規(guī)模大、處理速度快、數(shù)據(jù)類型多、價值密度低四個特征,可以用4個V來概括,即數(shù)量(Volume)、速度(Velocity)、多樣(Variety)和價值(Value)。數(shù)量(數(shù)據(jù)體量巨大):大數(shù)據(jù)的數(shù)據(jù)體量巨大,大數(shù)據(jù)收集和分析的數(shù)據(jù)量非常大速度(速度快):大數(shù)據(jù)的數(shù)據(jù)產(chǎn)生速度非???、處理速度也非??於鄻樱〝?shù)據(jù)類型多):大數(shù)據(jù)的數(shù)據(jù)來源多,各種結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)共存是大數(shù)據(jù)的普遍現(xiàn)象價值(價值密度低):大數(shù)據(jù)的價值密度低。價值密度的高低與數(shù)據(jù)總量成反比(1)大數(shù)據(jù)要分析的是全體數(shù)據(jù),而不是抽樣數(shù)據(jù),(2)對于數(shù)據(jù)不再追求精確性,而是能夠接受數(shù)據(jù)的混雜性。(3)不一定強調(diào)對事物因果關(guān)系的探求,而是更加注重它們的相關(guān)性大數(shù)據(jù)對社會的影響:(1)大數(shù)據(jù)讓決策更精確(2)大數(shù)據(jù)帶來新的就業(yè)需求81.常見文件格式(后綴)一覽表文件類型后綴說明音頻
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年專用打印機采購銷售協(xié)議范本
- 2024年個人借款協(xié)議模板
- 2024年家用壁紙買賣協(xié)議模板
- 2023-2024學(xué)年浙江省余姚八中高考第四次模擬數(shù)學(xué)試題試卷
- 2024年企業(yè)融資中介協(xié)議范本
- 2024無財產(chǎn)瓜分離婚協(xié)議示范文本
- DB11∕T 1717-2020 動物實驗管理與技術(shù)規(guī)范
- DB11∕T 1601-2018 毛白楊繁育技術(shù)規(guī)程
- 2024設(shè)備維護與保養(yǎng)協(xié)議范本
- 2024年專業(yè)收銀員崗位聘用協(xié)議樣本
- 酒店的基本概念
- 重點但位消防安全標(biāo)準(zhǔn)化管理評分細(xì)則自評表
- 掛牌儀式流程方案
- 傳輸s385v200v210安裝手冊
- 風(fēng)險調(diào)查表(企業(yè)財產(chǎn)保險)
- 農(nóng)業(yè)信息技術(shù) chapter5 地理信息系統(tǒng)
- 淺談新形勢下加強企業(yè)稅務(wù)管理的對策研究
- 必看!設(shè)備管理必須要懂的一、二、三、四、五
- 空冷島專題(控制方案、諧波及變壓器容量選擇)
- 結(jié)合子的機械加工工藝規(guī)程及銑槽的夾具設(shè)計
- 液氧汽化站安全技術(shù)操作規(guī)程2018-07.docx
評論
0/150
提交評論