版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
導(dǎo)讀:我們把關(guān)于信息處理的理論稱為信息論,它是20世紀(jì)40年代從通信實踐中發(fā)展并總結(jié)出來的一門學(xué)科,專門研究有關(guān)信息處理和可靠傳輸?shù)囊话阋?guī)律。這一理論對計算機(jī)技術(shù)的發(fā)展具有重要意義。為了更好地闡述這一理論,讓我們先來討論幾個大家耳熟能詳?shù)脑~:數(shù)據(jù)、信息、知識。01數(shù)據(jù)是一組有意義的符號
數(shù)據(jù)無處不在,只是它們沒有實體。
過去,人們習(xí)慣把數(shù)字的組合稱為數(shù)據(jù)。但在今天,這樣的理解顯然不夠全面。那么是否可以把數(shù)字、字符、字母的集合稱為數(shù)據(jù)?也不準(zhǔn)確。
在今天“大數(shù)據(jù)”的語境中,數(shù)據(jù)是可以被記錄和識別的一組有意義的符號,一般可通過原始的觀察或度量得到。數(shù)據(jù)是對客觀事物的邏輯歸納,可以用來表示一個事實、一種狀態(tài)、一個實體的特征,或一個觀察的結(jié)果,有些是用于描述某個對象的事實性數(shù)據(jù),有些則是通過觀察、分析、歸納得到的總結(jié)性數(shù)據(jù)。
數(shù)據(jù)可以是連續(xù)的,比如無線電通信時在空氣中傳輸?shù)碾姶挪ǎ鼈兪悄M數(shù)據(jù);數(shù)據(jù)也可以是離散的,比如在計算機(jī)中存儲的文檔和照片,它們是數(shù)字?jǐn)?shù)據(jù)。
承載數(shù)據(jù)的形式有很多,不僅包括文字、數(shù)字、符號、圖像、語音、視頻,也可以是對某個事物的屬性、數(shù)量、位置、關(guān)系的抽象表示。大氣的溫濕度、汽車的行駛路線、學(xué)生的檔案記錄、商務(wù)的合同,這些都是數(shù)據(jù)。
我們平時用電子設(shè)備看新聞、拍照片、買東西、打游戲,本質(zhì)上都是在和數(shù)據(jù)打交道。在計算機(jī)中,它們是一連串包含有0和1的二進(jìn)制數(shù)的組合。
02信息是用來消除不確定性的
現(xiàn)在我們來明確一下什么是數(shù)據(jù),什么是信息。當(dāng)人們在研究甲骨文時,上面記錄的符號僅僅是一些數(shù)據(jù)。要讀懂這些數(shù)據(jù),就必須了解數(shù)據(jù)背后要表達(dá)的含義。一旦對數(shù)據(jù)做出解釋,我們就能得到甲骨文上的信息。
數(shù)據(jù)與信息既有聯(lián)系,又有區(qū)別。數(shù)據(jù)是信息的載體,信息則需要依托數(shù)據(jù)來表達(dá)。它們是形與質(zhì)的關(guān)系,兩者密不可分。
信息由數(shù)據(jù)加工得來,它可以由數(shù)字和文字表達(dá),也可以表現(xiàn)為其他具有意義的符號,其承載形式不重要,重要的是信息能讓我們了解一些事情、鑒別一些真?zhèn)?、佐證一些觀點。也就是說,盡管數(shù)據(jù)存在的形式多種多樣,但我們真正想要獲得的是信息。
“信息”作為科學(xué)術(shù)語最早出現(xiàn)在哈特萊1928年撰寫的論文《信息傳輸》中,在該論文中他首次提出了將信息定量化處理的設(shè)想。1948年,信息論創(chuàng)始人、美國數(shù)學(xué)家香農(nóng)發(fā)表了一篇有著深遠(yuǎn)影響的論文—《關(guān)于通信的數(shù)學(xué)原理》,他明確指出了“信息是用來消除隨機(jī)不確定性的東西”。
一旦我們想要對信息進(jìn)行量化和比較,我們就不要去關(guān)注這些信息到底承載了什么內(nèi)容,而是要看這條信息出現(xiàn)后,是否改變了某些不確定性事件的概率。今天這一定義已經(jīng)被看作是對“信息”的經(jīng)典定義,在各種場合不斷被人引用。
無論是數(shù)字、字符或它們的組合,如果我們無法解讀,就不能稱其為信息。有一個重要的判斷標(biāo)準(zhǔn)是,看它是否承載了有用的內(nèi)容。無論是石頭上刻的畫、紙上寫的字、墻上的涂鴉還是電腦中的文件,只要它們能表達(dá)確切的含義,就能認(rèn)為是信息。
一串11位數(shù)字的號碼,如果它是隨機(jī)數(shù)字,則談不上是信息。如果我告訴你,這串?dāng)?shù)字是我的手機(jī)號,它就消除了不確定性,它便是一種信息。信息是把人們不清楚的給說清楚的那些內(nèi)容,如果已經(jīng)知道了,就不能算作新的信息。
舉例來說,今天任何一個小學(xué)生都知道地球是圓的,地球自轉(zhuǎn)產(chǎn)生了白天和黑夜。這在今天看來是一個基本常識,但我們的祖先并不知道。如果我們把發(fā)明文字作為人類文明的起點,那么大約經(jīng)過5000多年,也就是直到15世紀(jì),人們才開始接受地球是一個大圓球的觀點。
雖然“地球”對于今天的小學(xué)生來說不算是新的信息,但是對于古人來說,它不僅是信息,而且信息量巨大。
你或許已經(jīng)發(fā)現(xiàn)了,信息會因場景而定,因每個人的主觀認(rèn)識而定。同一條信息,對一些人是有用的,對另一些人或許就沒用了。
03知識是對信息的總結(jié)和提煉
隨意給出3個數(shù)字:68、21、192。這3個數(shù)字僅僅是數(shù)據(jù)?,F(xiàn)在給它們加上一些說明,比如:衣服的價格是68元,今天的氣溫是21攝氏度,小明爸爸的體重是192斤。 這些數(shù)據(jù)有了明確表達(dá)的含義,它們就是信息。
不僅如此,我們還能基于這些信息給出一些判斷:衣服不是很貴,天氣有點涼爽,男人該去減肥了。做出這些判斷,需要依賴我們平時生活中積累的經(jīng)驗和常識,即知識。
知識是對信息的提煉和概括,它是高度概括的信息。如果說信息可以解答一些簡單的問題,比如“誰”“在哪里”“做什么”,那么知識可以回答一些更具深刻認(rèn)知的問題,比如“怎樣”“為何”。
日常生活中最基本的知識是常識。比如明火不能碰、熱油不能遇水、人有生老病死、月有陰晴圓缺,它們大部分來自生活,是大家認(rèn)為都該懂得、不言自明的知識。今天很多約定俗成的常識,是由我們的祖輩口口相傳、代代相承而來。人并不是天生就有常識,知道火為何物、火可傷人、火可熟食。很多道理都是從生活實踐中總結(jié)而來的。
現(xiàn)如今,對于人工智能來說,要解決的核心問題是讓計算機(jī)具有常識。很多常識背后有著復(fù)雜的知識體系,機(jī)器必須真正“理解”知識,而不是“記憶”它們。
舉例來說,計算機(jī)或許能通過數(shù)據(jù)樣本學(xué)習(xí),知道人類有頭、手、腳等身體部位,但它很難理解既然這些部位都長在人體上,為何只有頭上有眼睛,手和腳上卻沒有?又比如,計算機(jī)學(xué)會并知道了“人有2只眼睛”,但它無法判斷這個世界上是否存在“有1只眼睛的人”和“有3只眼睛的人”。
如今的人工智能只能從數(shù)據(jù)中學(xué)習(xí)到數(shù)據(jù)之間的聯(lián)系,它還不能很好地處理有關(guān)常識的問題,這方面人們還有很長的研究之路要走。
以上討論的“知識”,指的都是人腦中的知識。它和計算機(jī)要處理的“知識”是不同的。從本質(zhì)上講,計算機(jī)只是模仿人類的知識,它們并沒有真正掌握這些“知識”。計算機(jī)只是通過一些特定方法把人類知識表達(dá)出來。而這個特定方法是基于圖技術(shù)。
圖是一種表示知識的工具,是描述知識的狀態(tài)、關(guān)系、路徑距離等相關(guān)要素的最自然的數(shù)學(xué)表達(dá)。它擅長存儲和處理復(fù)雜的網(wǎng)狀關(guān)系,所以在知識圖譜、社交網(wǎng)絡(luò)、用戶關(guān)系分析等領(lǐng)域有著廣泛的應(yīng)用。
近年來,基于圖技術(shù)的知識圖譜是十分熱門的研究領(lǐng)域。比如大眾熟知的維基百科就是一個知識圖譜應(yīng)用。知識圖譜可以用來描述各種實體以及它們之間的關(guān)系。它是一個龐大的圖形網(wǎng)絡(luò)知識庫。在這個網(wǎng)絡(luò)中,每個節(jié)點是一個實體,比如人名、地名、事件、活動,任意兩個節(jié)點之間的邊表示它們之間存在關(guān)系,如圖3-1所示?!鴪D3-1
基于圖形結(jié)構(gòu)的知識圖譜示意圖知識圖譜的基本組成是“實體–關(guān)系–實體”的三元組,它不僅能把與關(guān)鍵詞有關(guān)的知識系統(tǒng)化地展示給用戶,也可以基于知識進(jìn)行推演。比方說,從〈東方明珠,坐落在,浦東〉和〈浦東,屬于,上?!颠@兩個組合,就能推測得到〈東方明珠,位于,上?!?。
知識圖譜還會不斷更新迭代,用戶搜索的次數(shù)越多,范圍越廣,這個知識庫就能獲取越多的信息和內(nèi)容。
知識并不是與生俱來的,獲取知識通常有兩種途徑。
途徑一是親身體驗。比如,剛出生的嬰兒什么都不懂,將一杯熱水放到他面前,他會想要去拿杯子,結(jié)果喝水被燙到了。第二次他再看到杯子,有了上次被燙的經(jīng)驗,他會觀察杯口是否冒煙,摸摸杯子的溫度,再決定是否拿杯子喝水。在這個過程中,嬰兒通過自己的親身體驗,逐漸掌握了有關(guān)“熱水”的知識。
南宋理學(xué)家、思想家朱熹曾說:“所謂致知在格物者,言欲致吾之知,在即物而窮其理也?!彼磉_(dá)的意思是,獲得知識的途徑在于認(rèn)識世間萬物,并徹底研究它們的原理。就是說,要親身體驗這個世界來獲得寶貴的知識。每個人有不同的人生和經(jīng)歷,這些會成為我們獨有的知識。
親身體驗得來的知識是最真實的,所以它通常比較準(zhǔn)確。不過,這樣獲取知識的時間周期長,效率也比較低。
途徑二是通過別人教授。比如通過父母、老師、書本、網(wǎng)絡(luò)學(xué)習(xí)得來,但老師教的、書上印的可能出錯,這樣得來的知識未必準(zhǔn)確。不過,它仍然是獲取知識最主要的形式,畢竟我們沒有那么多時間和精力,凡事都親身經(jīng)歷一遍。站在前人和巨人的肩膀上,不斷學(xué)習(xí)新的知識,是人類科技進(jìn)步的根本原因。
有趣的是,在互聯(lián)網(wǎng)時代,任何人都能隨時隨地找到自己想要的信息,但我們的知識總量并不會立刻增加。學(xué)習(xí)是一種過程,需要時間積累,欲速則不達(dá)。
比如很多人都聽過“區(qū)塊鏈”,但大部分人并不清楚它是什么。有人認(rèn)為它是錢,也有人認(rèn)為它是一種身份認(rèn)證技術(shù)。但這些理解都不準(zhǔn)確。很多人只是從網(wǎng)上找到了關(guān)于區(qū)塊鏈的信息,并沒有真正得到關(guān)于它的知識。從某種意義上講,互聯(lián)網(wǎng)雖然提高了人們找到碎片信息的效率,但降低了人們掌握完整知識的能力。
當(dāng)然,互聯(lián)網(wǎng)對整個社會來說仍然利大于弊,它讓全世界的知識能夠快速傳遞和共享。每個人都可以在網(wǎng)絡(luò)上自由地發(fā)表觀點,這些內(nèi)容也被
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版機(jī)床進(jìn)出口買賣合同范本詳析2篇
- 2024年禁牧區(qū)水資源保護(hù)與管理合同
- 專業(yè)化油漆施工協(xié)議(2024年版)版B版
- 二零二五年高性能環(huán)保材料供應(yīng)與技術(shù)研發(fā)協(xié)議2篇
- 天府新區(qū)職業(yè)學(xué)院《信息內(nèi)容安全的理論與應(yīng)用》2023-2024學(xué)年第一學(xué)期期末試卷
- 二零二五版快遞行業(yè)專用包裝材料供應(yīng)協(xié)議2篇
- 2024版股權(quán)投資協(xié)議(投資金額和股權(quán)比例)3篇
- 2024運輸管理實訓(xùn)機(jī)構(gòu)運營合作協(xié)議3篇
- 天津商業(yè)大學(xué)寶德學(xué)院《圖像處理與機(jī)器視覺》2023-2024學(xué)年第一學(xué)期期末試卷
- 二零二五年高端混凝土預(yù)制構(gòu)件委托加工合同3篇
- 設(shè)備管理績效考核細(xì)則
- 中國人民銀行清算總中心直屬企業(yè)2023年招聘筆試上岸歷年典型考題與考點剖析附帶答案詳解
- 第5課《弘揚勞動精神勞模精神工匠精神》第1框《理解勞動精神勞模精神工匠精神》-【中職專用】《職業(yè)道德與法治》同步課堂課件
- 2025美國國防部財年美軍武器裝備采購預(yù)算中文版
- 70歲換證三力測試題附答案
- 中華醫(yī)學(xué)會利益沖突聲明模板
- 帶你玩轉(zhuǎn)VR虛擬現(xiàn)實智慧樹知到期末考試答案2024年
- DAM10KW中波發(fā)射機(jī)各單元的檢測與調(diào)整指導(dǎo)示意圖
- 物業(yè)采購工作總結(jié)
- 組織文化與領(lǐng)導(dǎo)力
- 膠粘性不良改善報告
評論
0/150
提交評論