下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、大數(shù)據(jù)常見術(shù)語解釋(1)胡經(jīng)國大數(shù)據(jù)(Big Data)是指無法在可承受的時間范圍內(nèi)用常規(guī)軟件工具進行捕 捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察 發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的出現(xiàn)產(chǎn)生了許多新術(shù)語,這些術(shù)語往往比擬難以理解。為此,我 們根據(jù)有關(guān)大數(shù)據(jù)文獻編寫了本文,供大家認識大數(shù)據(jù)參考。1、聚合(Aggregation )聚合是指搜索、合并、顯示數(shù)據(jù)的過程。2、算法(Algorithms)算法是指可以完成某種數(shù)據(jù)分析的數(shù)學公式。3、分析法(Analytics)分析法用于發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在涵義。4、異常檢測(Anomaly Detect
2、ion )異常檢測用于在數(shù)據(jù)集中搜索與預期模式或行為不匹配的數(shù)據(jù)項。除了 “Anomalies”以外,用來表示“異?!钡挠⑽膯卧~還有以下幾個:outliers, exceptions, surprises, contaminants0它們通??商峁╆P(guān)鍵的可執(zhí)行信息。5、匿名化(Anonymization)匿名化使數(shù)據(jù)匿名,即移除所有與個人隱私相關(guān)的數(shù)據(jù)。6、應用(Application)在這里,應用是指實現(xiàn)某種特定功能的計算機軟件。7、人工智能(ArtiHcial Intelligence)人工智能是指研發(fā)智能機器和智能軟件;這些智能設(shè)備能夠感知周圍的環(huán) 境,并根據(jù)要求作出相應的反響,甚至能自
3、我學習。8、行為分析法(Behavioural Analytics )行為分析法是指根據(jù)用戶的行為如“怎么做”,“為什么這么做”以及 “做了什么”來得出結(jié)論,而不是僅僅針對人物和時間的一門分析學科。它著 眼于數(shù)據(jù)中的人性化模式。9、大數(shù)據(jù)科學家(Big Data Scientist)大數(shù)據(jù)科學家是指能夠設(shè)計大數(shù)據(jù)算法使得大數(shù)據(jù)變得有用的人。10、大數(shù)據(jù)創(chuàng)業(yè)公司(Big Data Startup)大數(shù)據(jù)創(chuàng)業(yè)公司是指研發(fā)最新大數(shù)據(jù)技術(shù)的新興公司。11、生物測定術(shù)(Biometrics)生物測定術(shù)是指根據(jù)個人的特征進行身份識別。12、B 字節(jié)(BB: Brontobytes)B字節(jié)約等于1000 Y
4、B (Yottabytes),相當于未來數(shù)字化宇宙的大小。1B 字節(jié)包含了 27個0!13、商業(yè)智能(Business Intelligence)商業(yè)智能是指一系列理論、方法學和過程,使得數(shù)據(jù)更容易被理解。14 分類分析(Classification Analysis)分類分析是指從數(shù)據(jù)中獲得重要相關(guān)性信息的系統(tǒng)化過程;這類數(shù)據(jù)也被 稱為元數(shù)據(jù)(Meta Data),即是描述數(shù)據(jù)的數(shù)據(jù)。15、云計算(Cloud Computing)簡而言之,云計算是指通過互聯(lián)網(wǎng)提供智能化計算資源的服務模式或商業(yè) 模式。提供資源(資源池上的計算能力、存儲空間和信息服務)的網(wǎng)絡(luò)被稱為 云(或云端),由云按需提供可
5、動態(tài)伸縮(可以無限擴展、隨時獲取、按需使 用、按使用付費)的廉價計算服務;計算能力是通過互聯(lián)網(wǎng)進行傳輸?shù)摹?6、聚類分析(Clustering Analysis )聚類分析是指將相似的對象聚合在一起,每類相似的對象組合成一個聚類 (也叫作簇)的過程。這種分析方法的目的在于分析數(shù)據(jù)之間的差異和相似 性。17 冷數(shù)據(jù)存儲(Cold Data Storage)冷數(shù)據(jù)存儲是指在低功耗服務器上存儲那些幾乎不被使用的舊數(shù)據(jù);這些 舊數(shù)據(jù)檢索起來將會很耗時。18、比照分析(Comparative Analysis)比照分析是指在非常大的數(shù)據(jù)集中進行模式匹配口寸,進行一步步的比照和 計算從而得到分析結(jié)果的過程。19、復雜結(jié)構(gòu)數(shù)據(jù)(Complex Structured Data)復雜結(jié)構(gòu)數(shù)據(jù)是指由兩個或多個復雜而相互關(guān)聯(lián)的局部組成的數(shù)據(jù)。這類 數(shù)據(jù)不能簡單地用結(jié)構(gòu)化查詢語言或工具(SQL)來解析。20、計算機產(chǎn)生的數(shù)據(jù)(Computer Generated Data)計算機產(chǎn)生的數(shù)據(jù)是指如日志文件這類由計算機生成的數(shù)據(jù)。21、并發(fā) (Concurrency)并發(fā)是指同時執(zhí)行多個任務或運行多個進程。22、相關(guān)性分析(Correlation Analysis )相關(guān)性分析是指一種數(shù)據(jù)分析方法,用于分析變量之間是否存在正相關(guān)或 者負相關(guān)。23、客戶關(guān)系管理(Cust
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024至2030年中國四柱臺式精密油壓拉伸機數(shù)據(jù)監(jiān)測研究報告
- 2024年中國高鈣純石灰粉市場調(diào)查研究報告
- 2024年中國膠原蛋白水晶眼膜市場調(diào)查研究報告
- 2024年中國旗繩市場調(diào)查研究報告
- 2024年中國室內(nèi)石膏花型市場調(diào)查研究報告
- 2025至2031年中國塑料網(wǎng)繩行業(yè)投資前景及策略咨詢研究報告
- 《MAX粒子制作實例》課件
- 智能典當服務系統(tǒng)開發(fā)合同
- 婚慶攝影服務拍攝效果不滿意免責協(xié)議
- 動物農(nóng)莊的奇妙世界讀后感
- 【8物(科)期末】合肥市蜀山區(qū)2023-2024學年八年級上學期期末物理試題
- GB/T 44990-2024激光熔覆修復層界面結(jié)合強度試驗方法
- 四川省成都市2023-2024學年高二上學期期末調(diào)研考試語文試題(解析版)
- ps經(jīng)典課程-海報設(shè)計(第六講)
- 江蘇省泰州市2023-2024學年高一上學期期末語文試題及答案
- 【MOOC】工程制圖解讀-西安交通大學 中國大學慕課MOOC答案
- 期末復習(試題)-2024-2025學年三年級上冊數(shù)學蘇教版
- 能源崗位招聘筆試題及解答(某大型國企)2024年
- 浙江省杭州市西湖區(qū)2023-2024學年九年級上學期期末語文試題(解析版)
- 人員車輛物品進出管理考核試卷
- 山區(qū)道路安全駕駛
評論
0/150
提交評論