版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
個(gè)上扒來(lái)了常用的大數(shù)據(jù)術(shù)語(yǔ)表拋磚引玉供大家深入了解其中部分定義參考了100100之我們。A聚合(Aggregation)算法(Algorithms)–可以完成某種數(shù)據(jù)分析的數(shù)學(xué)分析法(ytics)–用于發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在涵義異常檢測(cè)(Anomalydetection)“Anomalies”,用來(lái)表示異常的詞有以下幾種:outliers,exceptionssurprisescontaminants.他化(Anonymization)–使數(shù)據(jù),即移除所有與個(gè)人隱私相關(guān)的數(shù)據(jù)應(yīng)用(Application)–實(shí)現(xiàn)某種特定功能的計(jì)算機(jī)軟件人工智能(ArtificialInligence)–研發(fā)智能機(jī)器和智能軟件,這些智能設(shè)備能夠感知周遭B行為分析法(Behaviouralytics)–這種分析法是根據(jù)用戶的行為如“怎么做為什么大數(shù)據(jù)科學(xué)家(BigDataScientist)大數(shù)據(jù)(Bigdatastartup)–指研發(fā)大數(shù)據(jù)技術(shù)的新興公司生物測(cè)定術(shù)(Biometrics)–根據(jù)個(gè)人的特征進(jìn)行識(shí)B(BB:Brontobytes)1000YB(Yottabytes),相當(dāng)于未來(lái)數(shù)字化宇宙的大小。1B270!商業(yè)智能(BusinessInligence)–是一系列理論、方法學(xué)和過(guò)程,使得數(shù)據(jù)更容易被理C分類(lèi)分析(Classificationysis)–從數(shù)據(jù)中獲得重要的相關(guān)性信息的系統(tǒng)化過(guò)程;這類(lèi)數(shù)據(jù)也被稱(chēng)為元數(shù)據(jù)(metadata),是描述數(shù)據(jù)的數(shù)據(jù)云計(jì)算(Cloudcomputing)–構(gòu)建在網(wǎng)絡(luò)上的分布式計(jì)算系統(tǒng),數(shù)據(jù)是于機(jī)房外的(即聚類(lèi)分析(Clusteringysis)–它是將相似的對(duì)象聚合在一起,每類(lèi)相似的對(duì)象組合成一冷數(shù)據(jù)(Colddatastorage)–在低功耗服務(wù)器上那些幾乎不被使用的舊數(shù)據(jù)。但這對(duì)比分析(Comparativeysis)–在非常大的數(shù)據(jù)集中進(jìn)行模式匹配時(shí),進(jìn)行一步步的對(duì)復(fù)雜結(jié)構(gòu)的數(shù)據(jù)(Complexstructureddata)計(jì)算機(jī)產(chǎn)生的數(shù)據(jù)(Computergenerateddata)并發(fā)(Concurrency)–同時(shí)執(zhí)行多個(gè)任務(wù)或運(yùn)行多個(gè)進(jìn)程相關(guān)性分析(Correlationysis)–是一種數(shù)據(jù)分析方法,用于分析變量之間是否存在正相客戶關(guān)系管理(:CustomerRelationshipManagement)–用于管理銷(xiāo)售、業(yè)務(wù)過(guò)程的一D儀表板(Dashboard)數(shù)據(jù)聚合工具(Dataaggregationtools)–將分散于眾多數(shù)據(jù)源的數(shù)據(jù)轉(zhuǎn)化成一個(gè)全新數(shù)據(jù)數(shù)據(jù)分析師(Datayst)–從事數(shù)據(jù)分析、建模、清理、處理的專(zhuān)業(yè)人員數(shù)據(jù)庫(kù)(Database)–一個(gè)以某種特定的技術(shù)來(lái)數(shù)據(jù)集合的倉(cāng)庫(kù)數(shù)據(jù)庫(kù)即服務(wù)(Database-as-a-Service)務(wù)(AWS:AmazonWebServices)數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS:DatabaseManagementSystem)–收集、數(shù)據(jù),并提供數(shù)據(jù)數(shù)據(jù)中心(Datacentre)–一個(gè)實(shí)體地點(diǎn),放置了用來(lái)數(shù)據(jù)的服務(wù)數(shù)據(jù)(Datacleansing)–對(duì)數(shù)據(jù)進(jìn)行重新和校驗(yàn)的過(guò)程,目的在于刪除重復(fù)信息、數(shù)據(jù)管理員(Datacustodian)–負(fù)責(zé)數(shù)據(jù)所需技術(shù)環(huán)境的專(zhuān)業(yè)技術(shù)人數(shù)據(jù)道德準(zhǔn)則(Dataethicalguidelines)數(shù)據(jù)訂閱(Datafeed)–一種數(shù)據(jù)流,例 訂閱和數(shù)據(jù)集市(Datamarketce)–進(jìn)行數(shù)據(jù)集 數(shù)據(jù)挖掘(Datamining)–從數(shù)據(jù)集中發(fā)掘特定模式或信息的過(guò)程數(shù)據(jù)建模(Datamodelling)數(shù)據(jù)集(Dataset)–大量數(shù)據(jù)的集合數(shù)據(jù)虛擬化(Datavirtualization)–數(shù)據(jù)整合的過(guò)程以此獲得的數(shù)據(jù)信息這個(gè)過(guò)程通去識(shí)別(De-identification)–也稱(chēng)為化(anonymization),確保個(gè)人不會(huì)通過(guò)數(shù)據(jù)被判別分析(Discriminantysis)–將數(shù)據(jù)分類(lèi);按不同的分類(lèi)方式,可將數(shù)據(jù)分配到不同的群組,類(lèi)別或者。是一種統(tǒng)計(jì)分析法,可以對(duì)數(shù)據(jù)中某些群組或集群的已知信息進(jìn)行文件存貯數(shù)據(jù)庫(kù)(StoreDatabases)–又稱(chēng)為文檔數(shù)據(jù)庫(kù)(-orienteddatabase),為、管理、恢復(fù)文檔數(shù)據(jù)而專(zhuān)門(mén)設(shè)計(jì)的數(shù)據(jù)庫(kù),這類(lèi)文檔數(shù)據(jù)也稱(chēng)為半結(jié)構(gòu)E探索性分析(Exploratoryysis)–在沒(méi)有標(biāo)準(zhǔn)的流程或方法的情況下從數(shù)據(jù)中發(fā)掘模式。E字節(jié)(EB:Exabytes)1000PB(petabytes),1GB。如今全球每天所制1EB提取-轉(zhuǎn)換-加載(ETL:Extract,TransformandLoad)F故障切換(Failover)容錯(cuò)設(shè)計(jì)(Fault-tolerantdesign)–一個(gè)支持容錯(cuò)設(shè)計(jì)的系統(tǒng)應(yīng)該能夠做到當(dāng)某一部分出現(xiàn)G游戲化(Gamification)圖形數(shù)據(jù)庫(kù)(GraphDatabases)()來(lái)數(shù)據(jù)這種圖形結(jié)構(gòu)包括邊緣屬性和節(jié)點(diǎn)它提供了相鄰節(jié)點(diǎn)間的自由索引功能網(wǎng)格計(jì)算(Gridcomputing)H。Hadoop數(shù)據(jù)庫(kù)(HBase)Hadoop框架共同使HDFSHadoop分布式文件系統(tǒng)(HadoopDistributedFileSystem);是一個(gè)被設(shè)計(jì)成適合運(yùn)行在通用硬件(commodityhardware)上的分布式文件系統(tǒng)高性能計(jì)算(HPC:Hi puting)–使用超級(jí)計(jì)算機(jī)來(lái)解決極其復(fù)雜的計(jì)算I內(nèi)存數(shù)據(jù)庫(kù)(IMDB:In-memory)物聯(lián)網(wǎng)(InternetofThings)J法律上的數(shù)據(jù)一致性(Juridicaldatacompliance)K鍵值數(shù)據(jù)庫(kù)(KeyValueDatabases)–數(shù)據(jù)的方式是使用一個(gè)特定的鍵指向一個(gè)特定L延遲(Latency)遺留系統(tǒng)(Legacysystem)負(fù)載均衡(Loadbalancing)位置信息(Locationdata)GPS日志文件(Logfile)MM2M數(shù)據(jù)(Machine2Machinedata)機(jī)器數(shù)據(jù)(Machinedata)–由傳感器或算法在機(jī)器上產(chǎn)生的數(shù)據(jù)機(jī)器學(xué)習(xí)(Machinelearning)MapReduce(Map:映射,Reduce:歸納)大規(guī)模并行處理(MPP:MassivelyParallelProcessing)(或多臺(tái)計(jì)算機(jī))元數(shù)據(jù)(Metadata)(數(shù)據(jù)是什么)MongoDB(NoSQL數(shù)據(jù)庫(kù)(Multi-DimensionalDatabases)(OLAP)多值數(shù)據(jù)庫(kù)(MultiValueDatabases)–是一種非關(guān)系型數(shù)據(jù)庫(kù)(NoSQL),一種特殊的數(shù)據(jù)庫(kù):能處理3個(gè)維度的數(shù)據(jù)。主要針對(duì)非常長(zhǎng)的字符串,能夠完美地處理HTML和XMLN自然語(yǔ)言處理(NaturalLanguageProcessing)網(wǎng)絡(luò)分析(Networkysis)–分析網(wǎng)絡(luò)或圖論點(diǎn)間的關(guān)系,即分析網(wǎng)絡(luò)點(diǎn)間的連NewSQLSQLNoSQL更O對(duì)象數(shù)據(jù)庫(kù)(ObjectDatabases)–(也稱(chēng)為面象對(duì)象數(shù)據(jù)庫(kù))以對(duì)象的形式數(shù)據(jù),用于面允許使用式編程(declarativeprogramming)對(duì)象.基于對(duì)象圖像分析(Object-basedImageysis)–數(shù)字圖像分析方法是對(duì)每一個(gè)像素的數(shù)操作型數(shù)據(jù)庫(kù)(OperationalDatabases)–這類(lèi)數(shù)據(jù)庫(kù)可以完成機(jī)構(gòu)的常規(guī)操作,對(duì)商業(yè)運(yùn)營(yíng)非常重要,一般使用事務(wù)處理,允許用戶、收集、檢索公司內(nèi)部的具體優(yōu)化分析(Optimizationysis)–在產(chǎn)品設(shè)計(jì)周期依靠算法來(lái)實(shí)現(xiàn)的優(yōu)化過(guò)程,在這一本體論(Ontology)異常值檢測(cè)(Outlierdetection)–異常值是指嚴(yán)重偏離一個(gè)數(shù)據(jù)集或一個(gè)數(shù)據(jù)組合總平均值P模式識(shí)別(PatternRecognition)P字節(jié)(PB:Petabytes)–約等于1000TB(bytes),約等于1百萬(wàn)GB(gigabytes)。歐洲核子(CERN)大型強(qiáng)子對(duì)撞機(jī)每秒產(chǎn)生的粒子個(gè)數(shù)就約為1PB平臺(tái)即服務(wù)(PaaS:tform-as-a-Service)–為云計(jì)算解決方案提供所有必需的基礎(chǔ)平臺(tái)的預(yù)測(cè)分析(Predictiveysis)–大數(shù)據(jù)分析方法中最有價(jià)值的一種分析方法,這種方法有隱私(Privacy)公共數(shù)據(jù)(Publicdata)–由公共基金創(chuàng)建的公共信息或公共數(shù)據(jù)集。Q數(shù)字化自我(fiedSelf)–使用應(yīng)用程序用戶一天的一舉一動(dòng),從而更好地理解其查詢(xún)(Query)R再識(shí)別(Re-identification)–將多個(gè)數(shù)據(jù)集合并在一起,從化的數(shù)據(jù)中識(shí)別出個(gè)人信息回歸分析(Regressionysis)–確定兩個(gè)變量間的依賴(lài)關(guān)系。這種方法假設(shè)兩個(gè)變量之間RFID;這種識(shí)別技術(shù)使用一種無(wú)線非接觸式射頻電磁場(chǎng)傳感器來(lái)傳輸數(shù)據(jù)實(shí)時(shí)數(shù)據(jù)(Real-timedata)–指在幾毫秒內(nèi)被創(chuàng)建、處理、、分析并顯示的數(shù)據(jù) mendationengine)–推薦引擎算法根據(jù)用戶之前的行為或其他路徑分析(Routingysis)–針對(duì)某種方法通過(guò)使用多種不同的變量分析從而找到一S半結(jié)構(gòu)化數(shù)據(jù)(Semi-structureddata)–半結(jié)構(gòu)化數(shù)據(jù)并不具有結(jié)構(gòu)化數(shù)據(jù)嚴(yán)格的結(jié)構(gòu),情感分析(Sentimentysis)–通過(guò)算法分析出人們是如何看待某些話信號(hào)分析(Signalysis)–指通過(guò)度量隨時(shí)間或空間變化的物理量來(lái)分析產(chǎn)品的性能。特相似性搜索(Similaritysearches)仿真分析(Simulationysis)–仿真是指模擬真實(shí)環(huán)境中進(jìn)程或系統(tǒng)的操作。仿真分析可智能網(wǎng)格(Smartgrid)–是指在能源網(wǎng)中使用傳感器實(shí)時(shí)其運(yùn)行狀態(tài)有助于提高效率軟件即服務(wù)(SaaS:Software-as-a-Service)Web的通過(guò)瀏覽器使用的一種應(yīng)用軟件空間分析(Spatialysis)–空間分析法分析地理信息或拓?fù)湫畔⑦@類(lèi)空間數(shù)據(jù)從中得出SQL結(jié)構(gòu)化數(shù)據(jù)(Structureddata)-可以組織成行列結(jié)構(gòu),可識(shí)別的數(shù)據(jù)。這類(lèi)數(shù)據(jù)通常是一條記TT字節(jié)(TB:bytes)–約等于1000GB(gigabytes)。1TB容量可以約300小時(shí)。時(shí)序分析(Timeseriesysis)–分析在重復(fù)測(cè)量時(shí)間里獲得的定義良好的數(shù)據(jù)。分析的數(shù)拓?fù)鋽?shù)據(jù)分析(TopologicalDataysis)–拓?fù)鋽?shù)據(jù)分析主要關(guān)注三點(diǎn):復(fù)合數(shù)據(jù)模型、數(shù)據(jù)(Transactionaldata)透明性(Transparency)U非結(jié)構(gòu)化數(shù)據(jù)(Un-structureddata)–非結(jié)構(gòu)化數(shù)據(jù)一般被認(rèn)為是大量純文本數(shù)據(jù),其中還V價(jià)值(Value)(4V特點(diǎn)之一)所有可用的數(shù)據(jù),能為組織機(jī)構(gòu)、社會(huì)、消多樣(Variety)(4V特點(diǎn)之一)數(shù)據(jù)總是以各種不同的形式呈現(xiàn),如結(jié)構(gòu)高速(Velocity)–(譯者注大數(shù)據(jù)4V特點(diǎn)之一)在大數(shù)據(jù)時(shí)代數(shù)據(jù)的創(chuàng)建、 真實(shí)性(Veracity)可視化(Visualization)大量(Volume)(4V特點(diǎn)之一)Megabytes至W天氣數(shù)據(jù)(Weatherdata)XXML數(shù)據(jù)庫(kù)(XMLDatabases)–XML數(shù)據(jù)庫(kù)是一種以XML格式數(shù)據(jù)的數(shù)據(jù)庫(kù)XMLYY(Yottabytes)1000ZB(Zettabytes),250DVD的數(shù)據(jù)容量。1YB,18年翻一番。ZZ(ZB:Zettabytes)1000EB(Exabytes),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度安全合規(guī)塔吊銷(xiāo)售與安全監(jiān)管服務(wù)合同3篇
- 2025泥工砌磚合同范文
- 2025關(guān)于企業(yè)臨時(shí)工勞動(dòng)合同的范本是怎樣的
- 2025防雷工程承包合同
- 適度寒冷暴露通過(guò)激活的棕色脂肪來(lái)源小細(xì)胞外囊泡調(diào)控病理性心肌肥厚的作用及機(jī)制研究
- 二零二五版門(mén)窗行業(yè)產(chǎn)品質(zhì)量檢測(cè)與認(rèn)證合同4篇
- 2025年度苗木種植與水資源利用保護(hù)合同范本4篇
- 2025年度企業(yè)形象展示活動(dòng)承辦協(xié)議書(shū)4篇
- 2025年度門(mén)樓智能鎖具集成安裝服務(wù)合同4篇
- 基于YOLOv5的輕量化交通標(biāo)志檢測(cè)算法研究
- 2024年住院醫(yī)師規(guī)范化培訓(xùn)師資培訓(xùn)理論考試試題
- 期末綜合測(cè)試卷(試題)-2024-2025學(xué)年五年級(jí)上冊(cè)數(shù)學(xué)人教版
- 2024年廣東省公務(wù)員錄用考試《行測(cè)》試題及答案解析
- 結(jié)構(gòu)力學(xué)本構(gòu)模型:斷裂力學(xué)模型:斷裂力學(xué)實(shí)驗(yàn)技術(shù)教程
- 黑色素的合成與美白產(chǎn)品的研究進(jìn)展
- 金蓉顆粒-臨床用藥解讀
- 法治副校長(zhǎng)專(zhuān)題培訓(xùn)課件
- 《幼兒園健康》課件精1
- 汽車(chē)、電動(dòng)車(chē)電池火災(zāi)應(yīng)對(duì)
- 中醫(yī)藥適宜培訓(xùn)-刮痧療法教學(xué)課件
- 免疫組化he染色fishish
評(píng)論
0/150
提交評(píng)論