大數(shù)據(jù)與NOSql概述_第1頁
大數(shù)據(jù)與NOSql概述_第2頁
大數(shù)據(jù)與NOSql概述_第3頁
大數(shù)據(jù)與NOSql概述_第4頁
大數(shù)據(jù)與NOSql概述_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

信息技術部,大數(shù)據(jù)與NOSql概述(2016年12月18日),主要內(nèi)容,大數(shù)據(jù)概述大數(shù)據(jù)的定義大數(shù)據(jù)的4V特征大數(shù)據(jù)的系統(tǒng)要求大數(shù)據(jù)的典型架構大數(shù)據(jù)的應用大數(shù)據(jù)的發(fā)展,主要內(nèi)容,Nosql概述什么是NoSQLNoSQL的優(yōu)勢和不足NoSQL的CAP理論實現(xiàn)NoSQL數(shù)據(jù)模型及分類,大數(shù)據(jù)的定義,大數(shù)據(jù)(bigdata),指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。在維克托邁爾-舍恩伯格及肯尼斯庫克耶編寫的大數(shù)據(jù)時代2中大數(shù)據(jù)指不用隨機分析法(抽樣調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進行分析處理。,大數(shù)據(jù)的4V特征,Volume(海量)、Variety(多樣)、Velocity(實時)、Value(價值)海量數(shù)據(jù)量巨大,對TB、PB數(shù)據(jù)級的處理,已經(jīng)成為基本配置。多樣處理多樣性的數(shù)據(jù)類型,結構化數(shù)據(jù)和非結構化數(shù)據(jù),能處理Web數(shù)據(jù),能處理語音數(shù)據(jù)甚至是圖像、視頻數(shù)據(jù)。實時在客戶每次瀏覽頁面,每次下訂單的過程中都存在,都會需要對用戶進行實時的推薦,決策已經(jīng)變得實時價值價值密度低,商業(yè)價值高。一條數(shù)小時的監(jiān)控視頻,可能有用的數(shù)據(jù)僅有一兩秒。能從海量數(shù)據(jù)中發(fā)掘出這些數(shù)據(jù),將成為企業(yè)競爭力的重要來源。,大數(shù)據(jù)的系統(tǒng)需求,高新能(Highperformance)高并發(fā)讀寫實時動態(tài)獲取和更新數(shù)據(jù)海量存儲(HugeStorage)海量數(shù)據(jù)的高效率存儲和訪問類似SNS網(wǎng)站高可擴展性和高可用性(HighScalability&HighAvailability)需要擁有快速橫向擴展能力能提供7*24小時不間斷服務,大數(shù)據(jù)典型架構,大數(shù)據(jù)典型架構,大數(shù)據(jù)典型架構,數(shù)據(jù)計算用時對比離線計算流式計算實時計算,大數(shù)據(jù)的應用,大數(shù)據(jù)與互聯(lián)網(wǎng)大交易數(shù)據(jù):來自電商的數(shù)據(jù),包括B2B、B2C、C2C、團購等大交互數(shù)據(jù):來自社交網(wǎng)絡的數(shù)據(jù),SNS、微博等兩類數(shù)據(jù)有效融合將是大勢所趨,更能增強企業(yè)的商業(yè)洞察力,大數(shù)據(jù)的應用,大數(shù)據(jù)與金融銀行,大數(shù)據(jù)的應用,大數(shù)據(jù)與金融保險,大數(shù)據(jù)的應用,大數(shù)據(jù)與金融證券股價預測客戶關系管理投資景氣指數(shù)分析,大數(shù)據(jù)的發(fā)展,NOSql的概念,什么是NoSQL?NoSQL是NotOnlySQL的縮寫,而不是NotSQL;它不一定遵循傳統(tǒng)數(shù)據(jù)庫的一些基本要求,比如SQL標準、ACID屬性、表結構等等。相比傳統(tǒng)數(shù)據(jù)庫,叫它分布式數(shù)據(jù)管理系統(tǒng)更貼切,數(shù)據(jù)存儲被簡化更靈活,重點被放在了分布式數(shù)據(jù)管理上。NoSQL數(shù)據(jù)庫主要應用于web2.0的大規(guī)模系統(tǒng),具有模式靈活、最終一致性、面向海量數(shù)據(jù)、分布式、開源、水平可擴展、配置簡單、非關系型等特點。,NOSql的優(yōu)勢,易擴展NoSQL數(shù)據(jù)庫種類繁多;共同的特點都是去掉系型特性;數(shù)據(jù)之間無關系,容易橫向擴展;甚至可以NoSQL之間的整合。數(shù)據(jù)模型靈活無需事先為要存儲的數(shù)據(jù)建立字段隨時可以存儲自定義的數(shù)據(jù)格式高可用NoSQL在不太影響性能的情況,就可以方便的實現(xiàn)高可用的架構。比如Cassandra,HBase模型,通過復制模型也能實現(xiàn)高可用。大數(shù)據(jù)量,高性能NoSQL數(shù)據(jù)庫都具有非常高的讀寫性能,尤其在大數(shù)據(jù)量下,同樣表現(xiàn)優(yōu)秀。這得益于它的無關系性,數(shù)據(jù)結構簡單。,NOSql的CAP原理實現(xiàn),分布式數(shù)據(jù)系統(tǒng)的CAP原理的三要素:一致性(Consistency)可用性(Availability)分區(qū)容忍性(Partitiontolerance)NOSql的CAP原理實現(xiàn):在分布式系統(tǒng)中,三個要素最多只能同時實現(xiàn)兩點考慮CP,主要是一些Key-Value數(shù)據(jù)庫,典型代表為Google的BigTable,將各列數(shù)據(jù)進行排序存儲。數(shù)據(jù)值按范圍分布在多臺機器,數(shù)據(jù)更新操作有嚴格的一致性保證。考慮AP,主要是一些面向文檔的適用于分布式系統(tǒng)的數(shù)據(jù)庫,如Amazon的Dynamo,Dynamo將數(shù)據(jù)按key進行Hash存儲。其數(shù)據(jù)分片模型有比較強的容災性,因此它實現(xiàn)的是相對松散的弱一致性最終一致性,NOSql數(shù)據(jù)模型及分類,NoSQL的兩個核心理論基礎:Google的BigTableBigTable將各列數(shù)據(jù)進行排序存儲;數(shù)據(jù)值按范圍分布在多臺機器;數(shù)據(jù)更新操作有嚴格的一致性保證。Amazon的DynamoDynamo使用的是另外一種分布式模型;模型更簡單,將數(shù)據(jù)按key進行hash存儲;其數(shù)據(jù)分片模型有比較強的容災性;實現(xiàn)的是相對松散的弱一致性(最終一致性)。,NOSql數(shù)據(jù)模型及分類,NOSql數(shù)據(jù)模型及分類,NOSql使用情況,NOSql數(shù)據(jù)模型及分類,DB-Engines發(fā)布了2016年12月份的數(shù)據(jù)庫排名,NOSql數(shù)據(jù)模型及分類,綜合來看,NoSQL數(shù)據(jù)庫正在逐漸地成為數(shù)據(jù)庫領

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論