




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大數(shù)據(jù)時(shí)代的數(shù)據(jù)庫(kù)11云計(jì)算概念提出2Hadoop的發(fā)展歷史3Hadoop的核心技術(shù)MapReduce4Hadoop核心技術(shù)數(shù)據(jù)庫(kù)Hbase5其它NoSQL數(shù)據(jù)庫(kù)23大數(shù)據(jù)特性4V特性Volume(數(shù)據(jù)量大)Variety(種類多)Value(價(jià)值密度低,商業(yè)價(jià)值高Velocity(處理速度快)對(duì)傳統(tǒng)數(shù)據(jù)庫(kù)的挑戰(zhàn)4用一個(gè)實(shí)例來理解云計(jì)算512345開發(fā)人員部署代碼,上傳數(shù)據(jù)庫(kù)結(jié)構(gòu)和數(shù)據(jù),并進(jìn)行必要的測(cè)試,之后運(yùn)維人員開通網(wǎng)站運(yùn)行期間,企業(yè)需要雇傭?qū)iT人員負(fù)責(zé)服務(wù)器和網(wǎng)絡(luò)的維護(hù),定期備份數(shù)據(jù)等日常工作購(gòu)買數(shù)據(jù)庫(kù)服務(wù)器來部署后臺(tái)數(shù)據(jù)庫(kù)配置網(wǎng)站的域名等工作購(gòu)買應(yīng)用服務(wù)器來部署這個(gè)網(wǎng)站云計(jì)算所需解決的問題
——假設(shè)某家企業(yè)開發(fā)一個(gè)旅游網(wǎng)站數(shù)據(jù)量6云計(jì)算所需解決的問題
——假設(shè)某家企業(yè)開發(fā)一個(gè)旅游網(wǎng)站企業(yè)需要待解決的問題1、購(gòu)買新的服務(wù)器2、增加更多的運(yùn)維成員3、購(gòu)買和安裝設(shè)備都是需要時(shí)間的,可能在此期間整個(gè)網(wǎng)站出現(xiàn)響應(yīng)減慢,經(jīng)常出錯(cuò)、導(dǎo)致大量的客戶流失4、淡季的時(shí)候,訪問量低,剛購(gòu)買的服務(wù)器又成為資源的浪費(fèi)成本效益怎樣解決這個(gè)問題呢?7云計(jì)算所需解決的問題
——假設(shè)某家企業(yè)開發(fā)一個(gè)旅游網(wǎng)站
引入云計(jì)算,它可以從根本上解決這個(gè)問題,因?yàn)樵朴?jì)算是通過互聯(lián)網(wǎng)將共享的硬件軟件資源按需提供給使用者,所有的設(shè)備都是由云計(jì)算服務(wù)商維護(hù),這樣無論是專業(yè)的軟件開發(fā)商,還是最終的客服,都可以將全部精力集中于業(yè)務(wù)領(lǐng)域,而無須考慮硬件維護(hù)、容災(zāi)等運(yùn)維問題,無形之中也為企業(yè)節(jié)省了成本、提高了經(jīng)濟(jì)效益…………8何為云計(jì)算?(理解1)
云計(jì)算,其實(shí)就是把所有的計(jì)算應(yīng)用和信息資源都用互聯(lián)網(wǎng)連接起來,供個(gè)人和企業(yè)用戶隨時(shí)訪問、分享、管理和使用,相關(guān)的資源可以通過全球任何一個(gè)服務(wù)器和數(shù)據(jù)中心來提取的技術(shù)。9何為云計(jì)算?(理解2)
是通過網(wǎng)絡(luò)將龐大的計(jì)算處理程序自動(dòng)分拆成無數(shù)個(gè)較小的子程序,再由多部服務(wù)器所組成的龐大系統(tǒng)搜索、計(jì)算分析之后將處理結(jié)果回傳給用戶。通過這項(xiàng)技術(shù),遠(yuǎn)程的服務(wù)供應(yīng)商可以在數(shù)秒之內(nèi),達(dá)成處理數(shù)以千萬計(jì)甚至億計(jì)的信息,達(dá)到和“超級(jí)電腦”同樣強(qiáng)大性能的網(wǎng)絡(luò)服務(wù)。10網(wǎng)絡(luò)計(jì)算發(fā)展展趨勢(shì)2012云格(Gloud=Grid+Cloud)1995集群計(jì)算原理:指令層次的并行1998網(wǎng)格計(jì)算原理:任務(wù)并行1999對(duì)等計(jì)算原理:數(shù)據(jù)并行2007云計(jì)算原理:位層次的并行(可處理長(zhǎng)字節(jié))網(wǎng)格技術(shù):主主要解決分布布在不同機(jī)構(gòu)構(gòu)的各種信息息資源的共享享問題云計(jì)算:主要要解決計(jì)算力力和存儲(chǔ)空間間的集中共享享使用問題。。11為什么云計(jì)算算如此流行特別是NoSQL---非關(guān)系型數(shù)據(jù)據(jù)庫(kù)12那么云計(jì)算數(shù)數(shù)據(jù)庫(kù)是怎樣樣提出的呢??數(shù)據(jù)量1、關(guān)系數(shù)據(jù)庫(kù)庫(kù)高并發(fā)讀寫速速度慢2、關(guān)系數(shù)據(jù)庫(kù)庫(kù)支撐容量有限限------類似Facebook、Twitter這樣的SNS網(wǎng)站,用戶每天產(chǎn)生生海量的用戶戶動(dòng)態(tài),每月月會(huì)產(chǎn)生幾億條條用戶動(dòng)態(tài),,對(duì)于關(guān)系型型數(shù)據(jù)庫(kù)庫(kù)來說說,在在一張數(shù)數(shù)億條條記錄錄的表表里面進(jìn)進(jìn)行SQL查詢,,效率率是極極其低低下乃至不不可忍忍受的的。3、關(guān)系系數(shù)據(jù)據(jù)庫(kù)擴(kuò)展性性差4、數(shù)據(jù)日日趨龐龐大,無論論是入入庫(kù)和和查詢?cè)儯汲霈F(xiàn)現(xiàn)性能能瓶頸頸5、用戶戶的應(yīng)應(yīng)用和和分析析結(jié)果果呈整整合趨趨勢(shì),,對(duì)實(shí)時(shí)性性和響響應(yīng)時(shí)時(shí)間要要求越越來越越高Nosql13關(guān)系數(shù)數(shù)據(jù)庫(kù)庫(kù)與Hadoop分布式式系統(tǒng)統(tǒng)的比較—————為何云云計(jì)算算數(shù)據(jù)據(jù)采用用Hadoop分布式式系統(tǒng)統(tǒng)14云計(jì)算算的核心技技術(shù)15云計(jì)算算提出出——hadoop思想用很多多小型型PC機(jī)來代代替大大型服服務(wù)器器16云計(jì)算算核心心技術(shù)術(shù)——hadoop子項(xiàng)目目家族族數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)工工具,,可以以看成成是從從SQL到Map-Reduce的映射射器ZooKeeper用于協(xié)協(xié)調(diào)分分布Avro數(shù)據(jù)序序列化化工具具,用于支支持大大批量量數(shù)據(jù)據(jù)交換換的應(yīng)應(yīng)用。。支持持二進(jìn)進(jìn)制序序列化化方式式,可可以便便捷,,快速速地處處理大大量數(shù)數(shù)據(jù)Chukwa在Hadoop之上的的數(shù)據(jù)據(jù)采集集與分分析框框架、、主主要進(jìn)進(jìn)行日日志采采集和和分析析Pig可以看17云計(jì)算算核心心技術(shù)術(shù)——英特爾爾hadoop發(fā)行版版組件件SQL-to-HDFS工具,利用用jdbc連接關(guān)關(guān)系形形數(shù)據(jù)據(jù)庫(kù)如連接接Oracle要安裝裝:ojdbc6.jar如連接接My-Sql要安裝裝:mysql-connector18云計(jì)算算核心心技術(shù)術(shù)——hadoop的發(fā)展展歷史史2004年,Google發(fā)表論論文,,向全世界界介紹紹了MapReduce。2005年初,,為了了支持持Nutch搜索引引擎項(xiàng)項(xiàng)目,,Nutch
2006年1月,DougCutting加入雅虎,Yahoo!提供一個(gè)專門的團(tuán)隊(duì)和資源將Hadoop發(fā)展成一個(gè)可在網(wǎng)絡(luò)上運(yùn)行的系統(tǒng)。2007年,百度開始使用Hadoop做離線處理,目前差不多80%的Hadoop集群用作日志處理。2007年,中國(guó)移動(dòng)開始在“大云”研究中使用Hadoop技術(shù),規(guī)模超過1000臺(tái)。2008年,淘寶開始投入研究基于Hadoop的系統(tǒng)——云梯,并將其用于處理電子商務(wù)相關(guān)數(shù)據(jù)。云梯1的總?cè)萘看蟾艦?.3PB,包含了1100臺(tái)機(jī)器,每天處理約18000道作業(yè),掃描500TB數(shù)據(jù)。
19云計(jì)算算核心心技術(shù)術(shù)——hadoop的發(fā)展展歷史史2008年7月,Hadoop打破1TB數(shù)據(jù)排序序基準(zhǔn)測(cè)試試記錄。。Yahoo!的一個(gè)Hadoop集群用209秒完成1TB數(shù)據(jù)的排排序,比比上一年年的紀(jì)錄錄保持者者保持的的297秒快了將將近90秒。2009年5月,Yahoo的團(tuán)隊(duì)使使用Hadoop對(duì)1TB的數(shù)據(jù)進(jìn)進(jìn)行排序序只花了62秒時(shí)間。2010年5月,IBM提供了基基于Hadoop的大數(shù)據(jù)據(jù)分析軟軟件——InfoSphereBigInsights,包括基基礎(chǔ)版和和企業(yè)版版。2011年8月,Cloudera公布了一項(xiàng)有有益于合合作伙伴伴生態(tài)系系統(tǒng)的計(jì)計(jì)劃——?jiǎng)?chuàng)建一個(gè)個(gè)生態(tài)系統(tǒng)統(tǒng),以便硬硬件供應(yīng)應(yīng)商、軟軟件供應(yīng)應(yīng)商以及及系統(tǒng)集集成商可可以一起起探索如如何使用用Hadoop更好的洞洞察數(shù)據(jù)據(jù)。2011年8月,Dell與Cloudera聯(lián)合推出出Hadoop解決方案案——ClouderaEnterprise。20Hadoop框架云計(jì)算核核心技術(shù)術(shù)1、管理文文件系統(tǒng)統(tǒng)的命名名空間記錄每個(gè)個(gè)文件數(shù)數(shù)據(jù)塊在在各個(gè)Datanode上的位置置和副本本信息2、協(xié)調(diào)客客戶端對(duì)對(duì)文件的的訪問3、記錄命命名空間間內(nèi)的改改動(dòng)或空空間本身身屬性的的改動(dòng)4、Namenode使用事務(wù)務(wù)日志記記錄HDFS元數(shù)據(jù)的的變化。。使用映映像文件件存儲(chǔ)文文件系統(tǒng)統(tǒng)的命名名空間,,包括文文件映射射,文件件屬性等等1、負(fù)責(zé)所所在物理理節(jié)點(diǎn)的的存儲(chǔ)管管理2、一次寫寫入,多多次讀取取3、文件由由數(shù)據(jù)塊塊組成,,典型的的塊大小小是64MB4、數(shù)據(jù)塊塊盡量散散布道各各個(gè)節(jié)點(diǎn)點(diǎn)21——分布式文文件系統(tǒng)統(tǒng)(HDFS)/MapReduce原理云計(jì)算核核心技術(shù)術(shù)MAPReduce22云計(jì)算核核心技術(shù)術(shù)——MapReduce編程模型型23Example:CountingWordsMap()?Input<filename,filetext>Parsesfileandemits<word,count>pairseg.<”hello”,1>Reduce()?Sumsvaluesforthesamekeyandemits<word,TotalCount>eg.<”hello”,(3527)>=><””hello””,17>24云計(jì)算核核心技術(shù)術(shù)——Hbase數(shù)據(jù)庫(kù)的的基本概概念1、HBase是一個(gè)分布式的、面向列的的開源數(shù)數(shù)據(jù)庫(kù),來自Google論文“Bigtable:一個(gè)結(jié)構(gòu)化數(shù)數(shù)據(jù)的分分布式存存儲(chǔ)系統(tǒng)統(tǒng)”2、HBase不同于一一般的關(guān)關(guān)系數(shù)據(jù)據(jù)庫(kù),它是一個(gè)個(gè)適合于于非結(jié)構(gòu)化化數(shù)據(jù)存存儲(chǔ)的數(shù)數(shù)據(jù)庫(kù).另一個(gè)不不同的是是HBase基于列的而不是是基于行行的模式式25——Hbase邏輯模型云計(jì)算核核心技術(shù)術(shù)1、以表的的形式存存放數(shù)據(jù)據(jù)2、表由行行與列組組成,每每個(gè)列屬屬于某個(gè)個(gè)列族,,由行和和列確定定的存儲(chǔ)儲(chǔ)單元稱稱為元素素3、每個(gè)元元素保存存了同一一份數(shù)據(jù)據(jù)的多個(gè)個(gè)版本,,由時(shí)間戳來標(biāo)識(shí)區(qū)區(qū)分限定符,,列名Key值天生面向向時(shí)間查查詢的數(shù)數(shù)據(jù)庫(kù)26——Hbase物理模型型云計(jì)算核核心技術(shù)術(shù)Hmaster管理元數(shù)數(shù)據(jù)(表表分區(qū)、、管理該該分區(qū)的的RegionServer)RegionSer通過過client讀寫寫數(shù)數(shù)據(jù)據(jù)Hbase的所所有有數(shù)數(shù)據(jù)據(jù)((Hlog和Hfile)均均存存儲(chǔ)儲(chǔ)到到HDFS上災(zāi)難難分分析析一個(gè)個(gè)列列簇簇27云計(jì)計(jì)算算核核心心技技術(shù)術(shù)———行式式數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)與與列列式式數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)理理解解281、對(duì)對(duì)應(yīng)應(yīng)每每次次數(shù)據(jù)據(jù)操操作作的的時(shí)時(shí)間間,可可由由系統(tǒng)統(tǒng)自自動(dòng)動(dòng)生生成成,也也可可以以由由用用戶戶顯式式的的賦賦值值2、Hbase支持持兩兩種種數(shù)數(shù)據(jù)據(jù)版版本本回回收收方方式式::A、每個(gè)個(gè)數(shù)數(shù)據(jù)據(jù)單單元元,,只只存存儲(chǔ)儲(chǔ)指指定定個(gè)個(gè)數(shù)數(shù)的的最新新版版本本B、保存存指定定時(shí)時(shí)間間長(zhǎng)長(zhǎng)度度的版版本本((例例如如7天))3、常常見見的的客客戶戶端端時(shí)時(shí)間間查查詢?cè)儯海骸啊澳硞€(gè)個(gè)時(shí)時(shí)刻刻起起的的最最新新數(shù)數(shù)據(jù)據(jù)”或或““給我我全全部部版版本本的的數(shù)數(shù)據(jù)據(jù)”。。云計(jì)計(jì)算算核核心心技技術(shù)術(shù)———Hba29云計(jì)計(jì)算算核核心心技技術(shù)術(shù)———Hba1、Hbase適合合大量量插插入入同時(shí)時(shí)又又有讀讀取取的情情況況2、Hbase的瓶頸頸是硬盤盤傳傳輸輸速速度度3、Oracle的瓶頸頸是硬盤盤尋尋道道時(shí)時(shí)間間4、Hbase很適合合尋尋找找按按照照時(shí)時(shí)間間排排序序topn的場(chǎng)場(chǎng)景景30云計(jì)計(jì)算算核核心心技技術(shù)術(shù)———Hbase場(chǎng)景景案案列列::瀏瀏覽覽歷歷史史31云計(jì)計(jì)算算的的核心心技技術(shù)術(shù)在現(xiàn)現(xiàn)實(shí)實(shí)應(yīng)應(yīng)用用注意意::下下面面實(shí)實(shí)例例大大部部分分摘摘錄錄于于2012年hadoop與大大數(shù)數(shù)據(jù)據(jù)技技術(shù)術(shù)大大會(huì)會(huì)該會(huì)會(huì)議議舉舉行行時(shí)間間::2012年11月30日-12月1日在在北北京京該會(huì)會(huì)議議權(quán)權(quán)威威級(jí)級(jí)別別::32------應(yīng)用用之之一一HadoopinTelecom云計(jì)計(jì)算算核核心心技技術(shù)術(shù)載波波的的優(yōu)優(yōu)化化用戶戶的的分分割割瞬間間查查詢?cè)?G用戶戶數(shù)數(shù)量量的的記記錄錄33云計(jì)計(jì)算算核核心心技技術(shù)術(shù)------應(yīng)用用之之二二HadoopinSmartCity罰單單信息息流流處處理理34云計(jì)計(jì)算算核核心心技技術(shù)術(shù)------應(yīng)用用之之三三阿里里云云““云云梯梯””集集群群發(fā)發(fā)展展淘寶寶的的搜搜索索引引擎擎能能夠夠?qū)?duì)數(shù)十十億億的商商品品數(shù)數(shù)據(jù)據(jù)進(jìn)進(jìn)行行實(shí)時(shí)時(shí)搜搜索索,另另外外還還擁?yè)碛杏凶宰灾髦餮醒邪l(fā)發(fā)的的文件件存存儲(chǔ)儲(chǔ)系系統(tǒng)統(tǒng)和緩緩存存系系統(tǒng)統(tǒng),以以及及Java中間間件件和和消消息息中中間間件件系系統(tǒng)統(tǒng),,這這一一切切組組成成了了一個(gè)個(gè)龐龐大大的的電電子子商商務(wù)務(wù)操操作作系系統(tǒng)統(tǒng)。35云計(jì)計(jì)算算核核心心技技術(shù)術(shù)------應(yīng)用用之之三三阿里里云云““云云梯梯””數(shù)數(shù)據(jù)據(jù)平平臺(tái)臺(tái)框框架架36云計(jì)計(jì)算算核核心心技技術(shù)術(shù)------應(yīng)用用之之三三百度度數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)框框架架DW37云計(jì)計(jì)算算核核心心技技術(shù)術(shù)HADOOP------數(shù)據(jù)據(jù)存存入入和和抽抽取取每小小時(shí)時(shí)移移動(dòng)動(dòng)數(shù)數(shù)十十TB的交易易數(shù)數(shù)據(jù)、、交交互互數(shù)數(shù)據(jù)據(jù)和和流流數(shù)數(shù)據(jù)據(jù)38全球球領(lǐng)領(lǐng)先先的的獨(dú)獨(dú)立立企企業(yè)業(yè)數(shù)數(shù)據(jù)據(jù)集集成成軟軟件件提提供供商商云計(jì)計(jì)算算核核心心技技術(shù)術(shù)----應(yīng)用用五五大數(shù)數(shù)據(jù)據(jù)是是云云計(jì)計(jì)算算的的兩兩大大核核心心內(nèi)內(nèi)容容之之一一39云計(jì)計(jì)算算核核心心技技術(shù)術(shù)全世界權(quán)威IT咨詢公司研究究報(bào)告預(yù)測(cè)KB,MB,GB、TB,PB、EB、ZB、YB、BB1ZB=1.153*1018KB40一、大數(shù)據(jù)存儲(chǔ)管理和索引查詢問題二、Hadoop性能優(yōu)化問題三、圖數(shù)據(jù)并并行計(jì)算模型型和框架四、并行化機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法五、社會(huì)網(wǎng)絡(luò)分析六、排名和推推薦七、Web信息挖掘和檢索八、媒體分析析檢索九、自然語(yǔ)言處理理十、大數(shù)據(jù)可視化計(jì)算與分析云計(jì)算核心技技術(shù)當(dāng)今數(shù)據(jù)熱點(diǎn)研究的十個(gè)問題::----數(shù)據(jù)分析發(fā)展展趨勢(shì)系統(tǒng)層基礎(chǔ)算法應(yīng)用算法應(yīng)用技術(shù)41Hadoop----發(fā)展形勢(shì)hadoop42BerkeleyBDAS平臺(tái)43NoSQL數(shù)據(jù)庫(kù)基礎(chǔ)理論CAP理論與一致性性模型數(shù)據(jù)存儲(chǔ)模型型與數(shù)據(jù)庫(kù)Key-valueDBColumn-orientedDBDocument-orientedDBGraphDB…44CAP理論強(qiáng)一致性(Consistency)系統(tǒng)在執(zhí)行某某操作后仍處處于一致的狀狀態(tài)??捎眯裕ˋvailability)每一個(gè)操作能夠在在一定時(shí)間內(nèi)內(nèi)返回結(jié)果,,如果超時(shí)則則被認(rèn)為不可可用。分區(qū)容錯(cuò)性((Partitiontolerance)在網(wǎng)絡(luò)分區(qū)((被劃分成孤孤立的區(qū)域))的情況下仍仍可接受請(qǐng)求求。45/101多副本數(shù)據(jù)一一致性模型強(qiáng)一致性無論更新在哪哪個(gè)副本上進(jìn)進(jìn)行,之后的的所有操作都都能獲得更新新的數(shù)據(jù)。弱一致性用戶讀到某一一操作對(duì)系統(tǒng)統(tǒng)的更新需要要一段時(shí)間最終一致性保證用戶最終終能夠讀到某一操作作對(duì)系統(tǒng)的更更新46/10147應(yīng)用場(chǎng)景:內(nèi)容緩存,,主要用于處處理大量數(shù)據(jù)據(jù)的高訪問負(fù)負(fù)載,也用于于一些日志系系統(tǒng)。優(yōu)點(diǎn):查找迅迅速缺點(diǎn):數(shù)據(jù)無無結(jié)構(gòu),通常常只被當(dāng)做字字符串或二進(jìn)進(jìn)制數(shù)據(jù)48Java實(shí)現(xiàn)的開源key-value數(shù)據(jù)庫(kù)特征數(shù)據(jù)自動(dòng)冗余余備份于多個(gè)個(gè)結(jié)點(diǎn)上數(shù)據(jù)分區(qū)存儲(chǔ)儲(chǔ)單點(diǎn)故障對(duì)整整個(gè)系統(tǒng)透明明支持復(fù)雜數(shù)據(jù)據(jù)類型的序列列化將數(shù)據(jù)項(xiàng)進(jìn)行行版本化,出出現(xiàn)故障時(shí)最最大限度保證證數(shù)據(jù)的完整整性49開源項(xiàng)目,源源代碼采用了了Apache2.0的使用許可特征自動(dòng)將在線數(shù)數(shù)據(jù)遷移到低低延遲的存儲(chǔ)儲(chǔ)介質(zhì)的技術(shù)術(shù)(內(nèi)存,固固態(tài)硬盤,磁磁盤)可選的寫操作作一一異步,,同步(基于于復(fù)制,持久久化)多線程低鎖爭(zhēng)爭(zhēng)用盡可能使用異異步處理自動(dòng)實(shí)現(xiàn)重復(fù)復(fù)數(shù)據(jù)刪除動(dòng)態(tài)再平衡現(xiàn)現(xiàn)有集群通過把數(shù)據(jù)復(fù)復(fù)制到多個(gè)集集群?jiǎn)卧椭еС挚焖偈∞D(zhuǎn)移來提供供系統(tǒng)的高可可用性。5051應(yīng)用場(chǎng)景:分布式文件件系統(tǒng)優(yōu)點(diǎn):查找迅迅速,可擴(kuò)展展性強(qiáng),更容容易進(jìn)行分布布式擴(kuò)展缺點(diǎn):功能相相對(duì)有限525354最初由Facebook開發(fā),用于儲(chǔ)儲(chǔ)存收件箱等等簡(jiǎn)單格式數(shù)數(shù)據(jù),集GoogleBigTable的數(shù)據(jù)模型與與AmazonDynamo的完全分布式式的架構(gòu)于一身Facebook于2008將Cassandra開源,此后,,由于Cassandra良好的可擴(kuò)放放性,被Digg、Twitter等知名Web2.0網(wǎng)站所采納,,成為了一種種流行的分布布式結(jié)構(gòu)化數(shù)數(shù)據(jù)存儲(chǔ)方案案。主要特征:模式靈活:使用Cassandra,像文檔存儲(chǔ)儲(chǔ),你不必提提前解決記錄錄中的字段。。真正的可擴(kuò)展展性:Cassandra是純粹意義上上的水平擴(kuò)展展。為給集群群添加更多容容量,可以指指向另一臺(tái)電電腦。你不必必重啟任何進(jìn)進(jìn)程,改變應(yīng)應(yīng)用查詢,或或手動(dòng)遷移任任何數(shù)據(jù)。分布式寫操作作:有可以在任何何地方任何時(shí)時(shí)間集中讀或或?qū)懭魏螖?shù)據(jù)據(jù)。并且不會(huì)會(huì)有任何單點(diǎn)點(diǎn)失敗。列表數(shù)據(jù)結(jié)構(gòu)構(gòu):在混合模式可可以將超級(jí)列列添加到5維。對(duì)于每個(gè)個(gè)用戶的索引引,這是非常常方便的。55應(yīng)用場(chǎng)景:web應(yīng)用等優(yōu)點(diǎn):數(shù)據(jù)要要求不嚴(yán)格,,不需要預(yù)先先定義結(jié)構(gòu)缺點(diǎn):查詢能能力不高,缺缺乏統(tǒng)一的查查詢語(yǔ)法56可以通過JavaScriptObjectNotation(JSON)API訪問“Couch”=“ClusterOfUnreliableCommodityHardware””,目標(biāo)具有高高度可伸縮性性,提供了高高可用性和高高可靠性,即即使運(yùn)行在容容易出現(xiàn)故障障的硬件上也也是如此特點(diǎn)CouchDB是分布式的數(shù)數(shù)據(jù)庫(kù),他可可以把存儲(chǔ)系系統(tǒng)分布到n臺(tái)物理的節(jié)點(diǎn)點(diǎn)上面,并且且很好的協(xié)調(diào)調(diào)和同步節(jié)點(diǎn)點(diǎn)之間的數(shù)據(jù)據(jù)讀寫一致性CouchDB是面向文檔的的數(shù)據(jù)庫(kù),存存儲(chǔ)半結(jié)構(gòu)化化的數(shù)據(jù)CouchDB支持RESTAPI,可以讓用戶戶使用JavaScript來操作CouchDB數(shù)據(jù)庫(kù),也可可以用JavaScript編寫查詢語(yǔ)句句,用AJAX技術(shù)結(jié)合CouchDB開發(fā)出來的CMS系統(tǒng)會(huì)簡(jiǎn)單方便57工作原理CouchDB構(gòu)建在強(qiáng)大的的B+樹儲(chǔ)存引擎之上上。這種引擎擎負(fù)責(zé)對(duì)CouchDB中的數(shù)據(jù)進(jìn)行行排序,并提提供一種能夠夠在對(duì)數(shù)均攤攤時(shí)間內(nèi)執(zhí)行行搜索、插入入和刪除操作作的機(jī)制。數(shù)據(jù)庫(kù)的結(jié)構(gòu)構(gòu)獨(dú)立于模式式,依賴于使用視視圖創(chuàng)建文檔檔之間的任意意關(guān)系,使用Map/Reduce計(jì)算這些視圖圖的結(jié)果在CouchDB中沒有鎖機(jī)制制,它使用的的是多版本并并發(fā)性控制((Multiversionconcurrencycontrol,MVCC)58特點(diǎn)介于關(guān)系數(shù)據(jù)庫(kù)和非關(guān)系數(shù)據(jù)據(jù)庫(kù)之間的產(chǎn)產(chǎn)品,是非關(guān)關(guān)系數(shù)據(jù)庫(kù)當(dāng)當(dāng)中功能最豐豐富,最像關(guān)關(guān)系數(shù)據(jù)庫(kù)的的支持的數(shù)據(jù)結(jié)結(jié)構(gòu)非常松散散,是類似json的bson格式,因此可可以存儲(chǔ)比較較復(fù)雜的數(shù)據(jù)據(jù)類型支持的查詢語(yǔ)語(yǔ)言非常強(qiáng)大大,其語(yǔ)法有有點(diǎn)類似于面面向?qū)ο蟮牟椴樵冋Z(yǔ)言,幾幾乎可以實(shí)現(xiàn)現(xiàn)類似關(guān)系數(shù)數(shù)據(jù)庫(kù)單表查查詢的絕大部部分功能,而而且還支持對(duì)對(duì)數(shù)據(jù)建立索索引59技術(shù)特點(diǎn)面向集合存儲(chǔ),易易存儲(chǔ)對(duì)象類類型的數(shù)據(jù)。。模式自由。支持動(dòng)態(tài)查詢。支持完全索
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 爬蟲行為分析在網(wǎng)絡(luò)安全中的應(yīng)用-全面剖析
- 環(huán)保智能紡織材料開發(fā)-全面剖析
- 無線通信中的信號(hào)處理-全面剖析
- 民房水管施工方案
- 多分支版本策略-全面剖析
- 個(gè)性化定制鞋設(shè)計(jì)-全面剖析
- 智能問答系統(tǒng)-第1篇-全面剖析
- 氣候變化經(jīng)濟(jì)評(píng)估模型-全面剖析
- 喬木砍伐施工方案
- 高考小說作用類題型集錦
- 停工責(zé)任的告知函(聯(lián)系單)
- CHT 8023-2011 機(jī)載激光雷達(dá)數(shù)據(jù)處理技術(shù)規(guī)范(正式版)
- 2024年演出經(jīng)紀(jì)人考試必背1000題附答案(黃金題型)
- 《人類起源的演化過程》閱讀測(cè)試題及答案
- JB-T 8532-2023 脈沖噴吹類袋式除塵器
- 第11課《送東陽(yáng)馬生序》(課件)九年級(jí)語(yǔ)文下冊(cè)
- (正式版)SHT 3045-2024 石油化工管式爐熱效率設(shè)計(jì)計(jì)算方法
- 2024年中儲(chǔ)糧集團(tuán)招聘筆試參考題庫(kù)附帶答案詳解
- 基于大概念的高中歷史大單元教學(xué)
- (2024年)保安培訓(xùn)圖文課件
- 《養(yǎng)老護(hù)理員》-課件:協(xié)助臥床老年人使用便器排便
評(píng)論
0/150
提交評(píng)論