數(shù)據(jù)庫(kù)系統(tǒng)原理與開發(fā)-列存儲(chǔ)數(shù)據(jù)庫(kù)-1_第1頁
數(shù)據(jù)庫(kù)系統(tǒng)原理與開發(fā)-列存儲(chǔ)數(shù)據(jù)庫(kù)-1_第2頁
數(shù)據(jù)庫(kù)系統(tǒng)原理與開發(fā)-列存儲(chǔ)數(shù)據(jù)庫(kù)-1_第3頁
數(shù)據(jù)庫(kù)系統(tǒng)原理與開發(fā)-列存儲(chǔ)數(shù)據(jù)庫(kù)-1_第4頁
數(shù)據(jù)庫(kù)系統(tǒng)原理與開發(fā)-列存儲(chǔ)數(shù)據(jù)庫(kù)-1_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

列存儲(chǔ)數(shù)據(jù)庫(kù)鳳荔用本節(jié)學(xué)目地?列存儲(chǔ)數(shù)據(jù)庫(kù)簡(jiǎn)介?HBASE數(shù)據(jù)庫(kù)?HBASE地?cái)?shù)據(jù)模型一鳳荔用一,列存儲(chǔ)數(shù)據(jù)庫(kù)簡(jiǎn)介?數(shù)據(jù)庫(kù)地?cái)?shù)據(jù)模型給出了數(shù)據(jù)地表達(dá)方式,二維表是關(guān)系模型地?cái)?shù)據(jù)結(jié)構(gòu),數(shù)據(jù)與數(shù)據(jù)之間地關(guān)系都在二維表表示。?數(shù)據(jù)庫(kù)以行,列地二維表地形式表示數(shù)據(jù),以一維字符串地方式存儲(chǔ),課程數(shù)據(jù)庫(kù)?Course_idCourse_nameCourse_typeCourse_hoursCourse_credit?C零零一數(shù)據(jù)庫(kù)原理及應(yīng)用學(xué)科基礎(chǔ)六四四?C零零二操作系統(tǒng)基礎(chǔ)學(xué)科基礎(chǔ)六四四?C零零三面向?qū)ο蟪绦蛟O(shè)計(jì)學(xué)科基礎(chǔ)四八三二鳳荔用一,列存儲(chǔ)數(shù)據(jù)庫(kù)簡(jiǎn)介?這個(gè)表包括課程代碼(Course_id),課程名稱(Course_name),類型(Course_type),學(xué)時(shí)數(shù)(Course_hours),學(xué)分(Course_credit)。?行式數(shù)據(jù)庫(kù)把一行地?cái)?shù)據(jù)值串在一起存儲(chǔ)起來,然后再存儲(chǔ)下一行地?cái)?shù)據(jù),以此類推(逗號(hào)是分隔符)。?存儲(chǔ)地效果是字符串:C零零一,數(shù)據(jù)庫(kù)原理及應(yīng)用,學(xué)科基礎(chǔ),六四,四,C零零二,操作系統(tǒng)基礎(chǔ),學(xué)科基礎(chǔ),六四,四,C零零三,面向?qū)ο蟪绦蛟O(shè)計(jì),學(xué)科基礎(chǔ),四八,三?一串字符,通過行地定義來定位三鳳荔用一,列存儲(chǔ)數(shù)據(jù)庫(kù)簡(jiǎn)介?列式數(shù)據(jù)庫(kù)把一列地?cái)?shù)據(jù)值串在一起存儲(chǔ)起來,然后再存儲(chǔ)下一列地?cái)?shù)據(jù),以此類推。?存儲(chǔ)地效果是字符串:C零零一,C零零二,C零零三,數(shù)據(jù)庫(kù)原理及應(yīng)用,操作系統(tǒng)基礎(chǔ),面向?qū)ο蟪绦蛟O(shè)計(jì),學(xué)科基礎(chǔ),學(xué)科基礎(chǔ),學(xué)科基礎(chǔ),六四,六四,四八,四,四,四?查詢地選擇規(guī)則是通過列來定義地,列式存儲(chǔ)數(shù)據(jù)庫(kù)是自動(dòng)索引化地;數(shù)據(jù)壓縮比高,查詢速度高四鳳荔用二,HBASE數(shù)據(jù)庫(kù)?HBase全稱是HadoopDatabase,是一個(gè)構(gòu)建在ApacheHadoop上地列式數(shù)據(jù)庫(kù)?HBase是一個(gè)開源地非關(guān)系型分布式數(shù)據(jù)庫(kù)(NoSQL),實(shí)現(xiàn)地編程語言為Java?Apache軟件基金會(huì)地Hadoop項(xiàng)目地一部分,可以容錯(cuò)地存儲(chǔ)海量稀疏地?cái)?shù)據(jù)。?HBase地表能夠作為不同任務(wù)地輸入與輸出,通過API來存取數(shù)據(jù),?Hbase建立在DFS上,提供高可靠,高能,列存儲(chǔ),可伸縮,實(shí)時(shí)讀寫地五鳳荔用二,HBASE數(shù)據(jù)庫(kù)--特點(diǎn)?表達(dá)地?cái)?shù)據(jù)量大?無模式?面向列(族)地存儲(chǔ)?數(shù)據(jù)類型單一?沒有嚴(yán)格形態(tài)地?cái)?shù)據(jù)。數(shù)據(jù)記錄可能包含不一致地列,不確定大小即為半結(jié)構(gòu)化數(shù)據(jù)。?HBase存儲(chǔ)數(shù)據(jù)是半結(jié)構(gòu)化使其具有可擴(kuò)展,?Hbase結(jié)構(gòu)地?zé)o限地,實(shí)體化地,嵌套地版本六鳳荔用三,HBASE數(shù)據(jù)模型?HBase以表地形式表達(dá)與存儲(chǔ)數(shù)據(jù),表由行與列組成,列劃分為若干個(gè)列族(rowfamily)。?列限定符(columnqualifier)與時(shí)間版本(version)RowKeyColumnFamily:CF一ColumnFamily:CF二TimeStampColumn:Column:Column:C二一Column:C二二C一一C一二".googl"C一一good""C一二good""C一二bad""C一二bad"T一e"七鳳荔用三,HBASE數(shù)據(jù)模型?(一)表(table)?(二)行鍵(RowKey,行row)?(三)列族(columnfamily)?(四)列(Column):屬于某一個(gè)列族,列組名稱:列名稱(columnfamilyName:columnName)?(五)單元(cell):單元是由行,列族,列限定符,值與代表值版本地時(shí)間戳組成地,存儲(chǔ)在單元里地?cái)?shù)據(jù)成為單元值。行與列地叉點(diǎn)稱為單元格,內(nèi)容是列地值,以二制形式存儲(chǔ)。?(六)時(shí)間版本(Timestamp時(shí)間戳):類型為六四位整型(Long),默認(rèn)是系統(tǒng)時(shí)間戳,用戶可自定義;每個(gè)cell都保存著多個(gè)版本。?兩種數(shù)據(jù)版本回收方式。一是保存數(shù)據(jù)地最后n個(gè)版本,二是保存最近一段時(shí)間內(nèi)地版本(比如最近七天)。八鳳荔用三,HBASE數(shù)據(jù)模型?HBase沒有數(shù)據(jù)類型,任何列值都被轉(zhuǎn)換成字符串行存儲(chǔ);?HBase表地每一行可以有不同地列;?相同RowKey地插入操作被認(rèn)為是同一行地操作。即相同RowKey地二次寫入操作,第二次可被可為是對(duì)該行某些列地更新操作;列由列族與列名連接而成,分隔符是冒號(hào),如d:Name(d列族名,Name列名)。?表地存儲(chǔ)結(jié)構(gòu):邏輯數(shù)據(jù)模型空白cell在物理上是不存儲(chǔ)地?。九鳳荔用三,HBASE數(shù)據(jù)模型?例關(guān)系型數(shù)據(jù)庫(kù)Hblog有三個(gè)表格?文章表Article(id,title,content,tags,author_id)與?作者表Author(id,name,nickname),?日志表blog(blog_ID,article_id,author_id,pub_time,...)?用HBASE設(shè)計(jì)表結(jié)構(gòu)為Hblog,這里行鍵是ID,列族有兩個(gè)article與author,article列族有三個(gè)列title,content,tags,auth列族有二個(gè)列name,nickname。。RowKeyColumnFamilyColumnKeysIDarticletitle,content,tagsauthorname,nickname鳳荔用三,HBASE數(shù)據(jù)模型?存儲(chǔ)結(jié)構(gòu)如下:author(列族)一一三一八一七九二一八一一一一二一article:title="Hbasebook".一三一八一七九二一六二七九八二九article:content=Nosql...一三一八一七九二一五八九八九零二article:tages=Database一三一八一七九二一四四六六七八五一三一八一七九二一三五七七八九八anthor.nime=.xyz.一三一八一七九二一二五一二零零一author.nime=.abc.一零一零零一一二鳳荔用三,HBASE數(shù)據(jù)模型?或全表掃描;?表創(chuàng)建時(shí)只需聲明表名與至少一個(gè)列族名,每個(gè)ColumnFamily為一個(gè)存儲(chǔ)單元;?Column不用創(chuàng)建表時(shí)定義即可以動(dòng)態(tài)新增,同一ColumnColumns會(huì)群聚在一個(gè)存儲(chǔ)單元上,并依Columnkey排序,鳳荔用三,HBASE數(shù)據(jù)模型?HBAS數(shù)據(jù)地存儲(chǔ)類型:TableName是字符串;RowKey與ColumnName是二制值(Java類型byte[]);Timestamp是一個(gè)六四位整數(shù)(Java類型long);value是一個(gè)字節(jié)數(shù)組(Java類型byte[])。?HBASE地?cái)?shù)據(jù)模型地定義地層次是:?Schema-->Table-->ColumnFamily-->Rowkey-->TimeStamp-->Value?。鳳荔用三,HBASE數(shù)據(jù)模型?Rowkey地設(shè)計(jì)非常重要。?ColumnFamily:列族,擁有一個(gè)名稱(string),包含一個(gè)或者多個(gè)相關(guān)列?Column:屬于某一個(gè)columnfamily,familyName:columnName,每條記錄可動(dòng)態(tài)添加?VersionNumber:類型為L(zhǎng)ong,默認(rèn)值是系統(tǒng)時(shí)間戳,可由用戶義?Value(Cell):Bytearray。鳳荔用HBASE數(shù)據(jù)模型—總結(jié)?HBase地?cái)?shù)據(jù)模型也是由一張張地表組成,每一張表里也有數(shù)據(jù)行與列?表(Table):數(shù)據(jù)組織表里面,表名--文件路徑里地合法名h

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論