hive與傳統(tǒng)數(shù)據(jù)庫相比_第1頁
hive與傳統(tǒng)數(shù)據(jù)庫相比_第2頁
hive與傳統(tǒng)數(shù)據(jù)庫相比_第3頁
hive與傳統(tǒng)數(shù)據(jù)庫相比_第4頁
hive與傳統(tǒng)數(shù)據(jù)庫相比_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Hive與傳統(tǒng)數(shù)據(jù)庫相比主要內(nèi)容2Hive與傳統(tǒng)數(shù)據(jù)庫不同點(diǎn)3一、hive的與傳統(tǒng)數(shù)據(jù)庫不同點(diǎn)4一、hive與傳統(tǒng)數(shù)據(jù)庫不同點(diǎn)1.數(shù)據(jù)存儲位置2.數(shù)據(jù)格式3.數(shù)據(jù)更新4.執(zhí)行方式5.延遲性和可擴(kuò)展性6.數(shù)據(jù)規(guī)模51.數(shù)據(jù)存儲位置Hive建立在Hadoop之上,所有的hive數(shù)據(jù)都存儲在HDFS中,而數(shù)據(jù)庫則可以將數(shù)據(jù)保存至塊設(shè)備或者本低文件系統(tǒng)中Hive在導(dǎo)入HDFS中的數(shù)據(jù)時(shí),僅僅把數(shù)據(jù)進(jìn)行了移動,把數(shù)據(jù)從原目錄移動到hive相應(yīng)目錄下62.數(shù)據(jù)格式Hive沒有定義專用的數(shù)據(jù)格式,數(shù)據(jù)格式可以由用戶指定,用戶定義數(shù)據(jù)格式需要指定三個屬性:列分隔符(通常為空格、”\t”、”\x001″)、行分隔符(”\n”)以及讀取文件數(shù)據(jù)的方法(Hive中默認(rèn)有三個文件格式TextFile,SequenceFile以及RCFile)。由于在加載數(shù)據(jù)的過程中,不需要從用戶數(shù)據(jù)格式到Hive定義的數(shù)據(jù)格式的轉(zhuǎn)換,因此,Hive在加載的過程中不會對數(shù)據(jù)本身進(jìn)行任何修改,而只是將數(shù)據(jù)內(nèi)容復(fù)制或者移動到相應(yīng)的HDFS目錄中。而在數(shù)據(jù)庫中,不同的數(shù)據(jù)庫有不同的存儲引擎,定義了自己的數(shù)據(jù)格式。所有數(shù)據(jù)都會按照一定的組織存儲,因此,數(shù)據(jù)庫加載數(shù)據(jù)的過程會比較耗時(shí)73.數(shù)據(jù)更新由于Hive是針對數(shù)據(jù)倉庫應(yīng)用設(shè)計(jì)的,而數(shù)據(jù)倉庫的內(nèi)容是讀多寫少的。因此,Hive中不支持對數(shù)據(jù)的改寫和添加,所有的數(shù)據(jù)都是在加載的時(shí)候中確定好的。而數(shù)據(jù)庫中的數(shù)據(jù)通常是需要經(jīng)常進(jìn)行修改的,因此可以使用INSERTINTO...

VALUES添加數(shù)據(jù),使用UPDATE...SET修改數(shù)據(jù)若想用更新數(shù)據(jù),則需要在hive-site.xml進(jìn)行相應(yīng)配置84.執(zhí)行方式Hive

中大多數(shù)查詢的執(zhí)行是通過

Hadoop提供的

MapReduce來實(shí)現(xiàn)的。而數(shù)據(jù)庫通常有自己的執(zhí)行引擎特例:進(jìn)行select*操作時(shí)不會執(zhí)行mapreduce95.延遲性和可拓展性因?yàn)閔ive執(zhí)行查詢操作時(shí)需要運(yùn)行mapreduce的job,由于mapreduce本身耗時(shí)較長,所以hive在查詢時(shí)延遲性較高,但當(dāng)數(shù)據(jù)量超過傳統(tǒng)數(shù)據(jù)庫處理能力時(shí),hive的并行計(jì)算能力則能體現(xiàn)出優(yōu)勢由于

Hive是建立在

Hadoop之上的,因此

Hive的可擴(kuò)展性是和

Hadoop的可擴(kuò)展性是一致的。而數(shù)據(jù)庫由于

ACID語義的嚴(yán)格限制,擴(kuò)展行非常有限。目前最先進(jìn)的并行數(shù)據(jù)庫

Oracle在理論上的擴(kuò)展能力也只有

100臺左右106.數(shù)據(jù)規(guī)模由于hive建立在Hadoop集群之上,且利用mapreduc

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論