版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
Hive與傳統(tǒng)數(shù)據(jù)庫相比主要內(nèi)容2Hive與傳統(tǒng)數(shù)據(jù)庫不同點(diǎn)3一、hive的與傳統(tǒng)數(shù)據(jù)庫不同點(diǎn)4一、hive與傳統(tǒng)數(shù)據(jù)庫不同點(diǎn)1.數(shù)據(jù)存儲位置2.數(shù)據(jù)格式3.數(shù)據(jù)更新4.執(zhí)行方式5.延遲性和可擴(kuò)展性6.數(shù)據(jù)規(guī)模51.數(shù)據(jù)存儲位置Hive建立在Hadoop之上,所有的hive數(shù)據(jù)都存儲在HDFS中,而數(shù)據(jù)庫則可以將數(shù)據(jù)保存至塊設(shè)備或者本低文件系統(tǒng)中Hive在導(dǎo)入HDFS中的數(shù)據(jù)時(shí),僅僅把數(shù)據(jù)進(jìn)行了移動,把數(shù)據(jù)從原目錄移動到hive相應(yīng)目錄下62.數(shù)據(jù)格式Hive沒有定義專用的數(shù)據(jù)格式,數(shù)據(jù)格式可以由用戶指定,用戶定義數(shù)據(jù)格式需要指定三個屬性:列分隔符(通常為空格、”\t”、”\x001″)、行分隔符(”\n”)以及讀取文件數(shù)據(jù)的方法(Hive中默認(rèn)有三個文件格式TextFile,SequenceFile以及RCFile)。由于在加載數(shù)據(jù)的過程中,不需要從用戶數(shù)據(jù)格式到Hive定義的數(shù)據(jù)格式的轉(zhuǎn)換,因此,Hive在加載的過程中不會對數(shù)據(jù)本身進(jìn)行任何修改,而只是將數(shù)據(jù)內(nèi)容復(fù)制或者移動到相應(yīng)的HDFS目錄中。而在數(shù)據(jù)庫中,不同的數(shù)據(jù)庫有不同的存儲引擎,定義了自己的數(shù)據(jù)格式。所有數(shù)據(jù)都會按照一定的組織存儲,因此,數(shù)據(jù)庫加載數(shù)據(jù)的過程會比較耗時(shí)73.數(shù)據(jù)更新由于Hive是針對數(shù)據(jù)倉庫應(yīng)用設(shè)計(jì)的,而數(shù)據(jù)倉庫的內(nèi)容是讀多寫少的。因此,Hive中不支持對數(shù)據(jù)的改寫和添加,所有的數(shù)據(jù)都是在加載的時(shí)候中確定好的。而數(shù)據(jù)庫中的數(shù)據(jù)通常是需要經(jīng)常進(jìn)行修改的,因此可以使用INSERTINTO...
VALUES添加數(shù)據(jù),使用UPDATE...SET修改數(shù)據(jù)若想用更新數(shù)據(jù),則需要在hive-site.xml進(jìn)行相應(yīng)配置84.執(zhí)行方式Hive
中大多數(shù)查詢的執(zhí)行是通過
Hadoop提供的
MapReduce來實(shí)現(xiàn)的。而數(shù)據(jù)庫通常有自己的執(zhí)行引擎特例:進(jìn)行select*操作時(shí)不會執(zhí)行mapreduce95.延遲性和可拓展性因?yàn)閔ive執(zhí)行查詢操作時(shí)需要運(yùn)行mapreduce的job,由于mapreduce本身耗時(shí)較長,所以hive在查詢時(shí)延遲性較高,但當(dāng)數(shù)據(jù)量超過傳統(tǒng)數(shù)據(jù)庫處理能力時(shí),hive的并行計(jì)算能力則能體現(xiàn)出優(yōu)勢由于
Hive是建立在
Hadoop之上的,因此
Hive的可擴(kuò)展性是和
Hadoop的可擴(kuò)展性是一致的。而數(shù)據(jù)庫由于
ACID語義的嚴(yán)格限制,擴(kuò)展行非常有限。目前最先進(jìn)的并行數(shù)據(jù)庫
Oracle在理論上的擴(kuò)展能力也只有
100臺左右106.數(shù)據(jù)規(guī)模由于hive建立在Hadoop集群之上,且利用mapreduc
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國電子通訊行業(yè)行業(yè)發(fā)展格局及未來前景預(yù)測研究報(bào)告(2024-2030版)
- 中國生物書籍行業(yè)市場發(fā)展分析及發(fā)展趨勢與投資戰(zhàn)略研究報(bào)告(2024-2030版)
- 中國熱軋薄寬鋼帶市場運(yùn)營態(tài)勢與前景趨勢預(yù)測研究報(bào)告(2024-2030版)
- 中國泵隔膜行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展研究報(bào)告(2024-2030版)
- 合同管理體系課程設(shè)計(jì)
- 認(rèn)識四肢課程設(shè)計(jì)
- 進(jìn)程調(diào)度是課程設(shè)計(jì)
- 課程設(shè)計(jì)工期質(zhì)保
- 洛陽市課程設(shè)計(jì)
- 煤礦隔爆措施課程設(shè)計(jì)
- 書籍小兵張嘎課件
- 生鮮豬肉銷售合同模板
- 2024年經(jīng)濟(jì)師考試-中級經(jīng)濟(jì)師考試近5年真題集錦(頻考類試題)帶答案
- 2024年黑龍江哈爾濱市通河縣所屬事業(yè)單位招聘74人(第二批)易考易錯模擬試題(共500題)試卷后附參考答案
- 私募基金管理人-廉潔從業(yè)管理準(zhǔn)則
- 醫(yī)療器械質(zhì)量方針和目標(biāo)管理制度
- 北京市城管執(zhí)法行政處罰裁量區(qū)域分類管理臺帳
- 5.1+走近老師(課件)2024-2025學(xué)年七年級道德與法治上冊
- 退役軍人事務(wù)員職業(yè)技能理論考試復(fù)習(xí)題及答案
- 農(nóng)村農(nóng)產(chǎn)品加工行業(yè)市場需求分析及未來三年行業(yè)預(yù)測報(bào)告
- 識別界限 拒絕性騷擾 課件 2024-2025學(xué)年人教版(2024)初中體育與健康七年級全一冊
評論
0/150
提交評論