![14.2 Hive數(shù)據存儲模型_第1頁](http://file4.renrendoc.com/view4/M02/0E/08/wKhkGGaOUkOAexCOAABb1CwLhI4635.jpg)
![14.2 Hive數(shù)據存儲模型_第2頁](http://file4.renrendoc.com/view4/M02/0E/08/wKhkGGaOUkOAexCOAABb1CwLhI46352.jpg)
![14.2 Hive數(shù)據存儲模型_第3頁](http://file4.renrendoc.com/view4/M02/0E/08/wKhkGGaOUkOAexCOAABb1CwLhI46353.jpg)
![14.2 Hive數(shù)據存儲模型_第4頁](http://file4.renrendoc.com/view4/M02/0E/08/wKhkGGaOUkOAexCOAABb1CwLhI46354.jpg)
![14.2 Hive數(shù)據存儲模型_第5頁](http://file4.renrendoc.com/view4/M02/0E/08/wKhkGGaOUkOAexCOAABb1CwLhI46355.jpg)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Hive的數(shù)據存儲模型Hive的數(shù)據存儲模型
Hive中所有的數(shù)據都被存儲在HDFS中,沒有專門的數(shù)據存儲格式(可支持Text、Avro、ORC、SequenceFile、ParquetFile、RCFile等),只需要在創(chuàng)建表時指定Hive數(shù)據中的列分隔符和行分隔符,Hive就可以解析數(shù)據。Hive的數(shù)據存儲模型創(chuàng)建一個內部表cityInfo(cityID,cityName,population),代碼如下:createtablecityInfo(>cityIDstring,>cityNamestring,>populationint)>rowformatdelimited>fieldsterminatedby','>storedastextfile;Hive的數(shù)據存儲模型Hive中的數(shù)據模型包括數(shù)據庫(Database)、表(Table)、分區(qū)(Partition)和桶(Bucket)。Hive的數(shù)據存儲模型(1)數(shù)據庫(Database):在HDFS中,數(shù)據庫表現(xiàn)為${hive.Metastore.warehouse.dir}目錄下的一個文件夾。在創(chuàng)建表時,如果不指定數(shù)據庫,則默認為“default”數(shù)據庫。(2)表(Table):在HDFS中,表表現(xiàn)為所屬數(shù)據庫目錄下的一個文件夾。Hive中默認創(chuàng)建的是內部表,這種表的數(shù)據由Hive來管理。當刪除表時,表的數(shù)據和元數(shù)據都會被刪除。Hive的數(shù)據存儲模型(3)分區(qū)(Partition):在Hive表查詢時,可能只需要掃描表中的某部分數(shù)據,不需要掃描表中的全部內容,因此在建表時引入了分區(qū)的概念。在Hive表查詢時,如果指定了分區(qū)字段作為篩選條件,那么只需要到對應的分區(qū)目錄中檢索數(shù)據即可,減少了處理的數(shù)據量,從而有效地提高了效率。Hive的數(shù)據存儲模型(4)桶(Bucket):桶可以被理解為將“大表”細分為“小表”的一種數(shù)據結構。這種設計主要是為了提高查詢效率,使得進行抽樣查詢時更加便捷。Hive的數(shù)據存儲模型桶是Hive數(shù)據模型中的最小單元。當某數(shù)據被加載到桶中時,首先會根據字段的值對其進行哈希處理,然后用哈希結果除以桶的數(shù)量來決定該數(shù)據應該存儲在哪個桶中。這樣就確保了每個桶中都有數(shù)據,但每個桶中的數(shù)據條數(shù)可能并不相等。Hive的數(shù)據存儲模型數(shù)據加載-哈希取值-分桶Hive的數(shù)據存儲模型桶是一種技術,用于將數(shù)據分解為更小、更易管
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 粵人版地理八年級下冊《第二節(jié) 重要的地理分界線》聽課評課記錄1
- 新人教版七年級數(shù)學上冊 3.1.2 《等式的性質》聽評課記錄
- 七年級(人教版)集體備課聽評課記錄:3.2《解一元一次方程(一)-合并同類項與移項1》
- 新蘇教版六年級數(shù)學下冊聽評課記錄
- 三年級語文上聽評課記錄
- 蘇科版數(shù)學七年級下冊10.2《二元一次方程組》聽評課記錄
- 人教版地理七年級下冊第十章《極地地區(qū)》聽課評課記錄1
- 人教版數(shù)學八年級下冊《19.3 課題學習 選擇方案》聽評課記錄
- 新人教版七年級數(shù)學上冊1.3.2《有理數(shù)的減法》聽評課記錄2
- 八年級道德與法治上冊聽課評課記錄第一單元走進社會生活
- 課題申報參考:生活服務數(shù)字化轉型下社區(qū)生活圈建設理念、模式與路徑研究
- 甘肅省民航機場集團招聘筆試沖刺題2025
- 北師大版小學三年級數(shù)學下冊全冊教案
- DCMM練習題練習試題
- 《工業(yè)化建筑施工階段碳排放計算標準》
- GB/T 33761-2024綠色產品評價通則
- 地下停車場充電樁技術方案建議書
- 幼兒園設施設備安全教育
- 廢舊保溫棉處置合同范例
- 《人工智能簡述》課件
- 《軌道交通工程盾構施工技術》 課件 項目5 盾構隧道防水施工
評論
0/150
提交評論