華為FusionStorage架構(gòu)分析-文檔資料_第1頁
華為FusionStorage架構(gòu)分析-文檔資料_第2頁
華為FusionStorage架構(gòu)分析-文檔資料_第3頁
華為FusionStorage架構(gòu)分析-文檔資料_第4頁
華為FusionStorage架構(gòu)分析-文檔資料_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1華為FusionStorage架構(gòu)分析常濤2基本功能接口: scsi/iscsi數(shù)據(jù)服務(wù):快照,克隆,精簡配置,分布式cache,備份(全量,增量),復(fù)制(基于volume的異步復(fù)制)存儲(chǔ)基本功能:集群狀態(tài)控制,分布式數(shù)據(jù)分布(DHT),rebuild,reblance過程控制,強(qiáng)一致性協(xié)議3基本組件FusionStorage Manager: 管理模塊,提供告警,監(jiān)控,日志等信息。FustionStorage Agent:代理進(jìn)程,實(shí)現(xiàn)和FusitonStorage Manager的通信。MDC(meta data cluster):集群管理,負(fù)責(zé)集群狀態(tài)的監(jiān)控,數(shù)據(jù)分布規(guī)則,數(shù)據(jù)rebu

2、ild的過程控制。(使用zookeeper)VBS(virtual block system)客戶端,提供分布式塊存儲(chǔ)集群接入點(diǎn)服務(wù)。OSD:數(shù)據(jù)服務(wù)組件。每個(gè)磁盤對(duì)應(yīng)一個(gè)OSD(類似于Ceph)4關(guān)鍵技術(shù):數(shù)據(jù)分布(數(shù)據(jù)路由)FusionStorage采用DHT算法 需要全局保存Partition disk 的映射表1)(LUN1,LBA)生產(chǎn)key2)通過key,通過計(jì)算hash值可得到 Partition3)通過查找全局的 partition 到disk 的路由表,可知具體的disk的值優(yōu)點(diǎn):1)保存partition到disk的映射表,可以實(shí)現(xiàn)負(fù)載均衡 2)保存的元數(shù)據(jù)比較少,可以支持

3、的規(guī)模比較大。缺點(diǎn):副本控制和分布的粒度是pool級(jí)別,volume級(jí)別的數(shù)據(jù)分布和副本的控制比較難。5關(guān)鍵技術(shù):Cache機(jī)制 Write Cache SSD cache,直接寫SSD返回 數(shù)據(jù)定期從SSD批量刷回HDD磁盤 Read Cache: 內(nèi)存 SSD read cache HDD 磁盤Cache沒有啥特別的。關(guān)鍵看cache緩存算法的實(shí)現(xiàn)優(yōu)劣。6關(guān)鍵技術(shù):讀寫IO流程讀操作: 直接讀Primary OSD寫操作:客戶端VBS發(fā)給Primary OSDPrimary OSD同時(shí)發(fā)送給本地磁盤和 Second OSD1) Primary OSD等待 Primary OSD 和 Sec

4、ond OSD的操作都完成,才向客戶端應(yīng)答。沒啥特別設(shè)計(jì),基本流程都一樣。7關(guān)鍵技術(shù):快照/克隆FusionStorage 采用 ROW 快照技術(shù) 優(yōu)點(diǎn)是寫操作性能幾乎不受損失 讀操作,特別是順序讀操作,會(huì)有影響?如果使用DHT技術(shù),ROW快照的機(jī)制具體如何實(shí)現(xiàn)? Ceph的機(jī)制? 快照的信息記錄在每個(gè)對(duì)象的屬性上 Sheepdog的機(jī)制?的機(jī)制? 快照的信息記錄在整個(gè)快照的信息記錄在整個(gè)volume的屬性上的屬性上Consistent Group 不支持? 快照的實(shí)現(xiàn),應(yīng)該是基于sheepdog的原理實(shí)現(xiàn)。ROW機(jī)制的快照還是挺不錯(cuò)的。8關(guān)鍵技術(shù):數(shù)據(jù)一致性協(xié)議/掉電保護(hù) 每個(gè)IO有編號(hào)(通

5、過編號(hào),實(shí)現(xiàn)順序處理) 主OSD和備OSD所接收到的IO編號(hào)處理順序完全一致。 ordered request 實(shí)現(xiàn)(類似Ceph的pg log, 性能是瓶頸嗎?) FusitonStorage的保電介質(zhì) NVDIM & PCIe SSD 所有的元數(shù)據(jù) + 數(shù)據(jù)都緩存在 保電介質(zhì)中,系統(tǒng)掉電重啟后replay類似ceph,NVDIM或者PCIe SSD 做日志(包括元數(shù)據(jù)和數(shù)據(jù))9關(guān)鍵技術(shù):平滑擴(kuò)容 DHT 技術(shù)比較容易的支持 Reblance/Rebuild 時(shí)的所占資源的控制 (沒有提到) 在恢復(fù)速度和不影響前端性能之間平衡10關(guān)鍵技術(shù):災(zāi)備 基于volume的同步復(fù)制 同城雙活 基于故障域?qū)崿F(xiàn)的雙活。但是難以實(shí)現(xiàn)基于volume的同步復(fù)制 基于volume的異步復(fù)制 異地復(fù)制 基于快照實(shí)現(xiàn)的全量和增量備份 可基于Volume的實(shí)現(xiàn)11其它功能 分布式緩存 有必要嗎? 如果負(fù)載均衡 針對(duì)熱點(diǎn)?讀熱點(diǎn)緩存在cache中,寫熱點(diǎn)也沒法分布式啊? 支持InifiniBand高速網(wǎng)絡(luò) Data Scrub 定時(shí)檢測(cè)存儲(chǔ)數(shù)據(jù) 提前預(yù)防數(shù)據(jù)錯(cuò)誤 硬盤可靠性 壞塊標(biāo)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論