企業(yè)備份系統(tǒng)運(yùn)維管理的關(guān)鍵問(wèn)題_第1頁(yè)
企業(yè)備份系統(tǒng)運(yùn)維管理的關(guān)鍵問(wèn)題_第2頁(yè)
企業(yè)備份系統(tǒng)運(yùn)維管理的關(guān)鍵問(wèn)題_第3頁(yè)
企業(yè)備份系統(tǒng)運(yùn)維管理的關(guān)鍵問(wèn)題_第4頁(yè)
企業(yè)備份系統(tǒng)運(yùn)維管理的關(guān)鍵問(wèn)題_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

企業(yè)備份系統(tǒng)運(yùn)維管理的關(guān)鍵問(wèn)題

對(duì)于每一個(gè)企業(yè)來(lái)講,數(shù)據(jù)備份恢復(fù)是企業(yè)IT運(yùn)維當(dāng)中非

常重要的一部分。如何保障必要的數(shù)據(jù)在必要的時(shí)間完成必要模式

的備份,并且能在需要的時(shí)刻將正確的數(shù)據(jù)在正確的位置恢復(fù),這

是數(shù)據(jù)備份恢復(fù)運(yùn)維工作必然的考核指標(biāo)。本文通過(guò)大量的運(yùn)維實(shí)

踐總結(jié)出備份系統(tǒng)運(yùn)維工作當(dāng)中遇到的一些關(guān)鍵問(wèn)題,并且按照實(shí)

際解決方案提煉解決思路。

1.如何解決平衡數(shù)據(jù)庫(kù)歸檔頻度和數(shù)據(jù)恢復(fù)完整性

1.1數(shù)據(jù)庫(kù)恢復(fù)的基本原理

對(duì)于數(shù)據(jù)庫(kù)的恢復(fù)來(lái)說(shuō)有很多種,我們只討論需要介質(zhì)恢復(fù)的情況。在

這種場(chǎng)合下,首先我們需要找到一個(gè)最近時(shí)刻點(diǎn)的全量備份進(jìn)行恢復(fù);然后

需要從備份介質(zhì)上找到這個(gè)時(shí)刻點(diǎn)之后的重做日志進(jìn)行數(shù)據(jù)追平,最后我

們需要找到本地沒(méi)有丟失的重做日志進(jìn)行再次追平直到?jīng)]有可用日志。如

如圖所示,在時(shí)刻A,我們開(kāi)始做在線(xiàn)全庫(kù)備份,在B時(shí)刻全庫(kù)備

份結(jié)束。當(dāng)數(shù)據(jù)庫(kù)運(yùn)行到E時(shí)刻之后數(shù)據(jù)庫(kù)發(fā)生了重大介質(zhì)故障,只能通

過(guò)介質(zhì)恢復(fù)。那么在A~C時(shí)間段內(nèi),大部分REDO日志文件都已經(jīng)歸檔到

備份介質(zhì)池當(dāng)中,服務(wù)器本地存儲(chǔ)目錄當(dāng)中只剩下CE(小于一個(gè)歸檔備

份時(shí)間間隔)的歸檔日志和沒(méi)有來(lái)得及歸檔的REDO日志文件。假設(shè)發(fā)生

的故障嚴(yán)重到服務(wù)器本地存儲(chǔ)目錄也無(wú)法恢復(fù)的時(shí)候,那么相當(dāng)于在C-E

這段時(shí)間產(chǎn)生的重做日志就丟失掉了。相當(dāng)在這種極端場(chǎng)合下,數(shù)據(jù)丟失的

最大窗口就是一個(gè)歸檔間隔時(shí)間段。當(dāng)然如果把這個(gè)間隔設(shè)置的足夠小的

話(huà),那么另外的問(wèn)題就產(chǎn)生了,備份作業(yè)隨著系統(tǒng)增加會(huì)呈爆發(fā)式并發(fā)啟動(dòng)

狀態(tài),最終會(huì)影響到整個(gè)備份系統(tǒng)的健康運(yùn)行導(dǎo)致歸檔無(wú)法及時(shí)轉(zhuǎn)儲(chǔ),最終

還是可能會(huì)導(dǎo)致數(shù)據(jù)庫(kù)的宕機(jī)。這就是一個(gè)矛盾,需要我們?nèi)ズ芎玫钠胶狻?/p>

1.2平衡數(shù)據(jù)庫(kù)歸檔頻率的方法

數(shù)據(jù)庫(kù)歸檔備份的頻率是指一天24小時(shí)內(nèi)間隔多長(zhǎng)時(shí)間進(jìn)行一次歸

檔日志的備份,一方面是要保障增量數(shù)據(jù)備份的完整性,另外一方面是要避

免因?yàn)榛謴?fù)空間不足導(dǎo)致數(shù)據(jù)庫(kù)的宕機(jī)時(shí)間。要平衡這個(gè)頻率窗口需要采

集以下幾類(lèi)數(shù)據(jù):

1)單位時(shí)間內(nèi)不同數(shù)據(jù)庫(kù)系統(tǒng)平均的歸檔日志量。

采集這個(gè)數(shù)據(jù)的目的在于詳細(xì)分析不同業(yè)務(wù)系統(tǒng)在不同時(shí)間段的寫(xiě)操

作頻繁程度。對(duì)于日志歸檔速度較快的系統(tǒng),我們需要提高其恢復(fù)區(qū)的空間

大小,同時(shí)加快歸檔備份的頻率,使得數(shù)據(jù)庫(kù)既能處于安全運(yùn)行狀態(tài)又能保

障極端故障場(chǎng)合下數(shù)據(jù)丟失的量在較小范圍之內(nèi)。

2)業(yè)務(wù)系統(tǒng)類(lèi)型。

所謂業(yè)務(wù)系統(tǒng)類(lèi)型即OLTP或者是OLAP,因?yàn)閷?duì)于OLAP來(lái)講,每

次的讀寫(xiě)操作都會(huì)是批量的執(zhí)行,它的歸檔速度是正常OLAP系統(tǒng)的幾十

倍甚至上百倍。最麻煩的是兩者皆有的業(yè)務(wù)系統(tǒng),比如說(shuō)銀行業(yè)中的交易系

統(tǒng),白天跑聯(lián)機(jī)交易,晚上跑核算批量,白天和晚上的日志歸檔速度有著巨

大的反差。那么我們就需要在批量作業(yè)時(shí)間段內(nèi)將備份頻率調(diào)快,將恢復(fù)區(qū)

空間設(shè)置提高。

3)備份系統(tǒng)可以容忍的最大并發(fā)量。

備份系統(tǒng)可以容忍的最大并發(fā)Jobs,不僅僅取決于備份軟件系統(tǒng)可

以并發(fā)調(diào)度的作業(yè)數(shù)目和備份作業(yè)服務(wù)器的數(shù)目,還要取決于備份介質(zhì)池

可以容忍的資源消耗限制。及時(shí)我們可以同時(shí)調(diào)度幾百個(gè)作業(yè),但是當(dāng)幾十

個(gè)作業(yè)同時(shí)寫(xiě)入備份介質(zhì)池時(shí)就會(huì)把備份介質(zhì)池的計(jì)算資源或者是10資

源使用殆盡。那么最終整個(gè)備份系統(tǒng)的并發(fā)數(shù)取決于短板因素。

4)不同數(shù)據(jù)庫(kù)系統(tǒng)恢復(fù)區(qū)能夠支撐最小時(shí)間窗口。

這個(gè)最小時(shí)間窗口是我們用數(shù)據(jù)庫(kù)的恢復(fù)區(qū)可用空間大小/單位時(shí)

間內(nèi)的最大歸檔速度來(lái)估算出來(lái)的時(shí)間窗口。因?yàn)槲覀冊(cè)诎惭b數(shù)據(jù)庫(kù)或者

是做變更的時(shí)候不可能按照每一個(gè)系統(tǒng)的特點(diǎn)詳細(xì)計(jì)算出其日志存儲(chǔ)空間

的大小,只能按照有限的幾個(gè)規(guī)格來(lái)做初始規(guī)劃。

有了以上數(shù)據(jù)之后,我們需要根據(jù)以下幾個(gè)原則來(lái)詳細(xì)設(shè)計(jì)我們的歸

檔作業(yè)頻率。

首先,根據(jù)4當(dāng)中采集到的數(shù)據(jù),將時(shí)間窗口較小的幾個(gè)系統(tǒng)進(jìn)行存

儲(chǔ)空間調(diào)整,使其日志存儲(chǔ)空間能夠滿(mǎn)足我們期望的最小時(shí)間標(biāo)準(zhǔn)。

然后,將一天24小時(shí)定義為幾個(gè)時(shí)間段,批量業(yè)務(wù)集中的時(shí)間段、

聯(lián)機(jī)業(yè)務(wù)集中的時(shí)間段、特殊任務(wù)集中的時(shí)間段等。當(dāng)然這個(gè)定義主要是根

據(jù)1&2中采集到的詳細(xì)數(shù)據(jù)來(lái)定義的。

接著,我們需要根據(jù)1中數(shù)據(jù)估算出一個(gè)歸檔作業(yè)大概持續(xù)的時(shí)間長(zhǎng)

度。為保障每一個(gè)時(shí)刻點(diǎn)的并發(fā)執(zhí)行備份作業(yè)數(shù)目遠(yuǎn)小于3中估算出來(lái)的

數(shù)據(jù)。

最后,需要把備份作業(yè)的頻度根據(jù)不同的時(shí)間段特點(diǎn)調(diào)整到以上條件

都滿(mǎn)足的狀態(tài),并在此前提條件下可以為了保障極端情況下的數(shù)據(jù)完整性

而適當(dāng)調(diào)快歸檔作業(yè)的備份頻率。下圖是一個(gè)根據(jù)以上采集數(shù)據(jù)進(jìn)行多維

分析的實(shí)例,僅僅是一個(gè)方法示意,歸檔頻率根據(jù)數(shù)據(jù)重要性分級(jí)、歸檔速

度、業(yè)務(wù)時(shí)間段分類(lèi)等前提進(jìn)行的粗略分析,最下面的一行數(shù)字表示每一個(gè)

時(shí)刻點(diǎn)并發(fā)的歸檔備份數(shù)目,其目標(biāo)在于平衡每一個(gè)時(shí)間間隔內(nèi)的平均備

份作業(yè)數(shù)。實(shí)際情況會(huì)比以下情況復(fù)雜很多,我們可以將時(shí)間間隔劃分的更

小,涉及的因素更多,分析的更加細(xì)致。

圖2數(shù)據(jù)庫(kù)歸檔頻率規(guī)劃分析案例

2.如何評(píng)估數(shù)據(jù)庫(kù)全量備份的策略

數(shù)據(jù)庫(kù)的全量備份來(lái)講,隨著數(shù)據(jù)量的不斷增加,其冬份作業(yè)耗費(fèi)的時(shí)

間也就會(huì)越長(zhǎng),耗費(fèi)的數(shù)據(jù)庫(kù)資源也越多,對(duì)在線(xiàn)業(yè)務(wù)的影響也就越大。另

外同一個(gè)時(shí)間段內(nèi)發(fā)起的全量備份越多,那么其占用的備份系統(tǒng)整體資源

(備份服務(wù)器、備份介質(zhì)池、鏈路帶寬等)也就會(huì)越多,其影響范圍也會(huì)越

廣。

首先,這個(gè)問(wèn)題是一個(gè)需要不斷優(yōu)化的問(wèn)題。對(duì)于每一個(gè)應(yīng)用系統(tǒng)來(lái)講,

根據(jù)業(yè)務(wù)服務(wù)的特點(diǎn),其備份的時(shí)間窗口也是不同的。可能初期備份作業(yè)能

夠在備份窗口內(nèi)完成,但是隨著數(shù)據(jù)量的增長(zhǎng),后期的備份作業(yè)就會(huì)超過(guò)備

份時(shí)間窗口。所以我們需要定期監(jiān)控?cái)?shù)據(jù)庫(kù)的全量備份作業(yè)時(shí)間,在事件窗

口范圍內(nèi)盡量通過(guò)調(diào)整合適的調(diào)度時(shí)間來(lái)完成全量備份。但是當(dāng)數(shù)據(jù)量增

長(zhǎng)到完全沒(méi)辦法在備份窗口完成的時(shí)候,那么我們就需要進(jìn)行調(diào)整全量備

份的頻度和具體調(diào)度時(shí)間點(diǎn)了。

其次,這個(gè)問(wèn)題是一個(gè)跟業(yè)務(wù)特點(diǎn)密切相關(guān)的的問(wèn)題。有些人喜歡把所

有的業(yè)務(wù)系統(tǒng)都按照一個(gè)標(biāo)準(zhǔn)去定義其數(shù)據(jù)庫(kù)全量備份的策略。比如說(shuō)TB

以下的數(shù)據(jù)庫(kù),每天一次全量備份;比如說(shuō)業(yè)務(wù)等級(jí)屬于重要的系統(tǒng),每天

一次全量備份;比如說(shuō)只要能備份的系統(tǒng),全部進(jìn)行每天一次的全量備份等

等策略。這些都是不科學(xué)的策略。應(yīng)該從業(yè)務(wù)系統(tǒng)的數(shù)據(jù)重要性去評(píng)估數(shù)據(jù)

庫(kù)全量備分的頻率,在現(xiàn)有備份系統(tǒng)有限的處理能力內(nèi)保障數(shù)據(jù)重要性高

的系統(tǒng)完成相應(yīng)的全量備份。

最后,這個(gè)問(wèn)題是一個(gè)需要從各個(gè)方面著手去解決的問(wèn)題。從備份網(wǎng)絡(luò)

的帶寬和隔離性考慮,應(yīng)該用單獨(dú)的告訴備份網(wǎng)絡(luò),備份客戶(hù)端應(yīng)該設(shè)置區(qū)

分于業(yè)務(wù)的單獨(dú)網(wǎng)絡(luò)通道及配置。從備份作業(yè)服務(wù)器的配置層面,我們應(yīng)該

配置相對(duì)合理的資源(內(nèi)存、磁盤(pán))來(lái)保障備份片在作業(yè)服務(wù)器層沒(méi)有瓶頸。

從備份介質(zhì)池層面,我們需要保障備份介質(zhì)的10處理能力不能成為備份

作業(yè)底端的性能瓶頸。

3.如何解決備份作業(yè)分布合理性問(wèn)題

其實(shí)這個(gè)問(wèn)題很簡(jiǎn)單,目的就是要保障備份時(shí)間窗口內(nèi)調(diào)度起來(lái)以及

運(yùn)行過(guò)程中的備份作業(yè)處于一種平衡狀態(tài),不能使其作業(yè)調(diào)用或者是并發(fā)

運(yùn)行過(guò)于集中。但是當(dāng)系統(tǒng)數(shù)目非常多,系統(tǒng)特點(diǎn)復(fù)雜,數(shù)據(jù)重要性級(jí)別有

很多種,數(shù)據(jù)量以及數(shù)據(jù)增速各不相同時(shí),這個(gè)問(wèn)題就變得比較復(fù)雜。我們

很難有一種精確的計(jì)算方法來(lái)實(shí)現(xiàn)其做到絕對(duì),但是我們可以根據(jù)以下的

方法進(jìn)行定性的分析和調(diào)整。

假設(shè)我們定義一個(gè)系統(tǒng)的備份作業(yè)在備份體系當(dāng)中必須具備的屬性為:

P1-應(yīng)用系統(tǒng)數(shù)據(jù)的重要性級(jí)別屬性,可以通過(guò)業(yè)務(wù)分析劃分為有限

的幾個(gè)級(jí)別。

P2-應(yīng)用系統(tǒng)在不同時(shí)間段內(nèi)的數(shù)據(jù)增量屬性,需要通過(guò)梳理歷史數(shù)

據(jù)來(lái)評(píng)估。

P3-應(yīng)用系統(tǒng)當(dāng)前的備份作業(yè)的時(shí)間長(zhǎng)度屬性,需要通過(guò)歷史數(shù)據(jù)結(jié)

合數(shù)據(jù)量來(lái)評(píng)估。

P4-應(yīng)用系統(tǒng)是否是具備雙重業(yè)務(wù)特性,比如兼?zhèn)渑亢吐?lián)機(jī)業(yè)務(wù)特

性。

通過(guò)以上幾個(gè)屬性的加權(quán)計(jì)算或者其他方法的定性分析,計(jì)算出每一

個(gè)系統(tǒng)的不同備份作業(yè)的定性矢量,然后我們可以將這些矢量根據(jù)其具體

備份窗口設(shè)置初始的調(diào)度時(shí)間點(diǎn),然后分析其具體分布圖是否均衡穩(wěn)定并

且進(jìn)行微調(diào)。例如下圖是一個(gè)粗略的分析實(shí)例,可以提供相關(guān)的參考思路:

ZAfiJlZM0

5翕--二-

ASI二I三三1-8-2§

<11■,37?、??-■-二um

<G)tt二二三-?--林,林W*.

IL1

VmoSHBDDDDDOI1111II

10Iaoo

y62000

?31

741930

$8■■2145

331奇8

1S640S0

JS1110

144iyo

141■onn■1VO

4」210

SJ4SO

一510

1110■■■■■0X)

?“04□QB■22SO

?17a-2230

)471720

?16.4八g

??“40

.14?!1!300

?34511188

r,■

£_!011,10

24111300

1311■3IS

UH:■J>0

&2021SO

241?14IS

£so218

1181,,000

21?218

優(yōu)化目標(biāo)。0223333J22222222322222122232222123333:232211111

圖3備份作業(yè)分布定性分析案例

以上案例僅僅是一個(gè)相對(duì)粗略的分析方式,僅僅是一個(gè)基于某一特定

案例的分析思路。我們可以根據(jù)業(yè)務(wù)系統(tǒng)特點(diǎn)結(jié)合更好的專(zhuān)業(yè)工具進(jìn)行更

加細(xì)節(jié)的分析

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論