LINUX環(huán)境下基于網(wǎng)絡(luò)存儲(chǔ)技術(shù)的操作系統(tǒng)遠(yuǎn)程備份恢復(fù)研究_第1頁(yè)
LINUX環(huán)境下基于網(wǎng)絡(luò)存儲(chǔ)技術(shù)的操作系統(tǒng)遠(yuǎn)程備份恢復(fù)研究_第2頁(yè)
LINUX環(huán)境下基于網(wǎng)絡(luò)存儲(chǔ)技術(shù)的操作系統(tǒng)遠(yuǎn)程備份恢復(fù)研究_第3頁(yè)
LINUX環(huán)境下基于網(wǎng)絡(luò)存儲(chǔ)技術(shù)的操作系統(tǒng)遠(yuǎn)程備份恢復(fù)研究_第4頁(yè)
LINUX環(huán)境下基于網(wǎng)絡(luò)存儲(chǔ)技術(shù)的操作系統(tǒng)遠(yuǎn)程備份恢復(fù)研究_第5頁(yè)
已閱讀5頁(yè),還剩81頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、V S6B823南開(kāi)大學(xué)碩士研究生畢業(yè)學(xué)位論文Linux環(huán)境下基于網(wǎng)絡(luò)存儲(chǔ)技術(shù)的 操作系統(tǒng)遠(yuǎn)程備份恢復(fù)研究姓 名:肖飛研究方向:智能自動(dòng)化與網(wǎng)絡(luò)通信 專(zhuān) 業(yè):控制理論與控制工程 導(dǎo) 師:陳增強(qiáng)教授南開(kāi)大學(xué)信息技術(shù)科學(xué)學(xué)院自動(dòng)化系二零零六年五月網(wǎng)絡(luò)存儲(chǔ)技術(shù)的飛速發(fā)展,為各種應(yīng)用提供了廉價(jià)安全的網(wǎng)絡(luò)存儲(chǔ)空間。操 作系統(tǒng)作為管理服務(wù)器信息和終端系統(tǒng)信息的必備單元,其中也包含有大量重要 的配置及日志信息。利用網(wǎng)絡(luò)存儲(chǔ)技術(shù)建立操作系統(tǒng)的遠(yuǎn)程備份恢復(fù)方案不僅有 利于服務(wù)器系統(tǒng)的災(zāi)后重建,也可以減少終端操作系統(tǒng)損壞帶來(lái)的損失。Linux是當(dāng)前應(yīng)用最廣泛的類(lèi)UNIX操作系統(tǒng),它具有高效、穩(wěn)定的優(yōu)點(diǎn), 并且對(duì)硬

2、件支持較好,非常適合服務(wù)器領(lǐng)域的應(yīng)用。而JFS、XFS等大型日志文 件系統(tǒng)是服務(wù)器系統(tǒng)安裝時(shí)的首選文件系統(tǒng)。在這個(gè)背景下,本文以Linux平臺(tái) 及開(kāi)源代碼資源為基礎(chǔ),研究文件系統(tǒng)備份恢復(fù)技術(shù),并利用成熟的網(wǎng)絡(luò)存儲(chǔ)技 術(shù)構(gòu)建了這兩種模式的操作系統(tǒng)遠(yuǎn)程備份恢復(fù)方案,其中:實(shí)現(xiàn)了一個(gè)基于Linux操作系統(tǒng),具有跨域工作能力的NAS服務(wù)器。 對(duì)Unh iSCSI Target端驅(qū)動(dòng)程序與LVM聯(lián)合使用時(shí)產(chǎn)生的錯(cuò)誤進(jìn)行處理,并完善了相關(guān)功能。 開(kāi)發(fā)了 JFS/XFS文件系統(tǒng)備份和恢復(fù)軟件。 處理了非正常狀態(tài)的JFS/XFS文件系統(tǒng)的備份和恢復(fù)。 本論文首先將介紹有關(guān)網(wǎng)絡(luò)存儲(chǔ)、文件系統(tǒng)的背景知識(shí);然后詳細(xì)

3、介紹了各 種網(wǎng)絡(luò)存儲(chǔ)技術(shù);最后,將NAS技術(shù)、iSCSI技術(shù)及文件系統(tǒng)備份和恢復(fù)技術(shù)綜 合起來(lái)搭建了操作系統(tǒng)遠(yuǎn)程備份恢復(fù)平臺(tái)。 本文的創(chuàng)新性在于:提出了一個(gè)基于Linux系統(tǒng)的,可工作在Windows和NIS混合域中的NAS 服務(wù)器,能完成各種域用戶(hù)的安全認(rèn)證,并且支持即插即用的功能,為操作系統(tǒng) 備份鏡像的局域網(wǎng)存儲(chǔ)提供了良好的網(wǎng)絡(luò)環(huán)境。將UNH的iSCSItarget與LVM管理工具結(jié)合起來(lái),改正了該程序在對(duì)外 提供LVM邏輯卷時(shí)出現(xiàn)的各種錯(cuò)誤,為操作系統(tǒng)的遠(yuǎn)程運(yùn)行時(shí)備份提供良好的數(shù) 據(jù)傳輸服務(wù)。通過(guò)移植Linux內(nèi)核中JFS/XFS的支持代碼,實(shí)現(xiàn)一套不依賴(lài)于操作系 統(tǒng)文件系統(tǒng)支持的,文件

4、系統(tǒng)備份恢復(fù)軟件。通過(guò)進(jìn)一步研究操作系統(tǒng)備份恢復(fù)中可能遇到的文件系統(tǒng)不一致現(xiàn)象, 綜合分析文件系統(tǒng)日志功能,建立了在文件系統(tǒng)不一致的情況下完成文件系統(tǒng)正 確備份的方案。關(guān)鍵詞:Linux操作系統(tǒng)網(wǎng)絡(luò)存儲(chǔ)技術(shù)iSCSI文件系統(tǒng)備份恢復(fù)JFS文件系統(tǒng)XFS 文件系統(tǒng)AbstractThe rapid growth of network storage technologies, gives all kinds of application a safe and inexpensive storage space. The Operation System (OS) which manages th

5、e system information of the server and the terminal has a lot of configuration and log information. Using the network storage technologies implement a platform to backup and restore the Operation System remotely, which not only can help the rebuilding of the server system, but also can reduce the lo

6、st of cause by the damage of the terminal system.As a UNIX-like operating system, Linux operating system works with high efficiency and outstanding stability, and supports most popular hardware, so it has been used widely, especially on network server area. JFS, XFS etc. are the most popular file sy

7、stem used by servers. This thesis research the file system backup and restore by using the Linux open source code, and two model of Operation System remote backup and restore are designed, by using the network storage technologies:Developed a NAS server using the Linux OS, which can work in a mixed

8、domain.Deal with the bugs appeared in UNH iSCSI drivers when it works with LVM, and improved some correlated functions.Developed the JFS/XFS backup and restore system.Solve the backup and restore problem of JFS/XFS when they are in a incoherent mode.After the brief background introduction of network

9、 storage and file system, this thesis elaborates all kinds of network storage technology. At last, with the NAS, iSCSI and file system backup and restore technology, a platform is build witch can implement the remote backup restore of the Operation System. The new idea of this thesis:(1) Design and

10、implement a NAS server based on Linux operating system. This NAS server can work properly under mixed domains, and also support plug and play features. It can well store the images that build by the backup and restore system.Use the UNH iSCSI target with the LVM tools, and correct the bugs that appe

11、ared when share the LVM logical volume with in target. This can help the remotely backup and restore system send the data through the network.With the porting of Linux kernel code that implement the JFS/XFS, design a file system backup and restore software, which can work without the support of the

12、Operation Systerm.After research the incoherent mode of the JFS/XFS that will occur in the backup and restore process, and the journal of the file system, design a plan that can help the system backup and restore that kind of file system correctly.Key Words: Linux Operation System Network Storage Te

13、chnology Internet SCSl(iSCSl) File System Backup Restore JFS XFS第一章緒論第一章緒論隨著計(jì)算機(jī)信息技術(shù)的飛速發(fā)展,人們對(duì)計(jì)算機(jī)的依賴(lài)也越來(lái)越大。不僅需 要利用計(jì)算機(jī)的運(yùn)算功能完成復(fù)雜的計(jì)算任務(wù),更多的是利用計(jì)算機(jī)存儲(chǔ)和管理 各種各樣數(shù)字化了的信息。本地存儲(chǔ)資源,在大量關(guān)鍵數(shù)據(jù)的存儲(chǔ)方面,無(wú)法全面滿(mǎn)足用戶(hù)在存儲(chǔ)量和存儲(chǔ)的安全性上的需求。網(wǎng)絡(luò)存儲(chǔ)技術(shù)11應(yīng)運(yùn)而生,專(zhuān)業(yè)化的異地存儲(chǔ)模式在提供大存儲(chǔ)空間的同時(shí),也保障了數(shù)據(jù)的安全性。操作系統(tǒng)在使用過(guò)程中保存了大量的軟件安裝配置信息和軟件使用的記錄 及曰志信息,這些信息對(duì)于存儲(chǔ)業(yè)務(wù)數(shù)據(jù)的用戶(hù)

14、而言當(dāng)然并不重要,他們關(guān)心的 是介質(zhì)中存儲(chǔ)的關(guān)鍵性業(yè)務(wù)信息,然而對(duì)于系統(tǒng)的使用和維護(hù)人員,這些信息則 相當(dāng)重要,在沒(méi)有備份信息的情況下,一個(gè)應(yīng)用服務(wù)器的恢復(fù)工作也許會(huì)花上好 幾個(gè)維護(hù)人員幾天的時(shí)間。即使是終端操作系統(tǒng)的重建也會(huì)花費(fèi)使用人員一到兩 個(gè)工作日的時(shí)間。由于實(shí)現(xiàn)自動(dòng)從操作系統(tǒng)中提取關(guān)鍵信息并進(jìn)行備份相當(dāng)困難,而手工提取 這些信息耗費(fèi)工作量太大,因此實(shí)現(xiàn)簡(jiǎn)單的備份操作系統(tǒng)全部信息,在存儲(chǔ)價(jià)格 曰益低廉的今天也是一個(gè)不錯(cuò)的解決方案。這樣雖然會(huì)花費(fèi)大量空間備份多余信 息,但是相對(duì)于復(fù)雜的系統(tǒng)重建工作,這樣的代價(jià)是值得的。網(wǎng)絡(luò)存儲(chǔ)技術(shù)的飛速發(fā)展為實(shí)現(xiàn)快速、安全、可靠的遠(yuǎn)程備份恢復(fù)系統(tǒng)提供 了各

15、種可行技術(shù)。本文從網(wǎng)絡(luò)存儲(chǔ)技術(shù)出發(fā),結(jié)合文件系統(tǒng)數(shù)據(jù)備份恢復(fù)方案的研究21及實(shí)現(xiàn),設(shè)計(jì)了操作系統(tǒng)遠(yuǎn)程備份恢復(fù)方案。一方面實(shí)現(xiàn)基于Linux操作系統(tǒng)的大型服務(wù)器的操作系統(tǒng)異地遠(yuǎn)程備份恢復(fù),為服務(wù)器的災(zāi)后重建提供方 便,節(jié)省服務(wù)器重建的時(shí)間及勞動(dòng)量,減少災(zāi)難帶來(lái)的經(jīng)濟(jì)損失;另一方面實(shí)現(xiàn) 終端PC機(jī)Linux操作系統(tǒng)的網(wǎng)絡(luò)備份恢復(fù),為局域網(wǎng)用戶(hù)提供方便快捷的操作 系統(tǒng)備份恢復(fù)方案,減少工作中由于錯(cuò)誤操作、病毒等帶來(lái)的經(jīng)濟(jì)損失。第一節(jié)操作系統(tǒng)備份恢復(fù)操作系統(tǒng)(Operating System,簡(jiǎn)稱(chēng)OS)是指負(fù)責(zé)對(duì)計(jì)算機(jī)硬件直接控制及管理的系統(tǒng)軟件。操作系統(tǒng)的功能一般包括處理器管理、存儲(chǔ)管理、文件管理、

16、 設(shè)備管理和作業(yè)管理等。當(dāng)多個(gè)程序同時(shí)運(yùn)行時(shí),操作系統(tǒng)負(fù)責(zé)規(guī)劃進(jìn)程以?xún)?yōu)化 每個(gè)程序的處理時(shí)間。小型嵌入式操作系統(tǒng),存儲(chǔ)ROM或Flash中,對(duì)于PC或大型服務(wù)器,操作系統(tǒng)都存儲(chǔ)在硬盤(pán)或硬盤(pán)陣列上。不論使用何種存儲(chǔ)介質(zhì), 操作系統(tǒng)的存儲(chǔ)都必須用到某種文件系統(tǒng),實(shí)現(xiàn)操作系統(tǒng)文件的管理。我們開(kāi)發(fā)的不依賴(lài)于操作系統(tǒng)文件系統(tǒng)支持的數(shù)據(jù)備份和恢復(fù)軟件,是實(shí)現(xiàn) 操作系統(tǒng)遠(yuǎn)程備份恢復(fù)的基本技術(shù)。該軟件在完成文件系統(tǒng)備份恢復(fù)的同時(shí)實(shí)現(xiàn) 了操作系統(tǒng)內(nèi)核鏡像文件物理位置讀取,保證了在恢復(fù)后的存儲(chǔ)介質(zhì)上操作系統(tǒng) 能正常啟動(dòng),對(duì)于日志信息的處理,在保證文件系統(tǒng)完整性的同時(shí),不丟失操作 系統(tǒng)運(yùn)行相關(guān)的任何有用數(shù)據(jù)。以此備

17、份恢復(fù)技術(shù)為基礎(chǔ),配合邏輯卷管理器(Logic Volume Manager,LVM)13的快照功能就實(shí)現(xiàn)了操作系統(tǒng)的運(yùn)行時(shí)備份而不必?fù)?dān)心數(shù)據(jù)備份期間操作系統(tǒng)運(yùn)行帶來(lái)的數(shù)據(jù)更新。為實(shí)現(xiàn)操作系統(tǒng)的遠(yuǎn)程備份與恢復(fù),必須利用某種成熟的網(wǎng)絡(luò)存儲(chǔ)技術(shù),實(shí) 現(xiàn)備份恢復(fù)信息的遠(yuǎn)程傳輸。由于操作系統(tǒng)備份和恢復(fù)需要直接讀寫(xiě)存儲(chǔ)介質(zhì),iSCSI技術(shù)14以其獨(dú)特性質(zhì)成為實(shí)現(xiàn)操作系統(tǒng)遠(yuǎn)程備份恢復(fù)的首選網(wǎng)絡(luò)存儲(chǔ)技第二節(jié)網(wǎng)絡(luò)存儲(chǔ)技術(shù)網(wǎng)絡(luò)存儲(chǔ)技術(shù)利用傳統(tǒng)的存儲(chǔ)設(shè)備和網(wǎng)絡(luò)設(shè)備實(shí)現(xiàn)網(wǎng)絡(luò)存儲(chǔ)功能,構(gòu)造出能 夠直接被網(wǎng)絡(luò)訪問(wèn)的網(wǎng)絡(luò)存儲(chǔ)設(shè)備。在這種新型的存儲(chǔ)結(jié)構(gòu)中,存儲(chǔ)系統(tǒng)不再通 過(guò)I/O總線附屬于某個(gè)特定的服務(wù)器或客戶(hù)機(jī),而是通過(guò)

18、網(wǎng)絡(luò)接口與網(wǎng)絡(luò)相連,由用戶(hù)通過(guò)網(wǎng)絡(luò)訪問(wèn)。目前常見(jiàn)的網(wǎng)絡(luò)存儲(chǔ)技術(shù)主要有NAS,3鄉(xiāng)|5】和18081。 NASNAS(Network Attached Storage,網(wǎng)絡(luò)附加存儲(chǔ)),是一種將分布、獨(dú)立的數(shù)據(jù) 整合為大型、集中化管理的數(shù)據(jù)中心,以便于不同主機(jī)和應(yīng)用服務(wù)器進(jìn)行訪問(wèn)的 技術(shù)。NAS是一種特殊的專(zhuān)用數(shù)據(jù)存儲(chǔ)服務(wù)器,包括存儲(chǔ)器件(例如磁盤(pán)陣列、 CD/DVD驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器或可移動(dòng)的存儲(chǔ)介質(zhì))和內(nèi)嵌系統(tǒng)軟件,可提供跨 平臺(tái)文件共享功能。NAS通常在一個(gè)LAN上占有自己的節(jié)點(diǎn),無(wú)需應(yīng)用服務(wù)器的千預(yù),允許用 戶(hù)在網(wǎng)絡(luò)上存取數(shù)據(jù),在這種配置中,NAS集中管理和處理網(wǎng)絡(luò)上的所有數(shù)據(jù), 將負(fù)載從

19、應(yīng)用或企業(yè)服務(wù)器上卸載下來(lái),有效降低總成本,保護(hù)用戶(hù)投資。 NAS本身能夠支持多種協(xié)議(如NFS、CIFS、SAMBA, FTP、 等), 而且能夠支持各種操作系統(tǒng)。通過(guò)任何一臺(tái)工作站,采用E或Netscape 瀏覽器就可以對(duì)NAS設(shè)備進(jìn)行直觀方便的管理。NAS是真正即插即用 的產(chǎn)品,并且物理位置靈活,可放置在工作組內(nèi),也可放在混合環(huán)境中,如混合了 UNIX/Windows NT局域網(wǎng)的環(huán)境中,而無(wú)需對(duì)網(wǎng)絡(luò)環(huán)境進(jìn)行 任何的修改- NAS產(chǎn)品直接通過(guò)網(wǎng)絡(luò)接口連接到網(wǎng)絡(luò)上,只需簡(jiǎn)單地配 置一下IP地進(jìn),就可以被網(wǎng)絡(luò)上的用戶(hù)所共享。SANSAN(Storage Area Network,存儲(chǔ)區(qū)域網(wǎng))

20、是一種將磁盤(pán)陣列、磁帶等存儲(chǔ)設(shè)備與服務(wù)器連接起來(lái)的髙速專(zhuān)用子網(wǎng)。SAN以FC( Fiber Channel,光纖通道)為硬件基礎(chǔ),結(jié)合了 FC和LAN的優(yōu)點(diǎn),繞過(guò)了傳統(tǒng)網(wǎng)絡(luò)的瓶頸,使數(shù)據(jù)的遷 移性更好。典型的SAN通常由存儲(chǔ)設(shè)備(包括磁盤(pán)、磁盤(pán)陣列、磁帶和磁帶庫(kù))、 服務(wù)器、連接設(shè)備(包括銅纜、光纖、網(wǎng)橋、集線器、交換機(jī)和接口適配器等)、 存儲(chǔ)管理應(yīng)用軟件(涉及數(shù)據(jù)共享、網(wǎng)絡(luò)結(jié)構(gòu)、數(shù)據(jù)保護(hù)和數(shù)據(jù)備份、數(shù)據(jù)交換、 群集、數(shù)據(jù)保護(hù)和災(zāi)難恢復(fù)等)。與傳統(tǒng)服務(wù)器與磁盤(pán)陣列之間的主/從關(guān)系不同, FC-SAN上的所有設(shè)備均處于平等的地位,多臺(tái)服務(wù)器以及多個(gè)存儲(chǔ)器可以配置 在同一個(gè)SAN上,實(shí)現(xiàn)了在不同的

21、硬件和操作平臺(tái)之間異構(gòu)存儲(chǔ)設(shè)備和數(shù)據(jù)的 整合。iSCSIiSCSI即Internet SCSI,是一種基于IP網(wǎng)絡(luò)的數(shù)據(jù)塊級(jí)的數(shù)據(jù)傳送協(xié)議,它 能夠通過(guò)IP網(wǎng)絡(luò)傳輸包含SCSI命令和SCSI數(shù)據(jù)包的數(shù)據(jù)塊,從而實(shí)現(xiàn)存儲(chǔ) 設(shè)備的遠(yuǎn)程訪問(wèn)?;趇SCSI協(xié)議的SAN結(jié)合了 NAS和傳統(tǒng)光纖SAN的優(yōu)點(diǎn),利用了現(xiàn)有 的IP網(wǎng)絡(luò)實(shí)現(xiàn)塊級(jí)存儲(chǔ)。改變了 NAS設(shè)備中操作系統(tǒng)(包括文件系統(tǒng)和存儲(chǔ) 子系統(tǒng)緊耦合的關(guān)系,將操作系統(tǒng)和存儲(chǔ)子系統(tǒng)分開(kāi),其文件系統(tǒng)功能部分單獨(dú) 構(gòu)成一個(gè)Server用以保存元數(shù)據(jù)。其存儲(chǔ)子系統(tǒng)采用外置式的SAN結(jié)構(gòu)由 多個(gè)智能存儲(chǔ)設(shè)備構(gòu)成一個(gè)存儲(chǔ)池,每個(gè)存儲(chǔ)設(shè)備有獨(dú)立的IP核,支持SC

22、SI 驅(qū)動(dòng)。面向數(shù)據(jù)塊的訪問(wèn)更靠近磁盤(pán)陣列和操作系統(tǒng)的底層,消除了對(duì)文件操作 的延遲,確保了系統(tǒng)的高性能,適合于對(duì)延遲敏感的應(yīng)用程序和基于事務(wù)處理的 數(shù)據(jù)庫(kù)。第三節(jié)文件系統(tǒng)第-章緒論文件系統(tǒng)m是操作系統(tǒng)重要的組成部分,它是系統(tǒng)中的數(shù)據(jù)信息的管理和組 織形式。文件系統(tǒng)管理和組織保存在磁盤(pán)驅(qū)動(dòng)器上的數(shù)據(jù),實(shí)現(xiàn)了數(shù)據(jù)完整性,即 保證寫(xiě)入磁盤(pán)的數(shù)據(jù)和隨后讀出的內(nèi)容的一致性。除了保存以文件方式存儲(chǔ)的數(shù) 據(jù)以外,文件系統(tǒng)同樣存儲(chǔ)和管理關(guān)于文件和文件系統(tǒng)自身的一些重要信息。然而具體分析起來(lái),文件系統(tǒng)的含義又比較模糊。首先,文件含義就有狹義 與廣義之分。狹義地說(shuō),文件是指磁盤(pán)文件,進(jìn)而可以是有組織有次序地存儲(chǔ)

23、于 任何介質(zhì)(包括內(nèi)存)中的一組信息。廣義地講,Linux從開(kāi)始時(shí)就把外部設(shè)備 都當(dāng)成“文件”。從這個(gè)意義上講,凡是可以產(chǎn)生或消耗信息的都是文件。以在 網(wǎng)絡(luò)環(huán)境中中來(lái)收發(fā)報(bào)文的“套接口”機(jī)制來(lái)說(shuō),它就不代表存儲(chǔ)著的信息但 套接口的發(fā)送端“消耗”信息,而接收端則“產(chǎn)出”信息,所以把套接口看成文 件是合乎邏輯的。即使拋開(kāi)文件定義的模糊性不說(shuō),文件系統(tǒng)又進(jìn)一步有幾種不同的含義,要 根據(jù)上下文才能加以區(qū)分:指一種特定的文件格式。例如,我們說(shuō)Linux的文件系統(tǒng)是Ext2, MSDOS的文件系統(tǒng)是FAT16,而WindowsNT的文件系統(tǒng)是NTFS或Fat32就 是指這個(gè)意思。指按特定格式進(jìn)行了“格式化

24、”的塊存儲(chǔ)介質(zhì)。上我們說(shuō)“安裝”或 “拆卸” 一個(gè)文件系統(tǒng)時(shí)指的就是這個(gè)意思。指操作系統(tǒng)中(通常在內(nèi)核中)用來(lái)管理文件系統(tǒng)以及對(duì)文件進(jìn)行操 作的機(jī)制及其實(shí)現(xiàn)。文件系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)的儲(chǔ)存、檢索和操作。為了實(shí)現(xiàn)這一目的文件系統(tǒng)需要 保持一個(gè)內(nèi)在的數(shù)據(jù)結(jié)構(gòu)使得數(shù)據(jù)的有組織存儲(chǔ),并且便于訪問(wèn)。這一內(nèi)部的數(shù) 據(jù)結(jié)構(gòu)被稱(chēng)為元數(shù)據(jù)。就是這個(gè)元數(shù)據(jù)的結(jié)構(gòu)為文件系統(tǒng)提供了其特定的身份和 性能特征。通常,我們并不直接和文件系統(tǒng)的元數(shù)據(jù)打交道。而是一個(gè)特別的文件系統(tǒng) 驅(qū)動(dòng)程序?yàn)槲覀冏飨鄳?yīng)的工作。文件系統(tǒng)驅(qū)動(dòng)程序是專(zhuān)門(mén)用來(lái)操作復(fù)雜的元數(shù)據(jù) 的。然而,為了使得文件系統(tǒng)驅(qū)動(dòng)程序正常工作,有一個(gè)很重要的必要條件:它 需要在某種

25、合理的、一致的和沒(méi)有干擾的狀態(tài)下找到元數(shù)據(jù)。否則,文件系統(tǒng)驅(qū) 動(dòng)程序就不能理解和操作元數(shù)據(jù),那么也就不能存取文件了。文件系統(tǒng)檢査程序?qū)崿F(xiàn)對(duì)元數(shù)據(jù)的掃描從而保證元數(shù)據(jù)的一致性。當(dāng)操作系 統(tǒng)關(guān)閉時(shí),它仔細(xì)地把所有的緩沖區(qū)數(shù)據(jù)轉(zhuǎn)送到磁盤(pán),并確保文件系統(tǒng)被徹底卸 載,以保證系統(tǒng)再次啟動(dòng)時(shí)能夠使用。然而,意外是無(wú)法避免的,操作系統(tǒng)可能 沒(méi)有時(shí)間徹底卸載文件系統(tǒng),這就導(dǎo)致元數(shù)據(jù)在某種情況下會(huì)陷入困境。第一章緒論 為了彌補(bǔ)這種情況,文件系統(tǒng)檢查程序?qū)⒃谙到y(tǒng)啟動(dòng)時(shí)徹底的掃描并且全面 地檢查元數(shù)據(jù),修正這一過(guò)程中找到的任何錯(cuò)誤。一旦文件系統(tǒng)檢查程序完成這 樣的工作,文件系統(tǒng)就可以使用了。盡管意想不到的電源故障或

26、者系統(tǒng)掛起可能 造成最近修改的數(shù)據(jù)丟失,但是由于元數(shù)據(jù)現(xiàn)在是一致的,文件系統(tǒng)就可以被裝 載和投入使用了。為確保文件系統(tǒng)的一致性,使用文件系統(tǒng)檢査程序全面掃描文件系統(tǒng)以維護(hù) 全部的元數(shù)據(jù),是一項(xiàng)極為費(fèi)時(shí)的工作。通常至少要花上好幾分鐘才能完成。更 糟糕的是,文件系統(tǒng)越大,完成這個(gè)徹底的掃描所花費(fèi)的時(shí)間就越長(zhǎng)。更好的解 決方式是為文件系統(tǒng)添加日志。曰志文件系統(tǒng)通過(guò)增加一個(gè)叫做日志的新的數(shù)據(jù)結(jié)構(gòu)來(lái)解決系統(tǒng)檢查問(wèn)題。 這個(gè)日志是位于磁盤(pán)上的結(jié)構(gòu)。在對(duì)元數(shù)據(jù)做任何改變以前,文件系統(tǒng)驅(qū)動(dòng)程序 會(huì)向日志中寫(xiě)入一個(gè)條目,這個(gè)條目描述了它將要做些什么。然后,繼續(xù)修改元 數(shù)據(jù)。通過(guò)這種方法,日志文件系統(tǒng)就擁有了近期

27、元數(shù)據(jù)被修改的歷史記錄,當(dāng) 檢查到?jīng)]有徹底卸載的文件系統(tǒng)的一致性問(wèn)題時(shí),就可以使用這個(gè)記錄維護(hù)文件 系統(tǒng)的一致性了。JFS文件系統(tǒng)JFS8)由IBM公司開(kāi)發(fā),最初出現(xiàn)在AIX操作系統(tǒng)之上,它是一種基于日志的字節(jié)級(jí)、面向事務(wù)的高性能文件系統(tǒng)。它具有可伸縮性和健壯性,與非日志 文件系統(tǒng)相比,它的優(yōu)點(diǎn)是其快速重啟能力:JFS能夠在幾秒或幾分鐘內(nèi)就把文 件系統(tǒng)恢復(fù)到一致?tīng)顟B(tài)。JFS是完全64位的文件系統(tǒng)。所有JFS文件系統(tǒng)結(jié) 構(gòu)化字段都是64位大小。這允許JFS同時(shí)支持大文件和大分區(qū)。2000年2月,IBM宣布在一個(gè)開(kāi)放資源許可證下,移植Linux版的JFS文件 系統(tǒng)。JFS也是一個(gè)有大量用戶(hù)安裝使用

28、的企業(yè)級(jí)文件系統(tǒng)。使用日志文件系統(tǒng),性能上會(huì)稍有損失,因?yàn)榫S護(hù)一個(gè)日志,系統(tǒng)需要寫(xiě)許 多數(shù)據(jù)。JFS通過(guò)把同步日志轉(zhuǎn)為異步日志從而減少了性能的損耗。使用同步日 志,系統(tǒng)直接進(jìn)行與文件系統(tǒng)的動(dòng)作成比例的日志記錄操作;而異步日志,日志 記錄較少,在不影響其它文件系統(tǒng)操作時(shí)進(jìn)行記錄,從而減少了日志開(kāi)銷(xiāo)。XFS文件系統(tǒng)XFS8文件系統(tǒng)是SGI開(kāi)發(fā)的高級(jí)日志文件系統(tǒng),XFS極具伸縮性,非常健 壯。所幸的是SGI將其移植到了 Linux系統(tǒng)中,它以開(kāi)放資源形式發(fā)布了他們自 己擁有的XFS的源代碼,并實(shí)現(xiàn)了向Linux的移植。作為一個(gè)64位文件系統(tǒng), XFS可以支持超大數(shù)量的文件(9gxlgb,甚至更大的1

29、8gxlgb),可在大型2d和 3d數(shù)據(jù)方面提供顯著的性能。XFS主要特性包括以下幾點(diǎn): 第一章緒論數(shù)據(jù)完全性采用XFS文件系統(tǒng),當(dāng)意想不到的當(dāng)機(jī)事件發(fā)生后,首先,由 于文件系統(tǒng)開(kāi)啟了日志功能,所以你磁盤(pán)上的文件不再會(huì)意外當(dāng)機(jī)而遭到破壞。 不論目前文件系統(tǒng)上存儲(chǔ)的文件與數(shù)據(jù)有多少,文件系統(tǒng)都可以根據(jù)所記錄的曰 志在很短的時(shí)間內(nèi)迅速恢復(fù)磁盤(pán)文件內(nèi)容??蓴U(kuò)展性XFS被設(shè)計(jì)成可擴(kuò)展的,以面對(duì)大多數(shù)的存儲(chǔ)容量和I/O存儲(chǔ)需 求,可處理大型文件和包含巨大數(shù)量文件的大型目錄,滿(mǎn)足快速增長(zhǎng)的磁盤(pán)需求。 XFS有能力動(dòng)態(tài)地為文件分配索引空間,使系統(tǒng)形成髙效支持大數(shù)量文件的能 力。在它的支持下,用戶(hù)可使用lex

30、abyte (lgxlgb)大的文件,遠(yuǎn)遠(yuǎn)大于現(xiàn)在 最大的文件系統(tǒng)。優(yōu)秀的I/O性能典型的現(xiàn)代服務(wù)器使用大型的條帶式磁盤(pán)陣列,以提供達(dá) 數(shù)gb/秒的總帶寬。XFS可以很好地滿(mǎn)足I/O請(qǐng)求的大小和并發(fā)I/O請(qǐng)求的數(shù)量。第四節(jié)Linux LVM技術(shù)簡(jiǎn)介L(zhǎng)inux LVM是一個(gè)更高的層次存儲(chǔ)介質(zhì)管理工具,在LVM的使用中,將涉 及以下相關(guān)概念:物理卷物理卷是指硬盤(pán)分區(qū)或者從邏輯上看起來(lái)和硬盤(pán)分區(qū)類(lèi)似的設(shè)備(比 如RAID設(shè)備)。邏輯卷一個(gè)或者多個(gè)物理卷組成一個(gè)邏輯卷。對(duì)于LVM而言邏輯卷類(lèi)似 于非LVM系統(tǒng)中的硬盤(pán)分區(qū)。邏輯卷可以包含一個(gè)文件系統(tǒng)(比如/home或者 /usr)o卷組一個(gè)或者多個(gè)邏輯

31、卷組成一個(gè)卷組。對(duì)于LVM而言,卷組類(lèi)似于非 LVM系統(tǒng)中的物理硬盤(pán)。卷組把多個(gè)邏輯卷組合在一起,形成一個(gè)可管理的單LVM的具體工作原理是,將每一個(gè)物理卷分成幾個(gè)基本單元,即所謂的 PE(Pliysical Extents)。PE的大小是可變的,但是必須和其所屬卷組的物理卷相同。 PE是一個(gè)物理存儲(chǔ)里可以被LVM尋址的最小單元。每一個(gè)邏輯卷也被分成一些可被尋址的基本單位,即所謂的LE(Logical Extents在同一個(gè)卷組中,LE的大小和PE是相同的,LE的大小對(duì)于一個(gè)卷組 中的所有邏輯卷來(lái)說(shuō)都是相同的。在一個(gè)物理卷中,每一個(gè)PE都有一個(gè)惟一的編號(hào),但是對(duì)于邏輯卷這并不 一定是必需的。這是

32、因?yàn)楫?dāng)這些PE ID號(hào)不能使用時(shí),邏輯卷可以由一些物理卷 組成。因此,LE ID號(hào)是用于識(shí)別LE以及與之相關(guān)的特定PE的。正如前面所 提到的,LE和PE之間是一一對(duì)應(yīng)的。每一次存儲(chǔ)區(qū)域被尋址訪問(wèn)或者LE的ID 被使用,都會(huì)把數(shù)據(jù)寫(xiě)在物理存儲(chǔ)設(shè)備之上。類(lèi)似的在非LVM系統(tǒng)中,有關(guān)分區(qū)的數(shù)據(jù)是存儲(chǔ)在分區(qū)表中,而分區(qū)表被 存儲(chǔ)在了每一個(gè)物理卷的起始位置,有關(guān)邏輯卷和邏輯卷組的所有元數(shù)據(jù)都存到 在VGDA(卷組描述符區(qū)域)中,其功能就好象是LVM的分區(qū)表,它存儲(chǔ)在每一 個(gè)物理卷的起始處。第五節(jié)本文的結(jié)構(gòu)安排本文第一章為引言,介紹了數(shù)據(jù)容災(zāi)、網(wǎng)絡(luò)存儲(chǔ)、文件系統(tǒng)、及LVM相關(guān) 的的基本概念。第二章主要涉及

33、網(wǎng)絡(luò)存儲(chǔ)技術(shù),詳細(xì)介紹了他們的特點(diǎn)、原理以及應(yīng)用。 第三章詳細(xì)介紹了 JFS和XFS文件系統(tǒng)的技術(shù)細(xì)節(jié)。 第四章講述如何實(shí)現(xiàn)操作系統(tǒng)的遠(yuǎn)程備份恢復(fù)。第五章給出了搭建iSCSI服務(wù)器的方法和實(shí)現(xiàn)過(guò)程,從而實(shí)現(xiàn)操作系統(tǒng)遠(yuǎn)程 備份恢復(fù)的鏡像數(shù)據(jù)傳輸。第六章給出了搭建跨域工作NAS服務(wù)器的方法和實(shí)現(xiàn)過(guò)程,為終端操作系 統(tǒng)備份鏡像數(shù)據(jù)提供網(wǎng)絡(luò)存儲(chǔ)空間。第七章給出了 JFS/XFS文件系統(tǒng)的備份恢復(fù)的設(shè)計(jì)與實(shí)現(xiàn)。 第八章給出了非正常態(tài)JFS/XFS文件系統(tǒng)備份恢復(fù)的策略及實(shí)現(xiàn)。 第九章總結(jié)了系統(tǒng)設(shè)計(jì)的思路及部分模塊設(shè)計(jì)心得。第二章網(wǎng)絡(luò)存儲(chǔ)技術(shù) 第二章網(wǎng)絡(luò)存儲(chǔ)技術(shù)網(wǎng)絡(luò)存儲(chǔ)沿著兩條主要技術(shù)的發(fā)展方向前進(jìn):SA

34、N和NAS。 本章首先從起源,技術(shù)及應(yīng)用等方面介紹NAS;其后將會(huì)詳細(xì)講解SAN技 術(shù),包括它的拓?fù)浣Y(jié)構(gòu)、特點(diǎn)和應(yīng)用。最后介紹iSCSI技術(shù)的基礎(chǔ)原理和iSCSI 協(xié)議及體系結(jié)構(gòu)。第一節(jié)NAS技術(shù)簡(jiǎn)介NAS的起源隨著人們對(duì)存取其他機(jī)器上文件需求的產(chǎn)生,文件服務(wù)器概念應(yīng)運(yùn)而生。文 件服務(wù)器一般都要比桌面系統(tǒng)擁有更大的存儲(chǔ)容量,并具有其他一些功能,如磁 盤(pán)鏡像、雙電源、多個(gè)網(wǎng)絡(luò)接口卡。到后來(lái),文件服務(wù)器逐漸進(jìn)化到帶有RAID 存儲(chǔ)子系統(tǒng)和其他一些高可用特性的高性能系統(tǒng)。1985年,SUN公司發(fā)明了 NFS,用于UNIX桌面系統(tǒng)與UNIX服務(wù)器之間 的連接,以及在它們之間存取文件。同時(shí),人們多次努力

35、在PC網(wǎng)絡(luò)世界中也實(shí) 現(xiàn)同樣的功能。IBM、3COM、微軟和其他一些廠商開(kāi)發(fā)出了網(wǎng)絡(luò)操作系統(tǒng)設(shè)備。 在這些業(yè)界巨人的競(jìng)爭(zhēng)中,Novell公司憑借其設(shè)備N(xiāo)etWare,成功推進(jìn)了 PC領(lǐng) 域內(nèi)網(wǎng)絡(luò)服務(wù)的概念。很長(zhǎng)一段時(shí)間里,Novell NetWare成為最主要的網(wǎng)絡(luò)操作 系統(tǒng)(NOS),在主要包含PC的網(wǎng)絡(luò)市場(chǎng)中非常流行。NOS解決方案需要消耗大量的管理資源,而且它的集成和安裝工作相當(dāng)復(fù) 雜,安裝和管理上更加方便的NAS系統(tǒng),在這種需求驅(qū)動(dòng)下悄然出現(xiàn)。NAS的特點(diǎn)大多數(shù)NAS都具有三個(gè)基本的特點(diǎn): (1)特殊的操作系統(tǒng)NAS最顯著的特點(diǎn)之一是采用可提供存儲(chǔ)功能的特殊操作系統(tǒng)或應(yīng)用系統(tǒng)。 這些特

36、殊的操作系統(tǒng)去掉了一些與文件服務(wù)無(wú)關(guān)的功能,而將主要功能集中在文 件管理與操作。優(yōu)化后的操作系統(tǒng)使內(nèi)核更好地支持對(duì)存儲(chǔ)器的讀寫(xiě),更充分地 利用諸如內(nèi)存、CPU、總線周期和網(wǎng)絡(luò)帶寬等硬件資源,具有較大的數(shù)據(jù)吞吐量; 圖2.1顯示了專(zhuān)用操作系統(tǒng)和通用操作系統(tǒng)的區(qū)別。不過(guò),NAS設(shè)備并不一定要 建立在這種特殊的操作系統(tǒng)之上。第二章網(wǎng)絡(luò)存儲(chǔ)技術(shù)(2)即插即用的網(wǎng)絡(luò)集成NAS的另一個(gè)特性是可以快速地安裝到一個(gè)網(wǎng)絡(luò)上,而無(wú)需客戶(hù)系統(tǒng)進(jìn)行太 多的配置工作。一般的想法是在移動(dòng)設(shè)備時(shí),無(wú)需在客戶(hù)系統(tǒng)上安裝和配置新的 軟件,也可以使用該設(shè)備。例如,對(duì)于Windows客戶(hù)系統(tǒng)來(lái)說(shuō),通過(guò)使用Windows 系統(tǒng)的網(wǎng)絡(luò)

37、鄰居功能,可以定位和使用移動(dòng)后的專(zhuān)用設(shè)備,就好像使用本地設(shè)備 一樣。(3)NAS裝置的可伸縮性NAS裝置的一個(gè)主要特性是在幾乎不影響客戶(hù)系統(tǒng)的情況下,插入到網(wǎng)絡(luò) 中。由于具備這種特性,因此NAS裝置的功能易于擴(kuò)展或伸縮。當(dāng)設(shè)備增加容 量時(shí),客戶(hù)可以立即使用所增加的容量,這種特性為客戶(hù)實(shí)現(xiàn)了無(wú)縫的存儲(chǔ)伸縮 性。雖然不同設(shè)備的存儲(chǔ)容量不能合并成單個(gè)存儲(chǔ)池或使用單一的邏輯視圖,但 至少可以在不中止現(xiàn)有的操作下添加額外的存儲(chǔ)容量。(4客戶(hù)端的靈活性采用NAS的另一個(gè)優(yōu)點(diǎn)是它能適用于多種平臺(tái)。因?yàn)镹AS裝置具有自己的 操作系統(tǒng)和通信功能,所以只需通過(guò)標(biāo)準(zhǔn)的協(xié)議接口和網(wǎng)絡(luò)中其他的節(jié)點(diǎn)互聯(lián), 而無(wú)需弄清各個(gè)

38、客戶(hù)和服務(wù)器系統(tǒng)內(nèi)部的實(shí)現(xiàn)細(xì)節(jié)。NAS 般會(huì)支持Windows 系統(tǒng)和UNIX最常用的一些版本,以及蘋(píng)果公司的Macintosh系統(tǒng),但是MVS、 VAX. AS/400和OS/2系統(tǒng)通常不是NAS裝置幵發(fā)商的目標(biāo),它們更適宜于與 NOS產(chǎn)品集成。NAS技術(shù)的應(yīng)用NAS的應(yīng)用領(lǐng)域比較廣泛,這里主要介紹以下幾個(gè)方面: (1)大型企業(yè)級(jí)的存儲(chǔ)應(yīng)用大型的NAS文件服務(wù)器能在高容量、高流量的環(huán)境下支持幾百個(gè)用戶(hù),可 以滿(mǎn)足大型企業(yè)級(jí)對(duì)存儲(chǔ)的需求。這樣的系統(tǒng)通常都設(shè)有專(zhuān)門(mén)的硬件和軟件,以 支持大量的用戶(hù)和流量;通過(guò)采用RAID技術(shù)、特殊文件系統(tǒng)、協(xié)議處理和完備 的冗余硬件設(shè)計(jì),能支持多達(dá)TB數(shù)量級(jí)的存儲(chǔ)

39、容量。NAS裝置也可以集成光纖 路徑SAN技術(shù),以連接它們內(nèi)部的磁盤(pán)子系統(tǒng)。通過(guò)一個(gè)或多個(gè)網(wǎng)絡(luò)接口進(jìn)行 以太網(wǎng)連接,NAS也可以支持FDDI、ATM和千兆以太網(wǎng),如圖2.1所示。第二章網(wǎng)絡(luò)存儲(chǔ)技術(shù) 圖2.1企業(yè)級(jí)應(yīng)用部門(mén)級(jí)的存儲(chǔ)應(yīng)用部門(mén)級(jí)或者中小企業(yè)的NAS存儲(chǔ)設(shè)備,是一種比大型企業(yè)級(jí)存儲(chǔ)設(shè)備規(guī)模 稍小的NAS產(chǎn)品。這些部門(mén)級(jí)的存儲(chǔ)設(shè)備,雖然沒(méi)有大型企業(yè)級(jí)NAS裝置那樣 的處理能力和容量,但是它們相對(duì)來(lái)說(shuō)花費(fèi)少,并且也具有相似的管理軟件和集 成能力。它們的存儲(chǔ)容量一般在50250GB范圍內(nèi),并通常釆用SCSI總線連接 的磁盤(pán)子系統(tǒng)。這類(lèi)系統(tǒng)通常帶有1或2個(gè)10Mb或100Mb帶寬的以太網(wǎng)接口。

40、SoHo類(lèi)文件存儲(chǔ)應(yīng)用有一類(lèi)NAS是體積非常小的SoHo類(lèi)存儲(chǔ)服務(wù)器。這種服務(wù)器的容量通常在 10240GB范圍內(nèi),一般基于Linux或BSD UNIX系統(tǒng),采用Intel處理器?;?于成本問(wèn)題的考慮,這種文件服務(wù)器通常使用1或2個(gè)的SCSI或IDE獨(dú)立磁盤(pán), 它們可以做成鏡像使用,但通常不做成RAID。另外,這種產(chǎn)品一般只提供一個(gè) 10/100Mb的以太網(wǎng)接口。NAS數(shù)據(jù)庫(kù)類(lèi)應(yīng)用到目前為止,已經(jīng)有一些NAS服務(wù)器被嘗試能用來(lái)作為專(zhuān)門(mén)的數(shù)據(jù)庫(kù)服務(wù) 器,但并沒(méi)有取得人們預(yù)想的成功。盡管如此,人們還是期待NAS數(shù)據(jù)庫(kù)產(chǎn)品 能作為數(shù)據(jù)庫(kù)技術(shù)的接口,成功推向市場(chǎng)。正如文件服務(wù)NAS產(chǎn)品需要提供與 文件

41、訪問(wèn)協(xié)議的集成,數(shù)據(jù)庫(kù)NAS產(chǎn)品也要求具備與數(shù)據(jù)庫(kù)訪問(wèn)協(xié)議的集成能 力。Oracle和其他數(shù)據(jù)庫(kù)廠商已公開(kāi)表明了他們的計(jì)劃,準(zhǔn)備向這種NAS數(shù)據(jù) 庫(kù)設(shè)備提供相關(guān)的軟件甚至硬件支持。(6)備份類(lèi)應(yīng)用設(shè)計(jì)用來(lái)專(zhuān)門(mén)用于網(wǎng)絡(luò)備份的NAS產(chǎn)品,但到目前為止都還沒(méi)有取得很大 的成功。通常,這類(lèi)產(chǎn)品設(shè)計(jì)用于備份網(wǎng)絡(luò)操作系統(tǒng)及其連接的客戶(hù)。不過(guò),這 種網(wǎng)絡(luò)備份設(shè)備還不足以用來(lái)保護(hù)高容量的服務(wù)器,通常高容量的服務(wù)器還需要 通過(guò)直接相連的磁帶驅(qū)動(dòng)器及時(shí)完成備份工作。也許,將來(lái)通過(guò)在一個(gè)設(shè)備上集 成NAS和SAN功能、支持以太網(wǎng)和I/O路徑連接后,服務(wù)器備份設(shè)備能取得更第二章網(wǎng)絡(luò)存儲(chǔ)技術(shù)多的成功。NAS文件服務(wù)器設(shè)

42、備,被認(rèn)為是用于備份桌面工作站和便攜機(jī)的一 種方案。通常,桌面系統(tǒng)的備份對(duì)于許多機(jī)構(gòu)來(lái)說(shuō)是一個(gè)難題,它并不容易通過(guò) 服務(wù)器備份產(chǎn)品來(lái)解決。主要的困難在于,當(dāng)運(yùn)行服務(wù)器備份進(jìn)程時(shí),工作站和 便攜機(jī)通常不能用于備份工作。另外,性能要求也是一個(gè)難點(diǎn)。采用NAS備份 桌面和便攜機(jī)系統(tǒng)的基本思想,是當(dāng)用戶(hù)登錄網(wǎng)絡(luò)時(shí),從用戶(hù)系統(tǒng)到NAS裝置 的磁盤(pán)信息同步。這種方法,類(lèi)似于用來(lái)在桌面和便攜機(jī)系統(tǒng)之間同步數(shù)據(jù)的磁 盤(pán)同步產(chǎn)品??傊?,NAS設(shè)備有很大的伸縮性,大到企業(yè)級(jí)應(yīng)用,小到家庭應(yīng)用都可以看 到NAS的身影。NAS本身所具有的靈活、簡(jiǎn)單、性?xún)r(jià)比高的特性也使其在中小 型企業(yè)的應(yīng)用中更加廣泛。第二節(jié)SAN技術(shù)

43、簡(jiǎn)介SAN技術(shù)打破了傳統(tǒng)的存儲(chǔ)設(shè)備和計(jì)算機(jī)之間的聯(lián)系方式。它將存儲(chǔ)設(shè)備從 網(wǎng)絡(luò)分離出來(lái),使它成為計(jì)算機(jī)網(wǎng)絡(luò)的對(duì)等體。換而言之,SAN技術(shù)將存儲(chǔ)設(shè) 備重新組合為網(wǎng)絡(luò)的組成部分,而不是將它們視為特定的集成系統(tǒng)中的一部分, 并根據(jù)數(shù)據(jù)存儲(chǔ)和訪問(wèn)的要求對(duì)它們進(jìn)行管理和規(guī)劃。SAN技術(shù)借用了許多現(xiàn) 有的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并將其應(yīng)用到數(shù)據(jù)存儲(chǔ)中。SAN的拓?fù)浣Y(jié)構(gòu)點(diǎn)到點(diǎn)SAN最簡(jiǎn)單的SAN連接2個(gè)節(jié)點(diǎn),使用一種被稱(chēng)為點(diǎn)到點(diǎn)的拓?fù)浣Y(jié)構(gòu)。這和一 個(gè)通過(guò)交叉線纜建造的2節(jié)點(diǎn)以太網(wǎng)很相似。除了點(diǎn)對(duì)點(diǎn)的SAN不是連接兩個(gè) 系統(tǒng),而是一個(gè)系統(tǒng)和它的存儲(chǔ)器。圖4.1說(shuō)明了一個(gè)簡(jiǎn)單的點(diǎn)對(duì)點(diǎn)SAN,連接 距離最長(zhǎng)能超過(guò)10000

44、米;其他的技術(shù)如SCSI和ATA也可以同樣將一個(gè)設(shè)備連 到總線上來(lái)實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)的拓?fù)浣Y(jié)構(gòu),但連接距離要遠(yuǎn)遠(yuǎn)小于SAN。圖2.2點(diǎn)到點(diǎn)SAN第二章網(wǎng)絡(luò)存儲(chǔ)技術(shù) 交換式SAN:主機(jī)吵 圖2.4環(huán)狀SAN交換式SAN是釆用網(wǎng)絡(luò)交換機(jī)構(gòu)建的一種存儲(chǔ)網(wǎng)絡(luò),這種網(wǎng)絡(luò)交換機(jī)類(lèi)似 于數(shù)據(jù)網(wǎng)絡(luò)中所使用的交換機(jī)。交換式SAN在建立點(diǎn)對(duì)點(diǎn)通信方面,類(lèi)似于點(diǎn) 對(duì)點(diǎn)網(wǎng)絡(luò)。不同之處在于,它所建立的點(diǎn)對(duì)點(diǎn)連接并不是永久性的,可同時(shí)并發(fā) 很多點(diǎn)對(duì)點(diǎn)的虛連接。圖2.3說(shuō)明如何使用交換機(jī)建立SAN。asf-sse圖2.3交換式SAN環(huán)狀SAN環(huán)狀SAN提供了在一個(gè)邏 輯環(huán)狀網(wǎng)絡(luò)上對(duì)公用管道的共 享類(lèi)似于令牌環(huán)和FDDI。在 一個(gè)環(huán)

45、狀SAN中使用的網(wǎng)絡(luò)設(shè) 備被稱(chēng)為集線器,在有相同端口 數(shù)的情況下,它比交換機(jī)便宜許 多。環(huán)狀SAN也可以級(jí)聯(lián),但 它不是通過(guò)多層交換層級(jí)聯(lián),而 是通過(guò)增加環(huán)的邏輯圓周尺寸 來(lái)級(jí)聯(lián)環(huán)。圖2.4是一個(gè)環(huán)狀 SAN。SAN的特點(diǎn)SAN技術(shù)有如下的特點(diǎn)。 容量易擴(kuò)展SAN沒(méi)有提高單個(gè)磁盤(pán)驅(qū)動(dòng)器的容量。它們也沒(méi)有增加主機(jī)系統(tǒng)中支持的主 機(jī)I/O控制器的數(shù)量。然而,它們能顯著地提髙連接到每個(gè)主機(jī)I/O控制器的設(shè)備數(shù)。它們還提供了通過(guò)將網(wǎng)絡(luò)交換機(jī)和集線器級(jí)聯(lián)來(lái)擴(kuò)展容量的方法。能被連 接到一個(gè)SAN上的設(shè)備數(shù)目取決于所使用的技術(shù)。以光纖路徑的使用為例,光 纖路徑環(huán)網(wǎng)能支持多達(dá)126和設(shè)備,而具有交換功能的網(wǎng)絡(luò)

46、在結(jié)構(gòu)上沒(méi)有尋找的 限制。由專(zhuān)門(mén)以太網(wǎng)改造而來(lái)的SAN也具有虛擬的無(wú)限尋址的能力。因此,對(duì) 于SAN而言,主機(jī)I/O控制器不再具有最大連接15個(gè)設(shè)備的限制,相反的,每 個(gè)控制器可以連接上百個(gè)甚至上千個(gè)設(shè)備。性能易擴(kuò)展除了提供lOOMB/s的網(wǎng)絡(luò)傳輸速率,SAN還可以為數(shù)據(jù)存取提供更好的可 擴(kuò)展性。對(duì)于交換SAN,它使用一個(gè)私有的虛擬網(wǎng)絡(luò),在網(wǎng)絡(luò)上,每個(gè)設(shè)備或子系統(tǒng) 有它們自己的路徑。因此,在設(shè)備防火墻或I/O控制器的設(shè)備驅(qū)動(dòng)器中沒(méi)有必要 進(jìn)行仲裁。設(shè)備訪問(wèn)的網(wǎng)絡(luò)擁塞處理也轉(zhuǎn)而由高速交換產(chǎn)品來(lái)完成。盡管使用多 個(gè)設(shè)備通過(guò)一個(gè)交換機(jī)進(jìn)行連接的方式肯定會(huì)帶來(lái)使用性能的下降,但和使用總 線仲裁技術(shù)帶來(lái)

47、的性能下降相比是微乎其微的。而最終的結(jié)果是被安裝的存儲(chǔ)器 容量越大,其訪問(wèn)速度越快。對(duì)于環(huán)狀SAN。它們對(duì)所有的節(jié)點(diǎn)是平等的,性能擴(kuò)展要比SCSI總線能提 供的好得多。但和交換網(wǎng)比則還略遜一籌。但光纖路徑環(huán)路由器的價(jià)格比光纖路 徑交換機(jī)便宜得多。距離易擴(kuò)展SAN能以高速在很長(zhǎng)的距離上運(yùn)作。而串行傳輸技術(shù),如光纖路徑,能比 并行傳輸技術(shù)(如S C S I)在更長(zhǎng)的距離上進(jìn)行數(shù)據(jù)傳輸。不僅僅是線纜更長(zhǎng) 了,而且也更容易在一個(gè)大的面積范圍中進(jìn)行橋接。光纖路徑技術(shù)在單模光纖中 不使用重發(fā)器,可以支持長(zhǎng)達(dá)10公里的數(shù)據(jù)傳輸,價(jià)格便宜些的多模光纖技術(shù) 支持大約5 0 0米的傳輸距離。即使是使用銅芯的光纖路

48、徑,它的3 0米的距離 限制也是SCSI的距離的兩倍多。易升級(jí)SAN允許存儲(chǔ)系統(tǒng)和設(shè)備在不中斷服務(wù)器工作的情況下連接到已有的存儲(chǔ) 網(wǎng)絡(luò)。這是SAN存儲(chǔ)技術(shù)的關(guān)鍵優(yōu)勢(shì)。設(shè)備和子系統(tǒng)能在SAN中存在,而不 屬于任何一個(gè)特定的服務(wù)器系統(tǒng),且允許存儲(chǔ)升級(jí)的很大一部分工作在不中斷現(xiàn) 存工作服務(wù)器的情況下被完成。替換存儲(chǔ)子系統(tǒng)可以在被升級(jí)的設(shè)備和子系統(tǒng)間 斷工作的同時(shí)完成測(cè)試。這樣,新的子系統(tǒng)可以在對(duì)工作服務(wù)器影響很小,甚至 沒(méi)有影響的條件下,用很短的時(shí)間甚至不用關(guān)閉系統(tǒng)就能完成升級(jí)過(guò)程。SAN的應(yīng)用 備份SAN備份是第一個(gè)大的應(yīng)用。SAN備份是一種基礎(chǔ)應(yīng)用,它將伴隨著SAN 技術(shù)的發(fā)展產(chǎn)生根本的變化。備

49、份的解決方案會(huì)影響系統(tǒng)集成的其他方面,如支 持更大服務(wù)器系統(tǒng)的能力。存儲(chǔ)池傳統(tǒng)的存儲(chǔ)系統(tǒng)面臨的一個(gè)主要問(wèn)題在于,它不能訪問(wèn)未使用的或空白的存 儲(chǔ)資源。這些存儲(chǔ)資源從網(wǎng)絡(luò)中的其他服務(wù)器連接到一個(gè)服務(wù)器上。這導(dǎo)致了在 對(duì)容量和性能的要求做出改變時(shí),改變存儲(chǔ)結(jié)構(gòu)要經(jīng)歷很長(zhǎng)的時(shí)間。而SAN允 許所有的服務(wù)器能輕松訪問(wèn)其中的存儲(chǔ)設(shè)備,從而解決了這些困難。這樣,任何 空閑存儲(chǔ)器都能被需要它的服務(wù)器訪問(wèn)。這種存儲(chǔ)器可以隨時(shí)根據(jù)指令使用,或 者固定地進(jìn)行分配。這種將存儲(chǔ)資源集中到一個(gè)存儲(chǔ)池,從而被當(dāng)作一個(gè)單一的多功能集合的能 力,被稱(chēng)為SAN的一個(gè)重要的基礎(chǔ)應(yīng)用。存儲(chǔ)池將收集可用的存儲(chǔ)空間,然后 將它們打包成

50、虛擬驅(qū)動(dòng)器。數(shù)據(jù)共享上面描述的存儲(chǔ)池允許服務(wù)器訪問(wèn)相同存儲(chǔ)子系統(tǒng)中不同的存儲(chǔ)資源,但它 不允許服務(wù)器共享相同的實(shí)際物理磁盤(pán)或虛擬磁盤(pán)上的相同文件或記錄。如果能 夠維護(hù)數(shù)據(jù)單個(gè)拷貝而不是同時(shí)保留若干個(gè)不同版本,則不僅可以防止當(dāng)數(shù)據(jù)頻 繁地在系統(tǒng)之間拷貝時(shí)不可避免發(fā)生的錯(cuò)誤,而且,如果數(shù)據(jù)形成后不用再次遷 移,那么在復(fù)制數(shù)據(jù)傳輸時(shí)消耗的帶寬也可以避免。數(shù)據(jù)共享是非常有用的系統(tǒng)基本應(yīng)用。在諸如ERP分布式應(yīng)用系統(tǒng)、互聯(lián)網(wǎng)、 電子商務(wù)系統(tǒng)等應(yīng)用中,常常會(huì)發(fā)生改變,應(yīng)用模塊需要從一個(gè)系統(tǒng)遷移到另一 個(gè)系統(tǒng),此時(shí)總線連接的系統(tǒng)要求這些模塊使用的數(shù)據(jù)也相應(yīng)地進(jìn)行遷移,從而 很大程度上增加了系統(tǒng)的復(fù)雜性。SA

51、N環(huán)境中的數(shù)據(jù)共享可以通過(guò)允許應(yīng)用模 塊在服務(wù)器之間的遷移,而不移動(dòng)相關(guān)的數(shù)據(jù)來(lái)消除這些困難。I/O尋徑I/O尋徑指決定和管理系統(tǒng)和存儲(chǔ)器之間的V0數(shù)據(jù)傳輸選用路徑的能力。 改變I/O數(shù)據(jù)傳輸?shù)穆窂交蜻B接將極大地提髙系統(tǒng)管理和存儲(chǔ)管理的效率。第二章網(wǎng)絡(luò)存儲(chǔ)技術(shù)SAN的一個(gè)主要特征在于,它能提供系統(tǒng)到設(shè)備的靈活連接。當(dāng)這種自由被 視為一種主要的優(yōu)勢(shì)時(shí),就需要對(duì)它進(jìn)行正確的管理以避免出現(xiàn)問(wèn)題。這就是I/O 尋徑的由來(lái)。I/O尋徑提供了一種通過(guò)SAN系統(tǒng)地將系統(tǒng)連接到存儲(chǔ)器,以及當(dāng) 發(fā)生變化時(shí)能有效進(jìn)行響應(yīng)的方法。I/O尋徑都是使SAN正常工作的重要組成部數(shù)據(jù)遷移最后一個(gè)要討論的SAN應(yīng)用領(lǐng)域是數(shù)據(jù)

52、移動(dòng)器。它的想法很簡(jiǎn)單,即一個(gè) SAN實(shí)體直接將數(shù)據(jù)由一個(gè)設(shè)備子系統(tǒng)移動(dòng)到另外一個(gè)子系統(tǒng)。系統(tǒng)管理功能、 文件傳輸、軟件分發(fā)和數(shù)據(jù)復(fù)制等,會(huì)使用數(shù)據(jù)移動(dòng)技術(shù)。數(shù)據(jù)移動(dòng)器的主要優(yōu) 點(diǎn)在于它的速度。通過(guò)使用直接的設(shè)備到設(shè)備傳輸,數(shù)據(jù)遷移能繞過(guò)會(huì)帶來(lái)延遲 和阻塞的許多I/O路徑部分。更重要的是,數(shù)據(jù)移動(dòng)器將主機(jī)服務(wù)器從直接管理 數(shù)據(jù)傳輸中解放出來(lái)。數(shù)據(jù)移動(dòng)器可以在幾乎所有的I/O尋徑組件中實(shí)現(xiàn)。這些 組件可以作為SAN中的發(fā)起者來(lái)啟動(dòng)它們的操作??赡軐?shí)現(xiàn)的數(shù)據(jù)移動(dòng)器包括 以下兒個(gè)部分:存儲(chǔ)橋和路由器。 存儲(chǔ)磁盤(pán)和磁帶子系統(tǒng)。 SAN交換機(jī)和集線器。 主機(jī)I/O控制器和設(shè)備驅(qū)動(dòng)器。 基于主機(jī)的卷管理器

53、。數(shù)據(jù)移動(dòng)器的一個(gè)主要問(wèn)題在于決定將哪些數(shù)據(jù)在存儲(chǔ)設(shè)備間移動(dòng)。所有設(shè) 備上和數(shù)據(jù)位置信息相關(guān)的智能,是由服務(wù)器的文件系統(tǒng)高速緩存或服務(wù)器上運(yùn) 行的存儲(chǔ)管理來(lái)實(shí)現(xiàn)。第三節(jié)iSCSI技術(shù)簡(jiǎn)介iSCSI協(xié)議把SCSI和TCP/IP網(wǎng)絡(luò)結(jié)合起來(lái),拓展了 SCSI的使用,使得存 儲(chǔ)服務(wù)器可以通過(guò)IP網(wǎng)絡(luò)同存儲(chǔ)設(shè)備交換塊數(shù)據(jù);而且,面向數(shù)據(jù)塊的訪問(wèn)更 靠近磁盤(pán)陣列和操作系統(tǒng)的底層,消除了對(duì)文件操作的延遲,在提高系統(tǒng)性能的 同時(shí)為遠(yuǎn)程備份恢復(fù)系統(tǒng)讀取和寫(xiě)入本地?cái)?shù)據(jù)提供了方便。iSCSI協(xié)議概述2003 年 2 月 11 日,IETF (Internet Engineering Task Force,互聯(lián)網(wǎng)工

54、程任務(wù) 組)通過(guò)了 iSCSI (Internet SCSI)標(biāo)準(zhǔn),這項(xiàng)由IBM、Cisco共同發(fā)起的技術(shù)標(biāo) 準(zhǔn),經(jīng)過(guò)三年20個(gè)版本的不斷完善,終于得到IETF認(rèn)可。iSCSI技術(shù)最重要的 貢獻(xiàn)在于其對(duì)傳統(tǒng)技術(shù)的繼承和發(fā)展上:其一,SCSI (Small Computer Systems Interface,小型計(jì)算機(jī)系統(tǒng)接口)技術(shù)是被磁盤(pán)、磁帶等設(shè)備廣泛采用的存儲(chǔ)標(biāo)第二章網(wǎng)絡(luò)存儲(chǔ)技術(shù) 準(zhǔn),從1986年誕生起到現(xiàn)在仍然保持著良好的發(fā)展勢(shì)頭:其二,沿用TCP/IP 協(xié)議,TCP/IP在網(wǎng)絡(luò)方面是最通用、最成熟的協(xié)議,且IP網(wǎng)絡(luò)的基礎(chǔ)建設(shè)非常 完善。這兩點(diǎn)為iSCSI的無(wú)限擴(kuò)展提供了堅(jiān)實(shí)的基礎(chǔ)。i

55、SCSI協(xié)議定義了在TCP/IP網(wǎng)絡(luò)發(fā)送、接收block (數(shù)據(jù)塊)級(jí)的存儲(chǔ)數(shù)據(jù) 的規(guī)則和方法。發(fā)送端將SCSI命令和數(shù)據(jù)封裝到TCP/IP包中再通過(guò)網(wǎng)絡(luò)轉(zhuǎn)發(fā), 接收端收到TCP/IP包之后,將其還原為SCSI命令和數(shù)據(jù)并執(zhí)行完成之后將 返回的SCSI命令和數(shù)據(jù)再封裝到TCP/IP包中再傳送回發(fā)送端。而整個(gè)過(guò)程在 用戶(hù)看來(lái),使用遠(yuǎn)端的存儲(chǔ)設(shè)備就象訪問(wèn)本地的SCSI設(shè)備一樣簡(jiǎn)單。支持iSCSI 技術(shù)的服務(wù)器和存儲(chǔ)設(shè)備能夠直接連接到現(xiàn)有的IP交換機(jī)和路由器上,因此 iSCSI技術(shù)具有易于安裝、成本低廉、不受地理限制、良好的互操作性、管理方 便等優(yōu)勢(shì)。2,3.2 iSCSI協(xié)議模型iSCSI層對(duì)SC

56、SI層的命令和數(shù)據(jù)進(jìn)行了封裝,使其能通過(guò)TCP/IP協(xié)議在網(wǎng) 絡(luò)中傳輸。iSCSI實(shí)現(xiàn)了 SCSI到TCP/IP的映射。當(dāng)Initiator將SCSI命令和數(shù)據(jù) 封裝到iSCSi協(xié)議包后,將向下提交到TCP層,最后封裝成IP包在IP網(wǎng)絡(luò)上傳 輸?shù)竭_(dá)Target后通過(guò)解封裝還原成SCSI指令和數(shù)據(jù),再由驅(qū)動(dòng)程序發(fā)送到指定 的驅(qū)動(dòng)器,從而實(shí)現(xiàn)SCSI命令和數(shù)據(jù)在IP網(wǎng)絡(luò)上的傳輸。iSCSI PDU 格式iSCSI PDU(Protocol Data Unit,協(xié)議數(shù)據(jù)單元)由4部分構(gòu)成:BHS(Basic Header Segment,基本頭部),長(zhǎng)度 48 字節(jié)。AHS(Additional H

57、eader Segment,附加頭部),包含一些附加信息,可選。Header-Digest,頭部數(shù)據(jù)校驗(yàn)碼。Data Segment,數(shù)據(jù)段,包含要傳輸?shù)臄?shù)據(jù),可選。 BHS包括的字段有:Opcode作碼。Total AHS LengthAHS的長(zhǎng)度,如果AHS不存在,該項(xiàng)值為0。LUNLUN 號(hào)。Initiator Task TagInitiator用來(lái)區(qū)別不同iSCSI任務(wù)的唯一標(biāo)識(shí)符。 會(huì)話管理iSCSI Initiator和Target通過(guò)建立TCP連接進(jìn)行通信和數(shù)據(jù)傳輸,特定的 Initiator和Target之間的所有TCP連接組成了一個(gè)會(huì)話(session)iSCSI的會(huì)話由 一

58、個(gè)二元組#識(shí),類(lèi)似于SCSI協(xié)議中的I-T-Nexus(I-T-聯(lián)結(jié))。iSCSI會(huì)話分為登錄階段(Login Phase)和全工階段(Full Feature Phase)。 iSCSI會(huì)話起始于登錄階段,登錄階段主要的工作包括:建立TCP連接,認(rèn) 證,協(xié)商會(huì)話的參數(shù),標(biāo)識(shí)TCP連接所屬會(huì)話等。最初,Target端程序會(huì)監(jiān)聽(tīng)某個(gè)TCP端口等待請(qǐng)求,當(dāng)Initiator連接到該端 口后,登錄進(jìn)程便開(kāi)啟了。會(huì)話的建立時(shí)需要進(jìn)行認(rèn)證,認(rèn)證過(guò)程會(huì)受到會(huì)話協(xié) 商參數(shù)的影響。登錄階段的具體過(guò)程其實(shí)是一系列登錄請(qǐng)求和及其響應(yīng)。當(dāng)認(rèn) 證通過(guò)后,會(huì)話便進(jìn)入全工階段,這時(shí)便可以傳輸SCSI命令了。編號(hào)和排序iS

59、CSI對(duì)命令和狀態(tài)進(jìn)行編號(hào),對(duì)數(shù)據(jù)進(jìn)行排序。iSCSI協(xié)議規(guī)定SCSI命令在會(huì)話過(guò)程中被順序傳輸,因此需要對(duì)這些命令進(jìn) 行編號(hào),iSCSI PDU 中使用 CmdSN(Command Sequence Number,命令順序字) 儲(chǔ)存這些序號(hào),CmdSN字段長(zhǎng)度為4個(gè)字節(jié)。命令順序是建立在會(huì)話的基礎(chǔ)上 的,被分配的CmdSN在會(huì)話范圍內(nèi)是統(tǒng)一的。Initiator和Target通過(guò)在會(huì)話中 都維護(hù)三個(gè)變量來(lái)實(shí)現(xiàn)命令的順序傳輸。命名與尋址iSCSI的Initiator和Target使用IP地址作為網(wǎng)絡(luò)實(shí)體的標(biāo)識(shí),iSCSI節(jié)點(diǎn)名 作為iSCSI節(jié)點(diǎn)的標(biāo)識(shí)。典型的iSCSI地址包含了 IP地址或域

60、名、端口號(hào)以及iSCSI設(shè)備名稱(chēng),其格 式如下:iSCSI:/:/錯(cuò)誤處理(1)格式錯(cuò)誤格式錯(cuò)誤分為兩種:PDU頭中的內(nèi)容非法和PDU內(nèi)容不一致。當(dāng)Initiator 或Target收到格式錯(cuò)誤的PDU后,需要馬上中止會(huì)話的所有連接。 摘要錯(cuò)誤當(dāng)Initiator和Target收到有頭摘要錯(cuò)誤的PDU時(shí),需要丟棄該包以及前一個(gè) 包包頭后的所有數(shù)據(jù)或者關(guān)閉該連接,因?yàn)檎e(cuò)誤意味著頭的長(zhǎng)度域被損壞序列錯(cuò)誤Initiator或Target收到的PDU中存在亂序的R2TSN/DataSN,說(shuō)明發(fā)生了摘 要錯(cuò)誤。如果是狀態(tài)SN亂序,Initiator收到雙份R2T/DataSN,則需要丟棄副本。協(xié)議錯(cuò)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論