機房設備搬遷解決方案講解_第1頁
機房設備搬遷解決方案講解_第2頁
機房設備搬遷解決方案講解_第3頁
機房設備搬遷解決方案講解_第4頁
機房設備搬遷解決方案講解_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、機房設備搬遷解決方案研發(fā)部二一二年十月目錄一、編寫目的 3二、總體要求 3三、搬遷前提條件 4四、搬遷工作內(nèi)容 6五、機房搬遷流程 13六、機房搬遷實施 14七、機房搬遷時間安排 17八、應急處理 17九、機房遷移設備清單 17十、備品備件清單 17十一、搬遷后觸發(fā)的事故說明 18編寫目的公司搬遷過程中,機房服務器、網(wǎng)絡等設備的搬遷是一項非常重要的工作, 涉及多類不同服務器設備, 包含單位核心數(shù)據(jù)、 應用等諸多核心資產(chǎn), 是一項系 統(tǒng)性工程。為規(guī)范性、 科學性指導公司服務器、 網(wǎng)絡等軟硬件設備的搬遷工作, 對關鍵 性搬遷業(yè)務工作進行細化, 優(yōu)化和調整搬遷過程中的關鍵工作, 保障機房搬遷工 作合

2、理、有序、高效實施, 做好重要文件和數(shù)據(jù)的備份工作, 保證原機房服務器、 網(wǎng)絡等設備的正常平穩(wěn)搬遷、 恢復和運行, 預防或降低在搬遷過程中可能發(fā)生的 問題和風險,特編制此方案。二、總體要求1. 搬遷方案機房服務器、 網(wǎng)絡等設備的搬遷需要經(jīng)過前期調研準備, 搬遷前系統(tǒng)有效的 備份,應急預案的制定和測試,搬遷過程斷電、下架、上架、給電等,搬遷后系 統(tǒng)的搭建安裝, 系統(tǒng)完好性測試及有效的監(jiān)控機制確立等步驟。 每一步工作都需 要制定周密計劃、 步驟并嚴格按照該計劃、 步驟實施, 其中任何一個環(huán)節(jié)出現(xiàn)差 錯都將影響整個搬遷工作的進度并增加風險。因此,應當在搬遷前制定周密、詳細的搬遷計劃、步驟并形成文檔資

3、料,其 中應包括準確的搬遷實施時間表和具體實施步驟以及緊急情況下的應急方案。 同 時,對計劃中每一個步驟都要明確安排具體責任人員以確保搬遷計劃落實和實 施。保證搬遷方案的正確性、可執(zhí)行性,搬遷過程合理、有序。本方案是以盡量不影響公司的日常工作或將影響降低到最低為前提的情況 下制定的, 即在休息日前開始搬遷工作, 到工作日以前完成整個服務器、 網(wǎng)絡設 備、網(wǎng)絡安全設備的搬遷、安裝及測試。并且在開機以后,繼續(xù)跟蹤系統(tǒng)的運行 情況,隨時處理系統(tǒng)運行的異常情況。2. 搬遷要求搬遷時限 :為保證業(yè)務系統(tǒng)運行的連續(xù)性,務必保證全部網(wǎng)絡系統(tǒng)、應用系 統(tǒng)、辦公系統(tǒng)于 48 小時(周末進行)內(nèi)搬遷并調試完畢,投

4、入正常運行。應急要求 :為最大程度降低因搬遷造成硬件故障從而導致的對業(yè)務運行連續(xù) 性的影響, 必須能夠對關鍵設備提供充足的備件以備應急。 一旦搬遷過程中出現(xiàn) 硬件故障,必須在 2 小時將備件更換完畢。 其它設備硬件若因搬遷過程中人為物 理損壞,按照損壞程度進行一定的賠償。3. 其他要求 保證搬遷前做好數(shù)據(jù)備份工作,搬遷后數(shù)據(jù)不得丟失,系統(tǒng)能夠恢復正常運 行;保證各硬件設備搬遷過程中不損壞; 對重要業(yè)務系統(tǒng)提前聯(lián)系廠家,保證意外情況下的技術支持;三、搬遷前提條件1. 新機房環(huán)境 新機房需要按照規(guī)劃要求安裝和裝修完畢,各項條件滿足搬遷要求,具體環(huán) 境要求:溫度:攝氏 23度2 度(夏季);20度

5、2 度(冬季)濕度: 45%65% 溫度變化率: 5 /h 不結露 電源頻率: 50HZ0.2HZ 電源電壓: 380V/220V5V 電源波形失真率:小于或等于己于 5% 含塵量:粒徑大于或等于 0.3um,粒數(shù)小于或等于 10000粒/ 無眩光、無頻閃、無噪音距離地面 0.8 米高處,照度不低于 300lx 計算機系統(tǒng)供電系統(tǒng)零地電壓小于 1 伏交流工作接地系統(tǒng)接地電阻小于 4 歐姆計算機系統(tǒng)安全保護接地電阻以及靜電接地電阻小于 4 歐姆防雷保護接地系統(tǒng)接地電阻小于 1 歐姆均布載荷:大于 800Kg/2. 搬遷實施方案網(wǎng)絡管理員了解公司現(xiàn)在機房的現(xiàn)狀以及搬遷后的具體要求。 充分考慮在實

6、施過程中可能出現(xiàn)的各種情況, 定制詳細可行性的遷移實施計劃, 將機房遷移工 作對公司的影響降至最小。 流程主要根據(jù)搬遷前的需要制定, 主要詳細了解當前 系統(tǒng)設備情況,系統(tǒng)運行情況。針對所了解情況制定詳細搬遷方案以及應急方案?,F(xiàn)場勘察與各公司技術人員現(xiàn)場交流確定實施方案對所有設備進行分析,制定應急3. 綜合布線 綜合布線和各專線全部聯(lián)通并測試通過,相關合作單位出具驗收報告等。各 種接口和連接孔制作完畢并符合要求。 所有的數(shù)據(jù)專線和普通電話號碼所對應的 機柜配線架號必須是準確無誤的,各工位所使用的電話號碼必須提前確定。4. 機柜、 UPS如條件許可,機柜安裝完畢、并軌合理, KVM按照標準安裝到制

7、定位置。如 沿用原機房機柜、 UPS電源等,明確 UPS電池組位置,焊接好 UPS電池組支架, 明確機柜、機架等應擺放的位置, 明確服務器、 交換機等所在的機柜和機架位置, 并配有準確可靠的強弱電布線設施。機房的供配電應是單獨的 UPS回路,機房 UPS輸出控制的區(qū)域必須在開關上 明確標識并具相應的配電系統(tǒng)圖及電源點位和布置平面圖。5. 工位信息點及電源安裝、調試好所有工位所對應的信息點及計算機用配電電源,保證可用。6. 數(shù)據(jù)備份原機房設備重要數(shù)據(jù)全部進行備份、記錄和標記,搬遷人員全部進行相關技 術培訓,關鍵設備制定詳細的搬遷和運輸方案。 所有備份數(shù)據(jù)通過光盤或者磁盤陣列的方式備份, 備份數(shù)據(jù)

8、為防止外露需要 網(wǎng)絡管理員進行備份和處理。在正式搬遷前,給各個相關業(yè)務部門發(fā)送數(shù)據(jù)備份通知,要求各個部門自行 進行重要數(shù)據(jù)和文件的備份工作。7. 搬遷工具及設備提前采購 根據(jù)機房服務器、網(wǎng)絡等設備搬遷過程中所需要的工具,制定工具清單,對 沒有或無法滿足搬遷要求的工具提前采購(含網(wǎng)線) ;新機房所需的設備或公司 實際運行所需的設備,如需要,一并提前采購。服務器、網(wǎng)絡等部署所需要的網(wǎng)線、跳線等必須是數(shù)量足夠、質量可靠、分 顏色管理,并貼有相對應的標簽,滿足搬遷后服務器、網(wǎng)絡等快速部署的需求。8. 光纖遷移準備 聯(lián)系公司光纖服務商,告知公司機房搬遷事宜,提前進行新老機房光纖遷移 可能性的論證及所需要

9、準備的工作; 在確定具體搬遷日期后, 聯(lián)系施工隊伍, 開 展光纖遷移工作。綜合來說,新機房的設備安裝要合理、美觀便于維護和使用,新老機房平滑 過渡。四、搬遷工作內(nèi)容1. 搬遷技術工作1) 確定機房搬遷的負責人以及負責人的聯(lián)系方式, 保證在搬遷的過程中統(tǒng)一指 揮管理。2) 確定服務器的數(shù)量,服務器的型號,服務器的配置等,如有需要,聯(lián)系相關 服務器的供貨商或者廠家提供技術支持或者備件支持服務, 并且在搬動服務 器之前必需有詳細的表格記錄。3) 確定相關的輔助設備,如:配線架、尾纖、跳線、插排等。4) 服務器數(shù)據(jù)的備份,所有關鍵數(shù)據(jù) ( 包括程序,數(shù)據(jù)庫,各服務器的配置參數(shù))必須進行備份。5) 確定

10、各個服務器搬遷后的 IP 變動和路由情況,并做好詳細日志。6) 各種設備提前做好技術檢測工作,登記每個設備的技術檢測情況。2. 機房搬遷可能的影響及影響評估 在此過程中,由機房搬遷負責部門組織,相關部門參與,機房搬遷負責人就 新機房環(huán)境的準備情況, 包括:空調環(huán)境、電源控制等, 機房搬遷設備狀況清單、 搬遷所涉及的工作范圍、內(nèi)容,以及搬遷過程中可能發(fā)生的事故、故障,存在的 風險等方面進行匯報, 各個部門進行評估, 制定出機房搬遷影響評估報告, 并交 由上級領導審閱。3. 繪制圖紙,詳細記錄搬遷前后的情況 提前規(guī)劃各個機柜、各個網(wǎng)絡設備的擺放位置,還要事先量好機器的具體尺 寸,對所有設備進行編號

11、,并填入登記表中之后到 現(xiàn)場規(guī)劃機器的具體擺放位 置,力爭最合理、最充分地利用機房的有效空間。此處需要注意的問題:如果需 要擴展機柜,則提前將綜合布線的數(shù)據(jù)信息點打在配線架 上,這樣,等把交換 機路由器等網(wǎng)絡設備搬遷過來,安裝好跳線,則網(wǎng)絡就可以正常使用。因搬遷后電話及網(wǎng)絡需與之前保持一致,對相關點位進行備份,在搬遷后將 根據(jù)原有機房點位進行恢復。4. 對設備進行分類統(tǒng)計 機房設備包括服務器、核心交換機、配線架、防火墻、存儲設備、 UPS 等, 給出進一步詳細的設備統(tǒng)計信息,包括設備型號、配置、所在的網(wǎng)絡等,在搬遷 之前給出相應的表格記錄文檔, 確定相關的輔助設備配件等, 同樣需要有詳細的 記

12、錄文檔。5. 系統(tǒng)備份 建立一個覆蓋中心的數(shù)據(jù)庫備份系統(tǒng), 包括數(shù)據(jù)中心和所有運作中心各種數(shù) 據(jù)的備份,盡可能提高各主機數(shù)據(jù)的安全性和可管理性。備份內(nèi)容應包括數(shù)據(jù)中心和運作中心:1) 應用數(shù)據(jù)庫備份2) 文件系統(tǒng)的備份- 7 -3) 操作系統(tǒng)備份4) 系統(tǒng)的災難恢復5) 備份系統(tǒng)應不對應用系統(tǒng)產(chǎn)生任何不良影響。6) 要求備份策略和備份手段減少數(shù)據(jù)的丟失 /錯誤,以便事故發(fā)生時快速有 效地恢復數(shù)據(jù)。所有服務器、小型機和陣列等設備進行操作系統(tǒng)配置信息備份和登記,對于 特殊配置的設備需要跟廠家或者供貨商提前聯(lián)系,特殊配置設備建議進行全備 份。對于這些設備的硬盤由于長時間的運行, 一旦停機后可能會出現(xiàn)

13、各種無法預 料的問題, 建議根據(jù)設備情況預備多塊不同容量和型號的硬盤, 當某塊硬盤出現(xiàn) 故障時可以馬上替換。所有交換機、防火墻、服務器等智能設備的配置信息進行備份。對搬遷過程 中出現(xiàn)的一系列軟件和硬件故障要有準備, 要和廠商或者供貨商提前聯(lián)系好, 找 出可能出現(xiàn)的問題點提前規(guī)避, 無法規(guī)避的要做好技術、 備件或者替代機準備工 作,便于在搬遷后出現(xiàn)故障時可以通過備機或者替代機臨時替用。 如廠商或者供 貨商不提供備機或者替代機需要尋求第三方支持時,要提前做好準備。6. 系統(tǒng)檢測全面預防靜電雖然計算機是靠電力工作的,但靜電卻會給計算機帶來致命傷害,尤其是可 能對主板芯片造成永久性損壞。靜電產(chǎn)生的原因

14、很多各種電源設備可能產(chǎn)生靜 電,計算機 CRT 顯示器可能產(chǎn)生靜電,工作中的手機、對講機也會在周圍空間 產(chǎn)生大量的靜電,這就要求我們要特別小心靜電的干擾,全面預防。盡量使服務器及其周邊設備的接地良好。 如果設備沒有接地,當我們要接觸里面的板卡時,應先用接地導線或其他放 電設施對其進行放電。對設備進行操作時 , 可以用手觸摸一下機箱外部的金屬來放掉自身攜帶的靜 電。保證機箱內(nèi)布局合理一般來說, 服務器機箱內(nèi)部的部件布局以及空間設計都 經(jīng)過科學排列, 相互之間結合緊湊卻不雜亂, 我們在添加和卸載服務器設備的時 候,一定要維持這種布局效果。注意:在機箱內(nèi)部還應有相當一部分預留空間,構成合理的“風道

15、”,這是- 8 -因為 CPU 已經(jīng)不僅僅是惟一的熱源,高轉速硬盤、光驅、各種芯片及板卡都在 這個狹小空間里產(chǎn)生著熱量, 所以在風扇轉動時, 機箱內(nèi)空氣必須能夠充分流動。 設備重啟正確操作 關機操作關閉操作系統(tǒng)關閉主機電源關閉外設電源 ( 如磁盤陣列,磁帶庫等 )關閉其他設備電源和機柜電源關閉總電源 開機操作打開總電源打開機柜電源打開外部設備電源 (如磁盤陣列 ,磁帶庫等 )待外部設備自檢完成后,最后打開主機電源加電啟動機器,如果機器能夠啟動, 說明系統(tǒng)完好; 如果加電之后就有問題, 說明系統(tǒng)在搬遷之前就有問題, 不是在搬遷過程中造成的。 搬遷方不負任何責任。7. 設備標簽和記錄服務器和小型機

16、:對服務器和小型機的網(wǎng)絡接口進行標簽, 當設備有多個網(wǎng)卡時每個網(wǎng)卡如何 連接,連接到那個設備都需要進行記錄和標簽。 服務器和小型機電源接口需要進 行標簽,一般服務器和小型機等重要設備都配置多個電源, 每個電源都連接到不 同的電源接口上, 所以對于多電源接口的設備需要進行詳細記錄和標簽。 對鍵盤 和鼠標接口也需要進行標簽或者記錄。對于設備特殊接口如:備份、呼叫中心、 外置硬盤等特殊接口必須進行重點標記和記錄, 每條特殊跳線都要詳細記錄和標 記。對于空余接口需要記錄和標記為不使用。位置和用途標記,當有多個相同類型的服務器時,每臺都要標記和記錄其使 用用途。及在機房中的位置等都要記錄詳細UPS:對機

17、房內(nèi)的 UPS 的功率和型號機型記錄和標記,電源接口的連接方式和供電模 式,以及對電源模塊的連接方式都要詳細記錄和標記, 每條不同的跳線最好也標 記清楚,對電池組內(nèi)的跳線連接方式和擺放模式進行詳細記錄和標記。 UPS 對 那些設備供電、電源線的連接方式也要進行記錄和標記。通訊設備: 通訊器材雖然有通信公司負責, 但是也要進行詳細的記錄和標記, 每條線的類型 和連接方式都要記錄和標記清楚, 每條線連接到那個設備上, 連接到設備的接口 和連接方式等都要詳細記錄,以及通訊器材的型號和容量等都要標記。網(wǎng)絡設備: 網(wǎng)絡設備是連線最為復雜的設備之一,機房內(nèi)的設備大多都連接到網(wǎng)絡設備里 面,如果網(wǎng)絡設備有配

18、置內(nèi)容和劃分端口等,就要對每個端口進行標記和記錄, 每個端口連接到那個設備等等記錄和標記。 對一個服務器需要連接多個端口的要 重點注意,因為一旦連接線路出現(xiàn)錯誤就將導致整個網(wǎng)絡的癱瘓。終端設備: 不同的終端提供不同的功能, 所以每個終端連接方式、 連接端口、 電源適配器等 都要進行記錄和標記, 不同的終端需要配合不同的設備使用, 每個終端和那個設 備配合使用,連接拓撲和跳線模式一定要詳細記錄和標記。搬遷機房中, 大量的設備和連接線往往會將技術人員搞得暈頭轉向, 所以要做到 互相監(jiān)督互相檢查才可以盡量做到周全和周密, 才會做到萬無一失。 在標記時要 做到盡量細化,標簽一定要使用高粘度不易脫落的,

19、以免在搬遷過程中脫落。8. 設備拆卸包裝設備拆卸的過程和順序是:服務器系統(tǒng)、 UPS、通訊系統(tǒng) , 然后網(wǎng)絡設備, 終端設備,搬遷過程也是如此。拆卸服務器時首先是外圍設備的拆除,包括鍵盤、鼠標、顯示器,然后是網(wǎng) 線、光纖跳線、讀寫器和特殊電纜的拆卸,不同的設備要放入不同的容器內(nèi),最 后就是主機的下架, 主機一般都固定及機柜里面, 每個主機可能有不同的導軌或 者工具要將他們和主機放在一起包裝和運輸, 以免到新機房后找不到原配配件而 無法上架。 主機一般要放在專門的箱子中, 箱子中要有防震發(fā)泡塑料, 防止主機 震動造成損壞,然后對主機進行固定,固定好后將箱子封閉。遠離高溫、高熱、 強磁環(huán)境。- 1

20、0 -UPS 拆卸過程中主要注意電池正負電極短路, 在拆卸過程中拆卸下來的電池 不要碼放, 要均勻整齊的擺放在地面上, 電池上面不能對方其他物品, 以免造成 電池放電、漏液、起火等因素。 如果原有電池包裝箱還有最好是每個電池都進行 保證,如果沒有包裝物在運輸過程中要單獨運輸, 注意運輸是電池不能碼放和堆 砌,要逐一放在平面上。通訊設備的拆卸主要有通信公司負責, 如果需要拆卸要重點保護拆卸完畢的 各種接口, 通訊設備一般都是光電設備, 光口拆除后內(nèi)部接口暴露, 搬遷過程由 于灰塵比較多容易造成光口無法使用, 因此在拆除過程中最好是通過接頭帽保護 接口。裝箱時注意不能碼放太多,運輸箱要防震,內(nèi)部要

21、放發(fā)泡塑料等減震。網(wǎng)絡設備在拆除過程中要注意靜電保護,一般網(wǎng)絡設備接地不理想,網(wǎng)線拆 除后靜電累積要通過機殼放電來保證設備安全, 所以要注意靜電放電, 同時在拆 除網(wǎng)線或者光纖的同時要將接口附近的灰塵清除干凈。 裝箱時一定要采取防震措 施,然后固定9. 設備搬遷運輸所有設備必須裝箱不能亂堆亂放, 在搬運過程中要平穩(wěn)輕放, 嚴禁設備倒置, 注意搬運過程中的力量, 要輕拿輕放不得踢砸等, 如果搬運時注意, 那設備一般 不會損壞, 機房搬遷過程中設備的故障和損壞主要是搬運過程不注意, 造成設備 內(nèi)部的部件損壞和脫落, 造成不應有的損失, 因此搬運時注意力道平衡, 輕取輕 放一般不會造成設備硬件問題。

22、機房設備都不能碼放太多,特別是 UPS 電池和服務器,一般服務器都不能 承重,碼放太多容易造成機器變形,引起設備故障,所以重要設備不要碼放,如 果碼放也不要超過兩層。新舊機房如果隔層時通過人力就可以搬運, 但如果距離比較遠的就需要運輸 車輛,車輛在運輸過程中速度不能太快,以慢速形式較易,轉彎時要不能太急, 要慢速轉彎, 不能造成設備的位移, 如果需要高速路運輸?shù)男枰獙Πb箱進行固 定。運輸時要選擇路途平坦,車輛少的路段運輸,每次不能運輸太多,每次必須 有人在貨物旁邊照應,以備應急情況。到達運輸?shù)貢r在向新機房內(nèi)搬遷時注意搬運細節(jié),不能用力過猛和扔投設 備,還是要輕拿輕放, 新機房一般都打掃干凈,

23、 所以設備不要帶著包裝箱進入新- 11 - 機房,要先拆箱后清理設備, 將設備清理干凈后放入機房的制定位置, 安裝時也 要注意不要碰撞和用力過猛。10. 設備安裝管理所有設備在進入新機房之前最好進行設備清理,條件許可的開箱清理。打開 機殼清潔設備內(nèi)表面的積塵, 可用干布噴上專業(yè)的清洗液擦拭。 布應盡量干, 擦 拭完畢應該晾干。 各種插頭插座、 擴充插槽、內(nèi)存插槽及板卡一般不要用水擦拭。 也可以用刷子刷或氣筒吹掉灰塵。拆裝清洗原則: 在打開機箱之前,雙手應該觸摸一下地面或者墻壁,釋放身上的靜電。保持 一定的濕度,空氣干燥也容易產(chǎn)生靜電,理想濕度應為 40%-60% ;清潔內(nèi)存條和適配卡各種時清潔

24、包括除塵和清潔電路板上的金手指。 可以用 刷子刷或吹掉灰塵。 也可用橡皮擦來擦除金手指表面的灰塵、 油污或氧化層, 切 不可用砂紙類東西來擦拭金手指,否則會損傷極薄的鍍層。因為所有設備長時間使用會老化 , 所有設備在正確設備清洗工作完成后 ,重新 裝上設備加電啟動電源, 如果能啟動說明設備完好, 如果運行不正常說明不是搬 遷過程中造成的。搬遷方不負任何責任。清潔完畢后按照新機房的規(guī)劃逐一安放設備, 設備安裝完畢后進行設備登記 和標記,記錄設備的功用和安裝時間、 負責人等。 設備最好按照不同的應用放在 不同的機柜和不同的區(qū)間內(nèi),最好規(guī)劃合理,比如:管理區(qū)、應用區(qū)等,可以按 照不同的行業(yè)應用和不同

25、的功能來劃分設備的區(qū)域。一個標準機柜可以放多個設備,但設備要合理搭配,比如電磁環(huán)境和溫濕度 等,每個設備之間要預留至少 10CM 的空隙便于散熱和通風,同時設備要固定 到機柜上,不能簡單的放在機柜托盤上。一個機柜不能擺放太多的設備。 KVM 等設備要擺放合理, 要易于管理員使用和觀看, 機房內(nèi)維護人員一般不能長時間 呆在機房內(nèi)部, 這樣容易造成對人體的危害, 所以維護人員都在管理區(qū), 通過遠 程登陸或者遠征桌面來管理各種設備。新機房內(nèi)電源應分別供電,有些設備是多電源結構,這些設備在安裝時電源 一定要連接到不同的電源插座上, 一旦某路電源出現(xiàn)問題也不會造成設備的停機 和損害- 12 -11. 系

26、統(tǒng)檢測及恢復所有設備上架安裝完畢后都要逐一加點測試,測試的主要內(nèi)容有:服務器硬 件配置是否改變、 服務啟動測試、 網(wǎng)絡設備啟動管理和配置變更、 通訊產(chǎn)品端狀 態(tài)燈等,測試的主要原因是設備搬遷過程中可能出現(xiàn)一系列問題, 比如硬盤損壞、 內(nèi)存松動、 灰塵污染等問題。 所以在正式使用之前一定要進行全面的檢測, 找出 問題解決問題,檢測出問題后及時解決和排除。當設備硬件沒有問題后還要進行一系列軟件方面的測試, 測試系統(tǒng)是不是正 常,有沒有系統(tǒng)服務無法啟動等問題, 對于軟件系統(tǒng)無法正常啟動的要及時恢復 啟動,恢復后還是無法使用的需要聯(lián)系廠商和代理商, 找出原因解決問題, 如果 還是無法解決的需要安排替換

27、機來代替。當所有的設備檢測無問題后可以正式啟動和應用, 對于一些系統(tǒng)需要恢復系 統(tǒng)的要恢復系統(tǒng), 需要恢復數(shù)據(jù)的要及時恢復數(shù)據(jù), 當設備完好并可以正常使用 后就可并到新的網(wǎng)絡中。設備在并網(wǎng)的時候有些需要變動 IP 地址和端口,如果 需要變動要及時通知網(wǎng)絡管理員或者相關負責人,以便變動后更換服務和配置, 這些都需要用戶技術人員親自辦理,特別是需要保密的數(shù)據(jù)。系統(tǒng)和設備恢復正常后要及時并網(wǎng)測試,測試要力求全面,當一切正常后搬 遷工作既成功完成。12. IP 地址規(guī)劃IP 地址規(guī)劃是針對設備在搬遷后 IP 地址有變化,設備需要重新配置制定的 配置表。在搬遷前對設備有一個詳細 IP 規(guī)劃,在配置時提高

28、效率避免錯誤。由于公司采用 IP 地址不變更,所以不需要改變,本項目省略。五、機房搬遷流程系統(tǒng)搬遷實施流程包括: 準備、拆卸、裝運、 安裝、調試等五個流程, 具體如下:1. 準備: 包括相關人員和設備準備、新機房環(huán)境準備、網(wǎng)絡環(huán)境、備份、現(xiàn)場所 有設備打標簽、模塊、設備準備等準備工作。2. 拆卸:主要只核心設備下架裝箱等3. 裝運:主要指設備由原機房到新機房的搬運過程。- 13 -4. 安裝:主要包括機柜就位、各機柜獨立安裝、網(wǎng)絡連線、強電接線、地板孔 調整等工作。5. 調試:主要包括強電調試、網(wǎng)絡調試、設備檢測、數(shù)據(jù)庫主機系統(tǒng)安裝調試、 測試、應用服務器系統(tǒng)安裝調試測試、系統(tǒng)聯(lián)測等內(nèi)容。實施

29、流程如下:設備端口標記表六、機房搬遷實施根據(jù)現(xiàn)有機房內(nèi)的設備情況,以及咨詢相關負責人,制定了搬遷實施計劃,按照機房內(nèi)設備不同的應用和使用情況,將搬遷工作分為 3 部分來執(zhí)行,第 部分是網(wǎng)絡設備的遷移, 第二部分是核心設備的遷移, 第三部分是其它設備的遷 移。1. 網(wǎng)絡設備的遷移機房內(nèi)部的網(wǎng)絡設備主要有, H3C1522 交換機 4 臺,華為 5328 核心交換 機 1 臺 ASA 防火墻一臺,以及各種網(wǎng)絡設備。具體的搬遷計劃如下:- 14 -1、線路標記和記錄4 小時2、設備配置信息備份和檢測1 小時3 、設備斷電、打包、搬運1 小時4、設備運輸1 小時5、設備檢測及恢復2 小時網(wǎng)絡設備是所有

30、設備聯(lián)網(wǎng)的前提保證, 所以網(wǎng)絡設備的搬遷是必須首先進行 的工作,搬遷選擇在晚上或者下午下班后進行, 一旦網(wǎng)絡設備搬遷結束就必須要 馬上恢復網(wǎng)絡設備,為下一步的關鍵服務器設備并網(wǎng)工作提供前提保證。網(wǎng)絡設備恢復正常后要馬上做網(wǎng)絡線路連通測試, 重要線路還要做壓力和持 續(xù)性測試,當線路測試正常后后續(xù)的設備才可以正常使用。2. 核心設備的遷移原機房內(nèi)主要的核心設備有 5328 核心交換機一臺,主要用途是網(wǎng)絡出口, 磁盤陣列一臺, 主要是存儲公司服務器數(shù)據(jù)。 由于設備比較重要所以相關的工作 會復雜一些,具體如下:1 、設備標記和記錄1 小時2 、設備系統(tǒng)檢測1 小時3 、5328 核心交換機配置文件備份

31、24 小時4 、磁盤整列數(shù)據(jù)備份到移動硬盤48 小時5 、設備斷電、打包、搬運1 小時6 、設備運輸1 小時7 、設備檢修1 小時8 、設備檢測及恢復2 小時9 、設備聯(lián)網(wǎng)測試2 小時斷電以前的工作需要提前進行,對系統(tǒng)和數(shù)據(jù)的備份工作因需時比較長,容 易出錯和故障, 需要做好相關的技術支持工作, 相關廠商的技術人員最好是現(xiàn)場 做技術工作, 帶有磁盤陣列的主機在開關機時都有一定的時限要求, 不能顛倒開 關機順序, 不能擅自改變時限要求。 在做好磁盤陣列備份后還要適時的進行光盤 備份工作,如果條件和時間允許光盤備份可以進行。備份建議:在備份好數(shù)據(jù)后,建議將數(shù)據(jù)異地備份,即通過移動介質移動磁- 15

32、 - 盤、光盤或其他介質將數(shù)據(jù)備份到其他地方,以備服務器有問題時恢復用其它服務器的備份主要是通過 DVD 光盤的方式來對系統(tǒng)和應用數(shù)據(jù)進行備 份。搬運和運輸時最好也是使用專用的包裝箱來包裝。 這些設備在運抵目的地后 要進行全面的清理和維護工作, 在所有設備重新維護后上架開機測試。 測試通過 即表面工作完成3. 其它設備的遷移機房內(nèi)其它設備主要有: UPS 、服務器、計算機等,這些設備包含了公司的 其它大部分業(yè)務, 如:殺毒、 FTP、郵件、 等。這些設備的搬遷步驟和時間如下:1 、設備的標記和記錄1 小時2 、系統(tǒng)設備檢測3 小時3 、設備備份 48 小時4 、設備斷電、打包、搬運3 小時5

33、、設備運輸1 小時6 、設備檢修2 小時7 、設備檢測及恢復3 小時8 、設備聯(lián)網(wǎng)測試2 小時在設備標記過程中除要詳細記錄各種線纜和接口外, 也要遵循上述設備的運 輸管理規(guī)定。對設備進行檢測時也要全面和詳細,具體包括:操作系統(tǒng)、硬件配 置、設備管理器、軟件配置、硬件連接狀況、設備安放情況等。在做完上述工作后需要對系統(tǒng)和數(shù)據(jù)進行備份, 其中殺毒服務器可以適時對 其進行備份,備份工具主要是使用 DVD 光盤,本服務器也可以不用做備份,或 者在本機內(nèi)部做備份。郵件服務器為虛擬服務器,可以做快照備份。備份后根據(jù)需要在做移動硬盤 盤備份,正常情況下快照備份完全可以做到突發(fā)情況恢復, 但是快照備份在磁盤

34、陣列下,一旦磁盤陣列當機無法恢復快照。因此還要異地移動存儲介質備份。斷電順序:服務器主機 磁盤陣列加電順序:陣列 服務器主機。陣列斷電:陣列斷電方式直接關閉電源即可- 16 -七、機房搬遷時間安排上述搬遷工作預計需要時間為 3 天,具體搬遷時間安排如下: 設備標記和記錄用時 0.5 天(提前做完) 重要設備備份用時 23 天(提前做完) 設備檢測用時 0.3 天 設備斷電和打包 0.3 天設備搬遷和運輸 0.5 天設備安裝和上架 0.5 天設備檢測及恢復 0.5 天八、應急處理在設備搬遷后出現(xiàn)異常情況時現(xiàn)場技術人員立即檢查設備,檢查故障現(xiàn)象, 確定故障位置。硬件故障在備件準備范圍內(nèi)的立即更換,

35、 不在范圍內(nèi)的立即使用備用設備最 短時間內(nèi)啟用備用設備。 由于配置數(shù)據(jù)或系統(tǒng)不能啟動的立即使用系統(tǒng)光盤備份 數(shù)據(jù)等先前準備的備用工具軟件系統(tǒng)軟件重新按裝或恢復。九、機房遷移設備清單序號設備名稱型號數(shù)量備注1二層交換機H3C 152242三層交換機華為 532813防火墻ASA14電話交換機國威15ROS路由電腦機箱16服務器戴爾6- 17 -7UPS電源ON-Line18空調美的19機柜圖騰2十、 備品備件清單在搬遷過程中經(jīng)常會有一些易損件損壞, 影響搬遷工作的順利進行, 甚至影響到 用戶的工作。我根據(jù)以下服務器配置列表將提供額外的備品備件以備急需。 公司網(wǎng)絡管理人員需要攜帶必要工具:螺絲刀,

36、筆記本電腦,偏口鉗等工具。設備數(shù)量單位光纖1條內(nèi)存 1*2GB1對硬盤300GB SAS1塊500GB SAS1塊測線儀1個替換網(wǎng)線1條捆扎帶1包X3650 電源個Windows 2008 Server 企 業(yè)版 安裝光盤1片Windows 2008 Server 標 準版 安裝光盤1片十一、 搬遷后觸發(fā)的事故說明1、Exchange 與域控當機事故事故時間: 2012年 7月 8號下午 16時2012年7月9號上午 10時30分事故前情況: 郵件服務器及公司各服務器網(wǎng)絡正常運轉。 收發(fā)郵件及訪問郵箱無不良反應。- 18 -事故發(fā)生經(jīng)過和處理情況:2012年 7月 8 號下午 16 時。由于裝

37、修人員擅自斷電導致機房斷電,網(wǎng)絡管 理人員立刻前去機房查看,服務器安順序開機,其中 Exchange 服務器開機后無 法正常運行,隨后展開針對 Exchange 服務器問題討論并實施經(jīng)過處理能正常訪 問。但是在 2012年7月9號上午 10時30分。由于裝修人員誤關閉電閘機房設 備再次意外斷電,網(wǎng)絡維護人員再前去處理的時候發(fā)現(xiàn)其它服務器可以正常運 行,其中預控、 Exchange 服務器無法開啟。針對這兩臺虛擬服務器展開排查。 確認是系統(tǒng)文件丟失及備份數(shù)據(jù)快照丟失。 因此無法進行數(shù)據(jù)還原。 我們嘗試一 切所能想到的方法都失敗告終其中包括: 用光盤引導修復系統(tǒng)文件、 檢查系統(tǒng)內(nèi) 存、安全模式都無

38、法恢復系統(tǒng)。 李勝磊李總和張杰張總知道發(fā)生事故幫助我們共 同討論但最終也無終而果。但好在我們通過 PE的手段進入到郵件系統(tǒng)成功拷貝 出了 Exchange數(shù)據(jù)庫文件。 嘗試過新建 Exchange服務器導入數(shù)據(jù)庫文件、 使用 軟件讀取數(shù)據(jù)庫文件。 但至今沒找到數(shù)據(jù)恢復的辦法, 不過我們一直在不斷的尋 找方法恢復數(shù)據(jù)文件。解決方案:Exchange 服務器:1)通過 EP進入郵件服務器,導出數(shù)據(jù)文件。2)新建郵件服務器導入數(shù)據(jù)(發(fā)現(xiàn)導入不成功)我們現(xiàn)在正在跟進,尋找 解決方法。3)新建免費 Linux 郵箱 poftfix 。因為是剛建立免費郵箱,問題如下: 通 訊組的不完善,郵件服務器運行仍然

39、存在問題。 我們會實時跟進, 找出原因。 做到郵箱服務器的穩(wěn)定與安全。域控服務器:1)目前公司沒有域控,暫時借用電信 DNS。等公司搬家事項穩(wěn)定??貙⒅匦陆?立。2)考慮到正版化問題, DNS解析服務器建立在 Linux 系統(tǒng)上。事故原因:- 19 - 裝修人員沒有跟公司網(wǎng)絡管理人員溝通直接關電導致機房斷電 裝修人員誤關電閘導致機房斷電事故損失情況:Exchange 服務器當機,直接導致公司郵件無法發(fā)送影響公司全體員工辦公 效率, 其中公司高層領導重要郵件數(shù)據(jù)無法讀取。 不過我們在 Exchange 服務器 當機 1 周之內(nèi)從新搭建免費郵箱先暫時供大家使用,后續(xù)我們會盡早恢復 Exchange

40、郵箱服務器。預控服務器當機,直接影響公司網(wǎng)絡通信導致外網(wǎng)無法訪問公司服務器以及 員工用網(wǎng)問題。我們通過電信 DNS已經(jīng)解決網(wǎng)絡問題, 新的預控服務器已經(jīng)搭建 完畢我們逐步完善,后續(xù)會重新使用公司預控。事故暴露問題1) 搬家計劃細節(jié)問題沒有考慮到導致 UPS沒有及時安裝2) 沒有做到緊急事故的處理方案3) 網(wǎng)絡管理人員責任心存在不足 預防事故重復發(fā)生的措施1) 加強網(wǎng)絡管理人員的責任心及做工作的嚴謹態(tài)度2) 加強員工的職業(yè)技能,定期做相關培訓3) 要每天對機房進行檢查,發(fā)現(xiàn)問題及時處理,如處理不了及時上報領導。4) 做好每天的機房運行日志。對事故責任的分析1)裝修工程隊負首要責任2)機房搬家部門

41、負連帶責任體會: 通過這次搬家出現(xiàn)的重大事故給我們敲響了警鐘,做任何事之前一定要想 好周密的計劃以及出現(xiàn)突發(fā)事件的決絕方法。 提高員工工作態(tài)度以及責任心是重 重之重!網(wǎng)絡管理人員加強自身的責任心以外還要加強職業(yè)技能。 技能提高了遇 事才能沉著冷靜!2、網(wǎng)絡的混亂- 20 -1)搬遷至 7 樓打亂原有 VLAN劃分。2)沒有做好網(wǎng)絡分布計劃3)實施緩慢 體會: 在搬遷之前應做好搬遷后網(wǎng)絡分布詳細計劃,以及 VLAN分布圖,根據(jù)計劃 實施。有計劃的實施效率會更高,事故率會更低。工作態(tài)度與積極性不高,思考 不夠全面。3、UPS安裝不及時造成損失: 由于各服務器再沒有 UPS保護情況下運行, 導致郵件

42、、 域控當機。 直接造成 公司網(wǎng)絡及收發(fā)郵件癱瘓為公司帶來直接工作效率損失。體會:公司新辦公環(huán)境正在裝修, 電壓不穩(wěn)定。 隨時都能有斷電的可能, 由于公司 領導出差, 安裝費用沒有審批抱著僥幸的心理導致 UPS電源沒有及時安裝。 遇事 第一想到的是領導, 領導不決定或者不在工作就暫停。 導致事故發(fā)生, 說明主見 性與自我分析能力不強。4、針對事故的有利方面1 )郵件服務器當機 利端: 讓我們學習到了搭建免費郵箱,在搭建的同時考慮到今后公司發(fā)展,本 著節(jié)約成本的想法把免費 Postfix 郵箱搭建在 Linux 系統(tǒng)上。 避免了后續(xù)安 裝正版系統(tǒng)問題。2 )域控服務器當機利端:學習在 Linux 系統(tǒng)上搭建 DNS解析服務。從中了解 Linux 系統(tǒng)各項服。 學習到了做事要留存技術方法文檔。八、搬遷工作中問題總結“工作責任心” 通過本次搬遷, 總結到個人工作態(tài)度, 以及對處理事務的責任 心不強,例如: 如果我們有著很強的責任心, 我想不會出現(xiàn)服務器當機的情況發(fā)- 21 - 生?!肮ぷ鞣e極性” 工作積極性不高, 做任何事情都是領導說什么, 我們就去做什 么,而且做的還不是很出色。 工作任務完成的還不是很徹底拖泥帶水。 要做好某 一件事并不是拉一步才走一步的。要自己去開拓進取、勇于創(chuàng)新突破自己?!肮ぷ饕粍谟酪荨?在工作中不能老是拿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論