山東機房運維:機房搬遷流程和注意事項
在機房運維過程中,最龐大的工程無外乎就是機房搬遷了,這種傷筋動骨的大動作,我們必須提前做好機房搬遷流程的梳理,提前做好預(yù)案。
數(shù)據(jù)中心搬遷/機房搬遷
一、 1、所有工作時間分為3個階段:搬遷前,搬遷中,搬遷后
搬遷前: 服務(wù)器在老機房運行階段,
搬遷中: 老機房停止服務(wù),下架,運輸?shù)叫聶C房階段 搬遷后:服務(wù)器運送到新機房,
2、整個搬遷過程需考慮如下幾個方面: 機柜空間,網(wǎng)絡(luò),硬件設(shè)備、操作系統(tǒng)、數(shù)據(jù)完整性,基礎(chǔ)服務(wù),項目應(yīng)用,搬遷流程 ,
機柜空間: 新舊機房機柜空間大小不同,需提前安排好服務(wù)器放置位置,
網(wǎng)絡(luò): 老機房有4個網(wǎng)段,需全部正確切換到新機房,并對應(yīng)上服務(wù)器所需網(wǎng)段,線上內(nèi)網(wǎng)環(huán)境應(yīng)保證不用任何改動,所有服務(wù)器上線后網(wǎng)絡(luò)自然接通,
硬件設(shè)備: 交換機、路由器、服務(wù)器硬件本身,存儲設(shè)備,應(yīng)保證正常啟動,防止配置丟失導(dǎo)致啟動后重新配置等問題,
操作系統(tǒng): 需提前做好檢測,防止操作系統(tǒng)不能啟動,
數(shù)據(jù)完整性: 需要保證數(shù)據(jù)完整,防止誤操作、物理損壞等造成數(shù)據(jù)丟失,
基礎(chǔ)服務(wù): vpn,文件服務(wù)器等影響全局的基礎(chǔ)服務(wù),需保證可以首先并正確啟動,
項目應(yīng)用: 需保證項目按照相應(yīng)順序以此正常啟動,主要要確保數(shù)據(jù)庫,緩存,消息隊列等基礎(chǔ)服務(wù)先啟動后,再啟動項目,
搬遷流程: 整個搬遷流程應(yīng)責(zé)任到每個人,明確責(zé)任,盡量簡化人為操作,防止人為造成損失。
二、 搬遷前準(zhǔn)備工作
1、 老機房工作
去老機房統(tǒng)計所有設(shè)備型號,U數(shù) 統(tǒng)計并確認(rèn)所有機柜外網(wǎng)段使用情況 統(tǒng)計網(wǎng)絡(luò)設(shè)備位置信息,使用情況等保證硬件設(shè)備標(biāo)簽完整、正確、識別性高,
根據(jù)上述信息,對所有硬件設(shè)備新增標(biāo)簽,注明搬遷責(zé)任人、網(wǎng)卡使用情況、新機房機柜號等內(nèi)容,便于搬遷時高效無誤的工作。
2、 新機房工作
運維所有員工逐次到新機房熟悉地形,防止因不熟悉地形,忙中出錯 所有機柜提前做好網(wǎng)線、電源線的準(zhǔn)備工作,內(nèi)網(wǎng)外網(wǎng)用不同顏色成品線區(qū)分,做到易識別。
臨時交換機上架,測試網(wǎng)絡(luò)連通性 測試每根網(wǎng)線連通性,每根電線連通性,保證上架時不是這些基礎(chǔ)小問題延誤工作 機柜貼標(biāo)示,再次注明機柜同服務(wù)器關(guān)系,避免上架時混亂。
3、 遠(yuǎn)程工作
統(tǒng)計所有nfs掛載情況,提前做好啟動自動掛載,
做好數(shù)據(jù)庫備份方案,各個項目主庫不能啟動應(yīng)急方案 做好文件備份方案,提前備份nfs上項目文件,
做好基礎(chǔ)服務(wù)替代方案,配置好替換路由器等,防止線上路由器損壞,
所有應(yīng)用、系統(tǒng)做好關(guān)停腳本 所有應(yīng)用、系統(tǒng)做好啟動腳本 測試腳本使用效果,保證可靠性。
三、 搬遷過程中
1、 老機房
提前到機房,每個人確認(rèn)負(fù)責(zé)服務(wù)器器,并熟悉位置,
確認(rèn)每項前期準(zhǔn)備工作是否已經(jīng)到位,
凌晨一點,按照關(guān)閉順序,每個人登陸負(fù)責(zé)服務(wù)器執(zhí)行關(guān)停腳本,關(guān)停所負(fù)責(zé)服務(wù)器,
通知機房技術(shù)人員,切換網(wǎng)絡(luò)到新機房,并由負(fù)責(zé)人測試新機房網(wǎng)絡(luò)連通效果,確保新機房網(wǎng)絡(luò)正常,
正常關(guān)閉并斷電后,下架服務(wù)器按照順序搬到樓下運輸車上。
2、 運輸過程中
數(shù)據(jù)庫服務(wù)器采用防震泡沫纏繞后裝車,
每個人負(fù)責(zé)自己的服務(wù)器不受大的震動,防止由于大震動導(dǎo)致服務(wù)器故障,不能啟動,
到新機房樓下,按照先后順序,依次進(jìn)入新機房,原則上數(shù)據(jù)庫服務(wù)器和基礎(chǔ)服務(wù)服務(wù)器先進(jìn)機房。
3、 搬遷到新機房后
每個人按照事先標(biāo)識好的標(biāo)簽上面的內(nèi)容上架,接通網(wǎng)絡(luò),接通電源 首先保證所有數(shù)據(jù)庫啟動,并檢查主從狀態(tài)等 剩余服務(wù)器確認(rèn)電源、網(wǎng)絡(luò)都插好后,加電啟動
所有服務(wù)器啟動后,觀察機柜電流表是否有超電現(xiàn)象,
有超電現(xiàn)象的機柜和無超電現(xiàn)象服務(wù)器調(diào)換位置,進(jìn)行電力平衡,
每個人登陸自己負(fù)責(zé)服務(wù)器,執(zhí)行啟動腳本,依次啟動虛機,項目應(yīng)用等 測試訪問情況,
訪問沒有問題以后,給測試人員打電話,走功能測試流程 通過后,結(jié)束等待訪問量上升后無問題,離開。