今天整理之前的運維資料,發(fā)現(xiàn)了自己整理的一次刀片服務器(運行的vmware虛擬化)事故處理流程,所以記錄下,備忘。
創(chuàng)新互聯(lián)公司長期為數(shù)千家客戶提供的網(wǎng)站建設服務,團隊從業(yè)經(jīng)驗10年,關注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務;打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為郾城企業(yè)提供專業(yè)的網(wǎng)站制作、做網(wǎng)站,郾城網(wǎng)站改版等技術服務。擁有十多年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。
一、事件處理過程
14:10 接到機房運維工程師通知,Opmanager監(jiān)控系統(tǒng)上出現(xiàn)了多臺服務器宕機現(xiàn)象,并且均為虛擬機。
14:12 通知機房運維工程師檢查HP刀片服務器是否有告警,遠程登錄vcenter進行檢查。遠程查看發(fā)現(xiàn)ESX04(10.203.11.64)出現(xiàn)告警,告警信息如下圖所示:
14:15 通知工程師ESX04出現(xiàn)告警,然后確認該刀片服務器是否存活,并進入機房確認設備上是否有硬件上的告警。
14:16 檢查邏輯上的網(wǎng)絡接口是否存在異常
如下圖所示,發(fā)現(xiàn)有兩塊網(wǎng)卡處于離線狀態(tài)
14:18 檢查其它刀片,發(fā)現(xiàn)ESXI02對應的網(wǎng)卡,發(fā)現(xiàn)為正常的
14:20 登錄HP刀片管理控制臺查看,未發(fā)現(xiàn)服務器告警信息。
14:19 參照其它EXSI,嘗試更改vmnic6、vmnic7兩塊網(wǎng)卡模式,該操作無法生效
更改網(wǎng)卡模式無法生效
14:27 在ESX04進行手動遷移虛擬機到其他主機上,遷移失敗。
14:58 將ESX04主機上的虛擬機全部關機
15:20 重啟ESXI主機,HA 自動將開著的虛擬機遷移到其他EXSI主機上啟動
15:30 ESX04主機啟動成功后,vsphereHA嘗試自動將虛擬機遷移回ESX04主機失敗,
15:50 手動遷移部分虛擬機回ESX04主機,觀察運行狀態(tài)。
二、日志分析
1、遠程登錄到ESXI的命令行,查看vmkernel的日志:
說明:由于esxi4采用的是utc時間,日志中顯示的較時間時間會慢8小時
/var/log # cat /var/log/vmkernel.log | grep '2014-12-18' 2014-12-18T03:27:49.106Zcpu46:6396479)WARNING: ScsiDeviceIO: 1211: Devicenaa.60014380064900f30000800000e40000 performance hasdeteriorated. I/O latency increased from average value of 3303 microseconds to68755 microseconds. 2014-12-18T03:31:54.595Zcpu8:16392)ScsiDeviceIO: 1191: Device naa.60014380064900f30000800000e40000performance has improved. I/O latency reduced from 68755 microseconds to 13691microseconds. 2014-12-18T03:32:32.643Zcpu12:17017)MigrateNet: vm 17017: 2061: Accepted connection from <10.203.11.100> 2014-12-18T03:32:32.643Zcpu12:17017)MigrateNet: vm 17017: 2131: dataSocket 0x4100253292f0 receivebuffer size is 563560 2014-12-18T03:32:32.644Z cpu12:17017)WARNING:Migrate: 262: Invalid message type for new connection: 542393671. Expecting message
如上面的日志顯示:13:27,主機的性能開始下降,I/O延遲變的較大
2、查看10.203.11.100是否有相關告警:
如上圖所示,提示esx04主機的網(wǎng)卡狀態(tài)出現(xiàn)錯誤
3、收集的其它日志如下,暫未發(fā)現(xiàn)異常
整個處理過程到此基本完成,所有的刀片服務器中,也就這臺偶爾抽風,也沒有明顯的特征
分享題目:記一次服務器宕機處理過程
網(wǎng)站URL:http://m.rwnh.cn/article20/igjcjo.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供電子商務、用戶體驗、品牌網(wǎng)站建設、做網(wǎng)站、網(wǎng)站策劃、商城網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)