作者 主題: VM運作時萬一SAN發生斷電故障,VM會自行修復嗎?需要chkdsk嗎?  (閱讀 7086 次)

0 會員 與 1 訪客 正在閱讀本文。

maxwkimo

  • 懷疑的國中生
  • **
  • 文章數: 39
  • 性別: 男
    • 檢視個人資料
假設啟動狀態的VM萬一儲域網路斷線或停電

VM會自行修復虛擬磁碟嗎?
又或者是有修復軟體可以做這類的修復嗎?
目前有開的機器使用windows chkdsk 或是linux fsck
有點疑惑,總覺得虛擬磁碟屬於映像檔內容又是檔案,好像沒有真的磁區?

不知是否有專家或有經驗的版友可以分享一下

u8526425

  • 俺是博士!
  • *****
  • 文章數: 1135
  • 性別: 男
    • 檢視個人資料
不管是實體或虛擬
這個時候你應該關心的是有沒有做好備份或備援
建議不要把全部希望寄託在不確定性太高的修復機制上面
多見者博,多聞者智,拒諫者塞,專己者孤

maxwkimo

  • 懷疑的國中生
  • **
  • 文章數: 39
  • 性別: 男
    • 檢視個人資料
感謝您的回覆

是有做完整備份的,目前整個環境40多台是沒有發現有毀損的狀況,但是保險起見想做個磁碟掃描來確認
擔心磁碟掃描這件事是否對VM的虛擬磁碟無效或是有更好的方式可以處理樣的狀況,所以才發問請教版友!

希望能給予一些意見及方案,彼此交換一下經驗!

日京三子

  • 全區板主
  • 俺是博士!
  • *****
  • 文章數: 8830
    • 檢視個人資料
    • http://www.24online.cjb.net
感謝您的回覆

是有做完整備份的,目前整個環境40多台是沒有發現有毀損的狀況,但是保險起見想做個磁碟掃描來確認
擔心磁碟掃描這件事是否對VM的虛擬磁碟無效或是有更好的方式可以處理樣的狀況,所以才發問請教版友!

希望能給予一些意見及方案,彼此交換一下經驗!

如果系統自我檢查有問題,那就是看能否拉快照或者備份回來,讓系統儘速恢復上線運作.....



等他慢慢修? 會不會等到天荒地老之後還是一場空?
-----
 至少我不會賭這樣的最後的機制.....
哈克不愛的多合一輸入平台----->新香草口味
過去的時間不斷流逝,抹去的眼淚已成追憶;
乾枯的雙手無力阻止,再會了我遠去的曾經。

maxwkimo

  • 懷疑的國中生
  • **
  • 文章數: 39
  • 性別: 男
    • 檢視個人資料
感謝幾位給予的意見與回覆

經過測試之後,針對VM虛擬磁碟的故障,斷線,異常啟動等幾個解決方案整理一下

1.常做快照是可行的,但快照太多反而系統會慢,所以變成要定期清理不需要的快照
2.完整備份當然可以解決故障的問題,但即時性的異動無法被這樣的備份所彌補,所以這類型的備份通常論月或年來算,不算最佳解
3.第三方工具進行針對磁區異動即時性的同步,還有搭配快照等強化備份與自動化排程,很方便但是要鈔票才能解決!

上述都是透過還原或取代的方式來解決VM故障的狀況
如果非得用原本的VM來修復的話,基本上好像要看VM狀況,我遇到的斷電後狀態
如果VM還能開機,卡在95%,千萬別亂動,放個一下子他是可能有機會開起來的! 不行的話可能要參考"進階作法"
開機後會發現某些服務異常無法啟動,例如vmtools 或是其他狀況,仍然可以透過chkdsk /f或fsck做復原
通常磁碟檢查還是會作修復的,初次啟動異常關機或斷電的VM會感覺特別慢(不知道磁碟在忙啥?)
沒啥大問題的話磁碟掃描完畢後重新開機就正常了

"進階作法"
至於那些開不起來或是整個死機的VM,要先檢查一下datastore裡面VM的檔案有哪些,有沒有毀損無法讀取
基本上vmdk沒壞的話都還有機會!

我試過的還魂大法有幾種
1.砍光其他沒用的設定檔,直接建立新VM來掛這顆舊硬碟
2.使用第三方A牌,S牌,E牌磁碟複製拷貝工具忽略錯誤,完成後修復啟動磁區或直接開來看看是否成功
3.有時候直接再convert一次也可以解決

還魂大法成功的機率不大,也很浪費時間,所以有備份還是比較重要(有備有保庇)
唉!原來Storge真的很怕斷電捏!.....別太相信RAID,三不五時異機備份一下吧!

u8526425

  • 俺是博士!
  • *****
  • 文章數: 1135
  • 性別: 男
    • 檢視個人資料
凡精密機器都很忌諱在運作當中不正常中斷 (含斷電狀況)
所以一般企業級設備的重要元件會設計成redundant
設計redundant power的用意也是拿來接不同電路的UPS
極力避免有電力中斷的問題產生
多見者博,多聞者智,拒諫者塞,專己者孤

duncanlo

  • SA 苦力組
  • 俺是博士!
  • *****
  • 文章數: 7312
    • 檢視個人資料
這個修復的動作,可能跟你Guest OS的種類有關,現在的FS多半開機會作check disk...

summer05145

  • 可愛的小學生
  • *
  • 文章數: 17
    • 檢視個人資料
唉!原來Storge真的很怕斷電捏!.....別太相信RAID,三不五時異機備份一下吧!

一般市售的Storage或是企業級的RAID Card都會有cache的設計,關鍵在於RAID的寫入需要運算跟時間
所以當前端設備的資料過來並不會第一時間被寫入硬碟,但是系統會先接收到RAID的回覆表示資料寫入完成
但事實上資料仍在RAID的Cache裡面處理中並逐步的寫到硬碟去。

看完上面的廢話後大家一定會想原來RAID的Cache大不一定是好事,但是硬體廠商怎麼可以不知道這個風險
還把Cache越搞越大,因為這些設備都可以加上鋰電池來保護。

無論是Stoage還是RAID Card加裝鋰電池後可以保護Cache裡面的資料達72小時,在正常情況可以讓設備
等到恢復電力後把資料寫完。

但是鋰電池是消耗品,選配,保固只有一年,單價不低,在Si遭受殺價的情況下第一個被拿掉的東西就是電池。
所以各位前輩不妨看看自己的設備有沒有安裝鋰電池(BBU)
小弟是Sever代理商
來只是純粹討論規格、架構、可用性
如果文章太過商業化請告知小弟