作者 主題: 請問如何管理大型機房?  (閱讀 7635 次)

0 會員 與 1 訪客 正在閱讀本文。

jonathan_lwo

  • 活潑的大學生
  • ***
  • 文章數: 319
    • 檢視個人資料
請問如何管理大型機房?
« 於: 2011-12-22 22:56 »
最近轉換跑道,在一家公司面試,
我先說自己做過的工作經驗,管理過的機房約有40到50部主機

如何管理呢?因為前老闆對管理的工具軟體也不怎麼投資
因此我都是土法練鋼,一台台登入看狀態,或是用windows
的MMC集中event log 檢查 ,
或是scrpit 把Server 的狀態集中傳回來檢查
被批評太耗時間了,檢查完一天就過去了


可是此公司機房不只一個,分散全球
每個點主機上百台,遠遠超過小弟的能力了…

如果是版上的大大們,這要如何管理呢?

aizr1212

  • 可愛的小學生
  • *
  • 文章數: 11
    • 檢視個人資料
Re: 請問如何管理大型機房?
« 回覆 #1 於: 2011-12-22 23:52 »
過去上班的時候,公司就會告知要如何管理了!! 而且不可能讓你自己一人管到"全球"吧~~~~

u8526425

  • 俺是博士!
  • *****
  • 文章數: 1135
  • 性別: 男
    • 檢視個人資料
Re: 請問如何管理大型機房?
« 回覆 #2 於: 2011-12-24 01:00 »
網管軟體
多見者博,多聞者智,拒諫者塞,專己者孤

蜜蜂

  • 活潑的大學生
  • ***
  • 文章數: 276
  • 性別: 男
    • 檢視個人資料
Re: 請問如何管理大型機房?
« 回覆 #3 於: 2011-12-24 22:44 »
台灣因為 IT 人力密集, 所以往往用人去解決問題. 而較少去規劃與改善 operation 的效率.
建議你可以先了解 IT 的 operation.
試問, 當人力還是一樣時, 要如何規劃達成管理兩倍於現在的服務規模 ?

市場上有幾門基本課是值得去上的,
ITIL® Foundation for Service Management
Supporting Cisco Service Provider IP NGN Operations

chanhoktai

  • 可愛的小學生
  • *
  • 文章數: 1
    • 檢視個人資料
Re: 請問如何管理大型機房?
« 回覆 #4 於: 2012-05-17 15:19 »
http://www.visguy.com/2009/04/14/rack-server-virtualization-add-in/
visio rack utilization add-on for basic real-time monitoring
sensaphone ims4000 for environmental monitoring

netman

  • 管理員
  • 俺是博士!
  • *****
  • 文章數: 17340
    • 檢視個人資料
    • http://www.study-area.org
Re: 請問如何管理大型機房?
« 回覆 #5 於: 2012-05-18 15:05 »
like google or facebook?

duncanlo

  • SA 苦力組
  • 俺是博士!
  • *****
  • 文章數: 7311
    • 檢視個人資料
Re: 請問如何管理大型機房?
« 回覆 #6 於: 2012-06-27 09:32 »
我覺得可以先參考ITIL把十個問題分類後,再分別找解決方案,
目前的技術應該只剩即時的成本分攤分析不好作而已...

chiehwu

  • 榮譽學長
  • 懷疑的國中生
  • **
  • 文章數: 33
  • 性別: 男
    • 檢視個人資料
    • 老吳研究室
Re: 請問如何管理大型機房?
« 回覆 #7 於: 2014-06-10 09:47 »
這個議題發布很久了,不過這是一個好議題。理論上,如果去管理大型機房,又是24小時的全球維運,應該很容易展現出工作價值,對於個人的收入也應該有所幫助,當然付出一定很多、很辛苦,所以一定要有知道大方向與相關的技巧才行。

首先記得,監控其實只是手段而已,利用軟體進行監控,只是擁有了好工具。自己的寫的 script 進行監控也可以,只是未必是好工具。現在的市場上,從機房的環境,到網路與伺服器硬體等,加上作業系統、資料庫、應用程式等等,每一個層級都有監控的軟體可以用,更有整合起來的軟體,提供 Dash Board 等相關的工具。說穿了,只要有錢,監控系統的這些軟體工具都似乎不是問題。

對啦,就是有錢,要老闆投資。要老闆投資,似乎很難!但是也會有理性的老闆與企業相信自身的業務是倚賴資訊系統的。因此,我再強調,監控只是手段,重點是要與業務整合。

接手管理的首先,一定要全面清查,哪些伺服器有跑哪些軟體,又那些軟體與哪些伺服器與軟體,共同構成那些業務系統。這些關聯性一定要清楚!然後,業務系統支持哪些業務部門,有哪些用戶,這也需要清楚。由此知道,那些用戶,或是業務部門的工作時間 … 比方說,7x24 小時不中斷?還是5x8 有下班時間?還是每個月有旺季與淡季分別,記得全球運營,你得要想的是各國的時差與系統的時差等等。

把業務時間都搞清楚了,也關連上相關的軟體與硬體,此時你應該可以看清一個全局!哪些軟體硬體,支持哪些業務,如果故障了,哪些業務會中斷,可以中斷嗎?還是不行中斷?可以維修的時間點有多少?這樣子,你監控的目的就出現了。此時,你思考的方向要朝兩個方向來看:主動與被動。

主動就是:預防性的工作。有了監控,很多問題,是可以事先發現及預防的。單點故障也可以輕易的找出來。被動就是:出現問題後你的對策。不要傻傻的拼命解決問題!業務停頓,時間都花費在你解問題的消耗上,變成了眾矢之的。應該立即啟動設計好的備援計劃,或是所謂的離線作業,不要讓業務中斷,也給自己爭取時間進行維修。

全局思考很重要,不要呆呆的只會工作。一旦把業務與資訊系統的關聯性展性的很清晰的時候,老闆還不投資,那你就可以考慮換老闆了,換一個有理性的老闆吧。

duncanlo

  • SA 苦力組
  • 俺是博士!
  • *****
  • 文章數: 7311
    • 檢視個人資料
Re: 請問如何管理大型機房?
« 回覆 #8 於: 2014-06-13 10:33 »
(((讚!!)))

有親身參與過的,就可以體會到吳老師所言.

共勉,學習,成長...