顯示文章

這裡允許您檢視這個會員的所有文章。請注意, 您只能看見您有權限閱讀的文章。


文章 - MiniCaesar

頁: [1]
1
Linux 討論版 / 回覆: 伺服器故障
« 於: 2010-03-14 21:55 »
1.
字數那麼豐富的提問....很久沒看到了
2.
grep 是一支專門抓關鍵字串的程式,比方說要在 error_log 找出任何有「Sun」的行,就像這樣下:
代碼: [選擇]
cat /var/log/httpd/error_log|grep Sun或者:
代碼: [選擇]
grep Sun /var/log/httpd/error_log3.
如果網站很熱門,那麼 log 大不太能跟管理無方劃上等號....
log 太大的話,不如索性先刪掉,直接觀察後續運作所新增的 log
4.
既然您卡住的地方是在防火牆,那麼我建議您檢查 /var/log/message 這類全系統的 log

1.請問這是誇獎嗎?還是指我使用過多的冗詞?

2.原來 grep 是這樣用的啊!謝謝您的指導!

3.我查了一下 Google Analytics 後發現每日造訪量在 50~100 之間,瀏覽量在 50~400 不等,這樣並不算很熱門。

4.這個 log 剛剛稍微看了一下了,大多數都是 smbd[2755]:   Unable to connect to CUPS server localhost:631,都是拒絕連線,這兩天我會在好好看過的!

在請教,為什麼我時常會在終端機看到這個訊息呢?『You have new mail in /var/spool/mail/root』

2
MIS 討論區 / Server 採購
« 於: 2010-03-14 03:47 »
學校有新的計畫案要採購 Server,我的目標是 Blade Server,日前打到 IBM 尋價,OEM 丟了一框兩刀五十萬,系主任聽了馬上說不要,想再這裡聽聽先進的想法與看法!未來 Server run 的是 CentOS、MySQL 主要是做商務平台,會使用到龐大的運算能力,因為無法評估未來的使用流量,所以選擇較容易擴充的 Blade Server,但因為這樣我陷入一個很大的難題,就是……關於 Blade Server 的架設、管理、維護,這些東西要去哪裡學習?還有價錢都是那麼高,壓不下來嗎?我們整個資管系一學期的經費都沒有五十萬,還是我買個 2U、4U 來做 Server 就好了呢?剛剛參考了一下中信局的集中採購案,但那都還是 2009 年的舊案,系主任說他看了也不喜歡,但是廠商開出來的價錢他又不要,剛剛相中了 DELL PowerEdge R905,但是那個價位系主任似乎也是無法接受,原則上最好能到達 R905 的能力,我知道『要馬兒跑的快,又要馬兒不吃草』但今天老闆不是我啊!我也很難去行事!

也想請教 Blade Server 的先進,假設現在機器已經運轉了,如果要加刀子必須要把機器下線嗎?

手上有台 HP DL320-G5p 其內建的 RAID 對於非大型網站,應該還算堪用吧?內建的 RAID 是不是屬於比較低階的呢?如果需要更好的 RAID 能力需要額外購買 RAID 卡吧?像是上面提到的 R905 他支援到 RAID5 這可靠嗎?

在這裡先說聲抱歉,我也才剛踏入 Server 界四個月,而且完全沒接受過任何訓練,也沒太多經驗,大多都是自學而成的,所以有些觀念不正確,也希望各位先進可以不吝指教,在踏入 Server 之前做了六七年的 PC 玩家,所以關於電腦進階至專家之間的問題應該還足以應付,一些常識是有的,可以深入探討沒有問題的!謝謝!

3
Linux 討論版 / 回覆: 伺服器故障
« 於: 2010-03-14 02:10 »
先看完幾本linux基礎及系統管理的或鳥哥的教學比較實在
記取教訓,成長的會比較快,但事先預防及準備才是上上策

其實,我已經看到進階還有專家了,基礎其實已經上來了,鳥哥的也看到眼睛花了,從小對電腦感興趣,造成眼睛負擔太重了!看電腦文章眼睛容易疲勞~所以鳥哥的大部分都是拜讀他的書!網站反而少去看了,不過網站變成是我的隨身工具書,因為瀏覽器按一下搜尋,一下就可以找到我要的重點!

唉唷! :-[我真的有準備啦!很多東西都準備齊全,但是就是會出狀況啊,不然怎麼會去 RAID 呢?不過等我搶救 Server 的時候發現 sdb 裡面竟然沒有 RAID 資料進去?完全讀不到裡面有東西,只能讀到分割,而且竟然沒有格式化,這樣的意思是我的 Software RAID 根本沒有作用?

4
Linux 討論版 / 回覆: 伺服器故障
« 於: 2010-03-14 00:31 »
看完你的描述後,我還是不知道你要問什麼。
你要問的應該是:要怎麼解決它吧?可是整個文章真的沒有what u want? 所以真的看不懂你PO這篇文是要幹什麼。

如果我有猜對的話,你應該要知道:1) 怎麼進入求援模式 2) 怎麼啟動/停止服務->除了service和chkconfig 3) 怎麼開一個大檔案
以上在鳥哥的私房菜裡都有解筨,再加油囉

學校的資源好好用,但是測試和運作的機器要盡量分開
話說回來,現在的電腦都能跑virtual PC吧 :)

還是看不懂嗎?那可能我真的有很大的問題了,竟然連陳述問題都有問題!我會在改進的!
至於我想問的問題呢,確實就如您猜測的一樣!當時的我曾想直接進入救援模式,但是,Linux 並不像我比較熟悉的 Windows,所以卡在那裏很懊惱,因為當下遇到這樣的狀況的時候,我也是想要先停止防火牆,但是就是不知道怎麼跳過這些預載的程序。
如果鳥大哥的網站有的話,那我真的要重新的細細品嚐了!
我也是想要好好運用學校資源,但是我現在卡在設備不足的問題啊,其實我也想測試與營運用主機分開,但最後捨棄掉測試用主機,因為手上分到的電腦都很強悍,Linux 都進不去,原本我手上有一台 Server還有四台 PC,結果 PC 接二連三夭折,通通拿去報廢了,現在剩兩台,一台邁入高慌,開個網頁都會出現嚴重錯誤,一天來兩個藍幕已經是家常便飯,所以現在那台變成同學們來我這裡時用的上網機,我根本不會用那台,而另外一台就是我在學校的 TeamViewer 的跳板,因為學校有防火牆,所以我在家的時候,只能經過這個跳板用 iPhone 或 PC 遙控!但效能沒辦法跑到 Virtul PC 或 VMwar 免強跑個文書就偷笑了。在我的辦公室裡面,落差還真的很大啊~ ::)
謝謝您的回應!

/ 可以在 raid 內,只要你獨立出 /boot 分割區不在 raid 即可。實務上,raid 1 環境時候 /boot 也不一定要獨立,因為情況允許。

一開始 build server 的時候,我有列一張伺服器的規格與組態表,不過那個檔案好像隨著之前報廢的電腦一起去垃圾場了,所以我不太敢肯定當時是不是 / 不讓我掛載!我記得我 Setting 時是使用 RAID 1 但 /boot 不讓我掛載,映像內 / 也是不讓我掛載,所以只好把 System 放在其中一顆 HDD,剩下的空間掛載 /backup /Webservice 了。 :-\ 總覺得自己很不適任,連當初自己列出來的組態表都沒印出來,小弟真的很混啊!
謝謝您的回應!

有台備援的 server 是必要的
當妳這台下線 , 就啟動那台應付應付 .. 虛擬系統也可以阿
最多使用者覺得慢時 , 妳就推說 ddos 攻擊就好啦

多大檔案會開不了 , 小弟也不知道
但通常我不會想開大檔案 , 只要 grep 關鍵字就好

防火牆啟動好像在 X 之前喔
所以您看到的恐怕是圖形化的開機程序而已
至於有沒有可能某程式載入時 ,  log 太大而卡住 , 妳何不原系統開機一天看進不進的去
若網路已經啟動就可以 ssh 進去看 ...
什麼 log 能那麼大 ? 有意義嗎 ? 怎保留要的 log 資訊 ?
這恐怕才是問題 ...

既然是軟體 raid , 執行的程式便在 linux 中 ...
根目錄不能嗎 ? 沒試過 ... 但 /boot 一定不能
至於效能問題 , 測試過應該不至於慢 ...

突然想到很久以前有客戶抱怨過一台 hp server , 也是 1u , 硬碟 sata
測試結果 .. 是任兩顆硬碟間傳輸速率有問題 ... 猜想晶片組問題
... 所以恐怕 dl320 本身的關係居大
(不知道是不是這台 , 被我們暱稱為小 DL ... 因為平常做 lab 都搬 360 380)

重灌是正常的 ..
之前幫客戶找一個懷疑被入侵網段的問題
一開口我便說 .. 能找到是純運氣
後來真的找到了 , 也做好補救措施
但還是告知被入侵 + 系統亂的主機要重灌
雖然希望 server 永遠不死 , 但畢竟乖乖是人在吃 ...
(也不知是純幫忙影響力大 , 還是我長的忠厚老實 ... 真的就重灌了)


我有考量到備援系統啊!但是畢竟這是學校,Server 又不是玩具,沒辦法買很多台放著!
就如上述所提,當初在 build 的時候,我是以我自己的舊有的知識去做的,當時我就有想要把手上的四台電腦拿一台用來備援,但是每台都不爭氣,Linux 都灌不進去,也找不到問題,我們學校是 HP 大軍,所以也沒辦法說交叉比對什麼的!

log 那麼大,要怪就要怪我!因為小弟失職,沒有時常檢查 log 所以我在想裡面一定一堆 error 沒有 debug ,還請教『grep』是什麼呢?

我有點不太了解 xWindow 的載入定義在哪裡耶?我個人的定義是離開文字介面後就算是 xWindow 了,防火牆不是跟著其他 Service 在同一個階段載入的嗎?我記得他是寫『正在啟動防火牆』,有點不太了解您的「所以您看到的恐怕是圖形化的開機程序而已」的意思!
log 太大卡住應該不致於,我大約每週中午 Server 就會重新啟動一次,如果是這樣的話,應該前幾週就會有狀況了!
時間是不容許讓他開一天耶,雖然事後的重建動作花了兩天。
正常來說,防火牆應該會比網路連線還要早載入吧?
是 httpd 的 log,error_log 347MB、error_log.1 1586MB、error_log.2 2968MB、error_log.3 4923MB、error_log.4 619MB,所有的 log 共 10GB,我也不知道從何看起,依照這麼龐大的錯誤記錄來看,我應該要看個一個禮拜吧?也只能說小弟管理無方,讓記錄檔肥成這樣子,從今以後我會固定時間去整理的!看來伺服器的問題可能不小,有這麼多的 error 我竟然沒發現!

Software RAID 會吃掉很重的記憶體,原本安插 2G 記憶體,吃到剩 400MB 現在改成主機板 RAID 後變成 2700MB(那次事件後,我又加了一條 DIMM)是不致於變慢,但是導致能運用的記憶體配額變少了!

有側試過兩顆 SATA HDD ,都在 1.5Mbps 左右!現在使用的是主機板內建的 RAID 1,不過我也不知道主機板內建的 RAID 是屬於哪種形式的,也許安裝專用的 RAID 卡會更好吧?您所謂的 DL 問題居大的意思是?現在手上有兩台 DL320G5p,不過原本學校之前負責的人都是採用 Windows Server 2003 R2(兩台原屬不同單位,提供不同性質之服務)似乎沒什麼太大的狀況,後來到我手上的時候,我經過了兩次系統遷移(那真的是浩大的工程啊)將 Windwos Server 移到 Linux,改成 Linux 上線至今也有四個多月吧?後期我比較沒怎麼維護,就變成這樣!這個部分小弟會在檢討檢討!
DL360、380 比較好嗎?近期要採購 Blade Server,還因為礙於售價始終無法擬成計畫案!不知前輩是否可以給予一些意見呢?下一個計畫需要的是彈性化的擴充設備,因為無法預期 Server 上線後的使用流量,所以必須要使用模組化的 Blade Server ,以利後期擴充,但小弟初入 Server 領域,仍需要許多前輩指導,希望可以給小的一點意見!

dark 大後面那段滿好笑的,您也是走電腦行業的嗎?我曾想過入侵問題,但如果真的是這樣,那就是校內入侵了,目前我的 Server 是在學校防火牆的保護傘下,對外開 Port 只有 80,至於校內的話是 All open ,如果真的是遭到入侵或是攻擊,我應該從哪裡看相關的紀錄呢?還有,學校老是可以發現有學生發動 DDoS、ARP spoof,這需要怎麼查呢?估計那些應該不是學生本身發的,應該是個人電腦變成跳板,在校內癱瘓學網,雖然 Server 躲在防火牆之下,但內賊難防,是否可以傳授一點經驗呢?





這裡的前輩們都很熱心,這讓我想到引領我踏入 Linux 的人,這次的架設 Server 其實是很亂來的,在 build 之前我可是有六年沒有碰 Linux ,最後一次玩是玩 Fedora 5,那時候也只是一般的 User 而已,用 Linux 上網,沒有深入研究 Linux 的東西,而這次用 Linux 我可是向學校圖書館借了二、三十本書,猛 K Linux,終於完成了,Linux 對我來說,就像一個重要的夢想,對於用滑鼠就可以架設網站的東西一點興趣也沒有,從現在起,我會更加努力的在 Linux 上,也謝謝這裡各位前輩的熱心回應!在此非常感謝大家!謝謝!

5
Linux 討論版 / 回覆: 伺服器故障
« 於: 2010-03-13 20:20 »

server 管理一點經驗與實務能力。所以你第一篇描述部份很難知道問題點,最好就是請熟悉這領域的人去看會更好...

若你沒辦法請有經驗的人去看,那就真的如你弟一篇使用重灌方式解決... 只是這個方式選擇似乎已經是最終方案了。
  正因為 Server 管理、維護都比架設還要來的難,所以我正是利用學校資源來累積自己的經驗!我很高興今天伺服器出了問題,讓我知道事情絕對不會這麼的順利,再怎麼穩定的伺服器,仍然有萬分之一的故障機率,如果事情總是進行的那麼順利,我相信我得不到更多的管理經驗!對於伺服器管理我身邊的人並不多,就算拿 Linux 領域來講,也只有那麼一兩個!

  我所提到重灌那真的是下下策!曾經有人跟我說,不是遇到問題重灌就好,而是遇到問題去解決他,如果只會重灌,那麼我永遠學不到什麼東西!當時是礙於多方壓力,也只好用最快速的方法去做!但我相信我自認為最快的方法,是我知識所能及的最快,而不是真正的最快,所以我想再這裡向各位 Linux 前輩請益!是否可以往哪個方向去著手調查,或著有什麼樣的觀念,可以提供我,糾正我!好讓我更上一層樓!我相信,我目前遇到的問題,與 Server 有關係,發生的問題是 Linux 的所有 User 都可能碰到的問題!

  也許我的問題沒有寫的很詳細,在這邊重新陳述一次好了!當天發現伺服器有點卡塵,所以就先停機清理伺服器內的灰塵,在處理關機程序的時候也都正常,並沒有出現任何錯誤,灰塵清理完畢後伺服器重新開機(每次開機就像開抽油煙機一樣,哄哄哄~),BIOS 程序正常,Boot 程序正常,xWindow 前置作業正常,但在啟動服務時異常,卡在『啟動防火牆』,怎麼看都像是死當,但滑鼠游標仍然在運作,為了確認原因,強制關機在開,仍然卡在同一個問題上,這個步驟重複了共三次!網路上想要爬文章,也爬不到,只好通知系上助理告知伺服器出狀況,無法即時上線,為了避免硬碟內的資料被重灌的過重中覆蓋,先把 MySQL 、 log 、網頁資料全部 copy 出來,不過因為資料量太大!把我的電腦弄到當機,只好去實驗室用工作站才把資料備份完,備份完畢就重灌了,在重灌的過程中想查一下 log 這才發現檔案太大,開不了。

問題大致如上,小白的流水帳有點多,請包涵了!

  對了,想再這裡請益一個問題,Linux 內建的 Software RAID 應該如何應用呢?本來我的 Server 有使用這個,但後來伺服器重灌的時候,發現 HP DL-320G5p 內建就有 RAID 功能,所以我就捨棄了 Linux 內的 RAID,我不懂的是,為什麼內建的 RAID 不可以掛載根目錄?這樣根目錄只能掛載在一顆 HDD 假設好死不死,今天壞掉的就是掛載根目錄的 HDD,那我不就恭喜恭喜了?所以想請教各位前輩們,Linux 內建的 RAID 應該要如何應用才會發揮最大的效益?不過確實發現 Software RAID 資源吃很重!

6
Linux 討論版 / 回覆: 伺服器故障
« 於: 2010-03-13 19:48 »
引用
前天我遇到了一個很嚴重的問題,就是我伺服器重新開機,結果在載入防火牆的時候就一當機,一直找不到原因!後來只好重灌!也足足讓我停機了五十二小時,學校各界的電話一直打來,讓我覺得壓力很大,連計算機中心的電話也一直來,當下我就在想,是不是我的選擇是錯的?當初就乖乖的跑 Linux 就好了,為什麼要換成 Windows 呢?不過我沒有後悔,我還是很喜歡 Winodws 的!我很想看我的 log 但是實在太大了,我不知道怎麼開才好,已經當掉好幾台電腦了,都打不開!每個記錄檔有 4GB 那麼大!現在還在困擾中,也不知道怎麼去 Debug ,因為這次是我第一次把 Windows 使用在 Server 上!

不過 Windows 真的很強悍!連機架型伺服器跑的都如履平地,穩定度很好,值得令我讚揚,當初還為了機架型伺服器的作業系統傷腦筋呢!


耶?? 這樣也會通耶~~ 科科

 :( 我不記得我的伺服器是使用 Windows 耶!
別這樣好嗎?這樣我感到很不舒服!
我只是想要再這裡交流一下,看看是不是有人可以給我一點意見!

7
Linux 討論版 / 回覆: 伺服器故障
« 於: 2010-03-12 02:30 »
1.
手動裝個新版的rsyslog每日切檔就很容易查了
載入firewall會當? 因該不至於重灌吧 , 這樣不是一樣等於重新設定嗎?
debug firewall的部份應該不會很困難才對,可能要多熟悉熟悉

2. 這台的功用是什麼?如果是這麼重要的server,沒有其他的設備能備援的嗎? 這樣應該是規劃的問題了


1.也許需要在努力的在這塊發展吧?當時只希望用最快的時間讓服務上線!所以用了最笨的方法了!感謝指點!

2.這台 Server 是系網的主機,其實沒有很重大的任務,但對正常來說對 MIS 來說是很重大的事件!也許還在學習階段,所以恢復的時間較常!以重要性考量目前這台 Server 是沒有需要備援設備,但接下來所要架設的網站就可能需要更穩定的設備的!下一個網站是商務網站,如果經費足夠,會以刀鋒伺服器為優先考量!

8
Linux 討論版 / 伺服器故障
« 於: 2010-03-11 20:36 »
前天我遇到了一個很嚴重的問題,就是我伺服器重新開機,結果在載入防火牆的時候就一當機,一直找不到原因!後來只好重灌!也足足讓我停機了五十二小時,學校各界的電話一直打來,讓我覺得壓力很大,連計算機中心的電話也一直來,當下我就在想,是不是我的選擇是錯的?當初就乖乖的跑 Windwos Server 就好了,為什麼要換成 Linux 呢?不過我沒有後悔,我還是很喜歡 Linux 的!我很想看我的 log 但是實在太大了,我不知道怎麼開才好,已經當掉好幾台電腦了,都打不開!每個記錄檔有 4GB 那麼大!現在還在困擾中,也不知道怎麼去 Debug ,因為這次是我第一次把 Linux 使用在 Server 上!

不過 CentOS 真的很強悍!連機架型伺服器跑的都如履平地,穩定度很好,值得令我讚揚,當初還為了機架型伺服器的作業系統傷腦筋呢!

頁: [1]