作者 主題: [求助]系統掛不停…又找不到原因…  (閱讀 2406 次)

0 會員 與 1 訪客 正在閱讀本文。

optionblue

  • 可愛的小學生
  • *
  • 文章數: 7
    • 檢視個人資料
各位大大好,我在測的這台電腦作業系統:RedHat7.3 on dual AMD,scsi raid5
Kernel及上面軟體尚未更新過(剛灌完的狀態)
系統三不五時掛掉,大概都三、五天一次…掛掉時可以打字也ping得到,但無法login,服務也不能用…掛掉後重新開機之後,fsck掃瞄修復完畢後就又可以使用…但總在數天之後掛掉…   每次都會出現這樣的訊息:

Assertion failure in journal_write_metadata_buffer() at journal.c:406:
"buffer_jdirty(jh2bh(jh_in))"
--------[cut here]------------
kernel BUG at journel.c:406!
invalid operand: 0000
iptable_)filter ipt_MASQUERADE ip_nat_smnp_basic ip_nat_irc ip_nat_ftp iptable_
CPU:   0
EIP:   0010:[<f883e924>]  Tainted:  P
EFLAGS:00010282

EIP is at journal_write_metadata_buffer [jbd] 0x74 (2.14.18-3smp)
ead: 0000001d  ebx: 00000000  ecx:c02eb880  edx: 00002ee2
.........略...........
Process kjournald (pid: 17, statckpage=f6267000)
Stack: f88430e1 ............略..........
Call Trace:.......略.......

真不知道是硬體掛還是程式核心有問題…全速運作時溫度不太高,也更換過一些硬體…但還是有一樣的問題…若排除硬體碬砒,覺得有可能是核心問題,但又覺得不太是(因為都是一段時間才掛)…
請各位大大幫忙看一下並給個建議…可以說明問題原因的話更好…感激不盡! ~~^.^~~

netman

  • 管理員
  • 俺是博士!
  • *****
  • 文章數: 17474
    • 檢視個人資料
    • http://www.study-area.org
[求助]系統掛不停…又找不到原因…
« 回覆 #1 於: 2003-02-26 21:41 »
您說裝完沒更新?
那很危險的哦,趕快去 redhat 網站看看哪些還沒更新:
https://rhn.redhat.com/errata/rh73-errata.html

希望不會太晚了吧...

Tetralet

  • 活潑的大學生
  • ***
  • 文章數: 370
    • 檢視個人資料
[求助]系統掛不停…又找不到原因…
« 回覆 #2 於: 2003-02-26 21:41 »
我上次也遇到類似的情形,
原來是 CPU 風扇燒掉了 -_-|||

aloysius

  • 活潑的大學生
  • ***
  • 文章數: 403
    • 檢視個人資料
Re: [求助]系統掛不停…又找不到原因…
« 回覆 #3 於: 2003-02-26 21:58 »
引述: "optionblue"
各位大大好,我在測的這台電腦作業系統:RedHat7.3 on dual AMD,scsi raid5
Kernel及上面軟體尚未更新過(剛灌完的狀態)
系統三不五時掛掉,大概都三、五天一次…掛掉時可以打字也ping得到,但無法login,服務也不能用…掛掉後重新開機之後,fsck掃瞄修復完畢後就又可以使用…但總在數天之後掛掉…   每次都會出現這樣的訊息:

Assertion failure in journal_write_metadata_buffer() at journal.c:406:
"buffer_jdirty(jh2bh(jh_in))"
--------[cut here]------------
kernel BUG at journel.c:406!
invalid operand: 0000
iptable_)filter ipt_MASQUERADE ip_nat_smnp_basic ip_nat_irc ip_nat_ftp iptable_
CPU:   0
EIP:   0010:[<f883e924>]  Tainted:  P
EFLAGS:00010282

EIP is at journal_write_metadata_buffer [jbd] 0x74 (2.14.18-3smp)
ead: 0000001d  ebx: 00000000  ecx:c02eb880  edx: 00002ee2
.........略...........
Process kjournald (pid: 17, statckpage=f6267000)
Stack: f88430e1 ............略..........
Call Trace:.......略.......

真不知道是硬體掛還是程式核心有問題…全速運作時溫度不太高,也更換過一些硬體…但還是有一樣的問題…若排除硬體碬砒,覺得有可能是核心問題,但又覺得不太是(因為都是一段時間才掛)…
請各位大大幫忙看一下並給個建議…可以說明問題原因的話更好…感激不盡! ~~^.^~~


您該不會使用VGA on board , 然後共享主記憶體的主機板吧? 用 AMI RAM test 試試會不會出錯,有些版子設計不良,在記憶體後段因為跟vga share,會造成錯誤,所以有可能您開了一段時間負載重了以後用到後段記憶體及SWAP時就會當機..我就遇過..某一行號的chip還真的有這種問題... :evil:

twu2

  • 管理員
  • 俺是博士!
  • *****
  • 文章數: 5400
  • 性別: 男
    • 檢視個人資料
    • http://blog.teatime.com.tw/1
[求助]系統掛不停…又找不到原因…
« 回覆 #4 於: 2003-02-27 01:17 »
用 ext3 ?
去 redhat 抓新的 kernel 試看看.

如果可以, 用 memtest86 先測看看. (1G 的 ram 標準測試應該會測超過一小時)

optionblue

  • 可愛的小學生
  • *
  • 文章數: 7
    • 檢視個人資料
[求助]系統掛不停…又找不到原因…
« 回覆 #5 於: 2003-02-27 09:04 »
引述: "Tetralet"
我上次也遇到類似的情形,
原來是 CPU 風扇燒掉了 -_-|||


一開始也有考慮cpu和memory,但memory換過也測過、cpu溫度不超過55度,
風扇沒問題…   但仍然會掛掉…
另外VGA卡是外接介面卡非on board… NIC是Intel pro-1000(更新過firmware)

系統還沒更新是因為其他相同硬體裝置的機器(只有硬碟裝置不同),都很正常,
為了容易對照比較所以還沒更新…但看來今兒個還是更新一下iptables和kernel好了…
不知道還有什麼部分需要更新?
很好奇的是,每次掛掉都一定會顯示出iptables...等、journal.c和kernel bug...

謝謝各位大大,還請繼續給點建議…  告知可能的原因…謝謝!