請教一個問題,不知道是什麼原因所引起,若知道原因或方向麻煩告知一下
問題:Oracle不定時變慢(一個月約1~2次, 時間日期不一定), 使得對他的請求均要很久才會回覆
OS : Red Hat Enterprise Linux ES release 4
Oracle : 9.2.0.1
狀況:(1) select , update, insert等語法均要很久才會回覆, 超過10min
(2) 使用TOP查詢, 發現IOWAIT已吃滿50~99%以上, 但CPU的耗用量低於 10%
(3) 使用iostat查詢, 不過tps佔很高, 並未發現有大量的資料讀取
(4) 只要把oracle service 關掉, iowait就降下來.
(5) 目前一定要透過oracle shutdown immediate關掉,再重新啟動才會好(abort關掉,重啟iowait一樣衝高)
(6) alter.log一直出現cannot allocate new log 與 Checkpoint not complete錯誤, 發生問題時才出現,
redolog常幾個小時才switch一次, 問題發生時, 2~6分鐘switch一次
(7) 當發生問題時,把AP關掉後,只留oracle單獨運行,狀況並沒變好.
(

Server HD並未出現警示, 有請系統工程師檢查HD,並無壞軌
(9) 有透過dbminer去檢查redo到底在做什麼, 結果發現有百分之80以上是INTERNAL的運作,但其對應的
redo_sql欄位並無資料.
so...真的不知道怎麼處理了..現在維護廠商也說沒遇過這種問題..朝更新patch方式來試..
但我覺得應該不是oracle bug, 不然別人早就遇過了, 所以麻煩知道原因或知道怎麼查的人告知一下.謝謝
狀況說明:
(2)
</u2/oradb/admin/topdb/bdump> top
16:07:24 up 90 days, 5:00, 5 users, load average: 4.09, 3.91, 2.69
323 processes: 322 sleeping, 1 running, 0 zombie, 0 stopped
CPU states: cpu user nice system irq softirq iowait idle
total 7.1% 0.0% 0.6% 0.0% 0.0% 69.1% 23.0%
cpu00 9.1% 0.0% 0.0% 0.0% 0.0% 44.0% 46.7%
cpu01 7.4% 0.0% 0.0% 0.0% 0.0% 47.2% 45.3%
cpu02 4.5% 0.0% 0.9% 0.0% 0.0% 94.4% 0.0%
cpu03 7.4% 0.0% 1.8% 0.0% 0.0% 90.7% 0.0%
Mem: 4091560k av, 4073536k used, 18024k free, 0k shrd, 7704k buff
2881744k actv, 560524k in_d, 75836k in_c
Swap: 8385920k av, 21908k used, 8364012k free 3211592k cached
(3) 並無大量的資料讀寫, 不過tps佔很高
avg-cpu: %user %nice %sys %iowait %idle
19.65 0.00 4.53 51.64 24.18
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
cciss/c0d0 0.00 0.00 0.00 0 0
cciss/c0d0p1 0.00 0.00 0.00 0 0
cciss/c0d0p2 0.00 0.00 0.00 0 0
cciss/c0d0p3 0.00 0.00 0.00 0 0
cciss/c0d1 130.30 274.75 11410.10 272 11296
cciss/c0d1p1 130.30 274.75 11410.10 272 11296
cciss/c0d1p2 0.00 0.00 0.00 0 0
avg-cpu: %user %nice %sys %iowait %idle
13.90 0.00 2.48 76.67 6.95
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
cciss/c0d0 0.00 0.00 0.00 0 0
cciss/c0d0p1 0.00 0.00 0.00 0 0
cciss/c0d0p2 0.00 0.00 0.00 0 0
cciss/c0d0p3 0.00 0.00 0.00 0 0
cciss/c0d1 130.69 166.34 12411.88 168 12536
cciss/c0d1p1 130.69 166.34 12411.88 168 12536
cciss/c0d1p2 0.00 0.00 0.00 0 0
(6) 一直出現cannot allocate new log 與 Checkpoint not complete錯誤
Thread 1 advanced to log sequence 10737
Current log# 2 seq# 10737 mem# 0: /u2/oradb/oradata/topdb/redo02.log
Wed Aug 27 08:41:09 2008
Thread 1 cannot allocate new log, sequence 10738
Checkpoint not complete
Current log# 2 seq# 10737 mem# 0: /u2/oradb/oradata/topdb/redo02.log
Wed Aug 27 08:51:04 2008