ハードウェア不良の問題切り分けの目安
単なる経験則。某所に書いたので、ここにも置こ。
サーバとして利用しているPCのハードウェア不良による不安定な
挙動が起きたときの問題の切り分け方。だいたいこんな感じ。
- HDD
- messagesにエラーが吐かれる
- HDDから変な音がする
- データが化ける場合はケーブル接続不良かケース内漏電
- HDDno寿命1年〜10年(たいてい2〜3年)
- CPU
- CPU不良はまずあり得ずたいていはオーバーヒート
- コンパイル中に segmentation fault, invalid system call,
illegal instruction とかでgccがコケる
- 暖かくなる時期に不安定になる
→ mbmonで計測
- メモリ
- いきなりリセットがかかる
- OSのインストール中とかでたいてい違う場所でこける
→ http://www.memtest.org/ のテスト用CDイメージで確認できる
(わりとすぐ見付かる)
- メモリを使うアプリケーションをあげると簡単にふっとぶ事が多い
- 良品が突然不良品になることは滅多になく、初期不良か
別のメモリとの組み合わせやBIOSのメモリクロック設定間違いで
発生するので、挿した直後はmemtestをかけるのが理想的
- 電源
- いきなりリセットがかかる or 電源が入らなくなる
- 夜中とかcronジョブをしているとき、知らないうちに落ちている
- 似たような時間帯に落ちるが厳密に同時刻ではない
- 負荷をかけて再現しようとしてもいまいち再現できない
- 近所の人の帰宅時間帯に落ちたりする(クーラーで電圧降下とか)
- 寿命はHDDと同程度
- M/B
- たいてい起動しなくなる
- ボタン電池を20秒位外してみて電源を入れ直すと直ることがある
- データが化けたり画面が化けたりすることもある
- 電圧超過とかでコンデンサがいかれることがおおい
- 壊れたら買い換えしかないので各種パーツを買い直す羽目に…
- パーツ追加中など電源のON/OFF繰り返しで壊れる可能性UP
電源とマザーボードトラブルの症状は似ているので、問題切り分けの
ために電源BOXの予備を買っておくとよい。
きまぐれ記
yuuji@
Fingerprint16 = FF F9 FF CC E0 FE 5C F7 19 97 28 24 EC 5D 39 BA
HIROSE Yuuji -
ASTROLOGY /
BIKE
/
EPO /
GUEST BOOK
/
YaTeX