% 表題: MAIL トラブルシューティング % % 履歴: 2010/07/23 山田 圭祐 作成 % 2010/09/09 山田 圭祐 不要な作業を削除 本ドキュメントは 2010/07/23 に発生した MAIL サーバの HDD 故障から MAIL サーバ復旧までの記録である。 1. 症状 2010/07/23 11:00 頃 MAIL サーバに接続できなくなった + /home 領域に I/O エラー + コンソール login 可 - /home は読み取り可 2. 復旧手順 故障した HDD をバックアップ HDD と交換する作業を行った 外付け HDD の型番はどちらも HDC-UX250 で接続方式は USB である 2-1. ネットワーク線を抜く 2-2. root で login (sudo では駄目) /home を umount しアンマウントする。fsck でディスクの検査と修復。 #umount -l /home #fsck -t ext3 -y /dev/sdd1 #e2label /dev/sdd1 Backup fsck ではディスクのバックドブロックが修復できないため、 この HDD は物理的に取り外すことにする 2-3. /home.bk を /home にマウントする #umount /home.bk #e2label /dev/sda1 home 2-4. 外付け HDD (新 /home.bk) 接続し、マウントする 接続した時点で sde として認識される パーティションの作成 #cfdisk /dev/sde 全体を一つのパーティションとし、ファイルタイプを Linux にする ファイルシステムの作成 #mkfs -t ext3 /dev/sde1 #e2label /dev/sde1 home-bk 壊れた HDD を外す #lv /etc/fstab LABEL=home /home ext3 defaults,usrquota 0 2 LABEL=home-bk /home.bk ext3 defaults 0 2 となっていることを確認し、マウントコマンドを実行 #mount -a 設定した通りにディスクがマウントされていることを確認し再起動 #reboot 2-6. /home (旧 /home.bk) から /home.bk へ rsync #/etc/cron.daily/rsync 2-7. ネットワークに接続し、接続のテスト # ping www 2-8. 異常終了したプロセスを kill するため、システム再起動 # shutdown -h now 一度外付けの HDD を全て外し、再起動。起動後 root でログインし HDD をマウント。 # mount -a 2-9. メール配送のチェック ローカル配送のチェック $ echo to: hoge | /var/qmail/bin/qmail-inject で自分宛にメールが送信出来たことを確認 リモート送信のテスト $ echo to: hoge@gfd-dennou.org | /var/qmail/bin/qmail-inject リモートからの受信テスト hoge@gfd-dennou.org から hoge@ep.sci.hokudai.ac.jp  サーバーの処理待ち中 2-10. 旧 /home の修復作業 旧 /home に用いていた HDD に fsck をかけたが、修復できなかった。 そのため、テプラを貼って廃棄物品に回す。    3. 復旧報告 報告はネットワーク委員会の教員に行ってもらう。 2010/07/23 06:00 -- 11:00 の間に受信したメールの一部は失われている可能性があるため、 その間に重要なメールが届く可能性のあった方は、相手方に再送をお願いし頂くという対応。