%=========================================================== % 地球惑星専攻サーバ トラブルカルテ % 日付 : 2004/09/07 % サーバ: dns 2nd(DHCP & NAT) サーバ (blue) % 文責 : 樋山 克明 %----------------------------------------------------------- この文章は dns 2nd(DHCP & NAT) サーバ にログインできなくなった問題の トラブルの内容と,その復旧記録である. ■ 目次 ・ 症状 ・ 原因 ・ 対処の方針 ・ 対処の作業ログ ・ 今後の長期的対応 ・ 参考資料 ■ 症状 dns 2nd(DHCP & NAT) サーバ(以下blue)に リモート,ローカル共にログインできない ■ 原因 1. ログが溜まってしまい HDD の容量が一杯になってしまっており、 ディスク溢れを起こしていた. 【上記の原因】 今のところ不明(2004/10/07 現在) 2. /etc/passwd, /etc/shadow 等が壊れていた 【上記の原因】 passwd , shadow を更新しようとしたときにちょうど HDD が一杯になってしまったと思われる. ■ 対処の方針 1. ディスク溢れに対して ・ 手で電源を切って強制再起動.   tmp/ が消えてログインできる領域が空くと思われるので,   ログインして不要なログを消す. ・ 再起動後にログインできない場合は Debian インストール CD を用いて   HDD をマウントし,ログイン.不要なログを消す. 2. passwd , shadow に対して ・ *.bk からコピーして復旧する. ■ 対処の作業ログ 1. 手動で再起動するが,ログインできない 2. インストール CD を用いてログインし,容量を空け,ローカルでログイン    Debian インストール CD を用いて,HDD をマウントし,ログインし # df すると,空きが 4 ブロックしかない. # cd /target/var/log に移動し, # rm **.89.gz とし,2 番目に古いログから削除後,リブート. ローカルからログインを試みてみる.     → ログインするのには十分と思われる領域を空けたのにログインできない. 3. passwd , shadow の復旧 - 再びインストール CD を用いてログイン passwd , shadow を調べてみる. # cd /etc/ # ls -l passwd* shadow* とすると,passwd , shadow のサイズがゼロになっていて, ファイルが壊れていた. - *.bk は壊れていないので,コピーして復旧. # cp passwd.bk passwd # cp shadow.bk shadow ローカルでもリモートでもログインできるようになった. 4. HDD 容量の確保 - まだディスク領域の空きが充分ではないので, 古い方から 30 日分のログを削除. - 2004/10/08 現在の HDD の状況は以下の通り  Filesystem Size Used Avail Use% Mounted on  /dev/hda1 28G 8.1G 18G 30% /   5. 作業の完了 再起動し,プライベートマシンがDHCP でつなげることを確認し,作業終了. トラブルカルテを書いて Web に上げると共に, epcore-ml に詳細をメール. ■ 今後の長期的対応 現在の対応 : とりあえず,様子見で放って置く. 作戦1. HDD の容量を増やす 作戦2. ログを早く回すようにする(2004/10/07 現在は 3ヶ月で回している). ■ 参考資料 1. epcore のトラブルカルテ ``2004/06/04 mail サーバからローカル配送が行なわれなくなった.'' 作成 : 森川 靖大 アドレス : http://www.ep.sci.hokudai.ac.jp/~epcore/manage/trouble/trouble-2004-06-04.txt