サーバ再構築の風景・その3
※先に その1、
その2 を読んでください。
2. 二日目
2.1 トラブル発生?
二日目。
M政がサーバ室に到着した時にはすでにT橋さんは作業を開始していた。
M政:「おはようございます。」
T橋:「おはようございます。」
M政:「今は何の作業をしてるの?」
T橋:「えーとですね…」
今日来たら X が立ち上がらなくなっていたそうで
現在パッケージの再インストールをしているとの事。
…そうきたか。
2.2 qmail のインストール
別に X がなくてもさほど作業に支障は出ないので
後回しにして qmail のインストールを開始する事にした。
本来は現管理者のT中君に付いてもらいながら
作業をやるはずだったのだが、事情があって来れなくなったので
新管理者のS沢君と元管理者のM田さんに付いてもらった。
マニュアルを見ながら作業を進める。
ここでの失敗は何通かテストメールが
現メールサーバの root に送られてしまった事。
原因は再構築中のホストのシステムメールが現メールサーバに送られる為。
しかも、mondo 宛てに送ったのだがメールサーバにいない
ユーザだった為さらに余計なエラーが出る結果となった。
最終的にはこれでよいのだが、わざとエラーメールを
発生させる時には予告くらい出すべきだったかもしれない。
2.3 tmp 問題
qmail の次は gate のインストール。
しかし、インストール途中で何かの man を
見ようとしてエラーが返ってきたので作業は中断。
原因の調査を開始。
エラーメッセージをそのまま検索にかけてみたら
どうやらファイルシステムに不良があると出るエラーらしい。
これを見て原因は恐らく HD のマウントだろうとピンと来た。
思い返せば X が上がらなくなったのもこの作業を行ってからだ。
で、 /etc/fstab を見直す。
hde1 /
hde2 /tmp/
hdg1 /bk/
hdg2 /tmp.bk/
sda1 /home/
sdb1 /home.bk/
M政:「あれ? /tmp ってシステムで使ってなかったっけ?」
M川:「使ってますねぇ。」
M政:「って事はこれが原因じゃないか?」
要するに元々存在するディレクトリとバッティングして
/tmp を使用する X や man が機能しなくなった、って訳だ。
T橋(和):「やってくれるねぇ、S木君も」
M政:「今ごろ気付いた我々も愚かだったけどね。」
M川:「S木さんは二徹でお疲れだったのでは…」
M政:「あれ? メールを見たら指示してるのO高さんだよ。」
一同:「O高さんかよ!」
T橋(こ):「やられましたね。」
M政:「こんな所に罠を張るとは…」(違うって)
/etc/fstab を書き直して再起動したら無事元に戻った。
後で聞いた話だが、O高さんの指示メールを見た時点で
M田さんはこの事に気付いていたそうだ。
…あれだけの人が見てて誰も指摘してくれないんだもんなぁ。
2.4 gate のインストール
気を取り直して gate のインストールを再開する。
例によってマニュアルを見ながら作業する。
gate に関しては最強のスーパーバイザーM川君がついているので
作業は順調そのもの。
特に失敗も無くあっさり終わる…はずだった。
M川:「じゃあそろそろ gate のテストをしてみましょうか。」
T橋(こ):「はい。」
M政:「あれ? なんか大量のエラーメールが epcore に届いているよ?」
M川:「え?……あ!」
がっくりとうなだれてしまったM川君。
そのまま一分くらい立ち直れなかった。
簡単に解説すると、先に /etc/shadow のコピーをしなかったために
大量の新規ユーザができたという扱いになって
専攻サーバのアカウントを持っている人全員にメールが送られた。
現在存在しない人に関しては epcore にエラーメールが届いたのだ。
…実は去年の再構築の時も同じ失敗をしている。
その4へ(未完成)
その1へ
その2へ
02/05/01 作成