サーバ再構築の風景・その3


※先に その1その2 を読んでください。

2. 二日目

2.1 トラブル発生?

 二日目。
M政がサーバ室に到着した時にはすでにT橋さんは作業を開始していた。
M政:「おはようございます。」

T橋:「おはようございます。」

M政:「今は何の作業をしてるの?」

T橋:「えーとですね…」

 今日来たら X が立ち上がらなくなっていたそうで
現在パッケージの再インストールをしているとの事。
…そうきたか。


2.2 qmail のインストール

 別に X がなくてもさほど作業に支障は出ないので
後回しにして qmail のインストールを開始する事にした。

本来は現管理者のT中君に付いてもらいながら
作業をやるはずだったのだが、事情があって来れなくなったので
新管理者のS沢君と元管理者のM田さんに付いてもらった。

マニュアルを見ながら作業を進める。
ここでの失敗は何通かテストメールが
現メールサーバの root に送られてしまった事。
原因は再構築中のホストのシステムメールが現メールサーバに送られる為。
しかも、mondo 宛てに送ったのだがメールサーバにいない
ユーザだった為さらに余計なエラーが出る結果となった。

最終的にはこれでよいのだが、わざとエラーメールを
発生させる時には予告くらい出すべきだったかもしれない。


2.3 tmp 問題

 qmail の次は gate のインストール。
しかし、インストール途中で何かの man を
見ようとしてエラーが返ってきたので作業は中断。
原因の調査を開始。

エラーメッセージをそのまま検索にかけてみたら
どうやらファイルシステムに不良があると出るエラーらしい。
これを見て原因は恐らく HD のマウントだろうとピンと来た。
思い返せば X が上がらなくなったのもこの作業を行ってからだ。
で、 /etc/fstab を見直す。
hde1 /
hde2 /tmp/
hdg1 /bk/
hdg2 /tmp.bk/
sda1 /home/
sdb1 /home.bk/
M政:「あれ? /tmp ってシステムで使ってなかったっけ?」

M川:「使ってますねぇ。」

M政:「って事はこれが原因じゃないか?」

要するに元々存在するディレクトリとバッティングして
/tmp を使用する X や man が機能しなくなった、って訳だ。
T橋(和):「やってくれるねぇ、S木君も」

M政:「今ごろ気付いた我々も愚かだったけどね。」

M川:「S木さんは二徹でお疲れだったのでは…」

M政:「あれ? メールを見たら指示してるのO高さんだよ。」

一同:「O高さんかよ!」

T橋(こ):「やられましたね。」

M政:「こんな所に罠を張るとは…」(違うって)

/etc/fstab を書き直して再起動したら無事元に戻った。
後で聞いた話だが、O高さんの指示メールを見た時点で
M田さんはこの事に気付いていたそうだ。
…あれだけの人が見てて誰も指摘してくれないんだもんなぁ。


2.4 gate のインストール

 気を取り直して gate のインストールを再開する。
例によってマニュアルを見ながら作業する。
gate に関しては最強のスーパーバイザーM川君がついているので
作業は順調そのもの。
特に失敗も無くあっさり終わる…はずだった。
M川:「じゃあそろそろ gate のテストをしてみましょうか。」

T橋(こ):「はい。」

M政:「あれ? なんか大量のエラーメールが epcore に届いているよ?」

M川:「え?……あ!」

がっくりとうなだれてしまったM川君。
そのまま一分くらい立ち直れなかった。

簡単に解説すると、先に /etc/shadow のコピーをしなかったために
大量の新規ユーザができたという扱いになって
専攻サーバのアカウントを持っている人全員にメールが送られた。
現在存在しない人に関しては epcore にエラーメールが届いたのだ。
…実は去年の再構築の時も同じ失敗をしている。


その4へ(未完成)

その1へ

その2へ


戻る

02/05/01 作成