hikari 問題対処ログ

  • 履歴
    • 2015/11/18 荻原弘尭
    • 2016/09/09 荻原弘尭
    • 2017/10/19 荻原弘尭

このページの目的

hikari で起こった問題とそれへの対処をまとめておく

起こった問題

  • ログインノード様に zsh を使った場合パスが通らない
  • 計算ノードが一部のユーザだけで占有されてしまう

ログインノード様に zsh を使った場合パスが通らない

問題

  • ログインシェルとして zsh を用いた場合, bash で通っていたパスが通らない

原因

  • zsh は bash と違いログインした時に /etc/profile を読み込まない. そのため, /etc/profile で設定していたパスが通らなかった

対処

  • zsh の最初に読み込むファイルは /etc/zsh/zprofile である. そこで /etc/profile を読み込むようにした

具体的作業

  • /etc/zsh/zprofile を修正する
    • # cd /etc/zsh
    • # vim zprofile
      • 以下を書き込む
        • source /etc/profile

計算ノードが一部のユーザだけで占有されてしまう

問題

  • 一部のユーザの計算でほとんどの計算ノードのコアが埋まってしまい, 他のユーザが計算できない状態になった

対処

  • ユーザの使用制限をかけた. 具体的には一ユーザの同時に投下できるジョブ数を 7 にした.

具体的作業

  • queue に制限をかける
    • # qmgr -c "set queue long max_user_queuable=7"
  • 確認
    • # qmgr -c "p s"

memo

  • マザーボードに電源を入れると2桁の数字が動いていくのがわかる. どうやら現在の状況を表している模様. なんとなくわかってきたのでいかに意味を列挙する.
    • 69: メモリチェック中. ここで止まるとメモリ関係に異常がある模様
    • 57: ビデオカードチェック中. ここで止まると, ビデオカードに異常があるか, そもそも VGA ケーブルがつながってない模様.