Up トラブルのパターンと解決方法 作成: 2008-10-24
更新: 2008-10-24


    情報システムでは,必ずトラブルが発生する。
    情報システム管理者は,このトラブルを解決しなければならない。
    (トラブルは,放置できない。)

    トラブルの解決は,トラブルの原因をつきとめ,これを処置することである。
    いま,ひとりのユーザから「メールを送れない」という訴えが管理者に届いたとしよう。 「メールを送れない」原因の候補は,このユーザのマシンと上流ネットワークの全部である。
    トラブル解決の最初のステップは,トラブルの原因の候補を一挙に絞ること。

    これは,勘の作業である。
    実際,「一挙に絞る」をやれるのは,勘のみである。

     Cf. 将棋のプロは,最善手を勘で決める。コンピュータにプログラムで将棋をさせるとき,コンピュータは網羅的に手を比較して,最善手を決める。勘をプログラミングすることは,コンピュータのいまのアーキテクチャでは無理。

    原因の予想にしくじると,ひどい回り道をすることになる。
    下手にいじり出すと,問題が複合化して,ますますわけがわからなくなる。
    問題のない箇所をいじって,システムをダメにしてしまうことにもなる。
    よって,勘が効くかどうかは,管理者の能力として最も重要な部類に入る。


    そして,勘は,経験がつくる。
    「メールを送れない」を言ってきたユーザがだれであるかで,原因の候補の当て込みが変わる。 このトラブルの発生しているセグメントがどこであるかでも,それは変わる。──等々。
    これが,経験というものである。

    経験は,人からもらうことができない。
    勘は,本を読むことでは,つかない。
    この意味からも,「管理者の成長は時間がかかる」。

    情報システム管理者は,トラブルによって育てられる。
    逆説めくが,トラブルの少ないシステムは,管理者にとってよくない。──特に,管理者養成にとっては。

      国立大学がインターネットにつながった当初は,ネットワーク機器もいまと比べて格段に脆弱で,しょっちゅうトラブルを起こした。 よって,初代の管理者は,トラブルによる勉強機会をたくさん持てた。