こんにちわ!
私の業務を簡単に説明しますとサーバーの運用管理を行っています。
運用管理とは、ITシステムを少しでも効率よく運営していく仕組みの事を指します。
運用管理をしていると、重大な事故が発生することがあります。
重大な事故が発生すると、精神的にも肉体的にも大きな負荷がかかります。
そして、そのたびに「ヒヤリハット」という言葉が出てきます。
ヒヤリハットとは、
「重大な災害や事故には至らないものの、直結してもおかしくない一歩手前の事例の発見」
「ハインリッヒの法則」
等とも言われています。
これは、
1つの重大事故の背後には、29の軽微な事故があり、その背景には300の異常が存在する、
という法則です。
「1:29:300」
要は、事故が1件起きたということは、裏に29件の軽微な事故があり、
その裏には300件の「ヒヤリ」とする事象が起きているのである。
運用管理の現場に置き換えると、
1件の重大な不具合の裏には、
29件の
「作業後のチェック不足」
「作業開始直前の顧客都合による仕様変更」
「事前の検証不足により、特定のハードウェアによる動作に不都合が発生」
等の軽微な事故がある。
そしてその裏には、
300件の
「顧客との打ち合わせ不足」
「顧客側での作業レビューの不足」
「複数の案件を掛け持ちしていることによる体力的な問題」
等が潜んでいる。
ということになります。
この法則は、ピラミッドのような構造で表せます。
最底辺に「ヒヤリ事故」があり、その上に「軽微な事故」があります。
そして、ピラミッドの頂点に「重大な事故」があります。
最底辺の「ヒヤリ」を抑えることができれば、
その次の「軽微な事故」を抑えることができ、
結果として「重大なミス」も事前に防げる、ということになります。
軽微な事故が頻発している場合は、近々、重大な事故が起きる恐れがあるので、
日頃の業務において注意が必要になります。
当たり前のように感じますが、出来ているようで中々出来ないことが多いです。
現場で行っている対策には以下のようなものがあります。
・対策1
作業を行う時は、指さし確認・声だし確認を行う。
人間は、多くの感覚器官を使って行動したほうが、意識が覚醒し、集中力・注意力・記憶力が向上します。
・対策2
見間違いやすい数字や記号は、「使わない」か「ふりがな」で対処する。
始めから見間違えやすい文字は使用しない。使用しなくてはならない時は文字の後にふりがなをつけ、見間違いを防ぐ。
・対策3
疲れてから休憩するのではなく、疲れる前に休憩をする。
疲れると、集中力や注意力が低下して、ミスにつながります。
「疲れたから休憩する」ということは「すでに疲れている」ということになります。
作業中に疲れがあり、それはすでに集中力・注意力が低下しているということです。
これは危ない状態です。
疲れたから休憩を取るのではなく、疲れる前に休憩を取るようにしています。
起こる前に対策を取るのは人間にもシステムにも大変重要なことです。
特に運用フェーズは開発・構築から比較するとサイクルとしてはとても長いです。
そのため縁の下の力持ち的役割として業務を支えるために
業務をこなす人にスポットをあてるべきだと私は考えています。