ネットワークエンジニアで高きを目指せ(サイバージャヤ、マレーシア)

世界を股にかけて転職する男(マレーシア<ー>ベトナム)

回線監視業務の現場について②(メンテナンス編)

NTT東西で、最大100Gbpsの大域保証型の高速広帯域アクセスサービスを開始するらしい。

 

ニュースのURLは以下の通り。

https://it.impressbm.co.jp/articles/-/18921

 

その記事の下のほうにピクっと眉がつい動いてしまう文言が書いてあった。

「信頼性を確保するため、ユーザーの回線単位で常時監視を実施する。故障発生時には、ユーザーへの通知と復旧対応を、24時間365日体制で実施する。」

 

あー彼らも私と同じように24時間365日体制で監視をしてるんだなーと妙な親近感が沸いた。

 

今日は私がやっている監視業務について多少小話をしたい。

監視業務、ネットワークの基本から学びたい方はどうもここから始めるパターンが多いと聞く。

 

監視といえば分かりにくいかもしれませんが、要するにネットワークを構築した神のような方がおり、そのネットワークがきちんと問題なく繋がっているのかを確認するのがわいや。

 

滅多なことで、障害は起こらないが何か異変が起きた場合アラームというのがなる。

アラームは下記Patliteがなる仕組みとなっている。

パトライト ネットワーク監視表示灯 直径25mm/3段/赤黄緑 NHS-3FB1-RYG

しかし、なっても滅多なことで障害は起こってはいない。

よく鳴るパターンはメンテナンスが行われているときである。

メンテナンスが行われていると、機器の再起動などを行うため一瞬ネットワークに障害が起こったかのように監視システムが感知して、なり響くこととなる。

 

そんな場合、非監視設定というのを行う。

下記ウェブサイトを読んでいただければイメージがつくかもしれない。

http://328.hateblo.jp/entry/2016/03/07/012853

 

通常、この期日でメンテナンスやりますよーみたいな連絡が上位デスクから事前連絡が来るので、その際、非監視設定をやります。

 

これをやっていない場合、別段ネットワークに問題が起こっていないのに、障害対応しなければならないので、大変です。

 

一個くらいならいいですが、その間別の問題も発生するかもしれません。

ネットワーク障害発生時には以下に早く問題解決できるかが非常に大事なってきます。

問題解決までの時間というのは、結局どれだけの時間提供すべきサービスが提供されていないかということになります。

 

なぜなら解決されるまでは、当たり前に繋がっているインターネットやメールサービスが利用できないからです。

 

重要な言葉でKPIKey Performance Indicatorという言葉があります。

現場では、問題発生後、何分以内に決められたフローに沿ってメール打ったり電話したりと様々なことを行わなければなりません。

以下、KPIについて分かりやすいサイトがあったので参考にされてください。

https://blogs.manageengine.jp/ithelpdesk-kpi/

 

ただ、結局問題だと思っていた内容が実は単なるメンテナンスだったとか、停電で現地が動かなくなっていたとかそういうのが多いです。

 

以下に現場から事前に情報を得られるかが、スムーズな監視業務を幅広く行えるかの鍵となります。

 

以下、その他私の業務に関する記事を載せておりますのでご参考にどうぞ。

 

interier.hatenablog.com

 

 

読者登録をしていただけると大変助かります。

 
 本サイトが参考になったらクリックをお願いします。

  にほんブログ村 にほんブログ村へ