NTTコミュニケーションズ様導入事例

複数の監視ツールを利用して顧客システムの保守・運用を実施していたNTTコミュ ニケーションズが、Zabbixを導入することで大幅なコスト削減と業務の自動化・ 効率化を実現した。

Objective

複数の監視ソリューションを統合し、保守運用の自動化と効率化を目指す

Requirements

冗長構成が組めるシステムであること

より安価な保守費用で監視マネージャーを維持できること

Approach

3つの監視サーバーをZabbixに統合

自動化ツールと連携し、障害の切り分けや復旧を自動化

Outcome

冗長構成により、可用性が大幅に向上

監視システムの統合でコスト削減と効率化を同時に達成

人手を介さない運用を目指して

大手通信事業者であるNTTコミュニケーションズは、世界中の企業にICTソリューションを提供するグローバル企業だ。ネットワークサービスやデータセンター、クラウドサービス、セキュリティサービスなど、さまざまな事業を世界各国で展開している。

その多岐にわたるサービスの中には、顧客システムのインテグレーションや保守・運用などのサポートも含まれる。こうしたサポート業務では、自動化によるコスト削減が求められる。

今井聡氏が所属するビジネスソリューション本部 ソリューションサービス部 オペレーションマネジメント部門 第二グループでも、できるだけ人手を介さない運用を目指し、自動化を進めていたという。その取り組みの一環として、今井氏が目をつけたのがZabbixだった。

3つの監視ツールを併用し、サーバーが乱立

今井氏の所属する部門では、NTTコミュニケーションズがお客様に向けて構築したシステムを監視し、保守や復旧、運用などの業務を担当している。Zabbixを導入する前は、3社の監視ツールを併用していたという。

「3つのツールを使うため、ひとつの案件につき2つのサーバーを用意していました。案件ごとにサーバーを立てることに課題を感じていましたし、それぞれサーバーのバージョンも異なるため、設定を共通化することもできませんでした」と、今井氏は当時の状況を振り返る。

サーバーが1台構成という点も課題だった。「1台でも止まると夜中でも連絡が入り、タクシーで駆け付けることもありました。また、サーバーの数が多く広いスペースではありましたが、熱の懸念もありました」(今井氏)

さらに差し迫っていた問題は、2021年に今井氏の部門の移転が決まっていたことだ。「拠点の移転に伴い、サーバーも移動することになりますが、監視を止めて移動するのは大変です。そこで、移転先に新しいサーバーを用意し、一時並行監視してからサーバーを止めることになりました」と今井氏。

とはいえ、案件ごとにサーバーを立てるとその数は膨大だ。そこでZabbixを導入し、サーバーを統合することにしたという。

幸いNTTコミュニケーションズには、10年以上前からZabbixの構築や保守、サポートを顧客に提供しているZABICOMチームが存在する。今井氏は同チームの協力を得て、冗長構成のZabbixを構築することに決めた。

12台のサーバーを1台に統合

新たな監視システムに求めていたことについて、今井氏は次のように語る。「まず、お客様へのサービスを変更するわけにはいかないので、既存の監視機能が備わっている点は重視しました。その上で、冗長構成が取れることです。工夫すればどのサーバーでも冗長構成は取れますが、データベースはひとつで動かそうと考えました。また、N社の監視システムはプロセスが1つしか動いておらず、並行監視ができなかったので、そのプロセスが改善ができる監視マネージャーを検討しました。さらに、社内で活用しているオペレーションの自動化に適しているかどうかも調べました」。こうした今井氏の求める要件をすべて満たしていたのがZabbixだった。

サーバーの統合により、大幅なコスト削減が見込めることから、承認もスムーズに降りたという。「まずは、私が担当する10社の監視サーバーをマイグレーションするにあたり、12台のサーバーを1つのサーバーに統合することになりました。移行した方がお釣りが来るレベルの大きな費用削減効果が見込めました」と今井氏。「今では30社分をZabbixに統合しているので、従来比2割減のコスト削減が実現できていると思います」

データベースの速度を高める工夫も

今井 聡 氏
NTTコミュニケーションズ 株式会社
ビジネスソリューション本部
ソリューションサービス部
オペレーションマネジメント 部門 第二グループ
今井 聡 氏

導入にあたっては、ストレージで発生した未知のバグに悩まされるなどの困難にも直面したが、Zabbixの導入自体はスムーズに進んだ。また、Zabbixで重要となるデータベースの速度を上げるため、書き込み速度を高めるDBサーバーを購入したほか、DACケーブルでデータベースを直接接続。さらには、ディスクの冗長構成は最速のRAID10に設定したという。

これまで活用していたN社と新たに導入したZabbixとの違いで今井氏の頭を悩ませたのは、監視のタイミングだった。「N社のでは5分間隔で監視し、その監視で異常が起きると1分でリトライするようにしていました。つまり、問題があると最長6分、最短1分でお客様に通知されることになります。Zabbixにはこのリトライ機能がなかったため、その違いにどう対応しようか悩みました」と今井氏は明かす。

その解決策として今井氏は、これまでの通知間隔の最長時間となる6分は最低限確保しようと考えた。「Zabbixでは、3分間隔の監視で2回アラートがあるとお客様に通知することにしました。これで機能の差が吸収できました」(今井氏)

また、監視設定作業の効率化に向け、監視項目の共通テンプレートも作成した。これによって作業が迅速化し、監視の共通化も可能になったという。「すべてテンプレートに紐づけされているため、新規案件は自動的にサーバーに連携されます。N社のでは監視項目をひとつずつ設定する必要がありましたが、今ではテンプレートを適応するだけです。昨今は監視対象となる機器やポートの数が増え、手作業では膨大な時間がかかるため、自動化が欠かせません」と今井氏は述べている。

冗長構成でメンテナンスによる停止も大幅に減少

こうしてZabbixによる冗長構成の監視システムができあがった。可用性が高まったことで、夜間に駆けつけるような事案もなくなり、順調に稼働しているという。

「自動化ツールと連携し、障害の切り分けや復旧の自動化に貢献しています。冗長構成になったため、メンテナンスで停止する回数も大幅に減りました。脆弱性への対応も監視を止めずに実施できるので、週に一度のペースで行っています」(今井氏)

また、これまでは3つのツールを併用していたため3つの画面を確認する必要があったが、今では画面もひとつになった。サーバーのみならず監視用PCも縮小でき、これまで1人4~5台抱えていたのが、1人1台程度になったという。

他のシステムと比較してZabbixが優れている点について今井氏は、並行監視ができることや冗長構成のしやすさ、API連携の容易さなどを挙げる。「プロセスを増やせるので、監視対象を並列して100個、200個という単位で動かせます。また、Zabbixサーバーの性能が限界に近づくと、Zabbixプロキシを立てることでひとつの画面で数百~数千社の監視も可能になるなど、スケールアウトが容易です」と今井氏は説明する。

マップ機能や親子機能もありがたい機能だと今井氏は言う。「マップ機能では、ネットワーク構成を示し、異常が発生した部分が赤く表示されるので、ネットワーク内で異常が起こっている場所が一目で把握できます。また親子機能では、手前の機器の故障によってその先にある多数の機器のアラートが上がることを防ぐため、通知件数が削減できます」

ユーザー権限が3つの区分に分けられている点も今井氏は評価している。N社のではユーザー権限が区別されておらず、全員が管理者権限だったため、過去にはオペレーターが設定を消去してしまったこともあったという。「Zabbixでは閲覧のみ可能なユーザーと、監視設定を追加できるユーザー、全体を制御できるユーザーの3種類が設定できるため、オペレーションミスの防止にも役立ちます」と今井氏は話す。

さらに今井氏は、Zabbixではグラフがデフォルトで表示できること、そしてそのグラフの画像を一括でレポートに引用できることなどにより、「お客様に月次レポートを出す作業が効率化されました」と述べている。

今後の導入拡大とさらなる機能への期待

現在利用しているZabbix 5.0ではサポートされていないが、今後アップデートする際にはジオマップ機能も活用してみたいと今井氏は語る。ジオマップ機能では、Googleマップと連携し、どの拠点でアラートが上がっているか一目で確認できるようになるため、チェーン展開する店舗の監視も容易になる。「これまでは障害が発生すると、自ら図を描いて説明していました。障害の切り分けも自分たちですべて確認していましたが、この機能を使えば可視化され、対応も迅速にできるようになります」と今井氏は述べ、アップデートに前向きな姿勢を見せている。

今井氏が実験台となり、自ら担当する案件の範囲内で始めたZabbixの導入だが、現在では部門内での導入が拡大しているという。

「今後は、セキュリティ上の理由で対応できない案件以外はすべてZabbixに統合していく予定です。現在は約30社の監視にZabbixを利用していますが、今後は約100社にまで拡張していきたいですね」(今井氏)

可用性が高まり、レポートもより見やすくなったZabbixでの運用は、顧客にも好評だという。小規模で始めた今井氏の取り組みが、部門全体の効率化に広がりつつあり、顧客満足度の向上にも結びついている。

システム概要

Zabbixサーバー数:2台
Zabbixプロキシ数:2台
冗長化構成の有無:有り(Active - Active構成)
監視拠点数:1,000拠点
監視対象数:40,000台
トリガー数:41,000
アイテム数:130,000
ユーザー数:75
Zabbixのパフォーマンスデータ(NVPS(1秒あたりの監視項目数)):426

NTTコミュニケーションズ株式会社

NTTコミュニケーションズは、お客さまのデジタルトランスフォーメーション実現に貢献する 「DX Enabler®」として、ICTの活用によるお客さまの経営課題の解決やスマートな社会の実現 に取り組みます。 2019年7月のグローバル事業の統合を通じ、ご提供できるサービスメニューの拡充やサポート エリアの拡大を行いました。 お客さまのグローバルビジネスを、さらに充実した体制とソリューションでサポートいたします。

本社:
東京都千代田区
設立:
平成11年7月1日
従業員数:
約9,000人
(2022年7月現在)
資本金:
2,309億円

監視ソリューションの活用事例をご紹介いただける場合は

質問事項にお答えください または、マーケティングチームまでお気軽にお問い合わせください。

完全無料、10分ほどで始められます

Zabbixダウンロード

Zabbixは真のオープンソースです。無制限かつコストゼロ。