現代の情報システムの運用チームでは、多様化するデバイスや働き方への対応、増大するデータ、自社データセンター以外のマルチクラウド化など管理すべき項目が多岐に渡り混迷を極めています。そして、それらを管理するために多様なツールを活用してします。このような環境下においてひとたび問題が発生した場合には、その問題の発見から原因の特定、対処法まで多くの時間を要する負のスパイラルを生んでいると言えます。2018年にオーストラリアにて最大級のスーパーマーケットチェーンが技術的問題に見舞われ、その問題を解決させるまでに営業停止を余儀なくされています。同社は大幅に売り上げを失い、顧客からの不満を集めました。このように情報システムが経営と直結する現代社会においてシステムの安定運用は必要不可欠です。

多くの企業は、リスクの高い深刻なサービス停止などのIT問題を迅速に察知し、予防し、発見し、解決に向けた取り組みが必要です。そこで注目されているのが「AIOps(人工知能によるIT運用チームのサポートと作業の自動化)」です。本記事ではAIを活用した運用管理ツールAIOpsとは何なのか?従来の運用管理ツールと何が違うのか?をご紹介します。

AIOpsとは?その特徴

AIOpsの特徴をざっくりと表すと、IT運用チームがより適切な判断を下すためのサポートを行うことです。情報システムの複雑化が進む今日のITインフラにおいて、運用管理に必要なプロセスは一段と難しいものになっています。従来型の、かつサイロ化された運用管理ツールや方法では多様化したシステムから発生するデータを処理できない傾向にあります。そこで、AIOpsは次のような特徴によりこの問題を解消してくれます。

異なるソースからデータを取り込む

サーバー、クライアント、ネットワーク機器、クラウドプラットフォーム、仮想マシン、周辺機器などあらゆるものが一つに繋がる昨今のITインフラは複雑さを極めており、そこから生成される管理のためのデータ量は従来型の運用管理ツールによるアプローチの想定を遥かに超えています。

運用管理ツールの目的は各種ログデータを統合・集約し、平均化することによって分析可能な環境を整えることです。しかしながら、複雑さを極めたITインフラではそのプロセスすら複雑化し、満足な運用管理が行えないのが現実です。

一方、AIOpsはITインフラ内のあらゆるタイプの大規模データセットを取り込むと同時に、包括的な分析のためのデータ再現性を維持でき、運用管理に必要な迅速な判断を促すための材料を揃えてくれます。

取り込んだデータの分析を簡素化する

AIOpsのさらなる特徴は、データの量も速度も異なるあらゆる形式から統合・集約できる点です。収集したデータは搭載されたAIによって自動的に分析され、将来における問題の予測と予防、既知の問題の原因究明へと大いに役立てることが可能になります。

AIOpsの利用シーン

現在、AIOpsの利用シーンとして想定されているのは「1. パフォーマンス分析」「2. 異常検知」「3. イベントの相関関係と分析」「4. ITサービス管理」「5. オートメーション」です。

パフォーマンス分析

AIOpsの代表的な利用シーンがパフォーマンス分析です。AIの機械学習(マシンラーニング/ML)を使用して大量のイベントデータを素早く収集・分析し、問題の根本となる原因を突き止めます。IT運用チームの主要業務となるパフォーマンス分析は、日々のデータ量増加と多様化によって複雑さを極めているため、従来の手法では機械学習を搭載した運用管理ツールであってもデータ分析は困難な状態です。一方、AIOpsは高度なAIを搭載しているため大規模なデータセットを素早く分析し、データの増加と複雑化の問題を取り除きます。将来的な問題を予測し、根本原因を突き止めることで問題を未然に防ぐことへと繋がります。

異常検知

ITインフラにおける異常検知は、膨大なデータの中からシステムに問題があることを示唆する異常値(データセット内で履歴データと比較して突出しているイベントログやアクティビティログ)を特定する作業です。異常検知にはアルゴリズムが採用され、単一のKPIについて過去と現在を比較して動作を監視し、スコアが異常値に達するとアラートする仕組みです。AIOpsではより素早く効果的な異常検知が可能になり、対象となるKPIの動作が識別されたときに、その実際の値と機械学習モデルの予測値との差に異常がないかを自動的に監視してくれます。

イベントの相関関係と分析

イベントの相関関係と分析とは、関連する複数のアラートによって生成される大量のイベントを解析し、その元となっている原因を特定、修復方法を提案します。従来の運用管理ツールではアラートが大量に生まれるだけで、問題に関する洞察は得られないのが難点です。一方、AIOpsはアルゴリズムによって類似性に基づいて重要なイベントログが自動的に分類されイベントログを常時管理する負担を減らしながら煩わしいノイズを自動的に削減します。さらに、イベントログの受診時にAIが関連イベントをまとめ、主要なイベントグループを中心としてルールベースのアクションが実行されます。

ITサービス管理

ITサービス管理とは社内のITサービスの設計・構築・提供・サポート・管理に関する全ての作業を包括するものです。ITサービスを社内のエンドユーザーに提供するためのポリシーやプロセス、手順も含まれます。他の利用シーンと同様にITサービス管理においてもAIOpsを利用する価値があり、AIによるデータ分析を通じて問題を素早く特定し、解決へとつなげることでIT部門の作業効率と効果を大幅に向上できます。

オートメーション

従来型の運用管理ツールではITインフラにおけるインシデントを理解し、対応・解決するために複数のソースの情報を手動でまとめなければいかないことがよくあります。AIOpsはデータが複数のソースから自動的に収集された相関づけられることから、迅速性と正確性を大幅に向上できるのが大きなメリットです。社内のIT運用チームは、AIOpsによる自動化機能を大いに活用してサーバーやOSに関する大々的なレポート作成、コンテナの管理最適化、クラウドプラトットフォームの監視、仮想環境の監視、ストレージの監視などを実現できます。

AIOpsがビジネスにもたらすメリット

最後に、情報システム運用チームがAIOpsを活用してITインフラを管理した際の、企業にもたらすメリットをご紹介します。

  • メリット 1. システム停止を回避して安定性を向上し、顧客満足度(社員満足度)を高める
  • メリット 2. サイロ化されたデータを統合し、分析とレポートの精度を向上させる
  • メリット 3. 根本的原因の分析と修復を素早く行い、時間とコスト、リソースを節約する
  • メリット 4. サービス提供にかかるレスポンスタイムを短縮し、応答の一貫性を高めてサービス品質を向上する
  • メリット 5. IT運用チームのリーダーが業務部門のリーダーとコラボレーションする時間を増やし、IT部門の戦略的価値を証明できる

いかがでしょうか?AIOpsがビジネスにもたらすメリットは非常に多く、情報システム運用チームだけでなく組織全体にとって多くの効果を創出してくれます。この機会に、AIOpsによるITインフラ管理を検討されてはいかがでしょうか? SysTrackに搭載されたAIOpsは、上記のメリットの他にヘルプデスクのコストを削減することも可能になります。
詳しいSysTrackのAIOpsはこちらをご覧ください。