AIOpsって何?わかりやすく解説

 システムやネットワークなどの複数のデータソースから集めたビッグデータをAIで分析し、課題を特定したり将来発生する問題の予兆を検知したりする「AIOps」について解説します。
6668_1.jpg

AIOpsの進め方や事例がわかる資料

AIOps(AI分析機能)を持つCloud Archの製品概要と、「セキュリティインシデント早期発見」と「サーバーの障害予兆検知」の2つの事例をご紹介した下記のようなPDF資料がダウンロードできます。

AIOpsを支援するCloud Archの概要資料

「AIOpsとは何か」と「Cloud Archの製品概要、AI分析機能」についてご紹介した資料

2つのAIOps事例「セキュリティインシデント早期発見」と「サーバーの障害予兆検知」

Cloud ArchのAIOps(AI分析機能)の概要と導入事例をご紹介

オージス総研のAIOps推進事例「進め方と得られた効果を解説」

ログイン画面に対する総当たり攻撃への対処をAIOpsを活用して効率化した事例をご紹介

AIOpsとは

 AIOpsとは、IT運用のタスクに統計解析や機械学習をはじめとするAI(人工知能)技術を適用する取り組みの総称であり、IT運用を自動化するための技術として注目されています。

 AIOpsという言葉自体はAIと運用(IT Operations)を組み合わせた造語で、2016年にGartner社が提唱したのが始まりです。Gartner社はAIOpsを「IT運用を支援するAI」と位置づけ、AIOpsプラットフォームとは「ビッグデータとAI、または機械学習を統合して、可用性や監視、イベントの相関付けと分析、ITサービスの管理と自動化、といったIT運用のさまざまなタスクを改善または部分的に刷新するようなソフトウェアシステムである」と定義しています。

 さらにGartner社は「AIOpsプラットフォームはDX(デジタルトランスフォーメーション)を組織的に推進する上で重要なツールである」と言及しています。

AIOpsの利用用途

 AIOpsが【IT運用にAI技術を適用する取り組みの総称】ということは、ご理解いただけたかと思いますが、実際にどういった場面で活躍し、どのような用途があるのでしょうか。AIOpsが利用される、主な用途についてご紹介します。

パフォーマンス分析

 ITインフラが生成する大量のイベントデータを収集し、パフォーマンスが正常な値を保っているのか、問題があるとすれば原因がどこにあるのかといった分析を行います。
 システムログの監視や分析について既存のツールも存在しますが、分析手法や出力内容が決まっているため、日々変化していくシステムに追随することが難しくなっています。その点AIはシステムログからパターンを発見する学習機能があるので、常に自分たちが求める視点での最新の分析データを得ることができます。

異常検知

 意外に感じられるかもしれませんが、システムの異常検知は自動化が難しい範囲です。ハードウェアは各ハードがエラーを報告する機能を持っているので、大部分が自動化可能なのですが、ソフトウェアの異常はシステムダウンなどの明らかなものはともかく、スローダウン(システムの応答が遅くなる)のようなシステムの動きとしては正常でも使っている人間にとっては挙動がおかしいといったものは、簡単に自動検知することはできません。
 その場合はシステムのさまざまなデータから「この部分がこういう値を示しているときは異常」という定義を人間が行う必要があります。AIOpsではさまざまなシステムデータからAIが異常のしきい値となるKPIを学習し、そのKPIと実際の観測データを比較することで異常を判断させます。

根本原因の分析

 根本原因の分析はイベントが発生した場合に、なぜ発生したのかを分析する機能です。イベント発生やシステムログの監視からエラーを検知した場合や障害発生時には、そのトラブルがなぜ発生したのかという根本の原因がわからないと対応ができません。AIOpsでは関連する大量のイベント情報を解析し、類似性と重要性に基づいて分類します。発生しても対処しなくてよいイベントは無視することができ、対処が必要な重要イベントは類似性に基づいて処理を検索し、対処方法をレコメンドします。

AIOpsの進め方や事例がわかる資料

AIOps(AI分析機能)を持つCloud Archの製品概要と、「セキュリティインシデント早期発見」と「サーバーの障害予兆検知」の2つの事例をご紹介した下記のようなPDF資料がダウンロードできます。

AIOpsを支援するCloud Archの概要資料

「AIOpsとは何か」と「Cloud Archの製品概要、AI分析機能」についてご紹介した資料

2つのAIOps事例「セキュリティインシデント早期発見」と「サーバーの障害予兆検知」

Cloud ArchのAIOps(AI分析機能)の概要と導入事例をご紹介

オージス総研のAIOps推進事例「進め方と得られた効果を解説」

ログイン画面に対する総当たり攻撃への対処をAIOpsを活用して効率化した事例をご紹介

AIOpsがもたらすメリット

 では、実際にAIOpsを導入することでどのようなメリットが生まれるのでしょうか。
 システム運用業務に導入することのメリットを3点ご紹介します。

1.業務品質の向上

 AIを用いてデータを分析し、そのパターンに基づいて判断を下すことが可能となるため、「対処する人間によって品質が異なる」といった属人化の問題が解消され、正確性が向上します。また常に最新のデータを機械的に分析してアウトプットすることによって、処理速度が向上します。

2.問題修復スピードの向上

 AIOpsではシステムのさまざまなデータから異常の早期発見や、問題発生時には根本原因をレコメンドすることが可能となるため、問題修復のスピードが向上します。それによって、システム障害が発生した場合、障害がビジネスや顧客に大きな影響を及ぼさないよう、できるだけすばやく問題を修復することができます。

3.運用保守コストの削減

 ITインフラの運用保守にAIを適用すれば、人手によるコストや運用コストを削減することができます。例えば、差し迫ったシステム障害を予測し防止、根本原因の特定と問題修復のための対処を自動化することが可能となり、システム障害にかかわる手動での作業が大幅に削減できますし、通信データをリアルタイムに分析し、マルウェアによる通信を特定することができれば、セキュリティインシデントを迅速に対処することが可能となります。

Cloud Archで実現できるAIOps

 AIOpsがもたらすメリットは、システム運用の現場で求められることの多い要素であり、AIOpsを導入することで、「品質向上」「インシデント早期対応」「コスト削減」が実現できます。そして、Cloud Archでは【AI分析】のほかに【モニタリング】と【自動実行】の機能を持ち合わせており、それらが組み合わさることで、AI機能を最大限に生かすことができます。
 Cloud Archでは、複数のAIモデルを保有しており、お客様の環境にあったモデルを選出します。選出後は、AIOpsで自動実行した運用タスクの結果や、それにともなって発生したITインフラの変化もモニタリングし、AIOpsにフィードバックする仕組みとなっています。そのため、長期的に利用すればするほどデータが蓄積され、導入環境にあったAIモデルが作成されます。

まとめ

6668_2.jpg
 本コラムでは、AIOpsについて概要をご紹介しました。
 オージス総研が提供する運用自動化ソリューション『Cloud Arch』はAIOpsを導入支援するサービスで、先述した計画策定のフェーズから本格導入までワンストップでサポートさせていただきます。

AIOpsの進め方や事例がわかる資料

AIOps(AI分析機能)を持つCloud Archの製品概要と、「セキュリティインシデント早期発見」と「サーバーの障害予兆検知」の2つの事例をご紹介した下記のようなPDF資料がダウンロードできます。

AIOpsを支援するCloud Archの概要資料

「AIOpsとは何か」と「Cloud Archの製品概要、AI分析機能」についてご紹介した資料

2つのAIOps事例「セキュリティインシデント早期発見」と「サーバーの障害予兆検知」

Cloud ArchのAIOps(AI分析機能)の概要と導入事例をご紹介

オージス総研のAIOps推進事例「進め方と得られた効果を解説」

ログイン画面に対する総当たり攻撃への対処をAIOpsを活用して効率化した事例をご紹介

2023年5月12日公開
※この記事に掲載されている内容、および製品仕様、所属情報(会社名・部署名)は公開当時のものです。予告なく変更される場合がありますので、あらかじめご了承ください。

関連サービス