WEBマガジン
「複雑化するシステムの運用管理には標準化と自動化を」
2013.01.18 株式会社オージス総研 大澤 登士弘
近年のITの進化に伴いシステムのアーキテクチャは複雑になり、運用をする上で非常に手間とスキルが必要になってきています。
この様なシステムを運用する為に、高度なスキルを持った技術者を沢山アサインしておくことは現実的ではなく、運用コストの削減やミスを無くすという観点からも可能な限り人手によるプロセスをなくし、効果的な製品の選択と効率的なプロセスにより自動化を進めることが不可欠です。
オージス総研では百年アーキテクチャを提唱しており、技術革新と環境変化に対応可能なシステムの基本構造を構築する為の一つのファクターとしてオープンな技術の採用を上げております。
この様な観点を踏まえ今回は、システムの運用管理、特にシステム監視の自動化とオープン・ソース・ソフトウェア(OSS)製品について触れます。
なぜ監視システムが必要なのか
システムはITの進化と共にますます高度化・複雑化してきております。例えば、仮想化技術や無線・センサー技術、ネットワーク技術、更にストレージ技術などシステム基盤領域だけでも急速に進化してきており、これらを複数組合せたり、応用させて自社運用に合うようにカスタマイズをしたりしてシステムを構築することが当たり前になってきております。
また、ITはビジネスを支える必要不可欠なものになってきており、ITの問題によりビジネスに支障が出ることが無いように常に安定稼動し続けなければならない状況になってきております。つまり、ITによって「ビジネスを止めないこと」と、万が一の場合にも「ビジネスの復旧を早めること」が最も重要なファクターといえます。
前者は、業務が停止する前にITシステムの障害を未然に検知することで回避可能であり、後者は、万が一システム障害発生した場合にも素早くシステムを復旧させて通常業務に戻すことが必要になってきます。この為にも、業務が継続出来る様に常にITを最適化し、システムダウンしない様に監視し続ける必要があります。
しかし、高度に複雑になってきているシステムをオペレータによる監視や個別のスクリプトの作りこみでは大変であり、限界があります。そこで監視ツールの活用や監視システムの自動化が必須になってきます。
システム運用管理の課題
高度化・複雑化するシステムを運用する上での深刻な課題が幾つもあります。
少し古い資料となりますが、下図のIDCジャパンが211社を対象に行ったアンケート調査結果によると、「運用管理にかかるコストが大きい」「運用管理を担当する人員が不足している」が1位と2位で、3位に「運用管理の自動化ができていない」、4位に「障害が起こってもすぐに原因の特定や影響分析ができない」と続いています。
図1 「システム運用管理に関する課題」 出典:IDC Japan調査 「いま、運用自動化を検討すべき理由」@IT情報マネジメントより抜粋 |
このアンケートはデータセンターの運用管理における課題ですが、システム監視業務に置き換えてもほぼ同様のことがいえます。
監視業務における具体的な解決すべき主なアクションは、以下にあげられます。
- システム障害を未然に防ぐ為、サービス、プロセス、イベントログなどを監視して、アプリケーションを安定稼動させる
- 障害発生時に影響を受けるシステム、業務を即座に把握する
- 監視対象の増加に伴う監視ツールのライセンス・保守コストの増加を抑える
- 障害発生時の迅速な対応に備え、24時間要員を張り付ける(システム強化する)
- サーバ毎の性能情報を蓄積し、現在適正かどうかの判断や将来のリソース計画に活用する
- 一部のスキルの高い担当者への依存度を軽減する など
システム監視ツールの見直し
まず監視ツールに関しては、自社の運用にあった(機能を持った)製品を選びたいのは当然ですが、加えて如何にコストを抑えて、効率的な業務(自動化)が出来るかということにも注視すべきでしょう。
コストや人的リソースの面から考慮すると、やはりOSS製品の活用が欠かせません。監視対象機器の数に比例して掛かる監視ツールのライセンスや保守コストの問題もあるでしょうし、持続可能なシステムを構築する上では、製品ベンダーの都合によるバージョンアップやパッチ適用を強いられる事による業務の一時停止や時間とコストの無駄、更にベンダー依存する技術やサポートに限られたリソースを裂かれることは避けたいところです。
OSS製品の場合、ライセンスコストが不要になるケースが多いだけでなく、ランニングコストに影響する保守費用も購入は任意です。また、ソースが公開されている為、その気になれば緊急時の障害に対するワークアラウンドや独自のカスタマイズなども可能であり、この様な場面で必要になるベンダーの割高なコストを払う必要が無くなるかもしれません。また、応用可能な共通技術であれば、他の製品や業務へのスキルの応用が利くというメリットも出てくるでしょう。
ところで、システム監視ツールに必要とされる機能は何があるでしょうか。以下に主な機能を紹介します。
- サーバの稼動監視
- ネットワーク機器、ポートの監視
- サーバリソースの監視
- ログファイルの監視
- 障害の検知と分類
- 影響範囲の特定
- 問題対応の自動アクション
- 将来の予測 など
これらの機能は、ある特定の機能に特化した製品ではなく、統合監視製品であれば概ね備わっている機能です。あとは細かい機能の違いや設定の方法や監視画面の見栄えなど自社の運用により合う製品を選択すれば良いでしょう。自動アクション機能が備わっていれば、ランブックオートメーション(RBA)と呼ばれる定型的な一連の作業をツールに組み込んで自動化させることができる為、問題検知時の決まった単純な作業などは自動化出来るでしょう。
また、RBA対応製品と謳っているものは、ワークフローによる条件分岐やデータ分析機能を備えているものもあり、より作業を自動化出来るツール(オプション)もあります。
それでは、OSS製品に関してはどうでしょうか。ZabbixというOSS監視製品の機能を例に見てみると、以下の表のような機能が備わっております。
この様に一般的に必要とされる機能は備わっており、また他の商用製品と比しても劣らない機能を持っております。
この様なOSS製品を本番業務に活用した事例が数多く出てきております。
監視業務プロセスの見直し
システム監視業務のプロセスに関しては、現状の監視業務プロセスが効率的かどうかを見直すことから始めると良いでしょう。
監視ツールによるアクションの自動化(RBAの実装)も重要ですが、その前に監視業務プロセス自体の見直しと標準化を行う事が先決です。必要の無い、或いは無駄な作業を効率化させることほど無駄なことはありませんので、まずは現状プロセスで無駄は無いか?より効率的に出来無いか?という観点で見直しをするべきです。そして自部門だけではなく全社的な視点で監視プロセスの標準化を検討すべきです。この標準化なくして効率化、自動化を進めたとしても、個別のシステムや部門の最適化までしか出来ず、全体最適まで達する事が難しくなるためです。
プロセスが標準化されれば、1人で多くのシステムの管理や別部門のシステムも新たなスキルや負荷を増やすことなく管理することが可能になり、作業の効率化も進み、結果的に作業ミスの軽減や運用コストの削減に繋がるかもしれません。また、監視ツールの全社での統一が可能になり、RBAもより広範囲に適用しやすくなり、全体最適が進み、多くの面で効果が見られるはずです。
おわりに
監視業務の見直しの検討の過程としては、まずはプロセスの標準化が前提であり、その標準化されたプロセスに対して全社視点での効率化を考え、できるだけ多くツールに実装することで自動化を図ることが出来ます。更にその先には"システムの自律化"へと続いていくのではないかと考えています。システムの自律化に関しては、ある機能に特化した自律化製品が出つつある状態です。例えば、データ分析と将来予測機能や自動修復機能などです。現在はそのような特化した自律化製品と統合監視製品などとの組合せにより、より自動化(自律システム)を目指している段階であると感じています。
センサー技術、ビッグデータの高速処理技術、データ解析・分析技術などの発達が目覚しいものがあります。こういった技術の活用・応用によりシステム全体がもっと自律的に制御できるような時代が来ると考えております。
今後の技術の発展、精度向上、各ベンダーの戦略などにも注視していきたいと思います。皆さんからの、ご意見も頂戴したいと思っております。
*本Webマガジンの内容は執筆者個人の見解に基づいており、株式会社オージス総研およびさくら情報システム株式会社、株式会社宇部情報システムのいずれの見解を示すものでもありません。
『WEBマガジン』に関しては下記よりお気軽にお問い合わせください。