システム運用の業務と課題-システム運用をラクにする運用自動化を実現するには?
システム運用とは
システム運用とは、システムが本番稼働した後、安定的に稼働させ続けるために行う必要のある業務です。そのために、システムやサーバーを監視し状況を把握し、障害を未然に防止するための作業を行います。もし障害が発生したら、手順書をもとに対処し復旧を図ることもシステム運用の重要な業務です。同じく、安定稼働を目的とした業務としてシステム保守がありますが、こちらはシステムに不具合や故障が発生したときに、その原因を調査して、必要に応じてシステムの改修や変更を実施します。そのため、対応が定型化できない業務も多いです。対して、システム運用は、障害を未然に防止する活動や業務がメインとなり、定型的な業務が多いのが特徴です。
運用自動化の進め方やAIOpsの推進事例
運用自動化やAIOpsに関連する主な資料
● 運用自動化やAIOpsを支援するCloud Archの概要資料
● AIOpsの2つの推進事例
● オージス総研のAIOps推進事例「進め方と得られた効果を解説」
システム運用の業務内容
システム運用と一口にいっても、その業務は多岐にわたります。具体的には以下のような業務があります。
監視障害対応 | ・各種監視業務(システム監視、ネットワーク監視、セキュリティ監視など) ・障害対応(アラートコール、一次対応、エスカレーションなど) |
---|---|
作業依頼 (定常作業) |
・ジョブのリラン、デプロイ作業など ・セキュリティパッチ適用 ・マスタメンテナンス、データ登録など ・システムのバージョンアップ ・ユーザーアカウント管理 |
運用管理 | ・インシデント管理 ・問題管理 ・変更管理 ・リリース管理 |
上記のような業務は、基本的には運用手順書を規定し、日々繰り返し行うことが多いです。また、定期的に実施する業務もありますが、システムアラートに起因する業務は突発的に発生するため、その作業量をコントロールすることが難しい側面があります。
システム運用の課題
システム運用の現場では、上記のように業務が多岐にわたるため、さまざまな課題が生じます。運用管理者や運用担当者からは、以下のような声がよく聞かれます。
- 作業量が多く、オペレーションミスがたびたび発生する
- 日々の作業に忙殺され、改善活動にまわせる時間がとれない
- 社内外から運用コストの削減を求められる
- システム環境の変化に対応できていない
- 運用手順書、ドキュメントが形骸化している
- 一部の担当者しか知らない属人化した作業がある
- 人が育たない、人が定着しない
- 運用現場のモチベーションが上がらない
これらさまざまな課題をすべて解決することは容易ではありません。ただ、多くの現場では、運用要員に恒常的に高負荷がかかっている職場環境が一番の要因ではないでしょうか。そこで、作業負荷のかかる日々の定型作業に対しては、運用要員が手作業で実施している業務をRPAやRBAといったツールを使って運用を自動化することで、その負荷を軽減するアプローチが有効です。
まとめ
システム運用における定型作業を自動化することは、作業負荷削減といったコスト面、ヒューマンエラーの抑制といった品質面といった両側面からみても非常に有効な施策です。しかし、やみくもにツールを導入して自動化を進めても失敗するリスクが高く、課題解決につながらないことが多いです。そこで、運用組織内部の全作業の洗い出し、業務プロセスを見える化(可視化)することが重要になってきます。運用の現場では、属人的な作業プロセス、曖昧なルールなど、管理者が把握していない隠れコストが多く潜んでいます。これらが自動化導入の障壁のひとつになります。
自動化を導入する際の具体的な課題については、次回のコラム「運用自動化のメリットと導入までの課題」についてご説明します。
運用自動化の進め方やAIOpsの推進事例
運用自動化やAIOpsに関連する主な資料
● 運用自動化やAIOpsを支援するCloud Archの概要資料
● AIOpsの2つの推進事例
● オージス総研のAIOps推進事例「進め方と得られた効果を解説」
※この記事に掲載されている内容、および製品仕様、所属情報(会社名・部署名)は公開当時のものです。予告なく変更される場合がありますので、あらかじめご了承ください。
関連サービス
-
運用自動化ソリューション「Cloud Arch」
オンプレミスシステムやプライベート / パブリッククラウドの複数サービスを利用しているシステム環境に対し、シームレスな運用自動化と統合監視の環境をご利用いただくことで複雑化するシステム運用の負担低減を実現します。
関連記事一覧
- Splunk(スプランク)とは?ログの有効活用により先進的システム運用を実現
- APM(アプリケーション性能管理)とは?
必要性、APMシステムの機能・概要 - AIOpsを始めるために必要なことを解説
- AIOpsとは?システム運用のAI活用事例やユースケース、メリットを解説
- サーバーダウンの原因と対策とは?システム障害を防ぐサーバー運用について解説
- システム・サーバー運用業務の自動化が進まない理由と運用自動化を成功に導くポイント
- 運用自動化プラットフォームKompiraとは?特長と導入メリット、事例について
- サーバー監視とは?目的やツールの選び方、自動化について解説
- 運用自動化の事例紹介-システム運用をラクにする運用自動化を実現するには?
- 運用自動化とは?メリットと進め方-システム運用をラクにする運用自動化の実現方法