Close

ベロシティの高いチーム向けの ITSM

Atlassian TEAM TOUR Tokyo 2024 開催決定!組織が進化を続けるためのヒントをお届けします。詳細・お申し込みはこちら

問題管理とは

問題管理は、IT サービスのインシデントの原因を特定して管理するプロセスです。これは、ITSM フレームワークの中核的な要素です。

優秀なインシデントの専門家からは、「インシデントの原因は何ですか?」という質問を実際に聞くことが少なくなります。確かにあなたは、幹部、顧客、そしてマスコミからその質問を頻繁に聞くでしょう。しかし、専門家の理解はより深いのです。

「インシデントの原因は何ですか?」という質問に対する答えは、多くの場合、無味乾燥で役に立たないためです。たとえば、書き換えられた設定ファイル、破損したデータベース エントリなどです。

インシデントの原因となったものの背後にある原因は何だったのだろうか。そのインシデントに至った要因は何だったのだろうか。どうすれば設定ファイルを書き換えられたのだろうか。破損したデータベース エントリを引き起こす条件は何だろうか。専門家が尋ねるのは、このような質問です。そして、専門家は問題管理の中心です。

問題管理は、インシデントを特定して修正するだけでなく、インシデントの根本的な原因を特定して理解し、その根本原因を排除するための最善の方法を特定するプロセスです。さらに、サイロ化されたチームによって実施されて切り離されたプロセスが原因であれば、原因の特定は組織にとって価値がありません。そのため、IT、セキュリティ、ソフトウェア開発者など、複数のチーム全体で問題管理を一定に広く実践する必要があります。サービスが再稼働するとインシデントは終了する可能性がありますが、根本的な原因と原因につながる要因が解決されるまで問題は残ります。

問題管理とその他の重要な ITIL プロセスの関係

問題管理は、インシデント管理やその他の ITIL プラクティスと連携して、全体的な ITSM 戦略を形成します。

問題管理とインシデント管理の比較

ITIL は、問題を 1 つ以上のインシデントの原因、または潜在的な原因と定義しています。効果的なインシデント管理と効果的な問題管理の背景にある行動は、多くの場合、類似しており重複していますが、重要な違いがあります。たとえば、最近のデプロイをロール バックすると、サービスが再稼働してインシデントが終了することがありますが、根本的な問題は残ります。

当社はそのため、問題管理とインシデント管理のプラクティスの関連性がますます深くなっていると考えています。インシデント間の時間に、IT チームは改善とサービス品質の向上につながる問題の調査に集中できます。このようにして、問題管理が組織にとって非常に重要になります。

問題管理と変更管理

変更管理とは、サービスの中断やダウンタイムなしに変更を計画、追跡、リリースするプロセスです。

変更によって中断またはダウンタイムが発生した場合、その変更はインシデント管理および問題管理のプロセス中に分析されます。

問題管理とナレッジ マネジメント

ナレッジ マネジメントは、ソリューションと一般的な手順やインシデントの回避策のドキュメントのリポジトリを作成します。適切なナレッジ マネジメント プラクティスを併用することで、インシデントの解決を迅速化してインシデントを減らせます。

問題管理とサービス リクエスト管理

サービス リクエスト管理は、アプリケーション、ソフトウェアの拡張、情報へのアクセスなど、提供されるものについてのユーザーからの要求を処理する手法です。サービス リクエストとインシデントは、区別することが困難な場合があります。実際、2007 年に ITIL V3 がリリースされるまでは区別されず、「インシデント」のカテゴリにまとめられていました。ITIL では、インシデントを「IT サービスの予期しない中断または IT サービスの質の低下」と定義しています。そこでは、サービス リクエストは、「情報または助言の要求、パスワードのリセットの要求、新しいユーザー用のワークステーションのインストールの要求など、ユーザーからの正式な要求」と定義されています。

問題管理のメリットとは

正しく実行すると、問題管理はビジネスにとって多くのメリットをもたらします。

解決までの時間を短縮

現在のインシデントの背後にある問題を明らかにするチームは、将来的にインシデントにより上手く対応できるでしょう。問題分析に関するベスト プラクティスを体系化することで、チームは次回のサービス停止時に、より迅速に対応して対策を実行できるようになります。

コストのかかるインシデントを回避

インシデントを避けることで、時間、コスト、そして多くの苦痛を軽減できます。Gartner によると、多くの組織はダウンタイムのコストが 1 時間あたり 30 万ドルを超えると報告しています。一部の Web ベースのサービスでは、その数が大幅に多くなる可能性があります。

生産性の向上

インシデントへの頻繁な対応を取り止めて、新しい価値を顧客に提供できるチームにリソースと時間を返しましょう。

チームによる根本的な原因の特定と学習を実現

組織が効果的に問題管理を実践すると、チームは継続的に調査してインシデントから学び、有益な更新をリリースできます。残念なことに、多くの企業では、問題管理チームがサイロ化されています。このようなチームでは、日常の業務から大きく切り離されているので、最も差し迫った問題を解決できません。

継続的なサービス改善を促進

問題管理は、インシデントを防止して価値を提供します。たとえば、低レベルのパフォーマンスの原因となるインシデントを修正すると、有益なサービス品質の向上ももたらします。

顧客満足度を改善

問題管理の改善により、インシデントの数が減って顧客満足度も向上します。また同じインシデントが複数回起こっていることが分かると、顧客の苛立ちを抑えられなくなります。インシデントの再発を減らすことで、顧客の信頼が醸成されます。

問題管理プロセス

Atlassian では、問題管理プロセスとインシデント管理プロセスをより緊密に結びつけることを提唱しています。

問題管理が負荷の高いサイロ化された独立のプロセスである場合、企業は蓄積した問題に直面することになります。このようなバックログは、一部のチームでは問題の課題がたどり着く最終的な場所になっています。問題に対応して重要な調査を行えるチームに、問題の解決を任せるのが最適です。

つまり、問題管理プロセスに寄与する主なステップを理解することは良いことです。たとえば、次のようなものがあります。

  1. 問題の検出 - 問題を事前に検出して修正したり、将来のインシデントが発生する前に回避策を特定したりできます。
  2. 分類と優先順位付け - 既知の問題を追跡して評価し、チームがまとまりを保ち、最も関連性が高く重要な問題に取り組むようにします。
  3. 調査と診断 - 問題の根本的な原因を特定して、修正のための最良の行動を特定します。
  4. 既知のエラーに関する記録の作成 - ITIL では、既知のエラーとは「根本原因と回避策が文書化された問題」のことです。この情報を記録すると、問題がインシデントを引き起こした場合のダウンタイムが短くなります。これは通常、既知のエラー データベースと呼ばれるドキュメントに保存されます。
  5. 必要に応じた回避策の策定 - 回避策は、問題の影響を減らしてインシデントにならないようにするための、一時的な解決策です。理想的ではありませんが、問題を容易に特定して解消できない場合は、ビジネスへの影響を抑えて顧客が直接インシデントに直面する状況を回避できます。
  6. 問題の解決とクローズ - クローズされた問題とは、解消されて別のインシデントを引き起こすことがない問題です。

問題管理のベスト プラクティスとヒント

ここまでに説明したように、これまで見てきた最も効果的なインシデント管理チームは、問題管理とインシデント管理を組み合わせています。

問題管理を独立したプラクティスとして設定すると、問題管理チームがボトルネックになったり、コントロールできない外部ベンダーに起因する問題など、誤ったポイントに焦点を当てたりするという課題が発生します。根本原因は、インシデントが起こってからずっと後まで調査されないことがよくあります。

多くの場合チームはインシデント管理プラクティスと問題管理プラクティスを統合することで、メリットを得られます。これはインシデントを解決するために作業すると同時に、インシデントにつながった原因を把握できる予防的なアプローチです。たとえば、ソフトウェアでインシデントを解決するには、コードの問題 (原因) を特定して、さらにインシデントを回避するために代替コードを開発する必要があります (修正)。

問題とインシデントに同時に対応することで、チームが対応体制ではないときに、サービスとパフォーマンスの品質に最も影響を与えている問題を特定して、将来のインシデントを防げます。

問題管理のヒント

事後的な根本原因分析に頼るのを避ける

インシデントや問題が 1 つの根本原因から発生していることは稀です。最良のチームは、すべての潜在的な要因を総合的に考慮し、誰も責めることのない分析を実践します。

問題が共有されるオープンな環境作りを推進する

問題分析とインシデント分析は、チーム メンバーが罰や報復を恐れることなく、事実を共有することが推奨されているオープンな対話でなければなりません。

重要なサービスに集中する

組織に最大の価値を提供するサービスに影響する問題への対処を優先します。

質問する際に「5 つの Why」を使う

多くのチームが、トヨタ生産システムの考案者である大野耐一氏による「5 つの Why」という技法を駆使することで、成功を収めています。詳しくは、Atlassian Team Playbook をご覧ください

ナレッジを広める

オープンなチームは、同僚や隣接するチームの学びのためのナレッジと知見を共有します。

学習する組織になる

効果的な問題管理に終わりはありません。最もパフォーマンスの高い組織でさえ、インシデントが発生します。真の世界クラスのチームとは、プロセスを常に繰り返して改善し、同僚や顧客に対する問題の影響を軽減するチームです。

フォローアップを追跡する

フォローアップ行動を適切に把握するために、明確で標準化された方法を開発することが重要です。常に問題管理を実践する必要があるため、ITSM ソフトウェアを使用することが重要です。これによって、チームはタスクの優先順位を決めて進捗を追跡し、インシデントの課題と問題を関連付けられます。

概要

インシデントは、多くの場合、サービスの将来の信頼性に対する計画外の投資として説明されます。効果的な問題管理は、インシデントの原因を特定して排除しながら、重要なサービスを改善します。

Jira Service Management の問題管理に関する詳細をご確認ください。

次の記事
Template