異常検知サービスをインストールした後、異常検知を有効にする必要があります。異常検知を有効にすると、根本原因の自動分析も有効になります。

異常検知サービスのインストール

異常検知を使用するには、Kubernetes クラスタに異常検知サービスをインストールします

異常検知の有効化

異常検知サービス をインストールした後、アプリケーションごとに個別に異常検知を有効にする必要があります。 

  1. [Alert & Respond] の [Anomaly Detection] で、ドロップダウンから次のいずれかのアプリケーションを選択します。
    • アプリケーション
    • User Experience: Browser Apps
    • User Experience: Mobile Apps
  2. [Anomaly Detection] を [ON] に切り替えます。
    異常検知を有効にした後、異常検知と根本原因の自動分析が使用可能になるまでには、48 時間かかります。その間、アプリケーションの機械学習モデルがトレーニングされます。
  3. [Alert & Respond] > [Anomaly Detection] > [Model Training] を選択して、ビジネストランザクション、ベースページ、およびネットワークリクエストのトレーニングステータスを表示します(該当する場合)。

この表で、トレーニングステータスについて説明します

ステータス意味
トレーニング中そのビジネストランザクション、ベースページ、ネットワークリクエストでモデルトレーニングが進行中です
準備モデルトレーニングが完了し、ビジネストランザクション、ベースページ、ネットワークリクエストは正常です。
警告モデルトレーニングは完了していますが、ビジネストランザクション、ベースページ、ネットワークリクエストで、トレーニング期間中に 1 つ以上の警告レベルの異常が発生しています。
クリティカル(Critical)モデルトレーニングは完了していますが、ビジネストランザクション、ベースページ、ネットワークリクエストで、トレーニング期間中に 1 つ以上のクリティカルレベルの異常が発生しています。
使用不可モデルトレーニングが完了していないため、ビジネストランザクション、ベースページ、ネットワークリクエストで異常検知が表示されません。

モデルトレーニングは、異常検知が有効である限り継続されます。たとえば、ビジネストランザクションへのトラフィックがその日のトレーニングの妨げになるのに十分な時間中断された場合、異常検知は過去 7 日間のモデルを使用して機能し続けます。 

サンプルサイズが非常に小さく、結果として得られるモデルが信頼できないため、1 分あたりのコール数(CPM)が非常に低いビジネストランザクション向けにトレーニングされた機械学習モデルはありません。

異常のモニタリング

ビジネストランザクション、ベースページ、およびネットワークリクエストの異常を表示およびモニターできます。

ビジネストランザクションに関連する異常を表示するには、次の手順を実行します。

  1. [Applications] > [Business Transactions] から、目的のビジネストランザクションを選択します。
  2. [Health] 列の [Warning] または [Critical] アイコンをクリックします。
    Business Transactions Health
    そのビジネストランザクションの正常性ルール違反と異常のリストが表示されます。
     Health Rule Violations and Anomalies 
  3. 異常のリストは複数の方法で表示できます。異常のモニタリングには、Splunk AppDynamics の操作方法が反映されます。次のいずれかのオプションを選択し、根本原因の自動分析の結果が含まれる詳細表示を開きます。
    • ツールチームのためにツールをセットアップして検証する場合は、
      [Alert & Respond] > [Anomaly Detection] > [Anomalies] で異常の詳細を表示します。
      Tools Anomalies
    • アプリケーション運用チームのためにアプリケーションをモニターする場合は、次の手順を実行します。
      • [Applications] > [Events] フィルタで、異常が含まれるように [Event Types] をフィルタリングします。
        Application Anomalies
      • [Applications] > [Troubleshoot] > [Violations & Anomalies] で、異常が含まれるように [Event Types] をフィルタリングします。
        Event Type Anomalies

正常性ルールによってトリガーされるようポリシーを構成する方法と同じように、異常によってトリガーされるようポリシーを構成できます。

ブラウザアプリケーションに関連する異常を表示するには、次の手順を実行します。

  1. メインメニューから、[User Experience] > [Browser Apps] の順にクリックします。
  2. 目的のブラウザアプリケーションを選択し、[Details] をクリックします。
  3. 手順
    1. [Violation & Anomalies] をクリックして、選択したブラウザアプリケーションに関連付けられているすべての異常を表示します。
    2. [Events] をクリックして、すべての異常イベントを表示します。

モバイルアプリケーションに関連する異常を表示するには、次の手順を実行します。

  1. メインメニューから、[User Experience] > [Mobile Apps] の順にクリックします。
  2. 目的のモバイルアプリケーションを選択し、[Details] をクリックします。
  3. 手順
    1. [Health Rule Violations] をクリックして、選択したブラウザアプリケーションに関連付けられているすべての異常を表示します。
    2. [Events] をクリックして、すべての異常イベントを表示します。

異常検知の構成

デフォルトでは、異常検知により、アプリケーション内のすべてのビジネストランザクション、ベースページ、ネットワークリクエストで検知された異常についてアラートが発生します。ただし、異常検知を構成することで、異常を明らかにする対象を、指定した組み合わせのビジネストランザクション、ベースページ、ネットワークリクエスト、シビラティ(重大度)レベル、および検知感度にすることができます。この構成は、確認するアラートをより少なくし、より絞り込みたい場合に行います。

  1. [Configure Anomaly Detection] をクリックして構成ダイアログを開きます。
    Configure Anomaly Detection
  2. ドロップダウンから目的のアプリケーションを選択します。
    • アプリケーション
    • User Experience: Browser Apps
    • User Experience: Mobile Apps

  3. 異常検知を行う対象を、次の中から 1 つ選択します。
    • ビジネストランザクションの場合
      • アプリケーション内のすべてのビジネストランザクション(これがデフォルトで選択されています)
      • 特定のティア内のビジネストランザクション
      • これらの指定されたビジネストランザクション
      • 次の条件に一致するビジネストランザクション
        • 次で始まる
        • 次で終わる
        • 記載内容
        • 次と等しい(Equals)
        • 正規表現と一致
        • リストにある
        • 空ではない

          また、NOT 演算子を選択して条件を反転することもできます。

    • ベースページの場合
      • アプリケーション内のすべてのベースページ
      • これらの指定されたベースページ
      • 次の条件に一致するベースページ:
        • 次で始まる(Starts With)
        • 終わり(Ends With)
        • 次を含む(Contains)
        • 次と等しい(Equals)
        • 正規表現と一致
        • リストにある
        • 空ではない(Is not empty)

          また、NOT 演算子を選択して条件を反転することもできます。

    • ネットワークリクエストの場合
      • アプリケーションでのすべてのネットワークリクエスト
      • これらの指定されたネットワークリクエスト
      • これらの指定されたモバイルアプリケーションのネットワークリクエスト
      • 次の条件に一致するネットワークリクエスト:
        • 次で始まる(Starts With)
        • 終わり(Ends With)
        • 次を含む(Contains)
        • 次と等しい(Equals)
        • 正規表現と一致
        • リストにある
        • 空ではない(Is not empty)

          また、NOT 演算子を選択して条件を反転することもできます。

           

  4. 次のシビラティ(重大度)レベルのいずれかを選択します。
    • すべてのシビラティ(重大度)警告クリティカルの両方を含む)
    • クリティカル
    • 警告

  5. [Detection Sensitivity] で、次のいずれかのレベルを選択します。

    機密レベル説明
    Highビジネスに不可欠なサービスにこのレベルを使用して、環境内で問題が確実に検知されるようにします。より多くのアラートをトリガーしますが、統計の信頼性は低くなります。
    このレベルは、ビジネスにとって重要だがクリティカルではないサービスに使用します。デフォルトでは、この感度レベルが選択されています。
    ビジネスへの影響が少なく、アラートが多すぎるのを避けるために、このレベルを使用します。
  6. 非実稼働環境で異常検知をテストする場合は、[Yes, turn on test mode] を選択します。

    テストモードでは、非実稼働環境での異常検知機能を評価できます。このモードでは、メトリックデータの収集が少ない場合でも、異常検知によってパフォーマンスの問題が正確に検知されます。開発環境またはステージング環境でテストモードを使用できます。

  7. [Save] をクリックして設定を完了します。