異常検知のインストールおよび設定

異常検知サービスをインストールした後、異常検知を有効にする必要があります。異常検知を有効にすると、根本原因の自動分析も有効になります。

異常検知サービスのインストール

異常検知を使用するには、Kubernetes クラスタに異常検知サービスをインストールします。

異常検知の有効化

異常検知サービスをインストールした後、アプリケーションごとに個別に異常検知を有効にする必要があります。

[Alert & Respond] の [Anomaly Detection] で、ドロップダウンから次のいずれかのアプリケーションを選択します。
- アプリケーション
- User Experience: Browser Apps
- User Experience: Mobile Apps
[Anomaly Detection] を [ON] に切り替えます。
異常検知を有効にした後、異常検知と根本原因の自動分析が使用可能になるまでには、48 時間かかります。その間、アプリケーションの機械学習モデルがトレーニングされます。
[Alert & Respond] > [Anomaly Detection] > [Model Training] を選択して、ビジネストランザクション、ベースページ、およびネットワークリクエストのトレーニングステータスを表示します（該当する場合）。

この表で、トレーニングステータスについて説明します。

ステータス	意味
トレーニング中	そのビジネストランザクション、ベースページ、ネットワークリクエストでモデルトレーニングが進行中です。
準備	モデルトレーニングが完了し、ビジネストランザクション、ベースページ、ネットワークリクエストは正常です。
警告	モデルトレーニングは完了していますが、ビジネストランザクション、ベースページ、ネットワークリクエストで、トレーニング期間中に 1 つ以上の警告レベルの異常が発生しています。
クリティカル（Critical）	モデルトレーニングは完了していますが、ビジネストランザクション、ベースページ、ネットワークリクエストで、トレーニング期間中に 1 つ以上のクリティカルレベルの異常が発生しています。
使用不可	モデルトレーニングが完了していないため、ビジネストランザクション、ベースページ、ネットワークリクエストで異常検知が表示されません。

モデルトレーニングは、異常検知が有効である限り継続されます。たとえば、ビジネストランザクションへのトラフィックがその日のトレーニングの妨げになるのに十分な時間中断された場合、異常検知は過去 7 日間のモデルを使用して機能し続けます。

サンプルサイズが非常に小さく、結果として得られるモデルが信頼できないため、1 分あたりのコール数（CPM）が非常に低いビジネストランザクション向けにトレーニングされた機械学習モデルはありません。

異常のモニタリング

ビジネストランザクション、ベースページ、およびネットワークリクエストの異常を表示およびモニターできます。

ビジネストランザクションに関連する異常を表示するには、次の手順を実行します。

[Applications] > [Business Transactions] から、目的のビジネストランザクションを選択します。
[Health] 列の [Warning] または [Critical] アイコンをクリックします。

そのビジネストランザクションの正常性ルール違反と異常のリストが表示されます。
異常のリストは複数の方法で表示できます。異常のモニタリングには、Splunk AppDynamics の操作方法が反映されます。次のいずれかのオプションを選択し、根本原因の自動分析の結果が含まれる詳細表示を開きます。
- ツールチームのためにツールをセットアップして検証する場合は、
  [Alert & Respond] > [Anomaly Detection] > [Anomalies] で異常の詳細を表示します。
- アプリケーション運用チームのためにアプリケーションをモニターする場合は、次の手順を実行します。
  - [Applications] > [Events] フィルタで、異常が含まれるように [Event Types] をフィルタリングします。

- - [Applications] > [Troubleshoot] > [Violations & Anomalies] で、異常が含まれるように [Event Types] をフィルタリングします。

正常性ルールによってトリガーされるようポリシーを構成する方法と同じように、異常によってトリガーされるようポリシーを構成できます。

ブラウザアプリケーションに関連する異常を表示するには、次の手順を実行します。

メインメニューから、[User Experience] > [Browser Apps] の順にクリックします。
目的のブラウザアプリケーションを選択し、[Details] をクリックします。
手順
1. [Violation & Anomalies] をクリックして、選択したブラウザアプリケーションに関連付けられているすべての異常を表示します。
2. [Events] をクリックして、すべての異常イベントを表示します。

モバイルアプリケーションに関連する異常を表示するには、次の手順を実行します。

メインメニューから、[User Experience] > [Mobile Apps] の順にクリックします。
目的のモバイルアプリケーションを選択し、[Details] をクリックします。
手順
1. [Health Rule Violations] をクリックして、選択したブラウザアプリケーションに関連付けられているすべての異常を表示します。
2. [Events] をクリックして、すべての異常イベントを表示します。

異常検知の構成

デフォルトでは、異常検知により、アプリケーション内のすべてのビジネストランザクション、ベースページ、ネットワークリクエストで検知された異常についてアラートが発生します。ただし、異常検知を構成することで、異常を明らかにする対象を、指定した組み合わせのビジネストランザクション、ベースページ、ネットワークリクエスト、シビラティ（重大度）レベル、および検知感度にすることができます。この構成は、確認するアラートをより少なくし、より絞り込みたい場合に行います。

[Configure Anomaly Detection] をクリックして構成ダイアログを開きます。
ドロップダウンから目的のアプリケーションを選択します。
- アプリケーション
- User Experience: Browser Apps
- User Experience: Mobile Apps
異常検知を行う対象を、次の中から 1 つ選択します。
- ビジネストランザクションの場合：
  - アプリケーション内のすべてのビジネストランザクション（これがデフォルトで選択されています）
  - 特定のティア内のビジネストランザクション
  - これらの指定されたビジネストランザクション
  - 次の条件に一致するビジネストランザクション：
    - 次で始まる
    - 次で終わる
    - 記載内容
    - 次と等しい(Equals)
    - 正規表現と一致
    - リストにある
    - 空ではない
      
      また、NOT 演算子を選択して条件を反転することもできます。
- ベースページの場合：
  - アプリケーション内のすべてのベースページ
  - これらの指定されたベースページ
  - 次の条件に一致するベースページ：
    - 次で始まる(Starts With)
    - 終わり(Ends With)
    - 次を含む(Contains)
    - 次と等しい(Equals)
    - 正規表現と一致
    - リストにある
    - 空ではない（Is not empty）
      
      また、NOT 演算子を選択して条件を反転することもできます。
- ネットワークリクエストの場合：
  - アプリケーションでのすべてのネットワークリクエスト
  - これらの指定されたネットワークリクエスト
  - これらの指定されたモバイルアプリケーションのネットワークリクエスト
  - 次の条件に一致するネットワークリクエスト：
    - 次で始まる(Starts With)
    - 終わり(Ends With)
    - 次を含む(Contains)
    - 次と等しい(Equals)
    - 正規表現と一致
    - リストにある
    - 空ではない（Is not empty）
      
      また、NOT 演算子を選択して条件を反転することもできます。
次のシビラティ（重大度）レベルのいずれかを選択します。
- すべてのシビラティ（重大度）（警告とクリティカルの両方を含む）
- クリティカル
- 警告

[Detection Sensitivity] で、次のいずれかのレベルを選択します。

機密レベル	説明
High	ビジネスに不可欠なサービスにこのレベルを使用して、環境内で問題が確実に検知されるようにします。より多くのアラートをトリガーしますが、統計の信頼性は低くなります。
中	このレベルは、ビジネスにとって重要だがクリティカルではないサービスに使用します。デフォルトでは、この感度レベルが選択されています。
低	ビジネスへの影響が少なく、アラートが多すぎるのを避けるために、このレベルを使用します。

非実稼働環境で異常検知をテストする場合は、[Yes, turn on test mode] を選択します。

テストモードでは、非実稼働環境での異常検知機能を評価できます。このモードでは、メトリックデータの収集が少ない場合でも、異常検知によってパフォーマンスの問題が正確に検知されます。開発環境またはステージング環境でテストモードを使用できます。
[Save] をクリックして設定を完了します。