ネットワークの可視性エージェントは、ネットワークエージェントによって観測された TCP フローに基づいて、広範な一連のメトリックを計算できます。KPI、PIE、およびトラブルシューティングのメトリックに加えて、メトリックブラウザで対象のネットワーク要素(階層、ノード、リンク、および接続)の詳細なメトリックを表示できます。時間ベースのチャートを使用して、次のような動作の特性を検出して分析できます。

  • TCP フローのセットアップ/切断の時間とエラー
  • スループット、セットアップ時間、ライフタイム、およびラウンドトリップ時間による要素の TCP フローの分布
  • TCP リセットによって終了したフロー
  • TCP 設定オプション(選択的確認応答、タイムスタンプ)に基づくフローの分布
  • これらのメトリックについて、メトリックブラウザでは接続フローという用語が置き換え可能として使用されます。「フロー、リンク、および接続」を参照してください。
  • ネットワークエージェントは、デフォルトでは個々の接続のメトリックを収集しません。推奨されるワークフローは、関連するノードまたは接続でパフォーマンスの問題を診断する必要がある場合にのみ、TCP フローのメトリックの収集を有効にすることです。「動的モニタリングモードとネットワークの可視性」を参照してください。

TCP フローのメトリックの表示

詳細なネットワークメトリックを表示するには、メトリックブラウザを開き、[Application Infrastructure Performance] に移動します。メトリックブラウザには、次の集約に対して接続/フローのメトリックが表示されます(赤色で強調表示)。

  • Application Infrastructure Performance >
    • Advanced Network >
      • Flows >
        • All Connections/Flows for Application
    • tier-name
      • Advanced Network >
        • Flows >
          • Call from <tier> to <service>
            • Call from <node> to <node-or-service>
              • Individual Connection/Flow (<node> to <service>)
            • All Connections/Flows for Network Link (<tier> to <service>)
          • All Connections/Flows for tier

TCP フローのメトリックの説明

メトリック名
説明と注意事項
デフォルトのモニタリングモード

# Client Limited

クライアントノードが送信した TCP ウィンドウの更新の数。これは、クライアントノードが、アプリケーションが処理できるレートよりも速いレートでデータを受信していることを示します

KPI

# Client Zero Window

クライアントの TCP バッファがいっぱいになると、クライアントは TCP 受信ウィンドウサイズとしてゼロを送信し、それ以上データを受信できないことを示します。その後、クライアントがそのバッファ内のデータを処理できるようになるまでデータ転送は停止します。

クライアントの TCP ゼロウィンドウメッセージの発生率が高い場合、次のいずれかに問題があります。

  • ノードの TCP 設定、または
  • そのフローを使用するクライアント側のアプリケーション
KPI

# Connection Errors

Syn Resets + Syn Blackholes + TCP Resets - Established の合計

KPI

# Connection Requests

選択した時間枠の間に送信された接続要求(成功および失敗)の合計数KPI

# Current Established Connections

確立された(セットアップされた)フロー/接続の数KPI

# Data Retransmits

すべての TCP 接続で再送信された TCP データパケットの数KPI

# Delayed Acks (Data Piggy Back)

ACK(確認応答)を別のメッセージに「ピギーバック」することによって、受信ノードが ACK を送信した平均回数Advanced

# Delayed Acks (Timeouts)

遅延 ACK(確認応答)タイマーが期限切れになったために、受信ノードが ACK を送信した平均回数

これは、遅延 ACK アルゴリズムの「最悪の場合」の遅延であり、送信側ノードと受信側ノードで、それぞれ Nagle アルゴリズムと遅延 ACK が有効になっている場合に最もよく発生します。遅延 ACK のレートが高くなると、接続の平均遅延に非常に大きな影響が及ぶ可能性があります。

Advanced

# Errors

接続のセットアップのエラー(SYN エラー)または接続の切断のエラー(FIN エラー)を示す送信された TCP メッセージの数KPI

# Fin Errors

接続の切断中に生成されたエラーの数(TCP FIN エラー)。FIN 待機状態の接続の数が多いと、新しい接続の作成が遅延する可能性があります。

KPI

# Flows (<1KB)

# Flows (1k - 10k)

# Flows (10k - 100k)

# Flows (100k-1MB)

# Flows (1MB - 10MB)

# Flows (>10MB)

これらのメトリックを使用して、スループット別にフローの分布を分析します

Advanced

# Flows - Handshake (1SD)

# Flows - Handshake (2SD)

# Flows - Handshake (3SD)

接続セットアップ時間がその接続グループの平均よりも 1、2、または 3 標準偏差だけ高いまたは低い TCP フローの数

理想的な条件下では、すべてのフローが平均の 1SD 以内になります

Advanced

# Flows - Lifetime (1SD)

# Flows - Lifetime (2SD)

# Flows - Lifetime (3SD)

有効期間が平均よりも 1、2、または 3 標準偏差だけ高い、または低い TCP フローの数。

理想的な条件下では、すべてのフローが平均の 1SD 以内になります。2SD または 3SD のフローは、ネットワークパスに従った一貫性のないフロー処理を示します。これらの一貫性のなさは、ネットワークサービスが使用可能な帯域幅を意図的に減らしている場合(帯域幅のスロットリング)、または一部のタイプのトラフィックを他のタイプのトラフィックよりも優先している場合(トラフィックシェービング)に発生します。

短時間の接続は、断続的に発生している場合でも、調査の必要がある問題を示している可能性があります。短時間の接続が多く生成されるほど、それらの接続のセットアップと切断に費やされるリソースが多くなります。

Advanced

# Flows - RTT (1SD)

# Flows - RTT (2SD)

# Flows - RTT (3SD)

ラウンドトリップ時間が、親グループ内のすべてのフローの平均よりも 1、2、または 3 標準偏差だけ高いフローの数。理想的な条件下では、すべてのフローが平均の 1SD 以内になります。

RTT が高い接続は、断続的に発生している場合でも、調査の必要がある問題を示している可能性があります。e-コマース Web アプリケーションの平均応答時間が 2 秒(許容範囲内)であるにもかかわらず、トランザクションの 5% が 20 秒以上(許容範囲外)である場合、非常に多くの顧客が不満を感じ、収益が失われる可能性があります。

Advanced

# Flows - TCP Data Rxmt

パケットが再送信されたフローの数。再送信は、パケットの損失を示します。Advanced

# Flows - TCP Resets

TCP リセットによって終了したフローの平均数

KPI

# Flows - w/o TCP SACK

TCP 選択的確認応答(SACK)オプションが無効になっているフローの数。SACK が有効になっている場合、受信側は、セグメントが失われた場合に複数のデータパケットの受信に対して確認応答するために SACK パケットを送信できます。これにより、再送信の回数を削減され、ネットワークのパフォーマンスが向上します。SACK が無効になっている場合、受信側は、ピアがパケットを受信した場合でも、セグメントが最後に失われた後にすべてのパケットを再送信する必要があります。

Advanced

# Flows - w/o TCP Timestamp

TCP タイムスタンプオプションが無効になっているフローの数。このオプションは、より正確なラウンドトリップ時間を計算するために使用します。Advanced

# IP Fragment Count

この TCP 接続グループの IP フラグメント属性の合計数。高いレベルのフラグメンテーションは、ネットワークの問題を示していて、アプリケーションのパフォーマンスに深刻な影響を与える可能性があります。KPI

# Loss Pkts

失われた(送信されたが受信されなかった)パケットの合計数Advanced

# Nagle Delays

送信側ノードが、前に送信したデータの確認応答(ACK)を待機する必要があったために、メッセージ送信イベントが遅延した回数。これは、送信側ノードと受信側ノードで、それぞれ Nagle アルゴリズムと遅延 ACK が有効になっている場合に最もよく発生します。

Advanced

# PIE Events

パフォーマンスに影響する要素(PIE)は、実際のボトルネックまたは潜在的なボトルネックの場所を特定するために使用します。

  • [Client Limited]cli_limitedイベントおよび [Client Zero Window]cli_zeroイベントは、クライアントノードの潜在的な問題を示します
  • RTO は、2 つのノード間のネットワークパスでの潜在的な問題を示します
  • [Server Limited]srv_limitedイベントおよび [Server Zero Window]srv_zeroイベントは、サーバノードの潜在的な問題を示します
KPI
# RetransmissionTimeouts

再送信タイムアウト(RTO)は、ネットワークパケット損失を示しています。これにより、TCP 再送信タイマー(データの確認応答を確認するためのタイマー)の期限が切れたときにデータが再送信されます

  • このタイマーは、デフォルトでは 200 ミリ秒 ~ 3 秒です(オペレーティングシステムとそのバージョンごとに異なります)
  • これにより、失われたデータを再送信するのにかなりの時間が無駄になるため、パフォーマンスが大幅に低下します
  • TCP は、パフォーマンスにさらに影響を与える「スロースタート」フェーズにフォールバックします
KPI

# SACK Retransmits

パケットの未受信を示す SACK メッセージが原因で再送信されたパケットの平均数KPI

# Server Limited

サーバノードが送信した TCP ウィンドウの更新の数。これは、サーバノードが、アプリケーションが処理できるレートよりも速いレートでデータを受信していることを示します

KPI

# Server Zero Window

サーバの TCP バッファがいっぱいになると、サーバは TCP 受信ウィンドウサイズとしてゼロを送信し、それ以上データを受信できないことを示します。その後、サーバがそのバッファ内のデータを処理できるようになるまでデータ転送は停止します。

サーバの TCP ゼロウィンドウメッセージの発生率が高い場合、次のいずれかに問題があります。

  • ノードの TCP 設定、または
  • そのフローを使用するクライアント側のアプリケーション
KPI

# Syn Blackholes

応答がなかったために失敗となった接続試行の回数。Syn blackholes は、アプリケーションのパフォーマンスに深刻な影響を与える可能性があります。

KPI

# Syn Resets

他のホストによって明示的に拒否された接続試行の数。Syn resets は、アプリケーションのパフォーマンスに深刻な影響を与える可能性があります。

KPI

# TCP Resets - Established

確立された TCP フローがリセットされた平均回数

KPI

# TCP Resets - Fin

TCP フローが終了のプロセス中にリセットされた平均回数KPI

# TTL Changes (1 - 2 hops)

# TTL Changes (3 - 4 hops)

# TTL Changes (>=5 hops)

この接続で発生したルーティングホップの変更の数。ルーティングホップが頻繁に変更される場合、ネットワークのルーティングの問題を示していて、アプリケーションのパフォーマンスに深刻な影響を与える可能性があります。

理想的な条件下では、ホップ数は一貫します。


Advanced

Avg # TTL Hops

この接続で発生したルーティングホップの変更の平均数詳細設定

Delayed Acks Lag (usec)

接続の全体的な遅延に対して遅延 ACK が追加する遅延の平均量Advanced

Initial RTT (usec)

最初の 2 つの SYN パケットのラウンドトリップ時間(エージェントがクライアントとサーバのどちらで実行されているかに応じて、SYN と SYN-ACK の間、または SYN-ACK と ACK の間のラウンドトリップ時間)

KPI

Latency - RTT (usec)

すべてのパケットの平均ラウンドトリップ遅延(パケット伝送から確認応答まで)

KPI

Lifetime (usec)

接続グループ内の TCP セッションの平均ライフタイム(初期セットアップから最終切断まで)KPI

Loss (per mille)

送信された 1000 パケットのうち失われたパケットの数。「Per mille(1000 分の 1)」は、1 つ桁が追加され精度が向上したパーセンテージです。KPI

Nagle Delays Lag (usec)

接続の全体的な遅延に対して Nagle 遅延が追加する遅延の平均量Advanced

Pkts per Sec

送受信されたパケットの平均レートKPI

Rx Pkts per Sec

受信パケットの平均レートAdvanced

Rx Throughput (BPS)

受信されたバイトの平均レートAdvanced

TCP Handshake (usec)

親グループのすべてのフローに対する、最初の 3 ウェイ接続セットアップのラウンドトリップ時間。

  1. SYN(クライアント --> サーバ)
  2. SYN-ACK(クライアント <-- サーバ)
  3. ACK(クライアント --> サーバ)
KPI

Throughput (BPS)

すべての TCP セッションの対象アプリケーションのスループット(1 秒あたりのバイト数)KPI

Tx Pkts per Sec

送信されたパケットのレート Advanced

Tx Throughput (BPS)

受信されたトラフィックのレート詳細設定