サーバまたは中間デバイスでパケット損失が発生することがあります。問題はハードウェアに関連している可能性があります。たとえば、デバイスが単にピーク時のトラフィック負荷を処理できない場合や、1 つ以上のネットワーク インターフェイスでケーブル障害が発生している場合があります。

また、問題はソフトウェアに関連している可能性もあります。たとえば、バグまたは設定ミスが原因で、ランダムな間隔で断続的にパケットが損失する場合があります。パケット損失がアプリケーションのパフォーマンスに影響する場合は、ネットワークの可視性を使用して、パケットがドロップされるノード、デバイス、および TCP 接続を特定できます。  

アプリケーションの症状

ある開発運用エンジニアが、ミッションクリティカルなアプリケーションのパフォーマンスのモニタリングを担当します。開発運用エンジニアは、アプリケーション ダッシュボードを開き、Order-Tier と、この階層への双方向のアプリケーションフローが赤色に突然変化していることに気付きます。開発運用エンジニアは調査することを決定します。

Application Flow Map

ネットワークの診断

  1. 開発運用エンジニアはネットワークダッシュボードに切り替え、Order-Tier と Payment-Tier、およびこれらの階層間のネットワークリンクで、PIE とネットワークエラーが急増していることに気付きます。 
    Network Dashboard 
  2. 開発運用エンジニアは、個々のトランザクションを分析することを決定します。開発運用エンジニアは [Transaction Snapshots] ページに移動し、非常に低速なトランザクションをダブルクリックします。トランザクションの概要から、遅延の 97% が Order-Tier と Payment-Tier の間のリンクで発生していることがわかります。開発運用エンジニアは、Order-Tier にドリルダウンし、[Network] タブに移動します。
     Drill down
  3. 開発運用エンジニアは、このトランザクションのダッシュボードを詳しく調べて、次のことにただちに気付きます。
    1. [Network Impact on Transactions] グラフ(左上)から、スナップショットの時間帯に PIE と Very Slow Calls が急増していることに気付きます。
      Network impact on transactions
    2. 開発運用エンジニアは、Errors と Very Slow Calls の相関関係に気付き、[Network Errors - Contributors] グラフを確認します。開発運用エンジニアは、これらのエラーがすべて Syn Blackholes であることにただちに気付きます。Order-Tier ノードは、Payment-tier ノードへの接続を確立しようとしていますが、中間の何かが接続をサイレントにドロップしています。これが発生した場合、パケットをドロップしているのは、通常はファイアウォールかまたはその他の中間デバイスです。要求側の階層は、接続の再確立を再試行します。これが原因で大幅な遅延が発生します。
       
      Network errors
    3. [Retransmissions Per Min] グラフにより、対象期間中の再送信がすべてデータの再送信であることがわかります。これは、アプリケーションノードではなく中間デバイスでドロップが発生していることを意味します。 
      Retransmissions per minute
        
  4. 開発運用エンジニアは、パケットドロップが発生している特定の TCP 接続を突き止めたいと考えます。開発運用エンジニアは、関連するネットワークエージェントで詳細診断モニターリングを有効にして、TCP 診断メトリックを収集します。開発運用エンジニアは、その後、ネットワークダッシュボードに移動し、Order-Tier と Payment-Tier の間のリンクをクリックします。これにより、PIE とエラーが増加しているすべての接続が表示されます。 

    Order-Tier, Payment Tier

開発運用エンジニアは、組織内のネットワーク管理チームに連絡し、「これらの接続で断続的に SYN blackholes と再送信が発生しています。調査して修正してください。」と伝えます。