Download PDF
Download page クラスタの正常性のモニターリング.
クラスタの正常性のモニターリング
クラスタダッシュボードでは、クラスタの正常性を可視化して、パフォーマンスへの影響を迅速に判断できます。各ダッシュボードインジケータは、クラスタパフォーマンスのさまざまな側面を提供します。
特記事項
クラスタ インベントリ ダッシュボードにマスターノードが 0(ゼロ)と表示される場合がありますが、これは想定内の動作です。オンプレミスのクラスタとは異なり、クラウドプロバイダーは Kubernetes プロジェクトとは別のペースで開発およびリリースし、個別に進化します。このマスターノード、または Amazon EKS、AKS、およびその他のクラウドベース環境またはクラスタ内のマスターノードの数によって、クラスタのマスターノードが非表示になります。報告されたクラスタの結果は、
kubectl get nodes
コマンドで生成された結果に似ています。報告された結果を確認するには、kubectl get nodes
コマンドを入力して、ノード情報、およびマスターノードがゼロと表示されているかどうかを確認します。- クラスタレベルのリソース使用率メトリックは、各ポッドによって消費されるリソースの合計です。クラスタエージェントでは個々のポッドの合計を報告するため、これらのメトリック値が数十万に達することがあります。
- ポッド使用率メトリックは、ポッド内で実行されている各コンテナの合計です。
- ポッドの数とポッドの状態(実行中、保留中、削除済み、および失敗したポッド)のメトリックには、指定した期間における平均履歴値ではなく、リアルタイムの値が表示されます。「今」実行中のすべてのポッドが報告されます。
クラスタダッシュボード
コントローラからクラスタにアクセスするには、次の手順を実行します。
- [Servers > Clusters > Cluster Name] を選択します。
- クラスタエージェントを選択し、ダブルクリックします。クラスタインターフェイスには、[Dashboard]、[Pods]、[Inventory]、および [Events] タブが表示されます。
[ダッシュボード(Dashboard)] タブ
- Errors card:
各クラスタでモニタ対象となる名前空間の円グラフが表示されます。
- Errors:個々のポッドの [Errors](エラーイベント数)、[Evictions](削除されたポッド数)、および [Threats](削除脅威数)の数
- Pods by phase:さまざまな状態([Failed]、[Pending]、[Running]、[Succeeded]、[Unknown])にあるポッドの数
- Activity over period:[Running] のポッドの数、および所定の期間の [Pending] の状態を示す時系列グラフ
- Cluster Capacity:
スコアバーには [CPU]、[Memory]、および [Pods] が表示されます。緑色の線は容量の使用量を示します。ダッシュボードには、このクラスタのリソース容量を計画するために使用できるクラスタの [CPU]、[Memory]、[Pod] の容量の使用率が表示されます。
- Issues card:
表示:
- Pod issues:クラスタエージェントがポッドの再起動とエラーを監視する場合
- Image issues:イメージの取得とエラー
- Storage:エラーやクォータ違反などのストレージ容量に関する問題
- Utilization card:
表示:
- CPU:要求、制限、および使用済み
- Memory:要求、制限、および使用済み
- PVCs:要求と容量
- Quotas card:
それぞれのクォータに関連するリソースの使用率(%)を表示します。エージェントは、次のリソースを追跡します。
- 使用済みの CPU 制限クォータの割合
- 使用済みのクォータのメモリ制限
- 使用済みの PVC クォータの割合
- 使用済みの CPU 要求クォータの割合
- 使用済みのメモリ要求クォータの割合
- 使用済みのストレージクォータの割合
数字はクラスタ全体で累積されます。これらのインジケータを使用して、課されたクォータに基づいて特定のリソースの可用性を追跡し、クラスタ容量の計画で使用します。
[Pods] タブ
[Pods] タブで、さまざまな状態のポッドを表示してステータスの概要を共有します。この例では、Amazon EKS で実行されているポッドを示しています。すべてのポッドは、登録済みの [Namespace] および [Pod Name] に基づいて表示されます。
終端されたポッドも AppDynamics コントローラから消去されるまで [Pods] リストに引き続き表示されますが、メトリックは更新されません。消去処理は定期的に自動実行されます。「クラスタエージェントのコントローラ設定」を参照してください。
上部カードには、モニター対象のポッドの概要と各クラスタでのポッドのステータスが表示されます。
- Total Pods:モニター対象のクラスタ内にあるポッドの合計数
- Running:実行状態のポッドの数と割合
- Pending:保留状態のポッドの数と割合。通常、保留中のステータスは問題を示します。Kubernetes のマニュアルを参照してください
- Evicted:消去されたポッドの数と割合
- Failed:障害が発生したポッドの数と割合
[Namespace] または [Pod Name] に基づいて検索できます。
ポッドタグとラベルに基づいて、さらにフィルタ処理できます。
任意のポッドをダブルクリックして、[Pod Details] パネルを表示します。[Pod Details] パネルから、そのポッド、ポッドイベント、およびポッドのラベルおよびタグで実行されているコンテナを確認できます。
クラスタエージェントは、ポッドを自動的に検出します。
- ステータス
- 名前空間
- ポッド名
- コンテナ ID
- ホストまたはサーバ
- CPU %(ポッド内で実行中のコンテナの合計)
- メモリ MB(ポッド内で実行中のコンテナの合計)
- 再始動
ポッドは、次の理由で削除されます。
- 名前空間がモニターされていない場合
- ポッドがクラスタから削除された場合(失敗したポッドを除く)
- ポッド数がポッド制限を超えた場合
- ポッドがブロックリストに登録されている場合
[Pod Details] パネル
[Pod Details] パネルには次のように表示されます。
- Namespace:ポッドが実行されている名前空間
- Hostname:名前空間またはポッド名
- Pod Events:
kubectl
describe pods
コマンドから生成された最新のイベントのリスト - Container(数):このポッドのコンテナ ID によって表示される実行中コンテナのリスト。各コンテナをクリックすると、個々のコンテナメトリックが表示されます。
- Tags:このポッドに指定される Kubernetes ラベル
[Container ID] をクリックすると、展開され、2 つのコンテナメトリック(CPU およびメモリの使用率)が表示されます。
[インベントリ(Inventory)] タブ
[Inventory] タブには、クラスタの高レベルのスナップショットまたはインベントリビューが表示されます。このタブにはクラスタの内容が表示されます。これにより、クラスタ内で実行されているアプリケーションのトラブルシューティングを行うことができます。
クラスタカードが次のように表示されます。
- Cluster Name:クラスタの名前
- Kubernetes Version: クラスタで実行されている Kubernetes のバージョン
- Cluster ID: クラスタエージェントの ID
- Pods:モニター対象ポッドの数
- Namespaces:モニター対象名前空間の数
- Masters:マスターノードの数
- Workers:ワーカーノードの数
- Disk Pressure: クラスタ内のディスク負荷傾向のスニペット
- Memory Pressure: クラスタ内のメモリ負荷傾向のスニペット
ポッドカードが次のように表示されます。
- Pods by Phases:ポッドが実行中、消去中、保留中、または失敗したかどうかを示します。この数は、[Pod] タブで「実行中」状態のポッドと同じ数になります。
- Privileged Pods:ポッドがルートとして動作します。
- No Limits:開始するポッドに制限を指定できます。制限なしメトリックは、制限が定義されていないポッドの数を示します。
- No Readiness Probe:準備状況をモニタするプローブを Kubernetes に設定した場合、値がここに表示されます。
- No Liveness Probe:稼働状況をモニタするプローブを Kubernetes に設定した場合、値がここに表示されます。
- Missing Dependencies - Config Maps & Secrets:ポッドが [Config Maps & Secrets] に依存している場合、それらの依存関係は失われています。
- Missing Dependencies - Services:ポッドがいずれかのサービスに依存している場合、それらの依存関係は失われています。
- Scaledowns:展開および ReplicaSets のスケールダウンの数。
- Pod Kills:キルされたポッドの数。
Namespaces:検索バーから検索できる名前空間のリスト。
オブジェクトカードには次が表示されます。
- Jobs: モニター対象となっている名前空間の合計ジョブ数、および失敗したジョブ数、アクティブなジョブ数、成功したジョブ数
- Deployments:モニター対象となっている名前空間の展開数、および使用可能/使用不可の合計レプリカ数
- ReplicaSets:モニター対象となっている名前空間の ReplicaSets 数、および使用可能/使用不可の合計レプリカ数
- DaemonSets:モニター対象となっている名前空間の DaemonSets 数、および使用可能/使用不可/実行されなかった合計ポッド数
- StatefulSets:モニター対象となっている名前空間の StatefulSets 数、および準備完了/未準備の合計レプリカ数
サービスカードには、クラスタ全体の正常性が表示されます。
- Services: モニター対象となっているサービスの合計数
- Endpoints: モニター対象となっているエンドポイントの合計数
- Readiness:準備完了の IP アドレスがないエンドポイントの数
- Orphans:IP アドレスがない孤立状態のエンドポイントの数
イベント タブ
[Events] タブには、選択したクラスタに固有のクラスタイベントが表示されます。フィルタを使用して、特定のイベントを表示できます。