8章サーバ監視
OSの標準的メトリクス
OSの標準的メトリクスへの依存を厳しく批判してきたが、全く役に立つ点がないというわけではない
診断やトラブルシューティングといった正しいコンテキストで使えば味方になる
これらのメトリクスのおすすめの使い方は、全システムで自動的に記録するようにしておきつつ、アラートは設定しないこと
監視項目と重要なメトリクス
- CPU
- 使用率
- メモリ
- 使用率と未使用率
- ネットワーク
- インターフェースに対するインとアウトのオクテット数・エラー数・ドロップ数
- ディスク
- iowait, await, IOPS
- ロードアベレージ
- CPUに処理してもらうのを待っているプロセスがいくつあるかの指標
- SSL証明証
- 有効期限
webサーバー…
webサーバに置いてパフォーマンスとトラフィックレベルを測るメトリクスは秒間リクエスト数
パフォーマンスにそこまで影響はないが全体の見通しの点で重要なのがHTTPステータスコード
データベース…
コネクション数(MySQLではスレッド)は全体のトラフィックレベルを見るのにちょうどいい
しかし、DBがどれぐらい忙しいかは、秒間クエリ数を見る必要がある
ロードバランサ…
フロントエンドとバックエンドの2つのメトリクスを取る
メッセージキュー… キューの長さと消費率
キャッシュ…
キャッシュから追い出されたアイテム数とヒット・ミス率
DNS…
自前で運用していなければ特に監視すべきものではない
自前で運用しているなら、ゾーン転送と秒間クエリ
DHCP…
DHCPプールが十分なリースの余裕を持っているか
スケジュールジョブ…
cronジョブなど