8章サーバ監視

OSの標準的メトリクス

OSの標準的メトリクスへの依存を厳しく批判してきたが、全く役に立つ点がないというわけではない
診断やトラブルシューティングといった正しいコンテキストで使えば味方になる

これらのメトリクスのおすすめの使い方は、全システムで自動的に記録するようにしておきつつ、アラートは設定しないこと

監視項目と重要なメトリクス

webサーバー…
webサーバに置いてパフォーマンスとトラフィックレベルを測るメトリクスは秒間リクエスト数
パフォーマンスにそこまで影響はないが全体の見通しの点で重要なのがHTTPステータスコード

データベース…
コネクション数(MySQLではスレッド)は全体のトラフィックレベルを見るのにちょうどいい
しかし、DBがどれぐらい忙しいかは、秒間クエリ数を見る必要がある

ロードバランサ…
フロントエンドとバックエンドの2つのメトリクスを取る

メッセージキュー… キューの長さと消費率

キャッシュ…
キャッシュから追い出されたアイテム数とヒット・ミス率

DNS…
自前で運用していなければ特に監視すべきものではない
自前で運用しているなら、ゾーン転送と秒間クエリ

DHCP…
DHCPプールが十分なリースの余裕を持っているか

スケジュールジョブ…
cronジョブなど