月刊ビジネスコミュニケーションによるエキスパートブログ
HOME | ABOUT |
atom rss2.0

« previous next »

ネットワークを支える監視技術の最新動向 その2-リソース閾値監視(静的閾値監視と動的閾値監視)①-

2012.01.23|新ネットワーク このエントリーをはてなブックマークに追加Yahoo!ブックマークに登録この記事をクリップ!BuzzurlにブックマークBuzzurlにブックマーク

2-1.静的閾値監視
一般的なリソース閾値監視は、予め固定化された閾値を監視システム側に設定しておき、その値を超えた場合のみアラームとして監視者に通知する方法でリソース閾値監視を実施している(以下、静的閾値監視)。
[例:CPU使用率を70%として監視システムに設定しておき、装置の状態がCPU使用率70%を超えた場合、アラームとして監視者に通知する]しかしながら、静的閾値監視では、以下の課題がある。

課題1:静的閾値の値が適切に設定されておらず、低い値が静的閾値に設定されている場合、システムは正常状態にもかかわらず多くのアラーム通知される場合がある。アラーム通知によって監視者は常に装置の状態を把握するための確認作業を行う必要があり、保守稼働の増加につながる。また、適切な静的閾値を決めるために、一定期間の正常状態のトラフィック量・リソース使用状況を調査し、その結果から人が静的閾値を判断しなければならない。

課題2:サーバーへのアクセス頻度が低い時間帯(昼間帯等)に、閾値を超えない範囲で、通常時とは異なるリソース使用率の変化(=異常状態)があった場合、閾値を超えていないため、アラーム通知せず、サイレント故障の状態となる。

2-2.動的閾値監視
2-1の課題解決方法として、監視対象装置の過去のリソース使用状況を収集し、正常状態を示す動的なベースラインを作成し、そのベースラインに基づきリソースを閾値監視すること(以下、動的閾値監視)により、正常な状態であるが静的閾値超過アラームを通知するアラーム誤検知を防止する(課題1の解決)。また、通常時と異なるリソース利用率の変化を検知することで静的閾値監視ではエラーメッセージの出ない性能劣化等のサイレント故障を防止する(課題2の解決)。


図2:静的閾値監視と動的閾値監視

次回は静的閾値監視と動的閾値監視のメリット、デメリットと、動的閾値監視(複数監視項目)について説明する。

トラックバック

このエントリーのトラックバックURL:
http://www.bcm.co.jp/mt/mt-tb.cgi/1180

コメントを投稿

(投稿頂いたコメントは内容を確認させて頂くので、公開まで時間がかかります。また、適切でないと思われるコメントは公開されない場合があるので、予めご了承下さい。)

Latest