ネットワーク機器の監視

Pingによる死活監視とSNMPによるトラフィック量を検討されるユーザー様が多くいらっしゃいます。下記参考になれば幸いです。

Pingセンサーは、既定値で32 Bypeパケットを5回送信し1回でも成功するとアップ(正常)と判定します。1回の失敗でダウン判定とする場合は、パケット損失に閾値を設定して下さい。閾値は「以上・以下」ではなく「より以上・より以下」です。5回中1回のPing失敗でダウン判定させるにはパケット損失が1/5=20%となる為、21%「より以下」として20%を含むように閾値を設定します。昔からの仕様です。Pingセンサーをマスターオブジェクトへ設定するとPingセンサーがダウンした際、そのデバイスの他の監視センサーを休止できます。ポーリング処理・リトライをPing一本に減らせます。安価な10G機器の場合、複数VLANからのPingに対応できないとNW機器仕様やNW機器ベンダーのナレッジに書かれている事があります。ご注意下さい。

SNMP Traffic センサーは、監視対象NW機器の受信トラフィック(In)、送信トラフィック(Out)、合計(Sum)以外に、エラー受信/送信、廃棄受信/送信、ユニキャストパケット受信/送信、非ユニキャストパケット受信/送信、マルチキャストパケット受信/送信、ブロードキャストパケット受信/送信、不明プロトコルの統計値を表示可能です。SNMPインスタンス番号が固定値でない場合は、キー値をご確認下さい。ifAlias、ifDescr、ifNameをキー値(ポートの特定)に設定可能です。ifAliasは重複しないポート名をNW機器へ設定する必要があります。ifAliasがキー値の場合、ifAlias名を入れ替えるとその名前で追いかけて監視します。10 Gigabit Ethernetまで対応、100 Gigabit Ethernet非対応、32bit Counterは650Mbits/sec以上を監視できません。詳細はお問合せ下さい。

SNMP Rmonセンサーは、kbit/s でのトラフィック量を知る事が可能です。SNMP Traffic センサーではKB/s 表示。Broadcast Packets、Colisions、CRC Errors、Drop Events、Fragments、Jabbers、Multicast Packets、Oversize Packets、Packets、Packets <= 64 Byte (#/s)、Packets 65 – 127 Bytes (#/s)、Packets 128 – 255 Bytes (#/s)、Packets 256 – 511 Bytes (#/s)、Packets 512 – 1023 Bytes (#/s)、Packets 1024 – 1518 Bytes (#/s)の表とグラフを作成しポートの利用状況を知る事が可能です。

トラフィックの詳細な利用(どのような通信が行われているのか?)を知るには、ミラーポートのパケットキャプチャ、L3スイッチのNetflowデータを取得する事がございます。PRTGでは、パケットキャプチャNetflow ver5、ver 9、IPFIXに対応します。

複数経路が存在する場合、 Traceroute Hop Count Sensorからホップ数が変化しないかを監視する事をお薦めします。

NW機器のFAN故障、電源故障、機器ステータスがクリティカルなイベントが発生した時、SNMP Trapや、SyslogメッセージをSyslog Serverへ送信設定し障害時に確認したい時があります。PRTGでは、SNMP Trapセンサー(UDP162)、Syslogセンサー(UDP514)でUTF-8のメッセージを受信しておき障害発生時にイベントメッセージを確認可能です。受信メッセージはメッセージタグから、日時、メッセージ内容、IPアドレスでフィルタ可能です。受信設定はanyとしてカウントし何かあった時にフィルタで障害のヒントを探す利用をお勧めします。時系列の表とグラフを作成するポーリング型のソフトウェアにSNMP Trap、Syslogメッセージ表示とフィルタ機能をつけた機能の為、複数条件による通知設定には向きません。複数条件による通知設定が必要な案件では数万円のシスログサーバー(WindowsOS + SQL Server Express)をご紹介します。大量のSNMP Trapを受信する場合にはハイパフォーマンスな用途向けでは、MG-Soft社製 MG Soft trap ringer をお勧めします。

NW機器の温度、動作ステータス(FAN、電源、冗長構成)をPing/SNMP Traffic監視のように時系列の表とグラフで監視されたい場合には、情報をMIBで持っていないかNW機器のMIBファイルを確認します。機器側の型番、構成、ファームウェア、コンフィグが対応しているかは製造元へご確認下さい。どのような値を正常値、異常値として取りうるのか仕様を確認下さい。NW機器の設定変更・再起動によりSNMPのインスタンス番号が動的に変わる事があります。ずれる場合は、SNMP Persist コマンドなどの設定が無いか製造元へ仕様をご相談下さい。NW機器仕様が不明の場合、ご相談ベースで可能な範囲で回答致します。エンタープライズ機器などの正式回答は機器ベンダー様の保守窓口へお問合せ下さい。

NW機器の温度、動作ステータス(FAN、電源、冗長構成)を特定するOID値が分かりましたら、SNMP Custom Sensorからポーリング監視可能です。複数OID値の監視はSNMP Custom Table Sensorから可能です。 NW機器のMIBファイルをPRTGへ取り込むにはMIB Importerを利用しPRTGから読み込み可能なOID libraries(*.oidlib ファイル)へコンパイルします。コンパイルしたファイルは、SNMP library Sensorから利用可能です。SNMP library Sensor 作成時にSNMP Walkが走ります。Walkが終了しないような数万のSNMP値を持つ機器仕様にご注意下さい。Walkが終了せずにタイムアウトする場合、MIB ImporterからMIBファイル取り込み後Partial Selectionで必要な個所のみ部分コンパイルしてSNMP Walkの処理時間を短くして下さい。

参考:NW機器のSNMP値テストツール(OID指定、SNMP Walk実行と結果のテキスト保存、ifAlias、ifDescr、ifNameの確認に便利です。)

参考:MIB Importer(MIBファイルをコンパイルしてSNMP library Sensorから特定のSNMP値を監視可能)