ネットワークエンジニアが語る発生確率の高いトラブルとその対処法

年々進化するネットワーク技術、近年ではSDNのような仮想サーバと連携するネットワーク仮想技術やソフトウェア化が行われるなど、利便性は広がりつつあります。

しかしながら、いつの時代になってもネットワークエンジニアにとって悩ましいのがネットワークトラブル。原因はちょっとしたことなのにそれが全社に影響を及ぼすようなことも少なくありません。

この記事では、比較的発生率の高く、影響の大きいネットワークトラブルについて紹介します。

ネットワークトラブル事例

ネットワークトラブルの要因にはいろいろなパターンがあります。ネットワーク機器故障、ソフトウェアバグ、突発停電などの外的要因などさまざまですが、そのなかでも多いのが人的ミス。つまり人が誤った使い方、設定をしたせいで発生するトラブルです。

ここでは人的トラブルのなかでも発生しやすく、かつ影響が大きいトラブルについて3件ご紹介します。

事例1:ネットワークループによる基幹ネットワークトラブル

1つ目の事例はネットワークループによって起こるトラブルです。

現在利用されているEthernetはループ構成では機能しないネットワークです。ループとは、輪になった構成のことです。

たとえばみなさんの会社のデスクにあるLAN用のハブ、1つのケーブルの両端を同じHUBに接続すれば輪が出来ますよね?これをループ構成といいます。

この構成を作ると、ループ防止機能を設定しない限り、通信データがこの輪の中で回りながら無限に増幅を続け、最終的にHUBが処理できる限界を超えてしまい、機能停止してしまいます。

このトラブルをブロードキャストストームといいます。

単なるケーブル結線ミスが事業所全体を止めることも

このブロードキャストストーム、ループが出来ているHUBだけでは済まず、増幅したデータが上位の基幹ネットワークにまで流れ込みます。

これにより最悪の場合、その事業所全体のネットワーク全体を停止してしまう大規模障害を引き起こす原因にもなります。

実はこの障害がなぜ厄介かというと、ループ発生個所を特定するのが非常に難しいのです。

機器ログで確認したくとも負荷が増大し機器の管理機能も停止しているケースが多く、結局ループ発生個所を目視で点検していくしかないことが多いのです。

その結果、障害は長期化してしまい業務影響を大きくしてしまうことが多いのです。

原因を調べると、従業員の善意だったりするケースも

原因は誰かが誤った結線をしたことが原因なのですが、その理由を聞くと実は善意による行動の場合もあります。

たとえばHUBの近くにLANケーブルのコネクタがあり、HUBから外れたんじゃないか?と思って差し込んだ、というものです。実は本人にはまったく悪気がない、むしろ善意がアダになっているケースもよくあることです。

対策は教育と防止機能の両方で抑え込むこと

この対策としてネットワーク機器にループ防止機能を設定する方法があります。

ループガード機能やストームコントロール機能を使うことで、ループ構成を作ってしまった場合、その部分を基幹ネットワークから自動的に切り離すことで影響を最小化できます。

しかしながら誤ってループ構成を作ることで、少なからずネットワークトラブルにはなります。大事なのは従業員への教育です。

誤ったケーブル接続するとトラブルになることを教育することでループ構成を発生させる確率を低減できます。社員全員に理解してもらうことこそ、本質的な対策といえるでしょう。

事例2:ネゴシエーションミスマッチによるネットワーク遅延

事例1はエンドユーザのミスなのに対し、こちらはネットワークエンジニアのミスによって発生するトラブル事例です。

2つ目の事例はネゴシエーションミスマッチによる遅延トラブルです。LANポートにはスピード設定があります。パソコンのLANポートに1Gとか100Mなどになります。

もう一つ、LANポートにはネゴシエーション設定というものがあります。全二重設定と半二重設定というものです。

たとえば1GbpsのLANの場合、送信・受信それぞれ1G の速度が出るのが全二重、送信・受信合わせて1Gしか速度がでないのが半二重と考えてください。

このトラブルは、ネットワーク機器間を接続するポート同士のネゴシエーションずれによって起こるトラブルです。

オートネゴシエーション機能がアダに

実はネットワークポートには自動的に速度、ネゴシエーションを判別して接続する機能があります。

オートネゴシエーション機能と言われている機能で、接続したポート同士で速度、ネゴシエーション設定を調整し、同じ設定に合わせて接続する機能です。

非常に便利な機能であり、ネットワーク機器間でもこの機能を利用した設定することが多いのですが、時に正しく動作しないケースがあります。

異メーカー同士の接続の場合、片側が半二重、片側が全二重で接続されてしまうことがあるのです。これをネゴシエーションミスマッチといいます。

見た目では正常に接続されているようにみえるが、異常に遅い

ネゴシエーションミスマッチを起こしても、見た目は問題ないように見えます。しかしながら、片側は1Gの帯域しかないのに対し、片側は2Gの帯域なので、1G以上のデータ送信ができず、さらに再送するロジックも正しく働きません。結果、大幅な遅延が発生してしまうのです。

基幹ネットワークに近い部分で発生した場合、拠点内全体の遅延につながり、業務影響が大きくなる要因になる可能性があります。

便利機能とはいえ、しっかり確認することが必要

オートネゴシエーションは非常に便利な機能な点と、双方の設定が違えばリンクアップしないと思われがちですがそんなことはありません。

このトラブルは、オートネゴシエーションという便利機能を過信し導入時の確認を怠ったことが原因です。

オートネゴシエーションで導入した場合でも、機器ログにより各ポートのネゴシエーションがどうなっているかを確認することは可能です。機能を過信せず、必ず確認することが必要です。

ちょっとしたことで人的トラブルは抑えられる

いまや当たり前のように利用しているネットワークですが、ちょっとした人的要因で大規模トラブルにつながってしまうことがほかにもまだたくさんあります。

トラブル防止には、教育や作業標準化が必要といえます。なんでも機械に頼るのではなく、人的対策も行うよう、これを機会に見直しをしてみてはいかがでしょうか。

[文] [編集]サムライト株式会社