昨日、我がサイトのネットワークに障害発生

February 21, 2009 – 3:56 pm

我がサイトを立ち上げてからほぼ1年半が経過した。この1年半、障害らしい障害も発生することなく過ごしてきたが、昨日(2月20日)午後4時ごろから10時ごろまでの6時間にわたって我がサイトへの接続ができない状態となった。数少ないとはいえ我がブログを愛読していただいている読者の皆様、障害の発生によりご不便をかけたこと、ごめんなさい。

障害の内容と原因: 障害は、午後4時頃発生したようだ。システムログを見ると、午後4時以降のアクセスがなくなっている。最初に障害の発生に気がついたのは、このブログへのアクセス状況を見ようとアクセス解析ツールを起動したときだ。応答がなかったのだ。それではと、SSHでサイトへの接続を試みたがやはりだめ。この時点でネットワークに障害が発生していることを理解した。

我が家のネットワーク構成: 我が家のネットワーク構成については、サイトを立ち上げた直後に書いたエントリー「Bフレッツのマルチセッションでサーバ専用ラインを確保」で簡単に紹介している。サーバに接続しているBフレッツのセッションと家族ともども使用しているセッションとは異なる構成にし、前者のサーバはAsahi-netを、そして後者のラインはOCNにそれぞれ接続されている。従って、我が家の日常的に使用しているネットワークから我がブログサイトに接続する場合には、我が家→OCN→Asahi-net→我が家(サーバ)という経路をとることになる。

原因はサーバ側で使っていたルータ: 日常的に使用しているネットワークからのWeb閲覧は(我がサイトを除いて)問題なく可能だった。ということは、Asahi-netと我が家(サーバ)との間に問題があるわけだ。以前、Asahi-netの中継局がメンテナンス作業で数時間にわたり不通になったことがある。そのときは、メンテナンス作業は10分程度で終わるという話だったが、かなりの長時間にわたり不通の状態になった。

今回もAsahi-netの問題かと思い、Asahi-netに電話での問い合わせをしようかと電話番号を調べてみたがネット上では見つけることができなかった。話はそれるが、プロバイダ側が問題をおこしたときには、どのような手段で問い合わせをすることができるのか、若干不満に思ってみたりした。

あれこれ考えて、結局、サーバマシン上からpingとかtracerouteなどでネットワークの状況を把握することにした。結果、実に、サーバマシンから光端末に至る前のルータが動作してないことに気がついた。このルータ、前のエントリーでも書いたようにBuffalo社製のBBR-4HG、4千円なりの代物。やはり、「安かろう、悪かろう」ということかなと思いながら、電源を一度落として、再投入。これで問題なく動作することになって、復旧した。

今回の教訓: あれこれ考える前に、ネットワークの状態をping、tracerouteなどを使って確認することが基本。きちんと切り分けをしながら問題の所在を明らかにするのが重要ということか。それと、ルータは、やはりそれなりの値段の信頼性の高いものを使うことも重要なのかもしれない。とはいうものの、年金生活者のホームサーバ、お金はかけられない。1年半にもわたって何の障害もなかったことをよしとすべきか?

それにしても、何故、BBR-4HGがダウンしたのか、その原因が不明なのは、ちょっと気味が悪い。


Post a Comment