「【詳報】NTT東がフレッツ障害の原因報告,旧ソフト搭載のルーターが経路再計算しきれず」(ITpro)
やっぱり、先日のフレッツ網の障害はルーター(L3SW)の障害だったようですね。 しかも、ハードウェア的障害を起こしたルーターを正常なものに入れ替えたときに発生した経路情報の再計算によるソフトウェア的な障害だったという、ありがちな障害だったと言うことで…
ルーター(L3SW)の障害って、本当に質が悪くて面倒なんだよね〜。 切り分けが大変で、しかも不安定動作というレベルだと原因の大元を辿るのが大変なんですわ。 前の会社でネットワーク構築したときも、一度L3SWの障害が発生したことがあったんですよ。 でも、現象を見ているとフロアにあるL2SWで障害が発生しているように見える。 しかもL3SWは二重化構成にしているので一方で障害が起こっても、もう一方でカバーできるはずなのに出来ていない。 いろんな切り分けをしていって、最終的にはL3SWの特定のポート収容されている基盤の障害だったんですけど、中途半端に死んでいるもんだから、原因究明までに6時間くらいかかったりしました。
中小企業の、ちっぽけなネットワークですらそんな感じなんだから、日本の半分をカバーするネットワークの障害なんて、原因究明が大変だよなぁ〜とか思ったり… そんなモノの上に構築されている社会は、障害に対して非常に脆弱なんだよなぁと改めて考えさせられました。
アナログなんて、イザとなったら線をぶった切って別のものにつなぎ合わせれば何とかなった世界ですけど、デジタルな世界は全くの別世界ですからね。 中を流れるデータのごくごく一部が異常値になっただけでも動かなくなる可能性がある世界。 デジタル化した放送局の技術屋さんって、そういったことを判って技術屋を名乗っているんでしょうかね? 今の放送設備はネットワーク設備の巨大化したものですからねぇ。
コメント