L2NWの盲点:雑記
NW設計した時の落とし罠
NW要件
久しぶりに拠点間の監視設計を頼まれました。
・通常通信のルーティングテーブルと監視のルーティングテーブルを混ぜない
・8拠点の裏側ルートはある
・通常通信しているルータのIFは監視したい。
・ルータには届いていいが、その配下の端末には届いてほしくない
以上が条件でした。
NW的にも様々な制約があるなか、めんどくさいので8拠点を全部1つのL2NWとして設計することにしました。
ONUの存在
監視の通常通信は成功、冗長化もIF抜いたりしていたら大丈夫でした。
が、間にONUが挟まってるのを度忘れしていました。
NW構成図にはたいがい網の一部として書かれているので抜けやすいものです。
ONUのせいで網障害を検知できないことを忘れていたのです。
(ただの馬鹿ですね。)
WAは用意してある
網障害が検知できないのは忘れていましたが、回避策があるのはわかっていたのでそれを提案。
冗長設計しているので正常系とバックアップ系の2面で監視すればいいというもの。
網障害起きても、もう一個で監視できてたらいいし、その間に網が直ってもらえればいい。
2面とも網障害が起きてたらそもそもどんな設計してても死んでるから考慮する必要なし。
ということです。
網障害以外ではそのWAが発動することもありません。
どこまで考えるか
VRFやBGPをフル活用して自動化するのはありだと思ってそれも検討してみました。
しかし、運用フェーズで一目見てわからないNWを渡された人の気持ちを考えるとやめとこうと思って1つめの案にはしませんでした。
VRF2つのOSPFプロセス2つのBGPネットワークです。
自分で考えたのならいいけど人の考えたNWなら、まぁやりたくありませんね。
切り分けポイントが多いのでちょっと変な挙動したり、構成変更が生じたら1から設計を考える必要もでてきますしね。
それなら、ちょっと手間がかかるけど、理解もしやすく拡張性があるほうがいいと私は思います。
総評
エンジニア気質がある人は素晴らしい最新の技術をてんこ盛りにして自動化を図るのですが、そのNWは自分がお守りするわけではありません。
拡張性、可読性は保守・運用に非常にひびきます。
考え方の話になりますが、目線はどこかしっかりと意識したいものです。