本日、ExpressRoute のエッジ ルーターにおけるメンテナンスのお知らせがお客様に送信されました。
お知らせにもあるとおり、今回のメンテナンスにおいてお客様のサービスに影響が発生することは想定しておりません。この点についてはご安心いただければと思います。ただ、送信されたお知らせの文面は最低限のものですので、どのようなメンテナンスが予定されており、どういった理由で影響がないのかなど、本ブログ記事にてご説明をさせていただきます。
これまでにも何度か実施されているメンテナンスと同じですので、内容についてはご存知の方もいらっしゃるかと思いますが、参考になりましたら幸いでございます。
なお、最初に送信された通知において、東京・大阪の両ロケーションにおける日本時間の表記に誤りがありました。修正版の通知を順次お送りしておりますが、日本時間と世界標準時間でずれがある場合は、世界標準時間を正としてご認識いただけますようお願いいたします。混乱を招いてしまい大変申し訳ございません。
メンテナンスの内容
ExpressRoute は、非常に簡単に図示しますと、以下のようなアーキテクチャになっております。エッジ ルーター (MSEE) とよばれる物理ルーターが 2 台 Azure 側に存在しており、それぞれ、回線プロバイダーのルーターと接続されています。
※ L2 モデルのプロバイダーをご利用の場合は、プロバイダーのスイッチを経て、L3 レベルではお客様のルーターと接続されています。以下の説明における「プロバイダーのルーター」という表現についても、L2 モデルのプロバイダーをご利用の場合は、お客様が構築されている BGP ルーターと読み替えていただければと思います。
メンテナンスの対象
今回、メンテナンスが発生するのは、MSEE (図における黄色のルーター) です。このルーターにおいて、片方ずつメンテナンスが実施されます。各ロケーションにおいて、数時間ずつ (東京および大阪では 6 時間ずつ) 計 2 回のメンテナンス ウィンドウが通知されておりますが、最初のウィンドウで片方のルーター、後のウィンドウでもう片方のルーターのメンテナンスが行われます。
つまり、冗長性を考慮し、片方ずつ十分に時間をわけてメンテナンスを行うことが予定されています。
メンテナンス時の挙動
ExpressRoute においては、プロバイダーのルーターと、MSEE との間で必ず BGP による動的な経路交換が行われており、ある経路がダウンした場合に、別の経路に切り替わるよう冗長性も BGP によって確保されています。
実際にメンテナンスが行われるタイミングでは、MSEE はいきなり応答を停止するのではなく、プロバイダーやお客様のルーターに対して BGP の Administrative Shutdown を明示的に通知します。プロバイダーのルーターはこれを受けて、経路を能動的に切り替えます。
Administrative Shutdown の通知が MSEE から送信されないと、プロバイダーやお客様のルーターにとっては、MSEE からの応答が突然なくなるため、タイムアウトになるまで再接続を試みたのちに、経路が切り替わります (つまり、MSEE が応答を停止してから、プロバイダーのルーターがタイムアウトと判断するまでの間、通信断が発生します)。
このような通信断を防ぐために、MSEE は Administrative Shutdown を明示的に通知し、プロバイダーのルーターがタイムアウトを待たずに、ダウンタイムなしで経路を切り替えるようにしています。
よくある質問
- 「BGP が構成されていれば問題ない」という記載があったが、BGP が構成されているかどうかはどうやって判断すればよいか。
- ExpressRoute おいては、経路の交換を行う手段が BGP しかありません。したがって、現在 ExpressRoute をご利用いただけているようであれば、必ず BGP は構成されています。BGP なしで ExpressRoute を利用することはできませんので、BGP の利用の有無をあらためて確認する必要はありません。
- 現在利用している ExpressRoute 回線は冗長化されているか。
- ExpressRoute は、「1 回線」作成すると、必ず内部的には 2 本の物理的な回線が構成され、2 台の MSEE が利用されます。つまり、シングル構成になっていることは原則ありません。
ただし、L2 モデルのプロバイダー (お客様自身で BGP ルーターを構成いただく必要があるプロバイダー) をご利用いただいており、ルーターを片方の回線にしか接続していない、片方の回線しか BGP の Neighbor を確立していないなど、極めて例外的な構成を取っている場合に限っては、今回のメンテナンスにあたって通信影響が生じます。
このような構成は、SLA が担保されない、弊社として保証していない特殊な構成であり、プロバイダーまたはお客様にて意図的に構成するものです。ご利用の ExpressRoute の環境が冗長構成されているかは、プロバイダーまたはお客様のネットワーク担当者にご確認ください。
- ExpressRoute Gateway の SKU と影響の有無は関係あるか。特に、Basic SKU の Gateway だと問題があるなどは考えられるか。
- Gateway の SKU がどれであっても、今回のメンテナンスに伴う影響の有無には関係ありません。Gateway は上記の図でいう青色の部分ですが、今回のメンテナンス対象である MSEE は黄色の部分であり、Gateway の SKU とは特に関係がありません。
- ExpressRoute と接続しているルーターにおいて、エラーなどが発生する可能性はあるか。
- MSEE から BGP の Administrative Shutdown の通知を送信しますので、通知を受け取り、BGP のセッションを切断したことを示すログなどが記録されることが想定されます。ルーターの監視を行っている場合は、メンテナンス期間中にこのようなログが記録されることをあらかじめご認識いただけますと幸いです。