複数の VNF への Cinder ボリュームのマルチアタッチの有効化

機能の概要と変更履歴

要約データ

該当製品または機能エリア

  • P-GW

  • SAEGW

該当プラットフォーム

  • VPC-DI

機能のデフォルト

無効:有効にするには設定が必要

このリリースでの関連する変更点

N/A

関連資料

  • P-GW Administration Guide

  • SAEGW Administration Guide

  • Statistics and Counters Reference

マニュアルの変更履歴

改訂の詳細

リリース

P-GW および SAEGW では、Cinder ボリュームマルチアタッチ機能が次のように拡張されています。

  • monitor system volume CLI コマンドを使用して、システム ボリューム ステータスをモニターします。

  • マルチアタッチ cinder ボリューム機能のデタッチ中にスイッチオーバーの理由を変更します。

  • SNMP トラップ通知を発生させます。

2024.02.0

最初の導入。

21.25

機能説明

Cinder は、VNF にボリュームを割り当てるための OpenStack ブロックストレージサービスです。ボリュームは、永続的なストレージを可能にするためにインスタンスにアタッチされるブロックストレージデバイスです。

OSP 16.0 より前の P-GW では、仮想顧客宅内機器(VCPE)と RedHat を使用するときに、運用上の問題が発生していました。VM の回復機能は QvPC-DI の VM 制御機能(CF)を停止させ、コンピューティングホストの障害により別のコンピューティングホスト上で復旧を試みます。新しい CF インスタンスが起動し、冗長ディスクアレイ(RAID1)が形成されると、アクティブな CF インスタンスは internet Small Computer System Interface(iSCSI)チャネルを介してディスクの同期を実行します。このプロセスはブロック単位で実行され、ディスク全体で反復されます。ディスクの同期は DI-LAN を介して行われます。ディスクサイズが 250GB を超えると、ストレージ構成、DI-LAN ネットワーク帯域幅、トラフィックによっては時間がかかります。

この問題を克服するために、OSP16.1 を使用して Cinder ボリュームのマルチアタッチをサポートします。この Cinder マルチアタッチ機能を使用すると、ボリュームを複数の VNF インスタンスに同時にアタッチできます。

  • QvPC-DI の CF1(アクティブ)と CF2(スタンバイ)は、オーケストレータの起動時に同じマルチアタッチボリュームに接続します。

  • StarOS は、CF1 と CF2 が iSCSI チャネルを介して同じディスクボリュームに接続されているかどうかを検出します。

  • Cinder ボリュームのマルチアタッチケースが検出されると、HD-RAID は HD ローカルディスクのみ(アクティブな CF に接続されたディスク)を使用して形成されます。このプロセスは、動作上の問題を解決するために HD-RAID ミラーリングを回避します。

マルチアタッチでのディスク障害

マルチアタッチでのディスク障害の場合、両方の CF が同じボリュームを指しているため、CF をスイッチオーバーできません。Cinder ボリュームマルチアタッチでディスク障害が検出されると、自動 ICSR スイッチオーバーが開始されます。Cinder ボリュームマルチアタッチのディスク障害シナリオを処理するために、シャーシ間セッションリカバリ(ICSR)設定が使用されます。

システム ボリューム ステータスのモニター

vPGW のアクティブな CF カードのマルチアタッチ Cinder ボリュームに障害が発生した場合、サービス冗長性プロトコル(SRP)グローバル コンフィギュレーション モードのシステムボリュームモニター 機能によって、以下のことを実行できます。

  • CLI コマンドを使用してボリュームのアタッチやデタッチ中のシステムボリュームをモニタリングする。

  • マルチアタッチ Cinder ボリュームがアクティブな CF カードから切断され、SRP スイッチオーバーが発生した場合に、スイッチオーバー理由を変更する。

  • アクティブな VNF のスタンバイ CF カードがボリュームのデタッチを検出したときに、SNMP トラップを通知する。

マルチアタッチ Cinder ボリュームの設定

システムがアクティブな CF からマルチアタッチ Cinder ボリュームのステータスをモニターできるようにするには、次の CLI コマンドを使用します。


configure 
   context context_name 
      service-redundancy-protocol 
      [ no ] monitor system volume 
   end 

  • monitor system volume :サービス冗長性プロトコル(SRP)を有効にしてボリュームをモニターします。

  • no :ボリュームモニタリングを無効にします。

モニタリングおよびトラブルシューティング

この項では、show コマンドを使用してこの機能を監視およびトラブルシューティングする方法について説明します。

コマンドと出力の表示

ここでは、この機能の show コマンドとそれらの出力に関する情報を示します。

show hd raid verbose

このコマンドの出力に、次の新しいフィールドが追加されました。

  • HD Raid

    • Degraded—No (Multiattach)

出力例を以下に示します。

HD RAID:
  State                : Available (clean)
  Degraded             : No(Multiattach)
  UUID                 : 643094ff:2cb03262:6e34e7e0:eddbca63
  Size                 : 214GB (214000000000 bytes)
  Action               : Idle
  Disk                 : hd-local1
  State                : In-sync component
  Created              : Tue Apr  9 09:00:17 2024
  Updated              : Wed Apr 24 02:21:18 2024
  Events               : 113252
  Model                : QEMU QEMU HARDDISK 2.5+
  Serial Number        : d6ae9d7e-12b1-4b62-93c3-1946ae882113
  Location             : CFC1 A7E5A7CF-561C-48A9-8784-F9580A3A7DAD
  Size                 : 214.7GB (214748364800 bytes)
  Disk                 : hd-remote1
  State                : Valid image of 643094ff:2cb03262:6e34e7e0:eddbca63
  Created              : Tue Apr  9 09:00:17 2024
  Updated              : Wed Apr 24 02:21:18 2024
  Events               : 113252
  Model                : QEMU QEMU HARDDISK 2.5+
  Serial Number        : d6ae9d7e-12b1-4b62-93c3-1946ae882113
  Location             : CFC2 59AE2254-E3C6-4E8C-8A94-03556C1B2EEB
  Size                 : 214.7GB (214748364800 bytes)

show srp monitor

show srp monitor コマンドが拡張され、マルチアタッチ シリンダ ボリュームの使用量モニターステータスが表示されるようになりました。

Auth. probe monitor state: Success
Auth. probe monitors up:   0
……
…….
VPP monitor state:          Success
SX monitor state:           Success
Volume monitor state:       Success

show srp monitor volume コマンドが拡張され、マルチアタッチ シリンダ ボリュームのステータスが表示されるようになりました。

[local]laas-setup# show srp monitor volume 
+----- Type:  (A) - Auth. probe  (B) - BGP  (D) - Diameter  (F) - BFD  (E) - EGQC 
|                     (C) – Card (V) - VPP  (S) - Sx  (M) - Multiattach Cinder Volume
|
|+---- State: (I) - Initializing (U) - Up   (D) - Down
||
||+--- GroupId
|||
vvv IP Addr         Port  Context(VRF Name)                     Last Update
-------------------------------------------------------------------------------
MI-   -                 -          -                  Tue Feb 06 06:04:50 2024
------------------------------------------------------------------------------

show srp call-loss statistics

show srp call-loss statistics show コマンドは、アクティブ CF のボリュームデタッチに関するスイッチオーバーの理由を Cinder Volume failure と表示します。

[local]CXTMVPGWVNC-Primary-11# show srp call-loss statistics  
Thursday December 21 16:23:28 UTC 2023
Switchover-4  started at : Thu Dec 21 16:20:44 2023,  took 1 seconds to finish.
    Switchover reason : Cinder Volume failure

(注)  


マルチアタッチボリュームがスタンバイ VNF からデタッチされると、次の 2 つの状況が発生する可能性があります。
  • アクティブな VNF でマルチアタッチボリュームのデタッチが発生すると、サービスに影響が及ぶ可能性があります。両方の VNF にボリュームがアタッチされていないため、このサービスへの影響は、自動 SRP スイッチオーバーが制限されている場合でも発生します。

  • 強制の有無にかかわらず、SRP スイッチオーバーコマンドを手動で実行すると、スイッチオーバーが発生する可能性があります。このようにサービスに影響が及ぶのは、ピア VNF にもマルチアタッチボリュームがアタッチされていないためです。

    そのため、ピアの HD RAID ステータスを速やかに修正することを推奨します。また、手動 SRP スイッチオーバーを実行する前に、ピアの HD RAID ステータスが適切であることを確認してください。


SNMP トラップ通知による SRP スイッチオーバー理由の確認

スタンバイ CF カードは次の SNMP トラップを生成します。

  • StorageNotFound :ボリュームのデタッチ

  • StorageFound :ボリュームのアタッチ

アクティブな CF カードからマルチアタッチボリュームがデタッチされたことが原因でスイッチオーバーが発生した場合、SRRPSwitchoverOccurred トラップは理由を Cinder Volume Failure と表示します。

Internal trap notification 1278
	(SRPSwitchoverOccured)  vpn SRP ipaddr 2002:4888:34:13:386:200:0:11 rtmod
	18 Switchover Reason: (18) Cinder Volume Failure

(注)  


Cinder ボリュームがアクティブカードに再接続されても、ソフトリロードが実行されない限り、システムで自動的に検出されません。