概要
このドキュメントでは、HyperFlexクラスタアップグレードプロセスを正常に実行するためのベストプラクティスについて説明します。
s
前提条件
要件
次の項目に関する知識があることが推奨されます。
- Unified Computing System Manager(UCSM)
- Cisco インテグレーテッド マネージメント コントローラ(CIMC)
- HyperFlex
- Elastic Sky X統合(ESXi)
- vCenter
- Intersight
使用するコンポーネント
- HyperFlex Connect 4.5(2e)
- UCSM 4.2.(1f)
- Intersight
- vCenter 7.0 U3
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
アップグレード前の手順
バージョンの選択
選択したターゲットバージョンは、HyperFlex環境のニーズに基づいて決定されます。その目的は、古いソフトウェアから新しいソフトウェアを改善、修正、および活用することです。
新機能、新たにサポートされるハードウェア、コンポーネント間の相互運用性、ガイドライン、制限事項、セキュリティ修正、解決済みの注意事項などの情報については、HyperFlexのリリースノートを参照してください。
リリースノートの情報を確認するには、 こちらからアクセスできます。
互換性
Hyperflexクラスタアップグレードを実行する前に、すべてのバージョンに互換性があることを確認します。シスコは次を推奨します。
- HyperFlex、Unified Computing System(UCS)、およびESXi/vCenterバージョンの相互運用性を確認します。
- ターゲットのHyperFlexターゲットバージョンでサポートされているすべてのハードウェアモデルを確認します。
- Cisco HyperFlexソフトウェアの要件と推奨事項については、ここを参照してください。
- 記載されているすべてのUCSおよびVMwareバージョンは、シスコによって推奨され、高度にテストされています。
- シスコでは、より信頼性が高く、高度にテストされたHyperFlexバージョンを推奨しています。
- 推奨されるHyperFlexバージョンは、金色の星が付いています。ここを確認してください。を参照。
アップグレードガイド
実行する手順が記載されたCisco HyperFlexアップグレードガイドを確認します。
このガイドでは、次のようなさまざまなタイプのシナリオに関する情報を提供します。
- 統合アップグレード。すべてのHyperFlexクラスタコンポーネントのアップグレードが必要
- 個別のアップグレード。 HyperFlexクラスタコンポーネントの1つをアップグレードする必要がある
- オフラインアップグレード。HyperFlexクラスタをシャットダウンする必要がありますか。
- クラスタタイプに応じたアップグレードワークフロー(標準、強度、エッジ)
- アップグレードガイドは、 こちらからアクセスできます。
- クラスタがCisco Intersightを使用して導入されている場合は、Intersightを使用します。ガイドを確認する こちらからアクセスできます。
考慮事項
- シスコでは、ワークフローのトラフィックが少ない時間帯やメンテナンスの時間帯にオンラインアップグレードを実行することを推奨しています。
- アップグレードが完了するまでの時間は、クラスタサイズの相対性です。
- オフラインアップグレードでは、すべてのゲスト仮想マシン(VM)がオフラインである必要があります。
- End of Life(EOL;廃止)として現在使用されているバージョンを避けるために、新しく使用可能になったバージョンのHyperFlexリリースノートを監視することをお勧めします。
- ここでCisco HyperFlexリリースノートのガイドを確認してください。
アップグレード前ツール
HyperFlexアップグレードを実行する前にヘルスチェックを実行して、潜在的な障害を修正し、アップグレード中の予期しない動作を回避します。
これらのヘルスチェックを実行する方法は2種類あります。
ハイパーチェック
このツールは、HyperFlexシステムでプロアクティブなセルフチェックを実行して、システムの安定性と復元力を確保するためのユーティリティです。
ハイパーチェックガイドの情報はここにあります。
Intersightヘルスチェック
これは、事前チェックに推奨される方法です。この機能は定期的に更新され、設定ミスの可能性を簡単に検出できる新しいトラブルシューティング機能が含まれています。
また、アップグレードプロセス中の不便さを表す新たに検出された警告を常に最新の状態で検出します。Intersight HealthCheckのガイド情報は次のとおりです こちらからアクセスできます。
Intersight HealthCheckデモ
手順 1:Intersightにログインし、インフラストラクチャサービスに移動して、HyperFlexクラスタを選択し、クラスタを選択します。
例は、San_Joseという名前のクラスタを示しています。Actionsドロップダウンメニューで、Run Health Checkを選択します。
注:この例では、単一のクラスタで実行されるヘルスチェックを示します。複数のクラスタを同時に選択してヘルスチェックを実行できます。
クラスタを確認し、 次へを参照。
ワークフローでは、必要に応じて一部のチェックをスキップできます。
ステップ 2:クリック 開始 プレチェックを開始します。
進行状況バーを確認し、HealthCheckタスクが完了するまで待ちます。
ステップ 3: HealthCheckタスクが完了すると、結果を確認できる場所がいくつかあります。
Health Checkタブには、一般的な結果が表示されます。例では、PassedとNot Runの結果が表示されないようにフィルタリングされています。
ステップ 4:クリック 影響を受けるノード 問題のノードを確認します。
Overviewタブで、Events: Alarms、Requests、およびAdvisoriesにチェックマークを付けます。
各イベントを展開すると、詳細が表示されます。
次の例は、Requestsが展開されていることを示しています。Run Selected Hypercheck Health Checks Failedをクリックします。
成功したチェックと失敗したチェックがすべて表示されます。
ステップ 5:Show Additional Detailsのトグルをクリックします。
各呼び出しチェックを拡張して、チェック対象のきめ細かいビューを表示できます。
Logs、Inputs、およびOutputsに関する詳細情報がJSON形式で提供されます。
教育ビデオ
ビデオをチェックします。
Intersightヘルスチェックビデオ
注:一部の修正には、Technical Assistance Center(TAC)の介入が必要です。必要に応じてケースをオープンします。
重要な検証
UCSMの未使用パッケージの削除
UCS Managerファームウェアマネージャでは、UCSファームウェアパッケージをFabric Interconnectのブートフラッシュパーティションにダウンロードする必要があります。 コンポーネントで使用されなくなった古いファームウェアパッケージを確認して削除し、Fabric Interconnectのブートフラッシュパーティションが不要なファイルで一杯にならないようにします。
Fabric Interconnectのスペースを確認します。
ステップ 1:Equipmentに移動し、Fabric Interconnectsを選択して、Fabric Interconnectを選択します。この例では、ファブリックインターコネクトA(プライマリ)を示しています。
ステップ 2:generalパネルで、Local Storage Informationを選択して展開します。
アップストリームスイッチでスパニングツリーポート(STP)PortFastが有効になっていることを確認する
アップストリームスイッチでSTP PortFastコマンドがサポートされている場合は、これをイネーブルにすることを強く推奨します。 PortFast機能を有効にすると、スイッチまたはトランクポートは、ただちに、またはリンクアップイベント時にSTPフォワーディングステートに入ります。したがって、リスニングステートとラーニングステートはバイパスされます。
PortFast機能はポートレベルで有効になっており、このポートは物理ポートまたは論理ポートのいずれかになります。
ファブリックインターコネクトポートまたはアダプタの物理ポートエラー
UCSMで、アップリンクまたはサーバのポートのポートエラーに関連する障害を確認し、フェールオーバーの望ましくないシナリオを回避します。
ステップ 1:UCSMにログインし、Equipmentタブに移動して、Rack-Mountsを展開し、Serversを展開します。この例は、サーバ1を示しています。
ステップ 2:Adaptersを展開してから、NICsを展開します。
ステップ 3:各ネットワークインターフェイスカード(NIC)が汚れていないことを確認します。
標準クラスタおよび拡張クラスタのアップストリームに設定されたストレージデータVLAN
Fabric Interconnect Bがダウンした場合にフェールオーバーが確実に行われるように、アップストリームデバイスでストレージデータVLANを設定する必要があります。
HyperFlexインストールガイドに記載されているすべての要件を満たしていることを確認します。
MTUおよびフェールオーバー
仮想マシンネットワークインターフェイスカード(vmnic)の両方のパスのネットワーク接続フローを確認します。
注:アップストリーム接続テストを実行するには、このビデオを確認してください。
このガイドを使用して、UCSポリシーに基づいて正しいNICチーミングが正しく設定されていることを確認します。
インフラストラクチャのアップグレード中は、ESXiアップリンクが起動してから、もう一方のFabric Interconnectをリブートします。
テストアップグレードの適格性の実行
Cisco HyperFlexリリース4.0(2a)以降では、Upgradeページにクラスタのアップグレード資格に関する最終テスト結果と、UCSサーバ、HXデータプラットフォーム、ESXiの最終テストバージョンが表示されます。
アップグレードの適格性テストを実行するには、HX Connectにログインします。
ステップ 1:Upgrade > Test Upgrade Eligibilityの順に選択します。
ステップ 2:UCSサーバファームウェアのアップグレードが適切かどうかをテストするには、UCS Server Firmwareチェックボックスをオンにします。
ステップ 3:Cisco UCS Managerの完全修飾ドメイン名(FQDN)またはIPアドレス、ユーザ名、およびパスワードを入力します。Current Versionフィールドで、Discoverをクリックして、アップグレードの前に検証する必要があるUCSファームウェアパッケージのバージョンを選択します。
ステップ 4:HyperFlexデータプラットフォームのアップグレードの適格性をテストするには、[HXデータプラットフォーム] チェックボックスをオンにします。
ステップ 5:vCenterのユーザ名とパスワードを入力します。アップグレードの前に検証する必要があるCisco HyperFlex Data Platform Upgrade Bundleをアップロードします。
手順 6:ESXiのアップグレードの適格性をテストするには、ESXiチェックボックスをオンにします。
手順 7:vCenter Administratorのユーザ名とパスワードを入力します。アップグレードの前に検証する必要があるCisco HyperFlex Custom Image Offlineバンドルをアップロードします
ステップ 8:[検証]をクリックします。
ステップ 9:アップグレード資格テストの進行状況が表示されます。
ユーザとパスワードの検証
パスワードの確認 を参照:
- vCenter管理者
- ESXiルート
- ストレージコントローラ仮想マシン(SCVM)のadminおよびroot
メンテナンスモードへの移行の検証
メンテナンスモードの操作中に、ホストで実行されている仮想マシンを別のホストに移行できることを確認します。VMを移行できない場合は、電源をオフにする必要があります。 VMが自動的に移行しないが、手動で移行できる場合は、DRSに関連する問題があるかどうかを確認します。
DRSが有効になっており、DRSのライセンスがある場合は完全に自動化されるように設定されていることを確認します。DRSが無効になっている場合、アップグレードプロセスでプロンプトが表示されたときにVMを手動でvMotionするには、手動による介入が必要です。
詳細については、VMwareのガイドを参照してください。
vMotionの確認 コンフィギュレーション
メンテナンスモードタスクを完了できないようにvMotionが適切に設定されていることを確認します。
vMotionのトラブルシューティングの詳細については、 こちらからアクセスできます。
クラスタでEVC(Enhanced VMotion Compatibility)が有効になっていることを確認します。
ステップ 1:VMware vCenterにログインし、Home and Clustersに移動します。
ステップ 2:vCenterクラスタをクリックします。この例では、San_Joseという名前のクラスタを示します。
ステップ 3:Configureを選択し、Configurationの下でVMware EVCをクリックして、EDITを選択します。
ステップ 4:使用する各プロセッサのEVCモードを必ずEnabledに変更してください。
仮想マシン(VM)でのアフィニティルールの確認
ゲストVMでアフィニティルールが作成されているかどうかを確認します。
ステップ 1:VMware vCenterからクラスタに移動します。
ステップ 2:Home and Clustersに移動します。この例では、San_Joseという名前のクラスタを示します。
ステップ 3:Configureを選択します。ConfigurationでVM/Host Rulesを選択し、ルールが作成されたことを確認します。
ESXiエージェントマネージャ(EAM)
HXDP 5.0(x)以降のリリースでは、SCVMのネットワークとデータストアを管理するためにESXiホストでEAMが使用されなくなりました。
HXDP 5.0(x)以前のバージョンでは、ネットワークとデータストアにSCVM情報が必要です。
ESXi Agent Manager(EAM)の状態が正常であることを確認します。
ステップ 1:VMware vCenterにログインします。
ステップ 2:Home and Clustersに移動し、各ESXiノードに移動します。
ステップ 3:VMware vCenterクラスタで、Configureに移動し、Virtual MachinesからAgent VM Settingsを選択します。
この例では、HyperFlexクラスタが5.0(2c)上にあるため、空白が表示されています
EAMを使用する場合は、vCenterに証明書エラーが表示されていないことを確認します。
EAMの詳細については、ここを参照してください。
vCenterおよびESXiライセンス
6.xから7.0にアップグレードする場合は、アップグレード前に新しいライセンスがあることを確認します。
アップグレード後は、評価モードが60日間しか有効になりません。
SSHの推奨事項
HXUSERロックアウト
ログインに失敗すると、ESXiユーザがロックされる可能性があります。
hxuserまたはrootユーザーのステータスを確認するには、次の手順に従います
ステップ 1:ESXiノードでrootとしてSSHセッションを開きます。
ステップ 2:pam_tally2 —user hxuser(またはroot user)を実行します。
ステップ 3:hxuserまたはrootがロックされていることを確認します。
[root@esxi1:~] pam_tally2 --user hxuser
Login Failures Latest failure From
hxuser 0
[root@esxi1:~] pam_tally2 --user root
Login Failures Latest failure From
root 0
[root@esxi1:~]
指定されたESXiユーザのロックを解除するには、次の手順を実行します。
ステップ 1:pam_tally2 —user hxuser —reset (またはrootユーザ)を実行します。を参照。
ステップ 2:Failuresのカウントが0に減ることを確認します。
[root@esxi1:~] pam_tally2 --user hxuser --reset
Login Failures Latest failure From
hxuser 0
[root@esxi1:~] pam_tally2 --user root --reset
Login Failures Latest failure From
root 0
ロックダウンモードまたは停止
ESXiホストのセキュリティを強化するには、ロックダウンモードを有効にする必要があります。この設定により、次の理由によるHyperFlexのアップグレードが防止されますhyperFlexクラスタアップグレードで無効にする必要があるチェックダウンモード。
ESXiロックダウンモードを無効にするには、次の手順を実行します。
ステップ 1:SSHをrootとしてESXiホストに直接実行します。
ステップ 2:F2キーを押して初期セットアップを実行します。
ステップ 3:ルートクレデンシャルを入力してDUCIセットアップを開きます。
ステップ 4:Configure Lockdownモード設定に移動し、disabledに変更します。
vCenterからロックダウンモードを無効にするには、
ステップ 1:vSphere Web Clientインベントリ内のホストを参照します。
ステップ 2:ポリシーの横の [レポート(Report)]管理tabキーを押しながらSettingsを参照。(6.7では、設定タブ)。
ステップ 3:[システム]で、を選択しますセキュリティプロファイルを参照。
ステップ 4:[ロックダウンモード]パネルで、編集を参照。
ステップ 5:クリックロックダウンモードロックダウンモードオプションのいずれかを選択します。
ロックダウンモード情報の詳細については、ここを参照してください
複製
レプリケーションが設定され、有効になっている場合は、アップグレードの前に一時停止する必要があります。
実行を使用したレプリケーションの一時停止 stcli dpスケジュールの一時停止 コマンドを発行し、アップグレード後に stcli dpスケジュールの再開 コマンドを使用して、アップグレードを実行します。
ドライブ障害
ドライブの障害により、HyperFlexクラスタのアップグレードが失敗します。HyperFlex Connect GUIでブロックリストまたは無視されたディスクを確認するには、次の手順に従います。
ステップ 1:HyperFlex Connect GUIを開き、https://<HyperFlex-virtual-ip-addres or fqdn>に移動します。
ステップ 2:System Informationに移動し、次にSystem Overviewタブを選択します。
ステップ 3:ディスクエラーがないか確認します。
ディスクの問題はCisco TACで修正する必要があります。
以前のマザーボードの交換、再導入、およびノードの削除
マザーボードの交換により、以前のホストUIDも新しいIDで置き換えられます。交換作業中に何らかの問題が発生した場合は、UIDの不一致が原因でHyperFlexアップグレードが失敗する可能性があります。
注:Intersight HealtCheckはIDの不一致を推奨します。HyperFlex ClusterをIntersightに接続してHyperFlex Cluster HealtCheckを実行することを強くお勧めします。
マザーボードの交換については、次の場所にあるstNode UUIDを比較してください。 ESXi CLIを使用して、UUID情報がHyperflexクラスタ内のUUIDと一致していることを確認します。
UIDを収集するには、次の手順を実行します。
ステップ 1:rootとしてESXiノードへのSSHセッションを開きます。
ステップ 2:次のコマンドを実行します。 hostsvc/hostsumm | grep -i uuid | grep -v instを参照。
ステップ 3:UUID情報を収集します。
[root@esxi2:~] vim-cmd hostsvc/hostsumm | grep -i uuid | grep -v inst
uuid = "1f82077d-6702-214d-8814-e776ffc0f53c", <----- ESXi2 ID
[root@esxi2:~]
[root@esxi2:~]
HyperFlexクラスタノードのUUID情報を取得するには、次の手順を実行します。
ステップ 1:HyperFlexクラスタのIPアドレスにSSHを実行します。
ステップ 2:コマンドstcli cluster infoを実行します。 |その他。
ステップ 3:stNodes IDを収集します。
hxshell:~$ stcli cluster info | more
stNodes:
----------------------------------------
id: c4a24480-e935-6942-93ee-987dc8e9b5d9
type: node
name: esxi1
----------------------------------------
id: 1f82077d-6702-214d-8814-e776ffc0f53c <----- ID for ESXi2
type: node
name: esxi2
----------------------------------------
id: 50a5dc5d-c419-9c48-8914-d91a98d43fe7
type: node
name: esxi3
----------------------------------------
stcliクラスタ情報 IDがESXiノードに表示される情報と一致することを確認します。
HXとvCenterのミスマッチ
HyperFlexクラスタ上のデータセンター、クラスタ、データストア名などのvCenter情報がvCenterと一致していることを確認します。情報の不一致により、HyperFlexクラスタのアップグレードが失敗します。
最新の情報を入手するには、次の手順に従います。
ステップ 1:RUN adminとしてHyperFlexクラスタIPにSSHで接続します。
ステップ 2:stcliクラスタ情報の実行 | grep -i vcenter。
ステップ 3:クラスタ内の登録済みvCenter情報を収集します。
hxshell:~$ stcli cluster info | grep -i vcenter
vCenterClusterName: vcenter-cluster
vCenterDatacenter: hx-cluster-name
vCenterURL: https://vcenter-url
vCenterDatacenterId: datacenter-name
vCenterClusterId: domain-c5124
vCenterUrl: https://vcenter-url
vCenterVersion: 7.0.2 Build-18455184
HyperFlex vCenterの再登録
名前の大文字と小文字は区別されることに注意してください。前の出力の名前とvCenter情報が一致しない場合は、vCenterの再登録が必要です。
vCenterをHyperflexクラスタに再登録するには、ここにあるvCenter登録ビデオを確認してください
Vcenterを再登録するには、次の手順を実行します。
ステップ 1:adminとしてクラスタIPアドレスにSSHを実行します。
ステップ 2:stcli cluster reregisterコマンドを実行します。
stcli cluster reregister [-h] --vcenter-datacenter NEWDATACENTER --vcenter-cluster NEWVCENTERCLUSTER --vcenter-url NEWVCENTERURLIP [--vcenter-sso-url NEWVCENTERSSOURL] --vcenter-user NEWVCENTERUSER
hxshell:~$ stcli cluster reregister --vcenter-datacenter MyData-Center --vcenter-cluster Cluster-Name --vcenter-url https://vcenter1-url --vcenter-user
Reregister StorFS cluster with a new vCenter ... Enter NEW vCenter Administrator password: Cluster reregistration with new vCenter succeeded hxshell:~$
関連情報