Cisco HyperFlex システム 3.0 トラブルシューティングリファレンスガイド

問題のトラブルシューティング

この項では、HyperFlex のコンポーネントおよびプロセスで発生する可能性のある問題とそれらの問題の回避策について説明します。

IP アドレスを展開するページに重複したサーバが表示される

Description

HX Data Platformの展開中に、IP アドレスページには同じサーバーが 2 回表示されます。

アクション: ペアから1つだけを選択します

これは、UCS Manager の設定をスキップし、HX Data Platformが UCS Manager とインポートした JSON ファイルの両方を参照する場合に発生する可能性があります。IP アドレスの各ペアの 1 つのみを選択します。

FI を手動で再起動するとインストールが失敗する

Description

展開中に FI を手動で再起動すると、インストールが失敗します。

アクション: 次を再起動する HX Data Platform インストーラ

手順

ステップ 1	HX Data Platform インストーラ VM を再起動します。
ステップ 2	展開を再開します。

UCS Manager だけをアップグレード中に、コントローラ VM の電源がオンにならないことがある

Description

UCS Manager のみのアップグレード中に、ノードのメンテナンスモードが終了した後で、コントローラ VM の電源がオンにならないことがあります。

アクション：vCenter で EAM サービスを再起動する

VMware vCenter EAM サービスは、コントローラ VM で自動的に電源オンになりません。コントローラ VM は EAM リソースプールの外部にあります。

vCenter で EAM サービスを再起動するには、/etc/init.d/vmware-eam restart を実行します。

EAM によりすべての EAM エージェント VM が再スキャンされ、これらの VM で発生していたすべての問題（コントローラ VM の電源オンの問題を含む）が解決します。

展開またはアップグレードが「「NoneType」オブジェクトに「scsiLun」属性がありません（'NoneType' object has no attribute 'scsiLun'）」というエラーで失敗する

説明

展開またはアップグレードが「「NoneType」オブジェクトに「scsiLun」属性がありません（'NoneType' object has no attribute 'scsiLun'）」というエラーで失敗します。

アクション：切断してから再接続する

これは、VMware の問題です。vCenter からホストとの接続を切断してから、ホストを再接続します。

重要	クラスタからノードを削除しないでください。これは接続の切断のみです。

アップグレードでメンテナンスモードに切り替わらない

説明

ノードがメンテナンスモードに切り替わらなかったためにアップグレードが失敗します。

アクション：vmware-vpxd サービスを再起動する

その他のすべての検証が正常に完了した場合、これは VMware の問題（VMware VPXD のクラッシュ）の可能性があります。

手順

ステップ 1

VPXD が再起動していることを確認し、再起動していない場合は ESX コマンドラインから手動で再起動します。

# service vmware-vpxd status

# service vmware-vpxd start

ステップ 2

アップグレードを再試行します。

メンテナンスモードに正常に切り替わるはずです。

アップグレードが vMotion 互換性検証で失敗する

説明

再試行したアップグレードが、vMotion 互換性検証で失敗します。

アクション：ホストからストレージシステムを再スキャンする

これは vCenter と ESXi の間の同期の問題が原因で発生します。

vCenter クライアントを使用して ESX ホストでストレージシステムを再スキャンします。

次の URL で VMware の記事『Perform Storage Rescan in the vSphere Client』を参照してください：

https://docs.vmware.com/en/VMware-vSphere/6.0/com.vmware.vsphere.hostclient.doc/GUID-FA49E8EF-A3DC-46B8-AA5B-051C80762642.html

VM 電源オン時のエラーのアップグレード：「互換性のあるホストが見つかりませんでした

説明

アップグレードの試行時に、「互換性のあるホストが見つかりませんでした（No compatible host was found）」エラーが発生し、VM の電源がオンになりません。

アクション：VM の電源を手動でオンにする

手順

ステップ 1

ESX コマンドラインから VM の電源をオンにします。

ステップ 2

コントローラ VM コマンドラインを使用して次のコマンドを実行します。

# stcli cleaner start

アップグレード時に 2 つのノードで障害が発生すると、コントローラ VM の電源オンが失敗する

説明

アップグレード中に 2 つのノードで障害が発生すると、コントローラ VM の電源がオンではないためにアップグレードが失敗します。

アクション：EAM サービスを再起動する

手順

ステップ 1

vCenter EAM サービスを再起動します。

ESX コマンドラインから次のコマンドを実行します。

# /etc/init.d/vmware-eam restart

ステップ 2

アップグレードを実行します。

6.5 より前の vCenter のアップグレードで、一部のコントローラ VM がグループ化される

Description

6.5 よりも古いバージョンの vCenter を使用して HX Data Platform をアップグレードした後に、「ESX エージェント（ESX Agent）」というラベルが付いたリソースプールに一部のコントローラ VM がリストされます。

アクション：必要なし

特に対処の必要はありません。機能への影響はありません。コントローラ VM などすべての仮想マシンは EAM 登録済みであり、HX Clusterに維持されます。すべての HX Clusterの操作は期待どおりに動作します。

グループ操作を実行する必要がある場合は、vCenter インターフェイスからコントローラ VM を ESX エージェントリソースプールにドラッグアンドドロップします。

vCenter の問題によりノードがアップグレードに失敗する

Description

オンラインアップグレード中に、vCenter デーモンがノード上でクラッシュすることがあります。クラッシュした場合は、ノードで HX メンテナンスモードを開始できません。HX メンテナンスモードが開始されないと、ノードでアップグレードを完了できません。vCenter が正常に機能している他のすべてのノードでは、アップグレードが完了します。

アクション：影響を受けたノードでアップグレードを実行し直してください。

手順

ステップ 1

vCenter の問題を修正します。

ステップ 2

クラスタ内の任意のノードからアップグレードを再開します。

HX Data Platform は、すでにアップグレードしているノードをスキップし、先に進んでアップグレードできていないノードのアップグレードを完了します。

HX Data Platform インストーラが別の vCenter によって管理されているホストを表示する

Description

HX Data Platform インストーラが、別の vCenter で管理されているホストを表示します。

ホストを vCenter から削除すると、通常はそのホストのサマリー情報から managementServerIP が削除されます。

ホストの削除時にホストのサービスが実行されていなかった場合、vCenter はホストが削除された後もそのホストを表示し続けます。

アクション：vCenter を再起動する

vCenter を再起動すると、問題のホストは vCenter で表示されなくなるはずです。

HX Data Platform と UCS Manager 間で異なる構成の設定

Description

ストレージクラスタのインストール、アップグレード、拡張プロセス実行時に、HX Data Platform インストーラは入力された構成の設定と UCS Manager 内の設定を確認します。たとえば次のシナリオで、不一致が生じる場合があります。

検証や設定を適用できるようになるまでに、以前関連付けられていなかったサーバがそうではなくなることがあります。これらのサーバは関連付けを解除する必要があります。
HX Data Platform ストレージクラスタに以前関連付けられていたサーバを使用しています。これらのサーバは関連付けを解除する必要があります。
既存のストレージクラスタの設定情報を手動で入力すると、エラーが生じやすくなります。VLAN ID や LAN 設定などの情報は、UCS Manager に表示される情報と一致している必要があります。以前保存した設定ファイルを使用して設定をインポートしてください。

アクション：既存の設定をインポートする

ストレージクラスタのインストール、アップグレード、拡張を完了すると、設定を保存するオプションが利用できるようになります。このオプションを使ってクラスタの設定情報を保存し、ストレージクラスタに変更を加える必要が生じたときは、ファイルに保存されている構成の詳細情報をインポートします。

アクション：サーバの関連付けを解除する

UCS Manager を使ってサーバの関連付けを解除する手順については、『Cisco HyperFlex Systems Getting Started Guide』を参照してください。簡単に手順を説明すると以下のようになります。

手順

ステップ 1	UCS Manager で、[Associated] タブ > [`node`] > [Actions] > [Disassociate Server] の順に選択します。
ステップ 2	ノードの関連付けが解除されていることを確認し、[Unassociated] タブ > [`node`] > [Assoc State] の順に選択します。[removing] の場合は移行状態です。
ステップ 3	ノードが関連付けの解除を完了していることを確認します。[Assoc State] が [none] になるまで待機します。[Assoc State]、[removing] のノードは選択しないでください。

FQDN による DNS エラーでクラスタの作成に失敗する

Description

ストレージクラスタのオブジェクトを識別するために完全修飾ドメイン名（FQDN）を指定すると、クラスタの作成が失敗することがあります。通常は、指定したドメインネームサービス（DNS）サーバが利用できないために起こります。

これは、ドメイン名または IP アドレスで識別する HX Data Platform インストーラオブジェクトとして入力されるすべてのドメイン名オブジェクトに当てはまります。これには、vCenter Server、ESX サーバ、コントローラ VM のアドレス、ストレージクラスタ管理またはデータネットワークのアドレス、DNS サーバ、NTP サーバ、メールサーバ、または SSO サーバがあります。

アクション: DNS サーバを確認する

手順

ステップ 1	HX Data Platform インストーラ VM のコマンドラインにログインします。たとえば、`ssh` を使用します。
ステップ 2	指定された DN サーバが動作することを確認します。 DNS サーバの IP アドレスを確認します。 `# nslookup <dns_server>` ストレージクラスタで使用するように設定されているすべての DNS サーバについて繰り返します。
ステップ 3	クラスタの作成に必要な各オブジェクトが、指定された DNS サーバから解決できることを確認します。これらのオブジェクトは、JSON ファイルまたは HX DP インストーラ GUI フィールドを通じて指定されます。クラスタオブジェクトの IP アドレスを特定します。 `# nslookup <object> <dns_server>` `<object>` は、クラスタの設定で HX Data Platform インストーラに指定する可能性があるすべてのオブジェクト、つまり、vCenter Server、ESX サーバ、コントローラ VM のアドレス、ストレージクラスタ管理またはデータネットワークのアドレス、DNS サーバ、NTP サーバ、メールサーバ、SSO サーバなどの FQDN または IP アドレスです。クラスタの設定オブジェクトごとに繰り返します。
ステップ 4	手順 2 または手順 3 のいずれかが確認できない場合、HX Data Platform Installer GUI では完全修飾ドメイン名（FQDN）ではなく、IP アドレスのみを使用します。

オフラインアップグレードでのクラスタ起動コマンドエラー：ノードを利用できません（Node Not Available）

Description

オフラインアップグレード後、VMware EAM の問題により、一部のコントローラ VM が再起動しないことがあります。stcli start cluster コマンドが「Node not available」というエラーを返します。

アクション：コントローラ VM の電源を手動でオンにして、ストレージクラスタを起動してください。

手順

ステップ 1

コントローラ VM の電源を手動でオンにします。

vSphere Web クライアントにログインします。
電源がオンになっていないコントローラ VM を見つけ出します。

ナビゲータで [vCenter Inventory Lists] > [Virtual Machines] > [vm] を選択します。

ストレージコントローラ VM の名前には、stCtlVM というプレフィックスが付きます。
右クリックするか、または [Actions] メニューから、[Power] > [Power On] を選択します。
すべてのストレージコントローラ VM の電源がオンになるまで、この手順を繰り返します。

ステップ 2

ストレージクラスタを再起動します。

任意のコントローラ VM のコマンドラインにログインします。
コマンドを実行します。

# stcli cluster start

HX プラグインの導入後に vSphere Replication プラグインが失敗する

Description

このエラーは、HX Data Platform プラグインをインストールした後に vSphere Replication プラグインをインストールすると発生します。最初に vSphere Replication プラグインをインストールしてから、HX Data Platform プラグインをインストールすることを推奨します。

アクション：HX Data Platform プラグインの登録を解除する

このタスクでは、HX 拡張機能を vCenter Managed Obejct Browser（MOB）から削除します。

始める前に

vSphere Replication プラグインを vCenter MOB から削除します。
vSphere Replication 仮想マシンを vCenter インベントリから削除します。
HX vCenter クラスタを vCenter データセンターから削除します。

手順

ステップ 1	まだの場合、vSphere ESX Agent Manager SDK をダウンロードします。
ステップ 2	VCenter から HyperFlexクラスタオブジェクトを削除します。
ステップ 3	vCenter サーバ MOB 拡張マネージャにログインします。ブラウザで、パスとコマンドを入力します。 `https://vcenter_server/mob/moid=ExtensionManager&doPath=extensionList` ログインクレデンシャルを入力します。
ステップ 4	vCenter Server MOB 拡張マネージャで、MOB と、削除したクラスタに関連付けられている拡張機能を表示します。 `rootFolder` を見つけて `(Datacenters)` リンクをクリックします。 [Data Object Type: ServiceContent] ページで [Name] 列をスクロールして、[Value] 列に示されているリンクをクリックします。 `childEntity` を見つけて `(datacenter_name)` リンクをクリックします。 [Managed Object Type: ManagedObjectReference:Folder] ページで [Name] 列をスクロールして、[Value] 列に示されているリンクをクリックします。 `hostFolder` を見つけて `(host)` リンクをクリックします。 [Managed Object Type: ManagedObjectReference:Datacenter] ページで [Name] 列をスクロールして、[Value] 列に示されているリンクをクリックします。 `childEntity` を見つけて、`(datacenter_name)` に対応する値をメモします。この値は、登録解除するクラスタのドメイン ID です。 [Managed Object Type: ManagedObjectReference:Folder] ページで [Name] 列をスクロールして、[Value] 列に示されているリンクをクリックします。
ステップ 5	[ExtensionManager] ページで、拡張機能を登録解除します。ブラウザで、パスとコマンドを入力します。 `https://vcenter_server/mob/moid=ExtensionManager&method=unregisterExtension` 拡張キーの値または `(datacenter_name_link)` を入力し、[Invoke Method] をクリックします。
ステップ 6	削除したクラスタが、vCenter が HX Data Platform プラグインと通信するために使用していた CIP である場合、vsphere-client サービスを再起動します。 vCenter Server MOB 拡張マネージャで、MOB と、削除したクラスタに関連付けられている拡張機能を表示します。 `extensionManager` を見つけて `ExtensionManager` リンクをクリックします。 [Data Object Type: ServiceContent] ページで [Name] 列をスクロールして、[Value] 列に示されているリンクをクリックします。 `extensionLIst["com.springpath.sysmgmt"]` リンクを見つけます。 [Managed Object Type: ManagedObjectReference:ExtensionManager] ページで [Value] 列をスクロールして、この列に示されているリンクをクリックします。完全なリストを表示する必要がある場合は、`(more...)` をクリックします。 `server` を見つけて `server` リンクをクリックします。 [Data Object Type: Extension] ページで [Name] 列をスクロールして、[Value] 列に示されているリンクをクリックします。 `/plugins/stGui-1.0.zip` で終わる URL を見つけます。これは HX Data Platform プラグインに使用される CIP です（例：`"https://cs002-cip-m.eng.storvisor.com/plugins/stGui-1.0.zip"`）。 [Data Object Type: ExtensionServerInfo[]] ページで明細リストをスクロールして、[Name: url]、[Type: string] で [Value] が `/plugins/stGui-1.0.zip` のものを見つけます。
ステップ 7	前のステップで見つけた CIP が、vCenter から削除したクラスタに関連付けられている場合、拡張機能をクリーンアップする必要があります。 `ssh` を使用して vCenter にログインします。 HX Data Platform プラグイン拡張機能フォルダをクリーンアップします。バージョンは古いものの、まだ互換性のある HX Data Platform プラグインを別のクラスタが実行している場合は、この作業が必要です。 vSphere サービスを再起動します。コマンドを実行します。 `# service vsphere-client restart`
ステップ 8	すべてのセッションからログアウトし、再度ログインします。

次のタスク

データセンタークラスタを再作成します。ホストを一度に 1 つずつ HX vCenter クラスタに追加します。
データストアから vSphere Replication 仮想マシンを再登録します。
vSphere Replication アプリケーションの Web フロントエンドで、vSphere Replication プラグインを再作成します。再作成した vSphere Replication プラグインが vCenter 内で使用可能であることを確認します。
HX Data Platform インストーラから HX Data Platform プラグインを再インストールし、ストレージクラスタを再作成します。

アップグレードは失敗するが、すべてのノードが最新であると報告される

Description

この問題は、vCenter から送信される RemoteException によるものです。この例外の原因として最も可能性が高いのは、HX ストレージクラスタと vCenter 間のネットワーク接続が断続的に途切れることにあります。

アクション：アップグレードを再試行します

オンラインアップグレードの再開が失敗する

Description

まれに、アップグレードが失敗した HX ストレージクラスタでオンラインアップグレードを再開しようとすると、アップグレードが再び失敗することがあります。ただし、HX クラスタは障害状態から回復して、正常な状態になっています。

アクション：もう一度アップグレードを再試行する

CLI を使用してアップグレードを再試行する場合は、stcli cluster upgrade コマンドで -f または --force オプションを使用します。あるいは、HX Data Platform プラグインを使用してアップグレードを再試行してください。

Cisco UCS のアップグレード中にコントローラ VM の電源がオンにならない

Description

vSphere がメンテナンスモードを終了した際、サーバ上の VM の電源がオンにならないことがあります。電源がオンにならない可能性がある VM には、ストレージコントローラ VM も含まれます。

アクション：コントローラ VM を手動で再起動する

これは、VMware の既知の問題です。詳細については、VMware KB の記事「Auto-Start Is Not Run When Manually Restarting a Host in Maintenance Mode」を参照してください。

サポートされていないボードを搭載したサーバストレージコントローラからのファームウェアのアップグレードが失敗する

Description

UCS ファームウェアのアップグレードが失敗しました。考えられる理由は、サポートされていないボードが HX サーバで使用されていることです。

アクション：ボードをデコミッションしてから再コミッションする。

手順

ステップ 1	参照されているボードをデコミッションしてから再コミッションします。
ステップ 2	サーバが正常であることを確認します。
ステップ 3	ファームウェアのアップグレードを再試行します。
ステップ 4	これで問題が解決しない場合は、Cisco TAC に連絡してサポートを求めてください。

vCenter の問題によりノードがアップグレードに失敗する

Description

オンラインアップグレード中に、vCenter デーモンがノード上でクラッシュすることがあります。クラッシュした場合は、ノードで HX メンテナンスモードを開始できません。HX メンテナンスモードが開始されないと、ノードでアップグレードを完了できません。vCenter が正常に機能している他のすべてのノードでは、アップグレードが完了します。

アクション：影響を受けたノードでアップグレードを実行し直してください。

手順

ステップ 1

vCenter の問題を修正します。

ステップ 2

クラスタ内の任意のノードからアップグレードを再開します。

HX Data Platform は、すでにアップグレードしているノードをスキップし、先に進んでアップグレードできていないノードのアップグレードを完了します。

ノードが正常な状態に戻るのを待機してアップグレードが停止する

Description

LSI のバージョンがバージョン 9 よりも古い場合、ノードでのアップグレード時にディスクが見つからないことがあります。ノードが正常でない場合、アップグレードを続行できません。

LSI バージョン 9 は、UCS ファームウェアバージョン 2.2(6f) と 2.2(7c) に関連付けられています。

アクション：ノードを手動で再起動する

手順

ステップ 1

コントローラ VM コマンドラインにログインします。たとえば ssh を使用します。

ステップ 2

ディスクが表示されていることを確認します。lsscsi コマンドを実行します。

# lsscsi

[2:0:0:0]    disk    ATA      INTEL SSDSC2BB12 CS01  /dev/sdb
[2:0:1:0]    disk    SEAGATE  ST1200MM0088     N003  /dev/sdc
[2:0:2:0]    disk    SEAGATE  ST1200MM0088     N003  /dev/sdd
[2:0:3:0]    disk    SEAGATE  ST1200MM0088     N003  /dev/sde
[2:0:4:0]    disk    SEAGATE  ST1200MM0088     N003  /dev/sdf
[2:0:5:0]    disk    SEAGATE  ST1200MM0088     N003  /dev/sdg
[2:0:6:0]    disk    SEAGATE  ST1200MM0088     N003  /dev/sdh
[2:0:7:0]    disk    ATA      INTEL SSDSC2BX48 CS01  /dev/sdi
[3:0:0:0]    disk    VMware   Virtual disk     1.0   /dev/sda

ステップ 3

ノードを手動で再起動します。

クラスタの拡張エラー：クラスタが見つからない

説明

HX Data Platform のクラスタ拡張ウィザードで、HX ストレージクラスタが見つかりませんでした。

アクション：クラスタの IP アドレスを手動で入力する

クラスタ拡張ウィザードの [Management IP Address] フィールドに、手動で HX ストレージクラスタ管理 IP アドレスを入力します。

クラスタ IP アドレスを見つけるには、次のようにします。

手順

ステップ 1	vSphere Web クライアントから、[vCenter Inventory Lists] > [Cisco HyperFlex Systems] > [Cisco HX Data Platform] を選択します。
ステップ 2	ストレージクラスタ名をクリックして選択します。パネルの最上部にある [Action Menu] から、[Summary] を選択します。
ステップ 3	表示された概要から、クラスタ管理 IP アドレスを見つけます。

DNS サーバが見つからないためにクラスタの拡張が失敗する

Description

ストレージクラスタの拡張では、新しいノードを FQDN ではなく、IP アドレスを使用して指定する場合でも、DNS サーバが必要です。HX Data Platform インストーラは、クラスタの作成中に指定されたすべての DNS サーバをチェックします。

以前指定された DNS サーバのいずれかが到達不可能な場合、クラスタの拡張は失敗します。
HX Data Platform のインストール時に DNS サーバを指定しなかった場合、クラスタの拡張は失敗します。

これらの条件のいずれかが当てはまる場合は、是正措置を実行します。

アクション：正しい DNS サーバを特定して指定する

手順

ステップ 1	任意の HX コントローラ VM のコマンドラインにログインします。たとえば、`ssh` を使用します。
ステップ 2	ストレージクラスタに設定されている DNS サーバを特定します。 `# stcli services dns show` サンプル応答 `10.64.1.8` `10.64.1.9` DNS のアドレスが表示されない場合は、手順 4 に進みます。
ステップ 3	ストレージクラスタで利用できなくなっているすべての DNS サーバを削除します。 `# stcli services dns remove --dns <dns_server>`
ステップ 4	ストレージクラスタに新しい DNS サーバを追加します。ストレージクラスタを作成したときに DNS サーバを指定しなかった場合は、疑似 DNS サーバを追加します。 `# stcli services dns add --dns <dns_server>`
ステップ 5	クラスタの作成に必要な各オブジェクトが、指定された DNS サーバから解決できることを確認します。これらのオブジェクトは、JSON ファイルまたは HX DP インストーラ GUI フィールドを通じて指定されます。クラスタオブジェクトの IP アドレスを特定します。 `# nslookup <object> <dns_server>` `<object>` は、クラスタの設定で HX Data Platform インストーラに指定する可能性があるすべてのオブジェクト、つまり、vCenter Server、ESX サーバ、コントローラ VM のアドレス、ストレージクラスタ管理またはデータネットワークのアドレス、DNS サーバ、NTP サーバ、メールサーバ、SSO サーバなどの FQDN または IP アドレスです。クラスタの設定オブジェクトごとに繰り返します。オブジェクトが解決に失敗する場合は、DNS サーバファイルにエントリを追加します。
ステップ 6	指定された DN サーバが動作することを確認します。 DNS サーバの IP アドレスを確認します。 `# nslookup <dns_server>` ストレージクラスタで使用するように設定されているすべての DNS サーバについて繰り返します。
ステップ 7	手順 5 と手順 6 を繰り返し、追加されたすべての DNS サーバが有効で、すべての HXDP オブジェクトが各 DNS サーバを通じて解決できることを確認します。
ステップ 8	HX Data Platform インストーラに戻り、ストレージクラスタの拡張を続行します。

古い HX インストーラによりクラスタの拡張が失敗する

Description

拡張のために追加したクラスタノードが間違ったクラスタに追加されます。これは、複数のクラスタの作成で同じ HX Data Platform インストーラを使用し、その後、その同じ HX DP インストーラを使用してそれらクラスタの 1 つを拡張する場合に起こります。HX DP インストーラは、デフォルトでは最新のクラスタにノードを追加します。

アクション： HX Data Platform インストーラ OVA を再展開する

手順

ステップ 1	HX Data Platform インストーラ OVA を再展開します。
ステップ 2	新しい HX Data Platform インストーラを使用してクラスタを拡張します。

手動による ESX インストール後の statsd の再起動

Description

手動で HX Data Platform サーバに ESX を再インストールした後、パフォーマンス統計情報が正しく表示されるように、stats daemon をリセットします。

アクション：stats daemon の再起動

手順

ステップ 1

ESX ホストのコントローラ VM のコマンドラインにログインします。

ステップ 2

restart コマンドを実行します。

# /etc/init.d/statsd restart

ステップ 3

ストレージクラスタのすべての ESX ホストのコントローラ VM でステップ 1 およびステップ 2 を繰り返します。

services.sh restart 実行時の scvmclient 管理サービスの再起動

説明

services.sh restart を実行すると、scvmclient 管理サービスが再起動する。

注意	このコマンドを実行すると、特定のホストから HX データストアが接続解除されます。

ノードをメンテナンスモードにします。
ESX コマンドラインにログインします。
サービスを再起動します。

# services.sh restart
ESX ホストデーモン、vCenter エージェントサービス、およびコントローラ VM を再起動します。

# /etc/init.d/hostd restart

# /etc/init.d/vpxa restart

ESX サーバの再起動によるアップグレードの終了とメンテナンスモードの開始

説明

アップグレード中の ESX サーバの電源リセットにより、アップグレードが終了し、サーバでメンテナンスモードが開始されます。

アクション：メンテナンスモードの手動での終了

手動でサーバのメンテナンスモードを終了します。アップグレードが続行します。

EAM がコンピューティングノードで起動しない

説明

EAM がコンピューティングノードで自動的に再起動しませんでした。

アクション：EAM を手動で再起動する

ノードがダウンした場合、ノードの削除に失敗する

説明

3 つのノードだけが稼働している場合にはノードを削除することはできません。

アクション：はじめに交換ノードを追加する

3 ノードクラスタ内のノードを交換する場合は、TAC によるサポートが必要です。ノードで障害が発生しているためにクラスタのノード数が 3 になった場合、ノードを交換するには TAC によるサポートが必要です。

HA が有効になっている ESX ホストの再起動

説明

システムがアクセスできないストレージクラスタのホストの HA を有効にした場合、ESX ホストを再起動すると、ストレージコントローラ VM の電源がオフになります。

これは、VMware の HA 障害の処理方法と ESX Agent Manager（EAM）設定間の相互作用によるものです。これにより、ストレージコントローラ VM が、復元後に電源オンにならない現象が生じる可能性があります。

アクション：HA が有効になっている ESX ホスト上でストレージコントローラ VM の電源をオンにする

手順

ステップ 1	最初に障害が発生したホスト上で HA を再設定します。
ステップ 2	ストレージコントローラ VM を手動で電源オンにします。

クラスタへの別ノード同時追加時のノード障害

説明

既存のストレージクラスタにノードを追加する場合、ストレージクラスタは、再調整が完了するまで元のストレージクラスタと同じ HA 復元力を持ち続けます。

たとえば、3 ノードのストレージクラスタがあり、2 つのコンバージドノードをストレージクラスタに追加する場合などです。再調整が完了するまで、ストレージクラスタは、5 ノードのストレージクラスタではなく、3 ノードのストレージクラスタとして動作します。したがって、バランスの再調整が完了する前にノードで障害が発生すると、ストレージクラスタのステータスは低下します。

（注）

再調整は通常、次のような状況で発生します。

24 時間の再調整スケジュールごとに行われ、ノードに障害が発生した場合の 2 時間後、またはストレージクラスタの領域が不足している場合にも行われます。
1 つのディスクの使用率が 50 % を超えた場合またはディスククラスタの集約使用率が 50 % 未満の場合。

アクション：ストレージクラスタの再調整を手動で開始する

手順

ステップ 1

ストレージコントローラ VM のコマンドラインから次のコマンドを実行します。

# stcli rebalance start --force

ステップ 2

再調整ステータスをモニタするには、次のコマンドを使用します。

# stcli rebalance status

vNIC または vHBA の変更後の PCI パススルーの設定

Description

vNIC または vHBA を手動で HX サービスプロファイルまたはサービスプロファイルテンプレートに追加すると、PCI デバイスが再列挙され、VMware directpath I/O 設定が失われます。サービスプロファイルを変更すると、ホストハードウェアが更新されるため、PCI パススルーを再設定する必要があります。サービスプロファイルを変更した ESX ホストごとに次の手順を実行します。

変更した ESX ホストのストレージコントローラ VM で次の手順を実行します。

アクション：ESX ホスト上で vSphere サービスプロファイルを更新する

手順

ステップ 1	ESX ホストを HX メンテナンスモードにします。
ステップ 2	サービスプロファイルで変更（ハードウェアの追加など）を行うか、変更を確認します。
ステップ 3	ESX ホストをリブートします。このホストのダイレクトパス設定が失われます。
ステップ 4	vCenter にログインして、[DirectPath I/O Configuration] ページを選択します。 vCenter クライアントで、`[ESX ホスト（ESX host）]` > [設定（Configuration）] タブ > [ハードウェア（Hardware）] ペイン > [詳細設定（Advanced Settings）] > [編集（Edit）] の順に選択します。 vCenter Web クライアントの [vCenter インベントリ（vCenter Inventory）] で、[リソース（Resources）] > [ホスト（Hosts）] > `[ESX ホスト（ESX host）]` > [管理（Manage）] > [設定（Settings）] > [ハードウェア（Hardware）] > [PCI デバイス（PCI Devices）] > [編集（Edit）] の順に選択します。
ステップ 5	パススルー用の LSI カードを選択します。 [DirectPath I/O Configuration] ページから、[Configure Passthrough] を選択します。 [Mark devices for passthrough] リストから、パススルー用の LSI カードを選択します。 [OK] をクリックします。
ステップ 6	ESX ホストをリブートします。
ステップ 7	HX ストレージコントローラ VM（StCtlVM）の設定を編集して、PCI デバイスを HX ストレージコントローラ VM に再マップします。不明な PCI デバイスを見つけて削除します。 vCenter クライアントで、[`HX storage controller VM`] を右クリックして [Edit Settings] > [PCI device 0] > [Remove] > [OK] の順に選択します。 vCenter Web クライアント：[`HX storage controller VM`] を右クリックし、[Edit Settings] > [Remove PCI device 0] > [OK] の順に選択します。 LSI ロジック PCI デバイスを見つけて追加し直します。 vCenter クライアント：[`HX storage controller VM`] を右クリックし、[Edit Settings] > [Add] > [PCI Device] > [LSI Logic PCI device] > [OK] の順に選択します。 vCenter Web クライアント：[`HX storage controller VM`] を右クリックし、[Edit Settings] > [PCI Device] > [Add] > [LSI Logic PCI device] > [OK] の順に選択します。
ステップ 8	HX メンテナンスモードから ESX ホストを削除します。ホストが再びアクティブになると、HX ストレージコントローラ VM が正常にブートして、ストレージクラスタに再参加します。

3 ノードのストレージクラスタ上で、すべてまたは大半のディスクに障害が発生すると、データの割り当てができない

説明

ノード上のすべてのハードディスクに障害が発生すると、HX Data Platform はノードにデータを割り当てることができません。3 ノードのストレージクラスタでこの問題が発生した場合、HX Data Platform は、データの整合性を維持する上で最低限必要な 3 つのデータのコピーを維持することができません。その結果、仮想的な ENOSPC 状態となります。

ノード上で複数のハードディスクに障害が発生し続けた場合、ストレージクラスタはノードへの書き込みを行おうとし、ディスク上の残りの領域を使用することから、不安定な状態となります。たとえば、3 つのノードすべてに 10 台の HDD があり、3 番目のノード上で 9 台の HDD に障害が発生した場合、不安定な状況が生じた結果、3 番目のノード上のディスクでは、クラスタのサイズが実際のサイズの 10 % に制限されます。これは、物理的な ENOSPC 状態です。また、オールパスダウン（APD）状態を引き起こす可能性もあります。

アクション：ストレージクラスタ内のすべてのノード上で、ストレージを物理的に調整します。

手順

ステップ 1	破損したディスクを問題のないディスクと交換します。
ステップ 2	ストレージクラスタに別のノードを追加します。
ステップ 3	確実に整合性がとれるように、ノードのストレージキャパシティを調整します。
ステップ 4	ストレージクラスタが自動的に回復しない場合は、ストレージクラスタを再起動する必要があります。クラスタ内のいずれかのノード上で、ストレージコントローラ VM のコマンドラインにログインします。ストレージクラスタをシャットダウンします。 `stcli cluster shutdown` ストレージクラスタを再起動します。 `stcli cluster start`

ディスクを削除するとストレージコントローラ VM の再起動に失敗する

説明

ディスクを削除して、自動再スキャンが完了する前にストレージコントローラ VM を再起動した場合、ストレージコントローラ VM の電源がオンにならない場合があります。

アクション：ディスクの削除後にストレージコントローラ VM の電源をオンにする

手順

ステップ 1

ストレージコントローラ VM の電源がオフになっていることを確認します。

ステップ 2

スクリプトを実行します。

/opt/springpath/support/rescanLuns.sh

ステップ 3

ストレージコントローラ VM の電源をオンにします。

ストレージコントローラ VM 上で障害が発生した SSD ホスティングを復旧させる

説明

ストレージコントローラ VM をホストする SSD に障害が発生した場合、SSD を復旧させる必要があります。

アクション：障害が発生した SSD を復旧させる

手順

ステップ 1	障害が発生した SSD を搭載したホストのコマンドラインにログインします。
ステップ 2	SSD のステータスが [dead timeout] になっていることを確認します。 `esxcli storage core device list -d SSD_ID \| grep 'Status:'` `Status: dead timeout`
ステップ 3	ストレージコントローラ VM の `vmx` をすべて強制終了させます。 `ps \| grep vmx \| grep -i stCtlvm` `kill -9 process_id_of_controller_vm`
ステップ 4	ストレージアダプタを再スキャンします。 `esxcli storage core adapter rescan -a`
ステップ 5	同じ仕様の新しい SSD にディスクを置き換えます。
ステップ 6	`hostd` を再起動します。
ステップ 7	ストレージコントローラ VM の電源をオンにします。

コントローラ VM の電源をオンにできない

Description

vSphere EAM が、リソース不足のためにコントローラ VM の電源をオンにできませんでした。

これは、vSphere HA がオンであり、アドミッションコントロールが [Reserved failover capacity to be at 1 host] に設定されている場合に発生します。この設定では、HA アドミッションコントロールは 1 つのホストが完全にフェールオーバーするのに十分なリソースを予約します。

アクション：vSphere アドミッションコントロールを調整する

VMware ドキュメント『Best Practices for Admission Control』（https://docs.vmware.com/en/VMware-vSphere/6.0/com.vmware.vsphere.avail.doc/GUID-BD6D9434-84C8-4937-BC76-04852F5EA136.html）を参照します。

vSphere を適切に調整します。

自動 vMotion 移行がタイムアウトエラーで失敗する

Description

この問題は、16 + 16 ノードのクラスタで観察されています。これは、VMware の既知の問題です。詳細については、VMware KB の記事「vMotion of a VM fails with the error: "Timed out waiting for migration data" (2143834)」を参照してください。

アクション：ネットワーク接続を確認する

2 つのノードの障害によりストレージコントローラ VM の電源オンに失敗する

Description

これは、VMware EAM（ESX Agent Manager）の問題が原因です。EAM がホスト上の VM を正しくマーキングしていません。

アクション：ストレージクラスタを再登録する

ストレージクラスタを再登録して vCenter ビューを同期します。ストレージコントローラ VM で、次のコマンドを実行します。

# stcli cluster register

HA および DRS が有効な状態でホストに VM を追加できない

Description

ユーザ VM の電源オンが「All required agent virtual machines are not currently deployed on host 'hostname' and the controller VM on the same ESX host is down.」で失敗します。

HA では、エージェントとしてマークされているいずれかの VM（この場合はコントローラ VM）の電源がオンではない場合には、ホスト上で VM の電源をオンにすることはできません。

DRS がこのホストにユーザ VM を配置する場合、この VM は電源オンになりません。

アクション：次の手順を実行する。

手順

ステップ 1	vCenter クラスタから、[DRS Automation] 設定を [Manual] に変更します。
ステップ 2	ESX ホストから VM の電源を直接オンにします。
ステップ 3	[Power On] ダイアログボックスで、コントローラ VM の電源がオンになっている ESX ホストを選択します。

ディスク共有の制限が設定された VM でのパフォーマンス低下

説明

ディスク共有の制限が設定された VM の電源がオンになると、各データストアのパフォーマンスが低下する。

アクション：VMware 単位で想定されている動作です。

手順

ステップ 1	mclock スケジューラを無効化します。
ステップ 2	デフォルトのスケジューラに移動します。

ストレージクラスタが読み取り専用状態の場合の DRS による VM の移行

説明

ストレージクラスタが読み取り専用状態になっていると、それらがすでに読み取り専用のストレージクラスタにある場合であっても、VMware DRS プロセスは VM をデータストアに移行します。その結果 VM は起動不可になります。

アクション：ストレージクラスタが読み取り専用状態の場合には、DRS を手動で無効にします。

手順

ステップ 1

HX Data Platform ストレージクラスタを選択します。

vSphere Web クライアントナビゲータから、[vCenter Inventory Lists] > [vCenter Inventory Lists] > [Cisco HyperFlex Systems] > [Cisco HX Data Platform] > [cluster] の順に選択します。

ステップ 2

[Summary] タブを選択し、[VC Cluster] リンクをクリックして [vCenter Summary] タブに切り替えます。[Manage] > [Services] > [vSphere DRS] の順にクリックします。[Edit] をクリックして [Turn ON vSphere DRS] をオフにし、[OK] をクリックします。

古い EAM 拡張により VM の電源オンに失敗する

Description

HX Data Platform を部分的にインストールまたはアンインストールした場合、HX Data Platform 拡張用の古い ESX Agent Manager（EAM）が残る場合があります。これにより、HX Data Platform のインストール完了後に、仮想マシンの電源オンが妨げられる場合があります。Managed Object Browser（MOB）拡張マネージャを使用して、古い拡張を削除します。

アクション：古い EAM HX Data Platform 拡張を削除する

手順

ステップ 1	まだの場合、vSphere ESX Agent Manager SDK をダウンロードします。
ステップ 2	vSphere クラスタからデータセンターを削除します。
ステップ 3	HX クラスタの UUID を指定します。各エージェンシーには、基盤となる vSphere 拡張機能を参照するフィールド、`cluster_domain_id` があります。この拡張機能 ID には、Managed Object ID（moid）が使用されています。ストレージコントローラ VM コマンドラインから次のコマンドを実行します。 `# stcli cluster info \| grep vCenterClusterId: vCenterClusterId: domain-c26`
ステップ 4	ストレージクラスタの拡張機能を登録解除する：vCenter サーバ MOB 拡張機能マネージャにログインします。まず、HyperFlex クラスタを登録解除します。ブラウザで、パスとコマンドを入力します。 `https://vcenter_server/mob/?moid=ExtensionManager` `vcenter_server` は、ストレージクラスタが現在登録されている vCenter の IP アドレスです。管理者用のログイン資格情報を入力します。
ステップ 5	クラスタ ID を持つ HX ストレージクラスタ拡張機能を探します。[Properties] > [extensionList] をスクロールして、次のストレージクラスタ拡張機能を探します `com.springpath.sysmgmt.cluster_domain_id` および `com.springpath.sysmgmt.uuid.cluster_domain_id`。クリップボードに、これらの文字列をそれぞれコピーします。文字列の端に二重引用符（”）がある場合、それを除外します。
ステップ 6	各ストレージクラスタ拡張機能の登録を解除します。 [Methods] テーブルから [UnregisterExtension] をクリックします。 [UnregisterExtension] ポップアップに拡張機能のキー値である `com.springpath.sysgmt.cluster_domain_id` を入力します。例：`com.springpath.sysgmt.domain-26` [Invoke Method] をクリックします。
ステップ 7	古い EAM 拡張機能を削除する：vCenter サーバ MOB ESX エージェンシー拡張機能マネージャにログインします。次に、HyperFlex クラスタに関連付けられていた古い EAM 拡張機能を削除します。ブラウザで、パスとコマンドを入力します。 `https://vcenter_server/eam/mob/` `vcenter_server` は、ストレージクラスタが現在登録されている vCenter の IP アドレスです。管理者用のログイン資格情報を入力します。
ステップ 8	当該のクラスタ ID を持つ古い HX ストレージクラスタの ESX エージェンシー拡張機能を見つけます。 [Properties] > [agency] > [Value] をスクロールします。エージェンシーの値をクリックします。 [Agency] ウィンドウで、[Properties] > [solutionID] > [Value] の拡張機能を確認します。正しい `cluster_domain_id` があることを確認します。例：`com.springpath.sysgmt.domain-26`
ステップ 9	古い ESX エージェンシー拡張機能を削除します。 [Agency] ウィンドウの [Methods] テーブルからメソッドを選択します。古い ESX エージェンシーは、`destroyAgency` または `uninstall` のいずれかを使用すると削除できます。 [method] ポップアップで、[Invoke Method] をクリックします。
ステップ 10	[ExtensionManager] タブを更新し、[extensionList] エントリに `com.springpath.sysgmt.cluster_domain_id` という拡張機能が含まれていないことを確認します。
ステップ 11	vSphere クライアントサービスを再起動します。 vSphere クライアントサービスが再起動されると、HX Data Platform の拡張機能が削除されます。vSphere クライアントサービスを再起動すると、ブラウザから vCenter へのアクセスが一時的に無効になります。追加情報については、VMware のナレッジベース『Stopping, starting, or restarting VMware vCenter Server Appliance 6.0 services (2109887)』を参照してください。
ステップ 12	HX Data Platform のインストールを実行し完了します。古い EAM 拡張の削除に関する追加オプションについては、テクニカルアシスタンスセンター（TAC）に確認してください。

VM フォルダやファイルの削除に非常に長い時間がかかる

説明

ユーザ VM が、ファイルシステム内に残っているユーザ VM 向けに作成された ESX *.lck ファイルや、vSphere にアクセスできなくなった場合、VM ファイルやフォルダの削除には非常に長い時間がかかる場合があります。

アクション：ESX サーバの VM ロックファイルをクリアする

手順

ステップ 1

ストレージクラスタ内のすべての VM ロックファイルを探します。

# cd /vmfs/volumes/my_datastore

# find . -name .lck* | xargs -n1 rm

ステップ 2

VM のファイルまたはフォルダの削除を再試行します。

VM ディスク使用率と vCenter VM コミットサイズの不一致

Description

VM にスナップショットまたは ReadyClone がある場合、VM ディスク使用率が vCenter の仮想マシンコミットサイズと一致しません。

アクション：なし

コンピューティングノードを削除してもデータストアが削除されない

説明

ストレージクラスタからコンピューティングノードを削除しても、関連付けられているデータストアが削除されませんでした。

アクション：データストアを手動で削除する

複数のデータストア追加時のエラー：ホスト上にマウントポイントが見つからない

Description

VMware の問題により、同時に複数のデータストアを追加しようとして、一部のデータストアがマウントされないことがあります。

アクション：データストアを再マウントする

一度にマウントするデータストアを減らしてマウントします。

HX プラグインを使用して、最初にマウントされなかったデータストアを再マウントします。

NFS 全パスダウンが発生し [File Locked by Consumer on Host] メッセージが表示される

説明

シリアル I/O 制御（SIOC）に関する VMware の問題が原因で、NFS 全パスダウン（APD）が発生し、次のようなメッセージが表示されます。

NFSLock: 2210: ファイルはホスト host_name 上のコンシューマーによって排他ロックでロックされています。

アクション：[Storage I/O Control] を切り替える

手順

ステップ 1	vCenter からデータストアビューで [`datastore`] > [Configuration] > [Properties] を選択します。
ステップ 2	[Storage I/O Control] を反対の状態に切り替えます。有効な場合は無効にします。無効な場合は有効にします。
ステップ 3	[Storage I/O Control] を元の状態に戻します。有効な場合は無効にします。無効な場合は有効にします。
ステップ 4	NFS ロックが解除されていることを確認します。

VLAN ID の変更後、データストアのマウントに失敗する

説明

ストレージクラスタの作成後に VLAN ID を変更すると、データストアのストレージクラスタへのマウントに失敗します。既存のデータストアを、ストレージクラスタからマウント解除することはできます。

アクション：ESX サーバのファイアウォールをリロードします。

ESX サーバのファイアウォールのリロードに関する指示については、VMware ESX のマニュアルを参照してください。

データ vSwitch に IP アドレス設定済みの VM カーネルポートがある場合、データストアのマウントが失敗する

説明

VMware の構成要件ごとに IP アドレスもしくはルールが重複する場合、接続が失われます。

アクション：トラフィックが意図した VM カーネルインターフェイスを使用しているか確認します。

次を設定します。

VM カーネルポートは、IP サブネットごとに 1 つだけです。

vSphere 5.x を使用している場合、iSCSI マルチパスやマルチ NIC vMotion には適用されません。
ルーティング不可能な専用の VLAN または vMotion 用の専用物理スイッチ。
ルーティング不可能な専用の VLAN または IP ストレージ用の専用物理スイッチ。
ルーティング不可能な専用の VLAN または耐障害性用の専用物理スイッチ。

クラスタ再起動後のデータストアのマウント解除

説明

ストレージクラスタが正常な状態に戻った後、既存のデータストアが自動的に再マウントされない場合があります。これは、1 つ以上のノードがダウンしている間にストレージクラスタが再起動されたか、ストレージクラスタの再起動に長い時間がかかっている場合に発生する場合があります。

アクション：データストアをマウントする。

方法を選択します。

HX Data Platform プラグインを使用する。
コマンドラインを使用する。

手順

ステップ 1

HX Data Platform プラグインを使用する。

vSphere Web クライアントの [Navigator] から、[vCenter Inventory Lists] > [Cisco HyperFlex Systems] > [Cisco HX Data Platform] > [cluster] > [Manage] > [Datastores] の順に選択します。
[datastore] を選択します。
[データストアのマウント（mount datastore）] アイコンをクリックするか、[アクション（Actions）] メニューから選択します。
データストアのマウントを確認し、[OK] をクリックします。

ステップ 2

コマンドラインを使用する。

ストレージクラスタ内のノードのストレージコントローラ VM にログインします。
コマンドを実行します。

# stcli datastore mount datastore_name

ストレージ I/O RM デーモンの実行時にデータストアのマウント解除ができない

説明

VMware の Storage I/O RM 機能が有効になっている場合、データストアで Storage I/O RM が有効になっていない場合でも、VMware が Storage I/O RM の追跡ファイルに書き込みを行うバグがあります。これらの追跡ファイルが、HX Data Platform のデータストアのマウント解除を妨げます。

アクション：マウント解除を再試行する。

手順

ステップ 1	データストアのマウント解除を再試行します。
ステップ 2	HX Data Platform のデータストアがマウントされているすべての ESX ホストの Storage I/O RM デーモンを停止します。
ステップ 3	データストアをマウント解除します。
ステップ 4	必要に応じて、Storage I/O RM デーモンを再起動します。

エラー「com.vmware.vim25.PlatformConfigFault」を伴うデータストア削除の失敗

Description

VSphere がランダムなデータストアを選択してハートビートに使用する、既知の VMware の問題があります。これはデータストアを削除しようとする HX Data Platform の操作をブロックします。VMware KB の「Unmounting or removing a datastore in a HA cluster fails with the error: The vSphere HA agent on host failed to quiesce file activity on datastore (2055137)」を参照してください。

アクション：ESXi ホストと vCenter をチェックしてからデータストアの削除を再試行する

手順

ステップ 1	VM がデータストアで実行されていないことを確認します。
ステップ 2	ESX ホストから、HX Data Platform のデータストアが VMware サービス storageRM で使用されているかどうかを確認します。 `# ls -ltra /vmfs/volumes/stfs-ds1/ \| grep -i iorm -rwxr-xr-x 1 root root 16511 Jan 20 20:05 .iormstats.sf drwxr-xr-x 1 root root 1125 Jan 20 20:06 .iorm.sf`
ステップ 3	`storagerm` のステータスを確認します。 `# /etc/init.d/storageRM status` `storageRM is running`
ステップ 4	`storagerm` サービスを停止します。 `# /etc/init.d/storageRM stop watchdog-storageRM: Terminating watchdog process with PID 34096 storageRM stopped`
ステップ 5	または、vSphere HA を無効にします。 vSphere クライアントの [Home] から、[vCenter Inventory Lists] > [Resources] > [Clusters > `storage cluster` > Manage] > [Settings] > > [Services] の順に選択します。 [vSphere HA] をクリックします。[Edit] をクリックします。選択されている場合は、[Turn on vSphere HA] の選択を解除します。
ステップ 6	データストアの削除を再試行してください。
ステップ 7	VSphere HA を無効にしていた場合は再度有効にします。
ステップ 8	可能なソリューションはこれ 1 つです。これで問題が解決しない場合は、テクニカルアシスタンスセンター（TAC）にお問い合わせください。

VMware ツールを使用して VM を停止するとレプリケーションが失敗する

Description

[Use VMware Tools to quiesce the virtual machine] オプションが選択されている場合、レプリケーションが失敗することがあります。

レプリケーションの開始時に、VM でレイアウト変更などのゲストツール関連アクティビティが進行している場合、レプリケーションが失敗することがあります。関連アクティビティには、VMDK の追加、HX Native Snapshot または Redlolog Snapshot の作成、削除、統合、VM の再設定、または vMotion などがあります。これは一時的なステートです。

レプリケーションが失敗すると、自動的に再試行されます。数回繰り返して試行してもレプリケーションが失敗する場合、一時的な VM レイアウト変更が失敗の原因ではない可能性があります。[Use VMware Tools to quiesce the virtual machine] オプションを選択解除することを検討します。

アクション: [Use VMware Tools to quiesce the virtual machine] オプションを選択解除する

手順

ステップ 1

HX Connect にログインします。

ステップ 2

仮想マシンに使用する保護方式の [Edit Schedule] を選択します。

独立して保護されている場合：[Replication] > [Protected Virtual Machines] > [vm_name] > [Edit Schedule] を選択します。
独立して保護されている場合：[Replication] > [Protection Groups] > [protection_group] > [Edit Schedule] を選択します。

ステップ 3

[Use VMware Tools to quiesce the virtual machine] を選択解除し、[Save Changes] を選択します。

データストアの名前変更後にリカバリが失敗する

Description

ターゲットデータストアの名前変更直後にリカバリを実行すると、「データストアが見つかりません（Datastore not found）」というエラーでリカバリが失敗することがあります。

アクション：リカバリを再試行する

データストアの名前の変更後数分間待機してから、リカバリを再試行します。

ノードを再起動すると、リカバリ、復元、複製が停止する

Description

次のコマンドを実行している間にノードを再起動すると、コマンドアクションが停止し、その後コマンドを再試行しても失敗します。

stcli dp vm recover

stcli dp vm restore

stcli dp vm clone

アクション：仮想マシンをクリーンアップする

手順

ステップ 1

vCenter から仮想マシンをクリーンアップします。

適切なオプションを選択します。

仮想マシンが登録されている場合は、vCenter から仮想マシンを削除します。
仮想マシンが登録されていない場合は、データストアから VM フォルダを削除します。

ステップ 2

stcli dp vm コマンドを再実行します。

stcli vm recover コマンドを再実行すると失敗する

説明

stcli vm recover を使用して初めて仮想マシンの回復を試行しましたが、完了しませんでした。また、このコマンドを再実行しても完了しませんでした。

部分的に回復した場合、仮想マシンが vCenter に登録されたままになっている可能性があります。これは削除する必要があります。

アクション：残っているファイルをクリーンアップする

手順

ステップ 1

vCenter から仮想マシンを削除します。

ステップ 2

/vmfs/volumes/<volume>/<vmname> ディレクトリを削除します。

ステップ 3

リカバリコマンドを再実行します。

# stcli vm recover

REST API 保護グループフィルタがすべてのグループを返す

説明

REST API を使用して保護グループを検索すると、REST 呼び出しでフィルタを適用するとしても、検索結果としてすべての保護グループが返されます。

アクション：なし

groups:get では、フィルタの name および type パラメータはサポートされません。

VM がスナップショット統合中に機能しなくなる

Description

HX ストレージクラスタ内の VM に関する redo ログスナップショットを取る場合は、redo ログスナップショットを保存する ESXi ホストの設定を編集します。この手順が完了していない場合は、VM がスナップショット統合中に機能しなくなる可能性があります。

redo ログスナップショットは、HX Data Platform のスナップショット機能ではなく、VMware のスナップショット機能を介して作成されるスナップショットです。

アクション：ESXi ホストで snapshot.asyncConsolidate="TRUE" を設定する

手順

ステップ 1

ESXi ホストのコマンドラインにログインします

ステップ 2

ファイル /etc/vmware/config を探して編集用に開きます。

ステップ 3

snapshot.asyncConsolidate パラメータを TRUE に設定します。

snapshot.asyncConsolidate="TRUE"

[Quiesce] オプションを使用したネイティブスナップショット

説明

VM の電源がオンの場合に、Windows 2008 または Windows 2012 サーバでの [Quiesce] オプションを使用したネイティブスナップショットはサポートされていません。

アクション：[Quiesce] 以外のオプションを使用する

VM の電源をオフにしてから、スナップショットを作成するか、または [Quiesce] 以外のデフォルトオプションを使用します。

vMotion がネイティブスナップショットデータストアを移動できない

説明

vMotion によるネイティブスナップショットの移動で、関連するデータストアを移動できません。ネイティブスナップショットのある仮想マシンで、vMotion の使用はサポートされていますが、ストレージ vMotion の選択のみサポートされていません。

アクション：元の VM だけに対して vMotion を使用する

VM を別のデータストアに移動する必要がある場合は、ソースのデータストアからスナップショットを削除し、元の VM に vMotion を実行します。

クラスタの再登録後にコントローラ VM が EAM エージェントではなくなっている

Description

stcli cluster reregister の実行後に、コントローラ VM が EAM エージェントとしてリストされません。

アクション：クラスタを再作成する

手順

ステップ 1

vCenter クラスタを削除します。

ステップ 2

vCenter クラスタを再作成します。

ステップ 3

HX クラスタを再登録します。

# stcli cluster reregister

複数の再登録後にクラスタが異常な状態になる

Description

複数のクラスタ再登録を実行すると、クラスタが異常な状態になることがあります。

アクション：クラスタを再作成する

HX Clusterは vCenter 情報を失い、virtCluster および HX Connect ステータスはクラスタがオフラインであることを示します。ただし HX Data Platform クラスタは、クラスタが全体的に正常だったことを示します。

クラスタを再作成します。

# stcli cluster recreate

ノードの削除後に ClusterNotConfigured エラーが発生する

Description

クラスタからノードを削除した後で、いずれかのコントローラ VM で stcli cluster info コマンドを実行すると ClusterNotConfigured と示されます。

アクション：クラスタを更新する

コントローラ VM コマンドラインから次のコマンドを実行します。

# stcli cluster refresh

クラスタ容量が個々のディスクよりも大きい

説明

表示されるクラスタ使用率の合計が、個々のディスクに対して示される使用率を上回る場合があります。

たとえば、クラスタ使用率は 80% であるのに対し、使用率が最大のディスクでも、使用率が 76% として示されるといった状況です。

アクション：なし

この違いは、管理レイヤの処理に起因する場合があります。使用率関連の決定を行う場合は常に、必ずクラスタ使用率の値を参考にしてください。

クラスタを再登録してもコンピューティングノードが EAM に再登録されない

Description

この問題はさまざまなシナリオで発生します。考えられるシナリオは次のとおりです。

シナリオ 1

2.1.x より前の古い HX バージョンから開始します。
コンピューティングノードを追加します。
クラスタを再登録します。
クラスタをアップグレードします。クラスタにコンピューティングノードを含めるタスクが失敗します。

シナリオ 2

2.1.x より前の古い HX バージョンから開始します。
コンピューティングノードを追加します。
クラスタをアップグレードします。タスクが完了します。
クラスタを再登録します。EAM レベルでタスクが失敗します。

シナリオ 3

新しい HX バージョン（2.1.x 以降）で開始します。
コンピューティングノードを追加します。
クラスタを再登録します。EAM レベルでタスクが失敗します。

アクション：コンピューティングノードを削除してから再登録する

手順

ステップ 1	コンピューティングノードから VM を vMotion で移動し、HX クラスタからコンピューティングノードを削除します。
ステップ 2	HX クラスタを再登録します。
ステップ 3	HX クラスタにコンピューティングノードを追加します。

大量の処理セットがあるワークロードで遅延の急増が観測される

Description

大量の処理セットがあるワークロードは、キャパシティ階層からデータにアクセスする必要があります。HX Data Platform バージョン 2.1(1b) 以降、バックエンドアクセスが最適化されて、一時的遅延増加の大きさと頻度が大幅に削減されました。

ハイブリッドクラスタの場合：この症状が現れている場合、アップグレードに必要なメンテナンス期間が長くなります。また、デフォルトのアップグレードプロセスではこの最適化が自動的に有効になりません。アップグレード処理中にこのパフォーマンス拡張を有効にするには、Cisco TAC までお問い合わせください。
オールフラッシュクラスタの場合：アップグレードの時間は大きな影響を受けません。また、デフォルトのアップグレードパスで、このパフォーマンス拡張が自動的に有効にされます。

アクション：2.1（1c）以降にアップグレードする

クラスタのヘルスステータスが再調整後も異常のままになる

説明

ROBO ストレージクラスタを含め、3 つのノードからなるあらゆるクラスタでは、いずれか 1 つのノードがメンテナンスモードまたは障害状態になると、クラスタのヘルスステータスが異常として設定されます。この問題は、再調整によって修正されることはありません。

アクション：ノードを正常な状態に戻す

ノードまたはノード内のコンポーネントで障害が発生していないことを確認します。ノードまたはコンポーネントで障害が発生している限り、クラスタの状態は異常のままになります。コンポーネントまたはノードが正常な状態に戻ると、クラスタは回復し、正常な状態に戻ります。

ESXi ホスト上で NTP が設定されない

説明

ESXi ホストで電源が再投入された場合、障害が発生した場合、またはメンテナンスモードが開始あるいは終了した場合、NTP サーバが同期されないことがあります。

ESXi ホストで NTP を手動で設定する

手順

NTP クライアントを有効にします。

vSphere Web クライアントから、[host] > [Manager] > [System] > [Time Configuration] > [User Network Time Protocol] を選択します。
[NTP Service Startup Policy] フィールドから、[Start and stop with host] を選択します。[OK] をクリックします。
ストレージクラスタ内の各 ESXi ホストに対して繰り返します。

プロビジョニングとは異なるクラスタキャパシティ

説明

HX Data Platform プラグイン内で、[Summary] タブのクラスタキャパシティと [Manage] タブのプロビジョニングされたキャパシティに、ストレージクラスタに割り当てられたストレージ量と異なる数値の表示されることがあります。これは、次のような状況で発生します。

クリーナーが未完了。VM は削除されたが、クリーナーが実行されていない。クリーナーは自動プロセスであり、完了後にクラスタキャパシティとプロビジョニングされた量が一致する必要があります。クリーナーコマンドに関する情報については、『Cisco HX Data Platform Command Line Interface Reference guide』を参照してください。
シックプロビジョニングまたはシッククローン。シックディスクまたはクローンが作成された場合、HX Data Platform は領域を確保しません。ソフト予約が使用され、データストアに使用された領域が表示されますが、領域はストレージクラスタ内で使用されていません。これは、データストアをオーバープロビジョニングすることがないように、管理者を支援する目的で設計されたものです。

アクション：ありません。

vShield 使用時のストレージコントローラ VM への接続

Description

vShield は HX Data Platform のアクティビティを妨げます。HX Data Platform クラスタへの vShield のインストールは推奨されません。

アクション：選択した HX コンポーネントを除外する

vShield をインストールする必要がある場合は、HX ストレージコントローラ VM および vCenter を vShield の保護から除外します。https://www.vmware.com/support/pubs/vshield_pubs.html にある、VMware vCloud ネットワークとセキュリティドキュメントを参照してください。

手順

ステップ 1	vShield Manager をインストールします。
ステップ 2	HyperFlex ストレージコントローラ VM および vCenter Server を vShield App の保護から除外します。 vCenter で、[Host & Clusters] > [Settings & Reports] > [vShield App] > [Exclusion List] > [Add] の順に選択します。各コントローラ VM を `stCtlVM<name>` で選択します。
ステップ 3	ストレージコントローラへのネットワーク接続を確認します（ping、ssh など）。
ステップ 4	vShield コンポーネントをインストールして設定します。
ステップ 5	設定が正しく動作することを確認するために、すべての ESXi ホストを同時に再起動してデータストアをオフラインにします。システムをバックアップしてから、手順 3 を繰り返します。

SSLv3 が無効な状態でソフトウェアのバックアップが失敗する

Description

vSphere 5.5 および 6.0 u1 の VMware のバグが原因で SSLv3 が無効な場合、バックアップソフトウェアが失敗することがあります。

アクション：VMware KB 記事を参照します

手順

VMware の関連記事へのリンクをクリックします。

vSphere 6.0u1 の場合は、「Enabling support for SSLv3 in ESXi (2121021)」（http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2121021）を参照してください。
vSphere 5.5 の場合は、「Enabling support for SSLv3 on vSphere 5.5 (2139396)」（https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2139396）を参照してください。

クラスタノードの電源をオフにした後、vCenter クラスタからストレージクラスタが見えなくなる

説明

vCenter クラスタ内のノードの電源がオフになっていました。ストレージクラスタは、ダウンノード数の許容範囲内であり、正常です。ただし、ストレージクラスタが vSphere を介して管理できません。

VMware vSphere 6.0 の既知のバグです。次を参照してください。https://communities.vmware.com/thread/514117?start=0&tstart=0

アクション：ノードをリセットする。

ノードの電源をオンにするか、電源がオフのノードを vCenter クラスタから切断します。

複数の VM 電源操作が原因でタスクキューでエラーが発生する

Description

複数の VM 電源操作が原因で、タスクキューでエラーが発生します。

アクション：キューをクリーンアップする

電源操作は HX Connect から開始できますが、vCenter を介して実行されます。vCenter タスクコレクタの最大数は 32 です。これは変更できません。

手順

ステップ 1

キュー内のタスクをクリーンアップします。

次の URL の関連記事『VCS vSphere – Check new notifications stuck on Queued – VMware vCenter Update Manager Check Notification』を参照してください：http://www.natestiller.com/2011/02/vcs-vsphere-check-new-notifications-stuck-on-queued-vmware-vcenter-update-manager-check-notification/

ステップ 2

HX Connect からログアウトし、再度ログインします。

ステップ 3

電源操作を再試行します。

同時操作の数が 32 を超えないようにします。

HX 接続データが更新されない

説明

HX Connect ステータスフィールドの表示データが更新されないことがあります。

アクション：ブラウザのキャッシュをクリアする

Microsoft Internet Explorer
1. IE ブラウザから [Settings]（歯車） > [Safety] > [Delete browsing history] を選択します。
2. 適切なチェックボックスをクリックします。
3. [Delete] をクリックします。
Google Chrome
1. Chrome ブラウザから [Menu]（縦に並ぶ 3 つのドット） > [More tools] > [Clear browsing data] を選択します。
2. 適切なチェックボックスをクリックします。
3. [CLEAR BROWSING DATA] をクリックします。
Mozilla Firefox
1. Firefox ブラウザから、[Menu]（縦に並ぶ 3 本の棒） > [Options]（歯車） > [Advanced] > [Network] を選択します。
2. [Cached Web Content] セクションで [Clear Now] をクリックします。

パフォーマンスチャートにノードを再起動している間のギャップが表示される

説明

HX クラスタでのノード再起動などのイベントによって、システムパフォーマンスが影響される場合があります。そのようなイベントが発生している間は、パフォーマンスチャートにデータギャップが示されることがあります。

アクション：なし

イベントが完了すると、パフォーマンスチャートのレポート作成が続行されます。

vSphere クライアントに HX Data Platform プラグインが表示されない

Description

Cisco HyperFlex システムまたは Cisco HX Data Platform が vSphere クライアントまたは Web クライアントに表示されません。この問題が発生する場合には、いくつかの状況が考えられます。該当する状況に対応したアクションを実行してください。

アクション：オプションを選択します

HX ストレージクラスタの作成後に vCenter サービスを再起動します。
アップグレード後に vCenter サービスを再起動します。
既存のクラスタがある vCenter に別のクラスタを追加した後に vCenter サービスを再起動します。
Firefox ブラウザに最新の Adobe FlashPlayer をインストールします。

手順

ステップ 1

vCenter サービスを再起動します。

vCenter Server コマンドラインにログインします。
vCenter サービスを再起動します。

# ssh root@vc_address # service vsphere-client restart
vCenter が再起動するまで待ちます。通常、これには数分かかります。
vCenter からログアウトしてから再度ログインし、vCenter インターフェイスが更新されることを確認します。

ステップ 2

Firefox ブラウザに最新の Adobe FlashPlayer をインストールします。

Shockwave Flash のバージョンを確認します。

Firefox ブラウザのアドレスバーに about:addons と入力します。
バージョンを確認し、最新の Flash Player を https://get.adobe.com/flashplayer/ からダウンロードしてインストールします。
Shockwave Flash のバージョンを再度確認します。
最新の Flash バージョン以外のバージョンがリストされている場合は、古いバージョンを無効にします。
vSphere Web クライアントをリロードします。

パフォーマンスチャートの表示が 100% のズームでフォーマットされていない

説明

パフォーマンスチャートの表示が 100% のズームでフォーマットされていません。

オプションのメトリックと小さな解像度を同時に選択すると、正しくフォーマットされていないチャートが表示されます。

アクション：チャートのズームを変更する

HX Data Platform プラグインが機能しない

説明

この問題は、新しいクラスタを作成した既存の vCenter で、別のバージョンの HX Data Platform も使用されている場合に発生することがあります。

アクション：vSphere にログインし直す

vSphere クライアントからログアウトして、もう一度ログインします。

Cisco HyperFlex システム 3.0 トラブルシューティング リファレンス ガイド

偏向のない言語

翻訳について

検索結果

章のタイトル： トラブルシューティング項目

トラブルシューティング項目

問題のトラブルシューティング

IP アドレスを展開するページに重複したサーバが表示される

FI を手動で再起動するとインストールが失敗する

手順

UCS Manager だけをアップグレード中に、コントローラ VM の電源がオンにならないことがある

展開またはアップグレードが「「NoneType」オブジェクトに「scsiLun」属性がありません（'NoneType' object has no attribute 'scsiLun'）」というエラーで失敗する

アップグレードでメンテナンス モードに切り替わらない

手順

アップグレードが vMotion 互換性検証で失敗する

VM 電源オン時のエラーのアップグレード：「互換性のあるホストが見つかりませんでした

手順

アップグレード時に 2 つのノードで障害が発生すると、コントローラ VM の電源オンが失敗する

手順

6.5 より前の vCenter のアップグレードで、一部のコントローラ VM がグループ化される

vCenter の問題によりノードがアップグレードに失敗する

手順

HX Data Platform インストーラが別の vCenter によって管理されているホストを表示する

HX Data Platform と UCS Manager 間で異なる構成の設定

手順

FQDN による DNS エラーでクラスタの作成に失敗する

手順

オフライン アップグレードでのクラスタ起動コマンド エラー：ノードを利用できません（Node Not Available）

手順

HX プラグインの導入後に vSphere Replication プラグインが失敗する

始める前に

手順

次のタスク

アップグレードは失敗するが、すべてのノードが最新であると報告される

オンライン アップグレードの再開が失敗する

Cisco UCS のアップグレード中にコントローラ VM の電源がオンにならない

サポートされていないボードを搭載したサーバ ストレージ コントローラからのファームウェアのアップグレードが失敗する

手順

vCenter の問題によりノードがアップグレードに失敗する

手順

ノードが正常な状態に戻るのを待機してアップグレードが停止する

手順

クラスタの拡張エラー：クラスタが見つからない

手順

DNS サーバが見つからないためにクラスタの拡張が失敗する

手順

古い HX インストーラによりクラスタの拡張が失敗する

手順

手動による ESX インストール後の statsd の再起動

手順

services.sh restart 実行時の scvmclient 管理サービスの再起動

ESX サーバの再起動によるアップグレードの終了とメンテナンス モードの開始

EAM がコンピューティング ノードで起動しない

ノードがダウンした場合、ノードの削除に失敗する

HA が有効になっている ESX ホストの再起動

手順

クラスタへの別ノード同時追加時のノード障害

手順

vNIC または vHBA の変更後の PCI パススルーの設定

手順

3 ノードのストレージ クラスタ上で、すべてまたは大半のディスクに障害が発生すると、データの割り当てができない

手順

ディスクを削除するとストレージ コントローラ VM の再起動に失敗する

手順

ストレージ コントローラ VM 上で障害が発生した SSD ホスティングを復旧させる

手順

コントローラ VM の電源をオンにできない

自動 vMotion 移行がタイムアウト エラーで失敗する

2 つのノードの障害によりストレージ コントローラ VM の電源オンに失敗する

HA および DRS が有効な状態でホストに VM を追加できない

手順

ディスク共有の制限が設定された VM でのパフォーマンス低下

手順

ストレージ クラスタが読み取り専用状態の場合の DRS による VM の移行

手順

古い EAM 拡張により VM の電源オンに失敗する

手順

VM フォルダやファイルの削除に非常に長い時間がかかる

手順

VM ディスク使用率と vCenter VM コミット サイズの不一致

章のタイトル：トラブルシューティング項目

アップグレードでメンテナンスモードに切り替わらない

オフラインアップグレードでのクラスタ起動コマンドエラー：ノードを利用できません（Node Not Available）

オンラインアップグレードの再開が失敗する

サポートされていないボードを搭載したサーバストレージコントローラからのファームウェアのアップグレードが失敗する

ESX サーバの再起動によるアップグレードの終了とメンテナンスモードの開始

EAM がコンピューティングノードで起動しない

3 ノードのストレージクラスタ上で、すべてまたは大半のディスクに障害が発生すると、データの割り当てができない

ディスクを削除するとストレージコントローラ VM の再起動に失敗する

ストレージコントローラ VM 上で障害が発生した SSD ホスティングを復旧させる

自動 vMotion 移行がタイムアウトエラーで失敗する

2 つのノードの障害によりストレージコントローラ VM の電源オンに失敗する

ストレージクラスタが読み取り専用状態の場合の DRS による VM の移行

VM ディスク使用率と vCenter VM コミットサイズの不一致

コンピューティングノードを削除してもデータストアが削除されない

複数のデータストア追加時のエラー：ホスト上にマウントポイントが見つからない

NFS 全パスダウンが発生し [File Locked by Consumer on Host] メッセージが表示される

データ vSwitch に IP アドレス設定済みの VM カーネルポートがある場合、データストアのマウントが失敗する

REST API 保護グループフィルタがすべてのグループを返す

[Quiesce] オプションを使用したネイティブスナップショット

vMotion がネイティブスナップショットデータストアを移動できない

クラスタを再登録してもコンピューティングノードが EAM に再登録されない

クラスタのヘルスステータスが再調整後も異常のままになる

プロビジョニングとは異なるクラスタキャパシティ

vShield 使用時のストレージコントローラ VM への接続

クラスタノードの電源をオフにした後、vCenter クラスタからストレージクラスタが見えなくなる

複数の VM 電源操作が原因でタスクキューでエラーが発生する

パフォーマンスチャートにノードを再起動している間のギャップが表示される

パフォーマンスチャートの表示が 100% のズームでフォーマットされていない