メインコンテンツまでスキップ

Unified Manager 7.2 で MetroCluster の監視に失敗しました。理由: MetroCluster コンポーネントの更新中に内部エラーが発生しました

If this article is created from a case then please add the case ID

Views:
4
Visibility:
Public
Votes:
0
Category:
not set
Specialty:
not set
Last Updated:

テスト中

状況

サーバーのダウンロードプロセスで翻訳ジョブをテストしています

Unified Manager 7.2 で MetroCluster の監視に失敗しました。理由: MetroCluster コンポーネントの更新中に内部エラーが発生しました

この KB 記事は、 ELIO で使用されています。主要 な変更を行う 前、またはこの記事をアーカイブする前に、 ng-elio-trainers@netapp.com に連絡してください。

 

[ 設定 ] メニューの [ クラスタデータソース ] タブの [ 説明 ] 列に、「モニタリングに失敗しました ... 」というメッセージが表示されます。
 

1005364-1.png

イベントが「 Event : Cluster Monitoring Failed 」およびトリガー条件「 Monitoring failed for cluster <MCC-cluster> 」で作成されました。理由: MetroCluster コンポーネントの更新中に内部エラーが発生しました。テクニカル サポートに連絡

1005364-2.png

サポートバンドルを収集するか、または収集されたログ「 ocum-error.log 」を直接確認すると、「 Error [oncommand] [collection-completion-0] [c.n.d.i.m.McCFabricConfigDiscoveryHandler] MetroCluster Monitoring Failed for <mc-cluster> 」というエントリが表示されます。

バックグラウンド

  • MCC クラスタモニタリングは、次の 3 つの方法に基づいています。
    • データの基本的なインベントリ(ノード、ボリューム、論理インターフェイスなど)。これは、クラスタの健全性を確認するために、 [Dashboard] メニューの [Overview] タブから参照できます。
    • 上記のオブジェクトのパフォーマンス監視。これは、「ダッシュボード」メニューの「パフォーマンス」タブで、クラスタのパフォーマンスデータを参照して確認できます。
    • 関連コンポーネント(スイッチ、 ISL 、接続など)の MCC 関連の追加購入
  • 3 つ目の方法( MCC コンポーネントモニタリング)は失敗しており、この記事で説明します。データの初期マッピングのみが成功し、以降の MCC コンポーネントのポーリングは、前述の現象で失敗します。したがって、 [Health/Cluster] ビューの [MetroCluster Connectivity] タブと [MetroCluster Replication] タブには、最新のデータは表示されません。

環境

OnCommand Unified Manager ( OCUM ) 7.2
OCUM 7.2 と相互運用可能な MetroCluster ( MCC )バージョンのみ

原因

問題の原因をリストします。複数の原因がある場合は、それぞれの原因ごとに個別の KB を作成してください。

原因 1 のログエントリ

 ERROR [oncommand] [reconcile-0] [[[MCC_CLUSTER_NAME]](baseline@13:16:25.716)] [c.n.dfm.collector.OcieJmsListener] Error during MetroCluster component monitoring : null com.netapp.dfm.ontap.outbound.zapi.OcumMonitoringFailedException: null [[TRUNCATED]] Caused by: java.lang.NullPointerException: null [[TRUNCATED]]

 

原因 2 のログエントリ

 2017-11-24 14:03:14,638 ERROR [oncommand] [reconcile-0] [[[MCC_CLUSTER_NAME]](incremental@14:03:05.700)] [c.n.dfm.collector.OcieJmsListener] Error during MetroCluster component monitoring : Could not execute JDBC batch update com.netapp.dfm.ontap.outbound.zapi.OcumMonitoringFailedException: Could not execute JDBC batch update [[TRUNCATED]] Caused by: org.hibernate.exception.ConstraintViolationException: Could not execute JDBC batch update [[TRUNCATED]] Caused by: java.sql.BatchUpdateException: Duplicate entry '200000108670aec0' for key 'Bridge_wwn_UQ' [[TRUNCATED]] Caused by: java.sql.SQLIntegrityConstraintViolationException: Duplicate entry '200000108670aec0' for key 'Bridge_wwn_UQ' [[TRUNCATED]] 

 

原因 3 のログエントリ

ocum-error.log から取得します

 2018-11-13 00:28:06,697 ERROR [oncommand] [collection-completion-0] [c.n.d.i.m.MetroClusterRefreshCollectionCompletionListener] MetroCluster monitoring failed for MCC_CLUSTER_NAME at 00:28:06. 2018-11-13 00:28:07,646 ERROR [oncommand] [reconcile-2] [MCC_CLUSTER_NAME(incremental@00:28:05.083)] [c.n.dfm.collector.OcieJmsListener] Error during MetroCluster component monitoring : expected one element but was: <[2b:2], [2d:2]>

 

原因 3

のログエントリ ocum-error.log
エラー OnCommand [scrile-1] [affhosmc.chkd.net(incremental@13:58:23.999)] [c.n.dfm-collector.OcieJmsListener] MetroCluster コンポーネントの監視中にエラーが発生しました :com.ctc.wstx.exc.WstxIOException: Invalid UTF-8 middle バイト 0xB (char #34185,byte #31999)

ocumserver.log
エラー OnCommand MetroCluster モニタリング中に MetroCluster エラーが発生しました。ZAPI の実行が失敗した XML 処理エラーです。 ZAPI コール store-bridge-get-iter から QSCPS040 :無効な UTF-8 中間バイト 0xB ( char#34126 、 byte #31999 )
com.netapp.dfm.ontap.outbound.zapi.ocumMonitoringFailedException : MetroCluster コンポーネントの監視が失敗しました。ZAPI の実行が失敗した XML 処理エラーです。 zAPI コール store-bridge-get-iter から <metrocluster name> :無効な UTF-8 中間バイト 0xB ( char#34126 、 byte #31999 )

。ブリッジの「最後のリブートの理由」のために、これが自動サポートまたは出力に表示されます。

 Critical Hardware Error Detected0xED 0x 

原因 1 :

UM が文書化した問題 1101736

原因 2 :

UM[1] は、 MCCS から削除した後にデータベース内の古いブリッジエントリに関する問題 1128276 を文書化しました。

原因 3 :

UM では、問題 114980 が文書化されてい
 

原因 4

ONTAP の文書化された問題 1277468

解決策

原因 1 の解決方法

OCUM 7.2P1 またはそれ以降のバージョンにアップグレードして、 MetroCluster コンポーネントの監視の修正を入手します。

原因 2 の解決方法

これは UM 7.3 以降で解決されています。

アップグレードが現在オプションでない場合は、古いエントリをデータベースから削除します。

  1. MySQL に[2]アクセスするには、 KB1029768 の手順に従います
  2. 次のコマンドを実行して、同じ出力があることを確認します。
     mysql> SELECT ocum.bridge.id,objectname,cluster_id,cluster.name,wwn,model FROM ocum.bridge INNER JOIN
  1.  +------------+-------------------------+------------+---------+------------------+------------------+ | id | objectname | cluster_id | name | wwn | model | +------------+-------------------------+------------+---------+------------------+------------------+ | 2131000004 | ATTO_FibreBridge7500N_5 | 6755 | BESNK46 | 200000108670aec0 | FibreBridge7500N | | 2131000007 | ATTO_FibreBridge7500N_5 | 25299 | BESNK47 | 200000108670b1c0 | FibreBridge7500N | +------------+-------------------------+------------+---------+------------------+------------------+ 2 rows in set (0.00 sec)
  2. 次のエントリのクリーンアップを実行します。
     delete FROM ocum.switchbridgeconnection where bridge_id in (select id FROM ocum.bridge WHERE ocum.bridge.serialNumber IS NULL AND isBeingMonitored!=b'1'); delete FROM ocum.bridge WHERE ocum.bridge.serialNumber IS NULL AND isBeingMonitored!=b'1';
  3. 約 15 分後に、 OCUM サービスを再起動し、取得ステータスを監視します

原因 3 の解決方法

1. OCUM VM のコールドスナップショットを作成します。


2. MySQL1029768
3 にアクセスするには、 KB の手順に従ってください。次のコマンドを実行して、同じ出力があることを確認します。

 mysql> select id, nodeBridgeConnection_id, nodePortWWPN, nodePort,bridgePortWWPN, bridgePortWWPN from ocum.nodebridgelink; +------------+-------------------------+------------------+----------+------------------+------------------+ |id |nodeBridgeConnection_id | nodePortWWPN | nodePort |bridgePortWWPN |bridgePortWWPN | +------------+-------------------------+------------------+----------+------------------+------------------+ | 2142001000 | 2141001000 | 10000090fabf3f21 | 2a | 2100001086a408c0 | 2100001086a408c0 | | 2142001003 |2141001003 | 10000090fabf3f24 | 2c | 2100001086a40700 | 2100001086a40700 | | 2142001006 | 2141001005 | 10000090fabf4164 | 2c | 2100001086a40a80 | 2100001086a40a80 | | 2142001007 | 2141001006 | 10000090fabf4161 | 2a | 2200001086a40a40 | 2200001086a40a40 | <--- | 2142001008 | 2141001007 | 10000090fabf3f23 | 2d | 2200001086a40a40 | 2200001086a40a40 | <--- | 2142001009 | 2141001007 | 10000090fabf3f20 | 2b | 2200001086a40a40 | 2200001086a40a40 | <--- | 2142001010 | 2141001008 | 10000090fabf4160 | 2b | 2200001086a408c0 | 2200001086a408c0 | | 2142001011 | 2141001009 | 10000090fabf4163 | 2d | 2200001086a40700 | 2200001086a40700 | +------------+-------------------------+------------------+----------+------------------+------------------+ 

4. ATTO ブリッジごとに 2 つ以上のエントリが見つかった場合は、次の手順に進みます。
5. 次のエントリのクリーンアップを実行します。

 mysql> delete from ocum.nodebridgelink;

6. 約 15 分後に、 OCUM サービスを再起動し、取得ステータスを監視します

 

原因 4 の解決方法

  1.  問題が発生しているブリッジをリブートすると、 Unified Manager のモニタリングの問題が解決されます。

追加情報

必要に応じて、ここで追加情報または関連リソースへのリンクを追加できます。

 

 

ネットアップは、本資料に記載されている情報または推奨事項の正確性、信頼性、保守性について、または本資料に記載されている情報の使用または推奨事項の遵守によって得られる結果に関して、いかなる表明または保証も行いません。本書に記載されている情報は現状のまま配布されており、本書に記載されている情報の使用または推奨事項や技術の実装はお客様の責任であり、お客様の運用環境を評価して統合する能力に依存します。本ドキュメントおよびここに記載の情報は、本ドキュメントに記載のNetApp製品のみに関連して使用できるものとします。