LTN Blog 〜 Lenovo Technology Network 〜

レノボのソリューション・サーバー製品に関する技術情報、お役立ち情報をお届けします

Nutanixクラスタの正常性の確認について~Health Monitoring~

皆さん、こんにちは レノボ・エンタープライズ・ソリューションズ 小宮です。

本日はNutanixの正常性の確認(Health Monitoring)についてご説明したいと思います。

まず、はじめにNutanixの正常性を確認するというが何を見ることができるのか?ということをお話します。

f:id:t_komiya:20181201231034p:plain

モニタリングできるものは仮想マシン、ホスト、ディスクなどの状態を表示、深刻度などを表示します。またスケジューリングして表示したり、Nutanixのクラスタのチェックを定期的に行ったり、ログ収集を行います。

それぞれの機能についての詳細は上図をご参照下さい。

 

それでは、それらについて画面イメージも交えながらお話します。

 

ヘルスダッシュボードには、クラスタ内のVM、ホスト、およびディスクに関する動的に更新された正常性 情報が表示されます。ヘルスダッシュボードを表示するには、メインメニューの左側にあるプルダウンリストから[Health]を選択します。

  • メニューオプション

ヘルスダッシュボードには、メインメニュー以外のメニューオプションはありません。

画面の詳細

ヘルスダッシュボードは3つの列に分かれています。

  • 左側の列には、各エンティティタイプ(VM、ホスト、ディスク、ストレージプール、ストレージコンテナ、クラスタ サービス、および[構成されている場合]保護ドメインとリモートサイト)のタブが表示されます。各タブには、クラスタのエンティティの合計(ディスクの総数など)と各正常性状態の数が表示されます。タブをクリックすると、表示された 情報が展開されます(次のセクションを参照)。
  • 中央の列には、左側の列で選択されているものに関する詳細情報が表示されます。
  • 右側の列には、すべてのヘルスチェックの要約が表示されます。また、チェックボタン(成功、警告、失敗、無効)から個々のチェックを表示するオプションもあります。
  • [ Summary ]タブには、チェックステータスとチェックタイプに従って、すべてのヘルスチェックのSummaryが表示
  • [ Checks ]タブには、個々のチェックに関する情報が表示されます。カーソルを項目の上に移動すると、その ヘルスチェックに関する詳細情報が表示されます(次の図を参照)。適切なフィールドタイプをクリックして[ Apply ]をクリックすると、チェックをフィルタリングできます。チェック内容は以下のように分類されます。
  • ステータスでフィルタリング
    合格(Passed), 失敗(Failed), 警告(Warning), エラー(Error), オフ(Off),またはすべて(all)
  • タイプでフィルタリング

    スケジュールされていない、スケジュールされていない、イベントトリガーされている、またはすべて

  • エンティティタイプ別にフィルタリングする

    VM、ホスト、ディスク、ストレージプール、ストレージコンテナ、クラスタサービス、またはすべて

f:id:t_komiya:20181201232054p:plain
たとえば、Failureをチェックのみを表示する場合は、[ Failure ]オプションを選択してチェックをフィルタします。 特定のチェックをクリックすると、中央の列に、チェックが失敗した日時とチェック失敗の割合の詳細な履歴が 表示されます。バーをクリックすると、合格と失敗の履歴の詳細グラフが表示されます(上図参照)。

マウスをグラフの線に沿って動かすと、その時点に関する情報が表示されます。

 

f:id:t_komiya:20181201232258p:plainまた検索ボックスに文字列を入力することで、特定のチェックを検索することもできます。「Actionタブにはチェックを管理し、チェックを実行し、ログを収集するオプションがあります。

f:id:t_komiya:20181201232412p:plain

フィルタリングもVMやホスト、ディスクなどで行うことができます。

  • グループ化カテゴリをクリックすると、そのグループ化に関する詳細情報が表示されます。左側の列が展開され、グループ化とフィルタオプションのセットが表示されます。選択したグループが強調表示されます。そのグループをクリックすると、別のグループを選択できます。各グループエントリには、そのグループに含まれるカテゴリの数が表示され、中央のセクションにはそれらのカテゴリに関する情報が表示されます。次の例では、ディスクストレージ階層が選択されており、そのグループには2つのカテゴリ(SSDとHDD)があります。デフォルトでは、すべてのエンティティ(この例ではすべてのディスク)がカテゴリ情報に含まれています。1つまたは複数のフィルタをクリックすると、含まれているリストを絞り込むことができます。
  • 中央の列には、選択したグループ内の各カテゴリのフィールドが表示されます。各フィールドには、そのカテゴリの詳細が表示されます。特定のエントリにカーソルを置くと、追加情報が表示されます。フィルタリング用のドロップダウン選択リスト(グループ化フィルタと同じ)と、情報を並べ替えるためのリストによるドロップダウンソートがあります。
  • 右側の列には、そのエンティティタイプに関連するヘルスチェックが引き続き表示されます。

f:id:t_komiya:20181201232753p:plain

f:id:t_komiya:20181201232912p:plain

それぞれのエンティティについて、ダイアグラムビューで見ることも、それぞれの詳細な情報で出力することもできます。

 

一連のヘルスチェックが定期的に実行され、一連のクラスタヘルスインジケータが提供されます。実行する検査を 指定し、スケジューリング可能な検査および各ヘルスチェックのための他のパラメータを構成することができます。

クラスターヘルスチェックは、AOS、ハイパーバイザー、およびハードウェアコンポーネントを含むさまざまな エンティティをカバーします。チェックのセットはデフォルトで有効になっていますが、いつでもチェックの実行、無効化、または再設定ができます。1つまたは複数のヘルスチェックを再設定するには、次の手順を実行します。

 

1.ヘルスのダッシュボードでは、Action Manage Check クリックします

ヘルスダッシュボードには、ヘルスチェックに関する情報が再表示されます。特定のヘルスチェックをクリックすると、その チェックが強調表示されます。ヘルスチェックを選択するか(最初に選択するか)、以前に選択したヘルスチェックが強調表示されます。次の情報が表示されます。

  • 左側の列には、ハイライトされた状態が正常性チェックの一覧として表示されます。いずれかのエントリをクリックして、そのヘルスチェックを選択して強調表示します。
  • 中央の列には、このヘルスチェックの機能が記載されており、影響を受けるエンティティ(ホスト、ディスク、またはVM)全体で実行スケジュールと履歴が提供されます。
  • 右の列には、このヘルスチェックが失敗した原因(原因、解決、影響)が記載されています。

2.特定のチェックを実行するには、[ Run Check ]をクリックします。

3.ヘルスチェックをオフにする(またはオンにする)には、中央の列の上部にあるチェックオフ(またはチェックオン)リンクをクリックし、ダイアログボックスで[ Yes ]ボタンをクリックします。

4.パラメータの設定を変更するには(設定可能なパラメータがあるヘルスチェックの場合)、中央の列の上部にあるパラメータリンクをクリックし、ドロップダウンウィンドウでパラメータ値の1つ以上を変更して、[ Update ]ボタンをクリックします。このリンクは、ヘルスチェックに設定可能なパラメータが含まれている場合にのみ表示されます。設定可能なパラメータは、そのヘルスチェックに固有です。たとえば、CPU Utilizationヘルスチェックには、ホスト平均CPU使用率のしきい値とホストピークCPU使用率のしきい値の割合を指定するパラメータが含まれています。

f:id:t_komiya:20181201233422p:plain

f:id:t_komiya:20181201233545p:plain

  1. ヘルスチェックを実行するスケジュールを変更するには、中央の列の上部にあるスケジュール可能なチェックの スケジュールリンクをクリックし、ドロップダウンリストから間隔を選択します。1分から48時間までの間隔を選択 できます。各Checkにはデフォルトの間隔があり、ヘルスチェックに応じて1分に1回から1日に1回まで変更可能。 ほとんどの場合、デフォルトの間隔が最適であり間隔を変更することは推奨されません (Nutanixのカスタマーサポートによって要求されない限り)。

f:id:t_komiya:20181201234101p:plain

NCC(Nutanix Cluster Check)の間隔の設定について説明します。

こちらはNutanixのサポートに必要な情報を定期的にNutanixのサポートに送信します。(Pulseで設定します)

設定項目については上図をご参照下さい。 

f:id:t_komiya:20181201234158p:plain

Webコンソールを使用したCheckの実行について説明します。

Prism WebコンソールのHealthダッシュボードからNCCチェックを実行可能です。すべてのチェックを一度に実行するように選択することができます。失敗したチェックや警告を表示したり、選択した特定のチェックを表示したりすることができます。

f:id:t_komiya:20181201234247p:plain

Webコンソールを使用したログの収集について説明します。

Prism Webコンソールのホームダッシュボードから直接ログを収集可能。コントローラVM、ファイルサーバ、ハードウェア、アラート、ハイパーバイザ、およびシステムのログを収集可能。タスクが完了すると、タスクダッシュボードからログバンドルをダウンロード可能です。

 

参考にして頂ければ幸いです。よろしくお願い致します。