LTN Blog 〜 Lenovo Technology Network 〜

レノボのソリューション・サーバー製品に関する技術情報、お役立ち情報をお届けします

これからのHCIはオールフラッシュ化が不可欠?~すべてのワークロードをAll Together Now!~

皆さん、こんにちは レノボ・エンタープライズ・ソリューションズ 小宮です。本日はハードウェアとその技術の観点からHCIのことを語ってみようと思います。

 

HCIでオールフラッシュというと、非常に高額なシステムになりそうなイメージに捉えられるかと思いますが、数年前までは確かにSSDはとても高価なものであり、とてもHCIで構成しようとすると目が飛び出るくらいの金額になってしまいました。

 

でも、今でもそんな金額感なのでしょうか?

NVMeなどは確かにまだまだ安価になっているとは言い切れませんが、SSDに関しては、実際に15Krpmや10KrpmのHDDに比べても遜色のない金額になっています。

(逆に15Krpm/10KrpmのHDDが少なくなっている?)

 

情報は古くなっていますが、インターネット上でもHDDとSSDの価格はほぼなくなってきている情報もあります。

https://www.itmedia.co.jp/news/articles/1512/09/news103.html

https://pc.watch.impress.co.jp/docs/news/1003627.html

 

上記情報からすべてSSDでオールフラッシュ構成で購入しましょうという話はあくまで価格面でのメリットしかないようにしか見えないため、オールフラッシュ化に伴ってHCIでテクノロジーも含めて覚えてみましょう!

 

1.自律型エクステントストア  

f:id:t_komiya:20191207140541p:plain

こちらはNutanix社に関する技術的な内容になります。

ストレージの容量が大きくなるにつれて1クラスタあたりの容量が肥大化してしまいます。ファイルサーバーのような書き込みが少ないワークロードでは問題化しにくいが、書き込みの多いアプリケーションなどを利用する場合、クラスタで管理するメタデータから大きくなりすぎてパフォーマンスに影響を与える可能性も多くなります。そのため、大容量化に備えAOS5.10から自律型エクステントストアということで、ホスト内でローカルのメタデータを管理することにより、ホスト上のVMに対してハイパーフォーマンスIO環境を提供することができます。

このテクノロジーを利用することにより、IOを高速化することができますが、このAESを利用するにあたりオールフラッシュの構成が必須になります。

この機能を実現するには、1ノードあたりSSDが12本を最低用意する必要があるため、現状は2Uのサーバーでのみ動作することになりますが、今後はAOSのバージョンアップにより制限が緩和される可能性があるかもしれません。

 

また、AES(Autonomous Extent Store)のパフォーマンス向上に関する詳細なデータは以下のURLをご参照ください。

https://www.n0derunner.com/2018/12/nutanix-aes-performance-by-example/

 

AESを利用できない構成でも価格メリットがありますので、1Uモデルでもオールフラッシュ化しましょう!

 

2. さらに効率良いHCI構成を組むには?

f:id:t_komiya:20191207142347p:plain

Nutanixをさらにパフォーマンスを上げるためには、ハードウェアのパワーを借りる必要があります。以前こちらのブログでもご紹介した、上図のイメージのようなテクノロジーになります。

 

詳細は以下のURLに説明しておりますので、再度記載することは致しませんが、少し内容を補足しながら説明を行いたいと思います。

blog.lenovojp.com

 

・NVMeを導入する場合は、10Gのネットワークではボトルネックになることもある!?

f:id:t_komiya:20191207143044p:plain

昨年投稿したブログにも記載がありますが、NVMeは64Kのコマンドキューでストレージを通信してデータをアクセスを行います。そのため、データローカリティなどで書き込んだデータが同容量分別ノードにレプリケーションを取られることを考えると、大量のデータがネットワーク上に流れます。そのため、従来の10Gbのネットワークではスピードが足りなくなることが考えられます。

一般的には最大28Gb/s程度のネットワークが必要とされることから、10Gbのスイッチではなく25Gbスイッチは最低でも用意して頂いた方が良いかと思われます。

アプリケーションの通信などにおいては、RDMAなどのホストのCPUをオフロードする機能も利用できるようなNICを用意しておきましょう。

 

25Gbのスイッチに関しては、10Gbに比べると高いように思われますが、ベンダーにもよりますが、現状はそれほど高価ではなくなっているようです。また10Gbとの互換性もありますので、もし書き込みが多いアプリケーションを稼働させる場合は25Gbのスイッチを購入するのも悪くないと考えます。

 

・メモリも選び方によってはワークロードのパフォーマンスを上げてくれる!?

f:id:t_komiya:20191207145643p:plain

前述でSSDやNVMeのお話をしましたが、メモリモジュールでもストレージとして利用可能なPersistent Memory(永続的メモリ)を利用することにさらに高速化することができます。SSDから見るとレイテンシだけでいうと1000の1程度になります。最新のIntel社のCPUでこちらのメモリを選択可能になっているので、Nutanixで対応になった場合は是非試し頂ければと思います。(現状は構成不可)


・CPUはワークロードごとに選択できるの!?

f:id:t_komiya:20191207150354p:plain

現状IntelのCPUは4桁の数字と最後にアルファベットがついていることがあります。

アルファベットをよく見るとNFV用、検索用、VMの収容度、メモリ容量によって選択できることがあります。

VDIやデータベースの場合はM/Lなどの型番を選択することでメモリをより多く搭載できるハードウェアを選択することもできるため、どのようなワークロードを動作させるのかは考慮した上で、CPUの選択することも必要かもしれません。

 

今までのシステムではワークロードによりノードを分けて提案することが多かったかと思います。HCIになりインフラを統合することにより管理は統合したもののワークロードの種類によってノードを分けて動作させることはしたくないかと思います。

アプリケーションのライセンスの関係ですべてのワークロードに適用できるわけではありませんが、ライセンス費用がかさむようなことのワークロードであれば、オールフラッシュですべて統合してしまうことにより、パフォーマンスをボトルネックを少なくするということも悪くない構成だと思います。

 

昨今働き方改革などで業務の効率化が検討されております。オールフラッシュなどを積極的に導入することにより、効率化UPできるようなHCIを実現してみてはいかがでしょうか。
 

よろしくお願い致します。