Sunday, May 8, 2022

SANストレージとは:コスト圧縮技術が急進展、10年前の常識は通用しない! - 日経 xTECH Active

superselebbanget.blogspot.com
(出所:123RF)

(出所:123RF)

 ストレージ装置を、専用ネットワークでコンピュータに接続して使う場面が増えた。このようなストレージ専用ネットワークをSAN(Storage Area Network)といい、そこに接続するストレージを「SANストレージ」と呼ぶ。SANストレージは、コスト圧縮の技術が2010年代終盤にかけて実用的になったことで、現実的な選択肢になった。10年前の知識・常識はもはや通用しない。

 本記事ではSANストレージとは何か、SANストレージを効率的に利用する機能、メリットとデメリット、料金相場などを、ITインフラ アドバイザーの山田正和氏が解説する。併せて、代表的な製品や、日経クロステックActiveの記事で取り上げられた事例などを紹介する。

初回公開:2022/5/9

*「1. SANストレージとは」「2. SANストレージを効率的に利用する機能」「3. SANストレージを効率的に利用する機能のメリットとデメリット」「5. SANストレージの価格相場」は山田正和氏が執筆

1. SANストレージとは

 SAN(Storage Area Network)は、ストレージ装置とコンピュータを接続するストレージ専用ネットワークである。このストレージ専用ネットワークに接続するストレージを「SANストレージ」と呼ぶ。

 システム開発・運用の経験がある読者は、「SANストレージはとにかく高価」というイメージが強いだろう。大企業向けの製品では5年間の保守料金を含めて数億円台かかることも珍しくなかったからだ。フラッシュストレージの登場により、さらに拍車がかかったと感じる読者も多いだろう。

(出所:123RF)

(出所:123RF)

 しかし、「SANストレージはとにかく高価」は過去のイメージになりつつある。ストレージを効率的に利用し、SANストレージにかかるトータルコストも圧縮できる技術が2010年代終盤にかけて実用的になり、広く使われるようになったからだ。10年前の知識・常識は今では通用しなくなっている。

 具体的には、「自動階層型ストレージ機能」「SSDキャッシュ機能」「重複排除・圧縮機能」「マルチプロトコル機能」「クラウド連携機能」の5つが効率的にストレージを利用する技術の代表格だ。以前から存在はしていたが、実装の完成度に課題があったりして十分に活用されていなかった。ところが、ここ10年で技術がこなれて実用性が格段に高まり、状況が大きく変わった。

 これらは教科書的な学習をしていても得られない知識であり、ストレージベンダーから説明を受けたり、積極的に情報収集したりしないと得にくい知識である。以降で、効率的にストレージを利用する技術の概略やメリット・デメリット、そうした技術を搭載したストレージ装置の価格相場などを解説する。

2. SANストレージを効率的に利用する機能

 SANストレージを効率的に利用する5つの代表的な機能について説明する。

(1)自動階層型ストレージ機能

 従来は、業務用途ごとに将来の需要を予測して、それに応じてディスク容量や性能を設計する必要があった。また、将来の負荷増大に備えて、保険的に高性能なディスクを搭載しておくのが一般的だった。

 というのも、従来の一般的なストレージ設計では、SSD、SASハードディスク、SATAハードディスクなど速度や信頼性の異なる記憶媒体ごとにRAIDグループを定義し、業務用途の負荷に応じて論理ユニット(LU)を定義することで、配置設計していた。例えばデータベース(DB)のように頻繁にアクセスされるデータ領域はSSDで構成されたRAIDグループに、大量の過去のログなどアクセス負荷は高くないデータ領域はSATAハードディスクで構成されたRAIDグループに配置していた。

 一方、今日のSANストレージは「自動階層型ストレージ機能」を利用できる。自動階層型ストレージ機能では、記憶媒体の性能に応じて仮想的なグループを作り、グループ間で自動的に配置変更する。高い頻度でアクセスされるデータは性能の高いグループに自動配置され、アクセスの頻度が低いデータは性能の低いグループに自動配置される。そのため、ストレージ設計時に将来の需要予測まで加味して配置設計する必要はなくなった。

 将来の負荷増大の対策として、従来は保険的にSASハードディスクを調達する必要があったが、その必要性は自動階層型ストレージ機能の普及によって低減している。なお、従来は論理ユニットの移動を手作業で実施する必要があり、階層型のコンセプトを実運用に落とし込むのは困難だったが、自動階層型ストレージ機能では夜間帯に自動実施するので容易に実現できるようになった。

(2)SSDキャッシュ機能

 物理ディスクのアクセス速度はそれほど高くないため、メモリー(DRAM)をストレージのキャッシュに用いてアクセス速度を底上げしている。しかし、DRAMを用いたキャッシュメモリーは高価で、せいぜい総ストレージの1%にも満たない容量を搭載するのが精いっぱいだ。断続的なストレージへのアクセスによりキャッシュでは応答しきれなくなると、物理ディスクへのアクセスが発生する。こうなるとキャッシュによるアクセス速度の底上げ効果がなくなり、ストレージのアクセス速度が落ちてしまう。

 こうしたメモリーによるキャッシュを補完する技術が「SSDキャッシュ機能」だ。メモリーと物理ディスク間の2次キャッシュとしてSSDを利用する技術である。SSDはメモリーに比べると応答速度が遅いが、メモリーよりも安価だ。総ストレージ容量の1割程度を実装することも難しくない。そうすると、一般的なストレージ用途であれば90%後半の高いキャッシュヒット率を維持でき、「SSDキャッシュと性能が低いが廉価なSATAハードディスクで構成する」といったストレージの設計が可能で、ストレージのトータルコストを抑えられる。

 なお、SSDキャッシュ機能は、メモリーのキャッシュと同様にリアルタイムでキャッシュデータが出し入れされ、キャッシュ対象の単位も細かく、論理ユニット単位で有効にしたり無効にしたり柔軟な対応が可能だ。

(3)重複排除・圧縮機能

 重複排除機能は特定のサイズ(4キロバイトや8キロバイトなど)単位で重複するデータを検出して、同一のデータは重複して保管しない機能だ。用途によっては、ストレージ容量を大幅に削減できる。特に仮想デスクトップ環境(VDI)など、大量の仮想マシン(VM)のクローンで構築するような用途だと、絶大な効果を発揮する。全VMが共通してアクセスするOS領域やOfficeバイナリーファイルなどは重複排除が効きやすく、キャッシュにも維持されやすいからだ。

 一方、データ圧縮機能は物理ドライブにデータを書き込む際、データを圧縮する機能だ。一般的な圧縮解凍ソフトのような動作を、データアクセス時に自動で実施すると考えると分かりやすい。

(出所:123RF)

(出所:123RF)

 重複排除・圧縮機能を利用すると、格納する物理的なデータ量を削減して、物理ディスク容量を小さくしつつ、ユーザー全体に見せる領域は論理的に大きく見せることができる。つまり、限られた高性能なディスクを、多くのユーザーで共通して利用することが可能になる。ストレージ性能向上、コスト削減どちらの目的にもかなう技術となる。

 この機能が過去に活躍していたのは、主にバックアップ用のストレージであった。重複排除と圧縮の処理が、アクセス時のオーバーヘッドとなるからだ。しかし近年は、重複排除ロジックの性能向上、CPUやASICの進化に伴い、オーバーヘッドがストレージ全体の性能に与える影響が小さくなった。その結果、プライマリーストレージで常時利用しても差し支えないレベルになっている。

(4)マルチプロトコル機能

 従来のSANストレージはファイバーチャネル(FC)接続を用いるのが一般的だったが、近年はイーサネットのインターフェースを利用するiSCSI接続が普及してきた。

 一昔前のSANストレージもFCとiSCSIの両方に対応していたが、主役はFCで、iSCSIは脇役程度のイメージが強かった。しかし、ここ数年で10Gbpsのネットワーク・インターフェース・カード(NIC)やL2スイッチの低価格化が進んだことに伴い、iSCSI接続の普及が進んだ。FCは高速で信頼性が高い一方、専用のホスト・バス・アダプター(サーバーに搭載するインターフェースカード)やSANスイッチが必要で、それらは高額だった。また、設計や運用にあたってはFCに精通しSAN特有のスキルセットを持った要員が必要だった。iSCSIでは、こうした部品や要員が不要となるメリットもある。現在の一部のストレージ製品ではiSCSIが標準で、FC接続がオプションの製品もあるほど、iSCSIは一般的になってきている。

 イーサネットのインターフェースで接続するiSCSIが普及したことにより、一部のSANストレージ製品ではファイル共有プロトコルの実装に拍車がかかったように感じる。ファイルサーバー向けのプロトコルであるNFSやCIFSも標準で実装するユニファイドストレージ製品も以前からあったが、ストレージの接続方法をイーサネットに統一することで存在感を増し、ミッドレンジモデルを中心に目立ってきた。結果、ストレージ統合によるコスト低減と、管理対象が少なくなることでの運用維持コスト低減が可能になった。

(5)クラウド連携機能

 IT業界のここ10年で最も大きな変化といえばクラウドの普及である。今日のストレージはクラウドとの連携機能も備えている。これにより大きく変わったのが、保守である。以前は、ストレージを電話回線で接続し、障害が発生したらサポートに故障状況を連携する仕組みが一般的だった。しかし最近は、クラウドによってストレージの稼働状況を常に連携し、故障予兆やストレージ使用率などをベンダー側で監視することが可能になり、ローカルサイトでの監視をアウトソースできるようになった。ストレージから通知される異常や警告イベントへの対応がベンダー側で可能となり、情報システム担当者の負荷低減に寄与する。

 また、ストレージのバックアップ先として同一製品のストレージに複製を作るレプリケーションが一般的だったが、パブリッククラウドのストレージサービスをバックアップ先に指定できる製品もある。災害対策で遠隔地のデータセンターにラックとストレージを配置する場合と比較して、構築の手間と費用が少なく済む。

(出所:123RF)

(出所:123RF)

3. SANストレージを効率的に利用する機能のメリットとデメリット

 SANストレージを効率的に利用する機能の導入により、もたらされるメリットとデメリットは以下の通りだ。

(1)自動階層型ストレージ機能のメリットとデメリット

 メリットは、長期的なストレージに対する負荷特性の変化に対応しやすいことである。以前から論理ユニットのRAIDグループ間の移動を動的に行うことは可能だったが、そのためには日々の論理ユニットの負荷特性を計測・評価する必要があった。とはいえ実際には、性能問題が表面化してから対応することが大半だろう。この計測・評価・移動を全自動でストレージ機能に任せられることがメリットである。

 デメリットとしては、自動階層型ストレージ機能の再配置機能が意図しない振る舞いをする可能性があることだ。例えば、負荷は高いが完了時刻までは余裕があるバッチ処理で再配置が発生し、翌日のオンライン業務で使用するデータベース領域が低速なストレージに移動され、オンライン業務に影響が出るなどの事態が起こり得る。明らかにストレージに高い性能が必要な領域は、SSDやSASハードディスクの領域に固定することをお薦めする。このように業務特性を考慮して、本機能を適用するか否かを設計しなければならないのは、本末転倒のようにも思える。そのため、リアルタイムでキャッシュデータが出し入れされ、キャッシュ対象の単位も細かく、論理ユニット単位で有効にしたり無効にしたりできるSSDキャッシュ機能の利用を、代わりに検討してほしいと筆者は考える。

(2)SSDキャッシュ機能のメリットとデメリット

 メリットは、ストレージ性能の底上げである。前述の自動階層型ストレージ機能に比べて突発的なストレージ負荷にも対応しやすく、ほとんどの利用シーンで有効に作用する。SSDキャッシュの効果で物理ディスクへのアクセスが少なくなるため、従来のように高速な物理ディスクを多数搭載し、ディスクの数を増やしてストレージ性能を確保する必要がない。また副次的な効果として、低価格・大容量のSATAハードディスクを効率的に利用することで、コストとデータセンタースペースと消費電力の削減にも寄与する。つまりSSDキャッシュ機能は、性能とコストの両方のメリットが享受できるといえる。

 デメリットというより注意点になるが、ストレージの広範囲にわたり断続的にランダムアクセスが発生するような用途は、仕組み上SSDキャッシュが効きにくいことには気をつけたい。このようなケースでは、当該論理ユニットをSSDキャッシュの対象から外すことで他の論理ユニットの性能劣化を避ける。またディスクの数を増やして読み込み速度を確保する性能設計が有効である。数十年前からのストレージ性能設計の定石であるが、注意したい。

(出所:123RF)

(出所:123RF)

(3)重複排除・圧縮機能のメリットとデメリット

 メリットは、OSなどのイメージファイルをコピーしてシステム構築するケースでは、ストレージ容量の大幅な節約が可能なことである。典型的なユースケースとしては、VDI環境がある。同じOSを搭載した仮想マシンが大量に作られ、更新データの大半が定期的なセキュリティパッチの一律適用であるため、極めて相性が良い。重複排除処理も圧縮・解凍処理もリアルタイムで行われるが、VDI環境で利用する限り、遅延は体感できない程度である。

 デメリットではなく注意点になるが、ゲストOSのレイヤーで暗号化されるデータは、重複排除の効果がほぼゼロになり得る。ゲストOS上で暗号化するようなケースでは、各ブロックが暗号化によってユニークとなり、重複排除が効かないからだ。暗号化がセキュリティポリシーのために必要な場合は、ストレージの暗号化機能で対応することが望ましい。

(4)マルチプロトコル機能のメリットとデメリット

 メリットは、ブロックストレージとファイルサーバーを別々に設計・構築・運用する必要がないことである。管理対象が少なくなるため小規模な情報システム部門にとってメリットが大きい。

 デメリットは、1つのストレージを様々な用途で利用可能となり、「バックアップ元とバックアップ先が同一のストレージ」といった、ストレージの故障対策にならないバックアップ運用が起こりやすくなる。具体的には、仮想マシン上で稼働するDBサーバーのバックアップをNFSサーバー上にファイルで取得するケースである。この場合、ストレージを設計した人から見れば複数のプロトコルを持つストレージだからバックアップ先として適切でないことは分かる。だが、そうした構成を十分に理解していない人から見るとSANとNFSは別のストレージとして見えてしまうため、注意が必要である。

(出所:123RF)

(出所:123RF)

(5)クラウド連携機能のメリットとデメリット

 メリットは、ベンダー側でのきめ細やかな異常検知とトラブルの予兆検知が可能になることである。特に前述の重複排除・圧縮機能の普及により物理容量を超えた論理容量をデプロイする(割り当てる)ことが多くなってきたことで、キャパシティー管理が複雑になった。そのようなときにキャパシティー監視をベンダー側でも見てもらえることは心強い。また、難解なストレージの異常・警告メッセージの検知・解析・対応をベンダー側に一任できるため、情報システム部門のストレージ担当者の負荷を大幅に下げることができる。

 さらに、ストレージのバックアップ先としてパブリッククラウドを利用すると、バックアップ先のデータセンターにラックとストレージを配置する場合に比べて構築の手間と費用を抑えられるため、費用面でもメリットが大きい。

 デメリットとしては、やはりセキュリティである。認証やアクセス制御などを適切に設定することでリスクを最小化し運用することは可能だが、セキュリティに絶対はない。そもそも社内のポリシー上、機密情報が集まるストレージを社外に配置すること自体を受容できないという会社も少なくない。利便性とセキュリティのバランスを鑑みて利用を検討したい。

4. SANストレージの代表的な製品

 代表的なSANストレージの製品として、出荷台数が比較的多いミッドレンジクラス、およびエントリークラスから6つの製品を挙げる。なお、同一製品でエントリーからミッドレンジまでを包含する性能やキャパシティーを有する製品もあるため、クラスの区分はあくまで参考である(日経クロステック Active調べ)。

ミッドレンジクラス

 ミッドレンジクラスにあたるのが、以下の4つである。

(1)HPE Primera:日本ヒューレット・パッカード HPE PrimeraのWebページ 、 (2)PowerStore:デル・テクノロジーズ PowerStoreのWebページ 、 (3)Hitachi Virtual Storage Platform Eシリーズ:日立製作所 Hitachi Virtual Storage Platform EシリーズのWebページ 、 (4)ETERNUS HX series:富士通 ETERNUS HX seriesのWebページ

エントリークラス

 エントリークラスにあたるのが、以下の2つである。

(1)HPE MSAストレージ:日本ヒューレット・パッカード HPE MSAストレージのWebページ 、 (2)PowerVault ME:デル・テクノロジーズ PowerVault MEのWebページ

5. SANストレージの価格相場

 各ベンダーの製品に応じて価格相場は異なるが、ここではミッドレンジモデルを前提に、VDI環境用途と統合ストレージ用途のケースについて述べる。

(1)VDI環境用途

 重複排除と圧縮、およびSSDキャッシュの機能が極めて有効に機能する。ゲストOSの数が多ければ多いほど重複排除が効き、コスト効率は向上する。SSDキャッシュと大容量SATAハードディスクの組み合わせによりコスト低減を図ったケースでは、筆者の主観ではあるが、従来のストレージ構成と比較して5分の1程度にコスト圧縮が可能だと考える。

 実際、1000VM(仮想マシン1000台)規模のVDI環境のストレージを数千万円程度で調達できた。しかも、これはかなり安全側に倒した重複排除率で設計した。計算上はその4分の1程度のストレージ容量(≒費用)でも問題なかったが、将来的に各ユーザーがローカルにファイルを配置し、必要なストレージ容量が増大することも想定され、高めの安全率を取った設計とした。

 従来、VDI環境では性能を考慮して多数のSASハードディスクで構成し、ラックスペースも電力も大きかったため「ストレージ=金食い虫」の印象が強かったが、今日はストレージ機能を有効に活用することにより大幅なコスト低減が可能になっている。

(出所:123RF)

(出所:123RF)

(2)統合ストレージ用途

 様々な用途のデータをまとめて格納する統合ストレージとして利用する場合は、重複排除機能は効果が望めないため適用しない。代わりにSSDキャッシュや、部分的に圧縮機能を利用する。この前提だと、従来のストレージ構成と比較して、筆者の主観ではあるが半分程度にコスト圧縮が可能だと考える。なお、IaaS(Infrastructure as a Service)環境のOSイメージファイルも配置する場合はその領域のみ重複排除を有効化し、データベースのデータ領域やログ保管領域などは重複排除を無効化するといった考慮をすることで、費用面と性能面のメリットを最大化できる。

 通常の統合ストレージは、特定の領域にアクセスが集中しやすい傾向がある。ホットスポットと呼ばれる領域である。そういった領域にSSDキャッシュが効果的に作用し、一定レベルの速度性能の底上げが可能となる。従来のSASハードディスクを多数並べるアプローチから脱却可能であり、前述の通りコストの圧縮が可能である。

 なお、ストレージベンダーのスペックシートを参照すると、この用途に求められる性能要件は数万IOPS(Input/Output Per Second)程度である。これが前提条件となる

6. SANストレージの代表的な事例

7. 注目のSANストレージ関連製品とサービス

 SANストレージを導入して現場で活用するには、様々な手助けをしてくれる製品やサービスを利用するとよりスムーズに進む。以下では、注目のSANストレージ関連製品とサービスを紹介する。

ネットアップ

ネットワールド

ネットワールド

日本クアンタムストレージ

8. SANストレージの新着プレスリリース

山田 正和
ITインフラ アドバイザー

現在、インフラ技術者としてマルチベンダー系SIer勤務。新卒以来約20年、金融・公共・法人など領域を問わずミッションクリティカルシステムのインフラ領域の構築に従事。バズワード的に出てくる新技術もデメリットを見極めつつ、メリットが最大化できるように、適用領域の目利きが肝要。また、システムは運用・維持のフェーズで価値を生み出してこそと考える。

Adblock test (Why?)


からの記事と詳細 ( SANストレージとは:コスト圧縮技術が急進展、10年前の常識は通用しない! - 日経 xTECH Active )
https://ift.tt/wY1XyDn
Share:

0 Comments:

Post a Comment