検索
言語

データ重複排除と圧縮

冗長データからディスク領域を解放することにより、ストレージのオーバーヘッドを削減

チェックされていないデータの増加は、多くの場合、ストレージ容量の急速な枯渇につながります。これにより、ITチームはハードウェアを追加し続けるため、結果的に不要なコストとリソースのオーバーヘッドが生じます。重複するデータセットは、問題の主要な原因となります。圧縮される可能性もあるが、元のサイズで保存されることでより多くのディスク領域を占めるデータセットも同様です。ストレージ容量の効果的な最適化が、これらの課題に対処するのに役立ちます。

DataCore SANsymphony software-defined storage offers two data reduction techniques for capacity optimization. Storage deduplication eliminates redundant data. Compression condenses the space required to store data. Both techniques prevent data loss to always maintain data integrity.

重複排除と圧縮とは

重複排除重複排除はデータのブロックを分析し、データブロックごとに一意のハッシュを作成します。ディスクに書き込まれる新しいブロックが既存のブロックと同じハッシュ値を持つ場合、既存のデータブロックを指す識別子に置き換えられます。

データの複数の冗長コピーを単一のコピーへの参照に置き換えることができるため、必要な容量を削減できます。

重複排除は、スナップショットやVDIイメージ内の冗長性など、同じデータのブロックが複数ある場合に最も効果的です。

重複排除圧縮は、最初に行に表示される同一のデータシーケンスを見つけ、次に最初のシーケンスのみを保存し、以降の同一のシーケンスを行に表示される回数に関する情報に置き換えることによって、データのサイズを縮小するアルゴリズムプロセスです。

最初のデータシーケンスのみがそのまま保存されるため、同じ情報を再度表す場合は、より少ないディスク領域容量で十分です。圧縮は通常、データセット自体の性質 (データセットが圧縮可能な形式であるかどうか、およびどれくらいのデータセットを圧縮できるか) に依存します。

重複排除と圧縮のメリット

  • ディスク領域の要件を削減し、ストレージの割り当てを最適化
  • ITコストの削減とROIの向上
  • ハードウェアの設置面積を削減し、設置面積とエネルギー要件を削減
  • ストレージ効率の向上

データ重複排除と圧縮の2つのアプローチ

DataCore SANsymphonyは、ストレージの重複排除と圧縮を実行する2つのアプローチを提供します。お客様のビジネス要件とIT要件に基づいて、適切なアプローチを選択できます。

インラインの重複排除と圧縮: データがディスクに書き込まれる前にデータの削減が行われます。SANsymphonyは受信データをスキャンして分析し、潜在的な最適化の可能性を探し、重複排除と圧縮を実行します。インライン処理により、データが保存される前に重複排除および圧縮が実行されるため、ディスク容量の要件が軽減されます。バックアップ操作が頻繁に実行され、生成される冗長データが多い場合は、バックアップを保存する前にデータサイズを削減するインライン処理を推奨します。

インラインの重複排除と圧縮は、SANsymphonyのENエディションでのみサポートされており、個別に、または必要に応じて重複排除、圧縮、またはその両方と一緒に有効にすることができます。

ポストプロセスの重複排除と圧縮: データがディスクに書き込まれた後にデータの削減が行われます。SANsymphonyは、まず生データをターゲットのストレージデバイスに保存します。その後、保存されたデータをスキャンして分析し、最適化の可能性を探します。重複排除および圧縮されたデータは、ストレージデバイスに書き戻されますが、以前よりも占有容量が少なくなっています。データ削減前に生データが最初にそのまま保存されるため、ポストプロセスを行うとターゲットデバイスの初期容量の割り当てが大きくなることに注意する必要があります。ポストプロセスにより、ピーク時以外の時間帯に容量の最適化をスケジュールできるため、ピーク時のIOPSへの影響を最小限に抑えることができます。

ポストプロセスの重複排除と圧縮は、SANsymphonyのEN、ST、およびLSエディションでサポートされています。SANsymphonyのエディションを比較してみましょう

インラインとポストプロセスのデータ重複排除と圧縮のインフォグラフィック

SANsymphonyを使用したインラインとポストプロセスのデータ重複排除と圧縮

重複排除と圧縮の効率と出力を決定するには、データの種類、データの変更率、アクセス頻度、バックアップ頻度など、多くの要因があります。アプリケーションレベルである程度の冗長性の排除を本質的に実行するワークロードもあり、その場合は重複排除と圧縮率が低くなります。また、同じオペレーティングシステムイメージの複数のコピーを持つVDIなどのワークロードもあり、その場合はバックアップ時の重複排除と圧縮率が高くなります。重複排除と圧縮によるメリットが最も高いファイルの種類には反復データブロックが含まれ、これは比較的静的なコンテンツを含み、アクセス頻度が低いです。インラインおよびポストプロセスの両方の容量最適化技術により、ITチームは設備投資費の削減を実現できます。実際の削減額は、重複排除および圧縮処理の効率と、個々の容量最適化率によって異なります。

ソフトウェアディファインドブロックストレージであるSANsymphonyを使ってみましょう