これまでのデータパイプラインは、オンプレミスのビジ ネスアプリケーションから収集される、動きが遅く簡単 に分類可能で予測可能なデータに対応するように設計 されたものでした。こうしたデータパイプラインは、さま ざまなソースからデータを取得し、使える形式に変換し てからデータウェアハウスなどのターゲットにロードす るという抽出、変換、ロード(ETL)型プロセスを採用し ています。このような旧式のパイプラインは、エンタープ ライズアプリケーションからの構造化データのソースは 問題なく処理できますが、最新のデータ環境の特徴であ る、多彩なデータタイプや取り込みスタイルには十分に 対応することができません。

いっぽう最先端のパイプラインは、まずデータを抽出してロー ドし、目的の場所に到達してからデータを変換するように設計 されています。このサイクルをELTと呼びます。最新のELTシス テムは、変換ワークロードをクラウドへ移すことにより、より高 い拡張性と伸縮性を実現しています。従来のオンプレミス環境 では、ETLジョブは同じインフラストラクチャー上で実行される 他のワークロードとのリソース競合が発生しますが、ELTでは、 データを未加工の状態で読み込み、データがどのように使われるかはっきりしてから用途に適した様々な方法でデータを変換します。

本E-bookでは下記について学べます:

  • 各アプローチの利点と欠点
  • 汎用性の高いデータマネジメント戦略の立て方
  • データパイプラインにおいてETLとELTを比較検討する場合

詳しくは、E-book「オンプレミスのETLからクラウドドリブンのELTへ」をダウンロードしてください。