データレイク

さまざまな種類や構造を持った膨大な量のデータ(ビッグデータ)を蓄積するデータ統合基盤を指す。
データウェアハウスがソースデータの取得プロセスを抽出・変換・読込の順番で行うのに対し(ETL)、データレイクでは抽出・読込・変換の順番で行う(ELT)。これは、データレイクはビッグデータを取り扱う性質から、事前に統合せず特定用途に合わせて統合することが多いためである。
(一部DMBOK2.0より抜粋、要約)

関連記事

« 一覧へ戻る

前の記事

データウェアハウス

次の記事

データマート