データウェアハウスのアーキテクチャ



このブログは、データウェアハウスのアーキテクチャ全体に焦点を当てています

データウェアハウスとは何ですか?

データウェアハウスは、複数の場所からの統合データが保存される中央の場所です。データウェアハウスは、新しいデータが生成されるたびに読み込まれるわけではありませんが、エンドユーザーは情報が必要なときにいつでもデータを評価できます。データウェアハウスを毎日、毎月、または四半期に1回ロードする必要がある時期については、ビジネスによって決定される特定のタイムラインがあります。





データウェアハウスアーキテクチャ

データウェアハウジングシステムが異なれば、構造も異なります。データソースの数が少ないものもあれば、大きいものもあります。

画像に示されているように、複数のトランザクションシステム、ソース1およびその他のソースがあります。ソースはSAPまたはフラットファイルである可能性があるため、ソースの組み合わせが存在する可能性があります。 ETL(Extract、Transfer、Load)は、データマートにデータウェアハウスをロードするために使用されます。データハウスとデータマートの違いは、データウェアハウスは組織全体で使用されるのに対し、データマートは個別にカスタマイズされたレポートに使用されることです。



Informaticaでの変換の種類

たとえば、財務部門のような会社には、マーケティング部門とは大きく異なる複数の部門があります。それらはすべて異なるソースからデータを引き出し、カスタマイズされたレポートが必要です。財務部門は主に統計に関心があり、マーケティング部門はプロモーションに関心があります。マーケティング部門は財務に関する情報を必要としません。

カスタマイズされたレポートには、データマートと呼ばれるデータウェアハウスのサブセットが必要です。それをロードする方法は2つあります。まず、データウェアハウスをロードしてから、マートをロードします。その逆も同様です。データアクセス層であるレポートシナリオでは、ユーザーはデータウェアハウスにアクセスし、レポートを生成します。これらのレポートツールはすべて、意思決定レベルの人々が技術情報に関心を持っていないため、消費者にとってフロントインターフェイスを非常に簡単にすることを目的としています。彼らは主にきちんとした使用可能なレポートに関心があります。

したがって、これらのレポートツールはすべてフロントエンドで実行されますが、バックエンドではクエリが生成されてデータベースにアクセスし、ユーザーはジャストインタイムでレポートを取得します。これらのレポートツールは、実行するジョブをスケジュールしてレポートを生成できます。



質問がありますか?コメント欄にご記入ください。折り返しご連絡いたします。

関連記事: