データウェアハウスとは何ですか?
データウェアハウスは、複数の場所からの統合データが保存される中央の場所です。データウェアハウスは、新しいデータが生成されるたびに読み込まれるわけではありませんが、エンドユーザーは情報が必要なときにいつでもデータを評価できます。データウェアハウスを毎日、毎月、または四半期に1回ロードする必要がある時期については、ビジネスによって決定される特定のタイムラインがあります。
データウェアハウスアーキテクチャ
データウェアハウジングシステムが異なれば、構造も異なります。データソースの数が少ないものもあれば、大きいものもあります。
画像に示されているように、複数のトランザクションシステム、ソース1およびその他のソースがあります。ソースはSAPまたはフラットファイルである可能性があるため、ソースの組み合わせが存在する可能性があります。 ETL(Extract、Transfer、Load)は、データマートにデータウェアハウスをロードするために使用されます。データハウスとデータマートの違いは、データウェアハウスは組織全体で使用されるのに対し、データマートは個別にカスタマイズされたレポートに使用されることです。
Informaticaでの変換の種類
たとえば、財務部門のような会社には、マーケティング部門とは大きく異なる複数の部門があります。それらはすべて異なるソースからデータを引き出し、カスタマイズされたレポートが必要です。財務部門は主に統計に関心があり、マーケティング部門はプロモーションに関心があります。マーケティング部門は財務に関する情報を必要としません。
カスタマイズされたレポートには、データマートと呼ばれるデータウェアハウスのサブセットが必要です。それをロードする方法は2つあります。まず、データウェアハウスをロードしてから、マートをロードします。その逆も同様です。データアクセス層であるレポートシナリオでは、ユーザーはデータウェアハウスにアクセスし、レポートを生成します。これらのレポートツールはすべて、意思決定レベルの人々が技術情報に関心を持っていないため、消費者にとってフロントインターフェイスを非常に簡単にすることを目的としています。彼らは主にきちんとした使用可能なレポートに関心があります。
したがって、これらのレポートツールはすべてフロントエンドで実行されますが、バックエンドではクエリが生成されてデータベースにアクセスし、ユーザーはジャストインタイムでレポートを取得します。これらのレポートツールは、実行するジョブをスケジュールしてレポートを生成できます。
質問がありますか?コメント欄にご記入ください。折り返しご連絡いたします。
関連記事: