Informaticaチュートリアル:Informaticaの「裏返し」を理解する



このInformaticaチュートリアルブログでは、Informatica PowerCenterの詳細、Informaticaアーキテクチャ、およびInformaticaでドメインを作成する方法について説明します。

前回のブログで そしてその実際のアプリケーション。ここで深く掘り下げて、このInformaticaチュートリアルブログで、Informatica、そのアーキテクチャ、およびユースケースについて理解しましょう。 は、さまざまな標準、システム、およびアプリケーションで相互運用できる独自の偏りのないデータ統合プラットフォームであるため、今日の市場で最も夢中になっているスキルの1つです。前回のブログで説明したように、Informatica PowerCenterはInformaticaの主力製品であり、同じ意味で使用されることがよくあります。要約すると、Informatica Powercenterは、あらゆる規模の企業や政府組織が、事実上あらゆるビジネスシステムのデータに、あらゆる形式でアクセス、検出、統合し、そのデータを企業全体にあらゆる速度で配信できる、単一の統合されたエンタープライズデータ統合プラットフォームです。 。これはETLツール(抽出、変換、読み込み)であり、他のETLツールに比べて主な利点は次のとおりです。

  • 堅牢で、WindowsとUNIXベースのシステムの両方で使用できます
  • 高性能でありながら、開発、保守、管理が非常に簡単です。

Informaticaチュートリアル:InformaticaPowerCenterを理解する

Informaticaをリアルタイムで理解するには、InformaticaアーキテクチャおよびInformaticaの他のコンポーネントについて深く理解する必要があります。したがって、このInformaticaチュートリアルブログの最後で、次のことを理解できるようになります。





  1. Informaticaアーキテクチャとは何ですか?
    1. Informaticaのクライアントコンポーネント
      1. InformaticaPowerCenterリポジトリマネージャ
      2. Informatica PowerCenter Designer
      3. PowerCenterワークフローマネージャー
      4. PowerCenterワークフローモニター
      5. コンソール管理者
    2. Informaticaのサーバーコンポーネント
      1. リポジトリサービス
      2. 統合サービス
      3. SAPBWサービス
      4. Webサービスハブ
  2. Informaticaでのデータの流れ
  3. Informaticaドメインとノード
  4. Informatica Services&Service Manager
  5. ユースケース:SCDを使用して製品ディメンションテーブルをロードする方法

Informaticaアーキテクチャとは何ですか?

Informatica PowerCenterのアーキテクチャは、サービス指向アーキテクチャ(SOA)の概念に基づいています。サービス指向アーキテクチャー(SOA)は、相互に通信するサービスのグループとして定義できます。通信のプロセスには、単純なデータ転送が含まれるか、同じアクティビティを調整する2つ以上のサービスが含まれる可能性があります。

Informaticaの開発は、コンポーネントベースの開発手法に基づいています。コンポーネントベースの開発は、特定の機能を備えた事前定義されたコンポーネントまたは機能ユニット、あるいはその両方を使用して最終製品を組み立てる手法です。 PowerCenterは、さまざまなコンポーネント(変換と呼ばれる)を使用し、必要に応じてそれらを相互にリンクすることにより、ソースからターゲットへのデータフローを構築できるようにすることで、コンポーネントベースの開発方法論に従います。それを実行するための良い方法は、最初にInformaticaのコンポーネントが何であるかを理解することです。次に、ユースケースを通じて典型的なビジネス上の問題を解決するためにInformaticaを適用する方法を学びます。



したがって、InformaticaPowerCenterツールは2つのコンポーネントで構成されています。彼らです:

  • クライアントコンポーネント
  • サーバーコンポーネント
Informatica-tutorial-Informatica-Architecture

図:Informaticaアーキテクチャの概要

Informatica PowerCenterのクライアントコンポーネント:

  • PowerCenterリポジトリマネージャー:

リポジトリマネージャは、リポジトリを管理するために使用されます。ユーザーとグループを管理できます。リポジトリユーザーとユーザーグループを作成、削除、編集できます。リポジトリの権限とフォルダの権限を割り当てたり、取り消すこともできます。



リポジトリマネージャには、次のウィンドウがあります。

  • ナビゲーター: リポジトリマネージャ、デザイナ、およびワークフローマネージャで作成したすべてのオブジェクトが表示されます。最初にリポジトリごとに、次にフォルダごとに編成されています。
  • メイン: ナビゲーターで選択されたオブジェクトのプロパティを提供します。このウィンドウの列は、ナビゲーターで選択したオブジェクトに応じて変わります。
  • 出力: リポジトリマネージャ内で実行されたタスクの出力を提供します。

図:リポジトリマネージャー

  • Informatica PowerCenter Designer

PowerCenter Designerは、さまざまなソースとターゲット間でデータを移動する方法を指定するクライアントです。 ここで、変換と呼ばれるさまざまなPowerCenterコンポーネントを使用してさまざまなビジネス要件を解釈し、それらを介してデータを渡します(変換)。 Designerは、ソース定義、ターゲット定義、および変換を作成するために使用され、マッピングの開発にさらに利用できます。

図:Informatica PowerCenter Designer

  • InformaticaPowerCenterワークフローマネージャー

    これは、全体的な運用目的を達成するように設計された、1つ以上のセッションおよびその他のタスクの順序付けられたセットです。それe一連のマッピング(セッションとして)およびその他のタスクを実行します。

図:ワークフローマネージャー

ワークフローマネージャーは、設計者がワークフローを構築して実行できるようにするPowerCenterアプリケーションです。次のように開くことができます。

  • 「W」アイコンをクリックすると、Designerから起動できます
  • [スタート]> [すべてのプログラム]> [Informatica PowerCenter9.6.1]> [クライアント]> [PowerCenterクライアント]> [PowerCenterワークフローマネージャー]のパスとは別に開くことができます
  • ワークフローデザイナから開くことができます-ワークフローオブジェクトの作成に使用するツール

図:ワークフローマネージャーインターフェイス

ワークフローマネージャーには、ワークフローの作成と整理に役立つ次のウィンドウが表示されます。

  • 複数のリポジトリやフォルダに接続して作業することができます。ナビゲーターで、ワークフローマネージャーは無効なオブジェクトの上に赤いアイコンを表示します。
  • タスク、ワークフロー、およびワークレットを作成、編集、および表示できます。
  • さまざまなタイプの出力メッセージを表示するためのタブが含まれています。 [出力]ウィンドウには、次のタブが含まれています。
    • ワークフロー、ワークレット、またはタスクを保存するときにメッセージを表示します。 [保存]タブには、ワークフローまたはワークレットを保存するときに検証の概要が表示されます。
    • ログを取得します。ワークフローマネージャーがリポジトリからオブジェクトをフェッチするときにメッセージを表示します。
    • ワークフロー、ワークレット、またはタスクを検証するときにメッセージを表示します。
    • リポジトリオブジェクトをコピーするときにメッセージを表示します。
    • IntegrationServiceからのメッセージを表示します。
    • リポジトリサービスからのメッセージを表示します。

Informaticaワークフローデザイナ

Informatica Serverのセッション、タスク、およびワークレットの実行順序と依存関係をマップします

図:ワークフローデザイナー

  • タスク開発者

セッション、シェルコマンド、および電子メールタスクを作成します。 TaskDeveloperで作成されたタスクは再利用可能です

  • ワークレットデザイナー

一連のタスクを表すオブジェクトを作成します。ワークレットオブジェクトは再利用可能です。

ワークフローマネージャーには、実行した操作のステータスを示すステータスバーも表示されます。

次の図は、開始タスク、リンク、およびセッションタスクコンポーネントを含む一般的なワークフローがどのように見えるかを示しています。

図:ワークフローマネージャーの例

モデルビューコントローラーの例java
  • InformaticaPowerCenterワークフローモニター

PowerCenterツールであるワークフローモニターは、ワークフローとタスクの実行を監視するために使用されます。

ワークフローモニターは、次の目的で使用できます。

  • ガントチャートビューまたはタスクビューで実行されたワークフローまたはタスクに関する詳細を表示する
  • ワークフローまたはタスクの実行、停止、中止、再開
  • ワークフローモニターには、少なくとも1回実行されたワークフローが表示されます。
  • ワークフローモニターは、IntegrationServiceおよびRepositoryServiceから継続的に情報を受信します。また、リポジトリから情報をフェッチして、履歴情報を表示します。

図:ワークフローモニター

Informaticaワークフローモニターを開く方法:

ワークフローモニターを開くには、次の場所に移動します。

[スタート]> [すべてのプログラム]> [Informatica PowerCenter9.6.1]> [クライアント]> [PowerCenterクライアント]> [PowerCenterワークフローモニター]

モニターを開くこともできます。

  • ワークフローマネージャーナビゲーターから
    • ワークフローマネージャーは、ワークフローマネージャーからワークフローが実行されたときにワークフローモニターを開くように構成できます。
    • Designer、Workflow Manager、またはRepositoryManagerの[ツール]> [ワークフローモニター]から
  • または、[ツール]ツールバーの[ワークフローモニター]アイコンから

図:ワークフローモニター-セクション

  • コンピューティングコンソール管理者

Informatica管理者コンソール(管理者ツール)は、InformaticaドメインとInformaticaセキュリティを管理するための管理ツールです。Informatica Administratorコンソール(管理者ツール)は、Informaticaのインストール後に使用できます。

図:Informatica管理者コンソール

管理コンソールは、ドメインで次のタスクを実行します。

  • アプリケーションサービスの管理: 統合サービスやリポジトリサービスなど、ドメイン内のすべてのアプリケーションサービスを管理します。
  • ノードの構成: バックアップディレクトリやリソースなどのノードプロパティを構成します。これにより、ノードをシャットダウンして、必要に応じて再起動することもできます。
  • ドメインオブジェクトの管理: サービス、ノード、ライセンス、フォルダーなどのオブジェクトを作成および管理します。
  • ドメインオブジェクトのプロパティの表示と編集: ドメイン内のすべてのオブジェクトのプロパティを表示したり、ドメイン内で編集したりできます。
  • セキュリティ管理タスク: ユーザー、グループ、役割、および特権を管理します。
  • ログイベントの表示: ログビューアを使用して、ドメイン、統合サービス、SAP BWサービス、Webサービスハブ、およびリポジトリサービスのログイベントを表示します。

図:管理者コンソール-インターフェース

つまり、一言で言えば、Informaticaのクライアントコンポーネントは5つのコンポーネントで構成されています。 Informatica Repository Manager、Informatica PowerCenter Designer、Informatica Workflow Manager、Informatica Workflow Monitor、およびInformatica AdministratorConsole。これは、ツール全体の型枠を形成します。ここで、InformaticaPowerCenterのサーバーコンポーネントを理解してみましょう。

InformaticaPowerCenterのサーバーコンポーネント

PowerCenterサーバーコンポーネントは、次のサービスで構成されています。

  • リポジトリサービス: リポジトリサービスはリポジトリを管理します。メタデータを取得し、リポジトリデータベーステーブルに挿入して更新します。
  • 統合サービス: Integration Serviceは、セッションとワークフローを実行します。
  • SAP BWサービス: SAP BWサービスは、SAP BWからのRFC要求を探し、ワークフローを開始して、SAPBWからデータを抽出したりSAPBWにデータをロードしたりします。
  • Webサービスハブ: Webサービスハブは、Webサービスクライアントからの要求を受信し、PowerCenterワークフローをサービスとして公開します。

Informaticaのクライアントコンポーネントとサーバーコンポーネントの両方を理解したので、次のインフォグラフィックでInformaticaのデータの流れ、つまりデータの処理方法を説明します。

Java用のEclipseを設定する

図:Informaticaのデータフロー

この時点で、ドメインとノード、サービスとサービスマネージャなど、Informaticaの他の基本単位を理解することは非常に論理的です。それでは、Informaticaでハンズオンを実行する前に、それらを理解するために少し時間を取ってみましょう。

Informaticaドメインおよびノー​​ド:

ドメインの主な機能は次のとおりです。

  • ドメインは、ノードとサービスの論理的なコレクションまたはセットです。
  • PowerCenterドメインは、PowerCenterの基本的な管理単位です。
  • ドメインは、単一のPowerCenterインストールにすることも、複数のPowerCenterインストールで構成することもできます。

ノードの主な機能は次のとおりです。

  • ノードは、物理マシンの論理表現です。ホスト名やポート番号などの物理属性があります
  • 各ノードは、アプリケーションとコアサービスを担当するサービスマネージャーを実行します
  • ノードはゲートウェイノードまたはワーカーノードにすることができますが、1つのドメインにのみ属することができます

図:Informaticaドメインnノード

Informatica Services&Service Manager:

サービスは、特殊な機能を提供するリソースです。すべてのPowerCenterプロセスは、ノード上でサービスとして実行されます。

Informatica PowerCenterには、次の2種類のサービスがあります。

  • アプリケーションサービスは、リポジトリおよび統合サービスを含むサーバーベースの機能を表します。
  • コアサービスは、PowerCenterが動作する環境を管理および維持する機能を表し、ログサービス、ライセンスサービス、ドメインサービスなどのサービスが含まれます。

サービスマネージャ

  • Service Managerは、すべてのドメイン操作を管理し、ドメイン内の各ノードで実行されるサービスです。
  • ゲートウェイノードでは、ServiceManagerが次の責任を負います。
    • ドメインの制御
    • ドメインで実行されているサービスの管理
    • サービスルックアップの提供
  • すべてのノードで、ServiceManagerはコアサービスとアプリケーションサービスを制御することを目的としています

PowerCenterのさまざまなコンポーネントがどのように相互作用するか:

図:Informaticaコンポーネントの相互作用

ユースケース:SCDを使用して製品ディメンションテーブルをロードする方法

問題文: 私たちの目的は、発効日を使用して、緩やかに変化するディメンション(SCD)タイプ2を使用して製品ディメンションテーブルをロードすることです。

顧客の顧客ID、名前、市、州、国の詳細を含む顧客ソースシステムを考えると、顧客が異なる値を取得するたびに、ターゲットディメンションテーブルに新しいエントリを作成する必要があります。

これをよりよく理解するには、顧客がターゲットディメンションテーブルにすでに存在する値とは異なる州または都市の値で戻ってきた場合、更新された値で新しいエントリを作成する必要があります。これは、SCDソリューションベースのターゲットテーブルを使用することで実現されます。

以下は、SCDを使用して製品ディメンションテーブルをロードするステップバイステップのプロセスです。

ステップ1 PowerCenterDesignerを開きます。

ステップ2 リポジトリに接続する

図:リポジトリへの接続の確立

ステップ3 Designerを起動します

図:PowerCenterDesignerの起動

ステップ4 データベースからソースをロードします

図:ソースデータセットをロードするためのさまざまなオプション

ステップ5 データベースに接続する

ステップ6: SCD_INPUT_DATAテーブルを選択します

ステップ7: 同様に、データベースからターゲットセットをロードします

図:ターゲットセットのさまざまなオプション

ステップ8 :以下に示すように、必要な操作を実行するワークフローを設計します

図:データベースのワークフロー設計

ステップ9 :Oracle SQLDeveloperを起動してロードします SCD_CUSTOMER テーブル

図:SCD_CUSTOMERテーブル

ステップ10 :顧客MaryとHannahの状態の値を変更します

図:メアリーの値の変更

図:ハンナの値の変更

ステップ11 :ワークフローモニターを起動し、ワークフローを実行します

Javaでstringbufferを使用する方法

図:ワークフローの実行

図:ワークフロー出力

ステップ12: 以下のコマンドを実行して、対象のデータベースを取得します

  • scd_customer_targetから*を選択します

図:ターゲット出力に対するSQLクエリの実行

ステップ13: 製品ディメンションテーブルの出力

図:製品寸法表の出力

結論として、ロードされた製品テーブルには、存在する値の変動を含むデータの履歴値が含まれています。これは、InformaticaPowerCenterを使用して取得されます。

このInformaticaチュートリアルブログがInformaticaの基盤を構築するのに役立ち、Informaticaについてさらに学ぶのに十分な関心を生み出したことを願っています。

すでにInformaticaをキャリアとして採用することを決定している場合は、なぜ私たちを見ていないのかをお勧めします コースページ。 EdurekaでのInformatica認定トレーニングでは、インストラクター主導のライブセッションと実際のユースケースを使用した実践的なトレーニングを通じて、Informaticaのエキスパートになります。

質問がありますか?コメント欄にご記入ください。折り返しご連絡いたします。