Sqoopを使用したOracleからHDFSへ



Sqoopを使用したOracleからHDFSへ-Sqoopを使用したOracleからHDFSへの手順を確認してください。

1.以下のリンクからOracleExpresss Editionをダウンロードし、解凍します。





https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40NNW5BcHZMTkdtcmc/edit

61



Pythonで__init__はどういう意味ですか

2.解凍すると、次の画像のようなOracle XEEditionの実行可能ファイルが見つかります。

3. OracleXEUnivをダブルクリックしてシステムにOracleデータベースをインストールし、「実行」をクリックします。



4. [次へ]をクリックします

5.使用許諾契約に同意し、[次へ]をクリックします。

6.デフォルトでは、オラクルはシステムをデータベース名として使用します。パスワードを入力しましょう

このデータベース用。

パスワードを入力–>システム

パスワードの確認–>システム

[次へ]をクリックします。

7. [インストール]をクリックします

8. [完了]をクリックします

9.フォルダにあるsqlnet.oraファイルを編集しましょう

C:oraclexepporacleproduct.2.0serverNETWORKADMIN

それを開くと、以下のコンテンツが見つかります。

以下のスクリーンショットのように編集します

10.OracleのSQLコマンドラインを起動しましょう。

「スタート」メニュー->「すべてのプログラム」->「OracleDatabase10gExpressEdition」->「

SQLコマンドラインを実行してダブルクリックします。

11. Cli fo OracleDatabaseを取得します。

12.Oracleデータベースに接続しましょう。

ユーザー名:システム

パスワード:システム

正常に接続されたというメッセージが表示されます。

13.簡単なテーブルを作成しましょう。

コマンド:

テーブルemp(id番号)を作成します

14. Insertコマンドを使用して、いくつかの値を挿入しましょう。

コマンド:

emp値に挿入(2)

15. Selectコマンドを使用して、データがテーブルに挿入されているかどうかを確認しましょう。

system.exit(0)を使用して、プログラムを終了できます。

コマンド:

empから*を選択

16.データをコミットしましょう。

コマンド:

コミット

17. Oracle DatabaseからSqoopにデータをインポートするには、データを追加する必要があります。

Oracleコネクタ(ojdbc6_g.jar)。

以下のリンクからjarファイルをダウンロードできます。

https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40Nekw3ZXBRWUU5Y1E/edit

18.Cloudera cdh3を開き、FileZillaを使用してOracleコネクタをCloudera cdh3(デスクトップへ)に移動します。

以下のリンクを使用して、ファイルをWindowsからcloudera cdh3vmに移動する方法を理解してください。

https://www.edureka.co/blog/transfer-files-windows-cloudera-demo-vm/

19.OracleコネクタがClouderaCdh3デスクトップに存在するようになったら、のlibフォルダに移動します。

以下のコマンドを実行してsqoopを実行します。

コマンド:

sudo cp /home/cloudera/Desktop/ojdbc6_g.jar / usr / lib / sqoop / lib /

20.以下のコマンドを実行して、ディレクトリをSqoopに変更します。

コマンド:

cd / usr / lib / sqoop /

21. Windowsでコマンドプロンプト(CMD)を開き、 IPv4アドレス

を実行することによって

以下のコマンド:

コマンド:

ipconfig

22.以下を実行して、Oracleデータベースに存在するテーブルempのデータをhdfsにインポートします。

コマンド:

コマンドに必要な項目:

IPv4アドレス–IPv4アドレス。私の場合は192.168.46.1です

データベース名–システム

テーブル名– emp

ユーザー名–システム

パスワード–システム

出力ディレクトリ–任意の可能性があります。 sqoopoutput1を使用しました

コマンド:

sudo bin / sqoop import –connect jdbc:oracle:thin:system /

system@192.168.46.1:1521:車両

–username system -P –table system.emp –columns“ ID” –target-dir /

sqoopoutput1 -m 1

23.コマンドが正常に実行されると、メッセージが表示されます

Javaでプログラムを終了する

下の画像のように取得したレコード。

24.ブラウザを開き、以下のURLに移動します。

URL:http:// localhost:50070 / dfshealth.jsp

[ファイルシステムの参照]をクリックします

25.sqoopoutput1ディレクトリをクリックします

26.part-m-00000ファイルをクリックします。

27.以下は、Oracleデータベースからインポートされたデータです。

おめでとう! Oracleデータベースからデータを正常にインポートしました

Sqoopを使用してHDFSに..!