Hadoop上に構築されたデータウェアハウジングパッケージであるApacheHiveは、データ分析、データマイニング、および予測モデリングにますます使用されるようになっています。組織はしっかりと保持している専門家を探しています 。この投稿では、Hiveスクリプトを実行する方法を見てみましょう。一般に、スクリプトを使用して一連のステートメントを一度に実行します。ハイブスクリプトはほとんど同じように使用されます。これにより、各コマンドを手動で記述して実行するために費やす時間と労力が削減されます。
Hiveスクリプトは、Hive0.10.0以降のバージョンでサポートされています。 CDH3にはHive0.90バージョンがインストールされているため、CDH3でHiveスクリプトを実行することはできません。 CDH4にはHive0.10.0バージョンがインストールされているため、以下の手順を試すことができます。 Hiveスクリプトを作成する方法を知っていますか?いいえの場合は、 より明確にするために。
それでは、Hiveでスクリプトを記述し、CDH4で実行する方法を見てみましょう。
ステップ1:Hiveスクリプトを作成します。
Hiveスクリプトを作成するには、ファイルを.sql拡張子で保存する必要があります。 Cloudera CDH4ディストリビューションでターミナルを開き、次のコマンドを実行してHiveスクリプトを作成します。
コマンド: sudo gedit sample.sql
上記のコマンドを実行すると、実行する必要のあるすべてのHiveコマンドのリストを含むファイルが開きます。
このスクリプトでは、テーブルが作成され、記述され、データがロードされ、テーブルから取得されます。
1. Hiveでのテーブルの作成:
コマンド: create table product(productid:int、productname:string、price:float、category:string)行は、「、」で終わる区切りフィールドをフォーマットします
ダイアグラムを使用したJavaのMVCアーキテクチャ
ここで、productはテーブル名であり、{productid、productname、price、category}はこのテーブルの列です。
「、」で終了するフィールドは、入力ファイルの列が記号「、」で区切られていることを示します。
デフォルトでは、入力ファイルのレコードは改行で区切られます。
2.テーブルの説明:
コマンド: 製品について説明する
3.データをテーブルにロードします。
最初にデータをテーブルにロードするには、テーブルに挿入する必要のあるレコードを含む入力ファイルを作成する必要があります。
入力ファイルを作成しましょう。
コマンド: sudo gedit input.txt
図のようにファイルの内容を編集します。
4.データの取得:
データを取得するには、selectコマンドを使用します。
コマンド: 製品から*を選択
上記のコマンドは、テーブルに存在するすべての列の値を取得するために使用されます。スクリプトは、次の画像に示すようになります。
これで、Hiveスクリプトの作成は完了です。これで、sample.sqlファイルを保存できます。
ステップ2:Hiveスクリプトを実行する
以下は、Hiveスクリプトを実行するためのコマンドです。
コマンド: ハイブ–f /home/cloudera/sample.sql
セールスフォースサービスクラウドとは
スクリプトの実行中は、スクリプトファイルの場所のパス全体が存在することを確認してください。
すべてのコマンドが正常に実行されていることがわかります。
これは、HiveスクリプトがCDH4で実行および実行される方法です。
HiveはHadoopの重要なコンポーネントであり、Hiveに関する専門知識により、高収入のHadoopジョブを獲得できます。 Edurekaには、MapReduce、Yarn、Pig、Hive、HBase、Oozie、Flume、Sqoopなどの概念を習得するのに役立つ特別にキュレーションされたHadoopコースがあります。下のボタンをクリックして開始してください。
質問がありますか?コメント欄にご記入ください。折り返しご連絡いたします。
関連記事: