SPARKでのYARNとHIVEの構築-ブログ

このApacheSparkとビッグデータのブログでは、特定のHadoopバージョン用にSparkを構築する方法を見てみましょう。また、YARNおよびHIVE用のSparkを構築する方法についても学習します。

このブログでは、特定のHadoopバージョン用にSparkをビルドする方法を見てみましょう。

また、HIVEとYARNを使用してSparkを構築する方法についても学習します。

あなたが持っていることを考慮して Hadoop、jdk、mvn そして行くシステムにプリインストールおよび構成済み。

configure-Building-Yarn-and-Hive-on-Spark

開いた Mozillaブラウザ およびダウンロード スパーク 以下のリンクを使用します。

https://edureka.wistia.com/medias/k14eamzaza/

シェフvsパペットvsansible

ターミナルを開きます。

コマンド：tar -xvf Downloads / spark-1.1.1.tgz

コマンド：ls

spark-1.1.1ディレクトリを開きます。

あなたは開くことができます pom.xml ファイル。このファイルはあなたにすべてについての情報を与えます 依存関係 あなたが必要です。

トラブルを避けるために編集しないでください。

コマンド：cd spark-1.1.1 /

コマンド：sudo gedit sbt / sbt-launch-lib.bash

以下のスナップショットのようにファイルを編集し、保存して閉じます。

以下のスナップショットで説明するように、オブジェクトのヒープスペースの問題を回避するためにメモリを削減しています。

次に、ターミナルで以下のコマンドを実行して、HIVEとYARNを使用してHadoop2.2.0のsparkをビルドします。

コマンド：./ sbt / sbt -P 糸 -P ハイブ -Phadoop-2.2 -D hadoop.version = 2.2.0 -D skipTests アセンブリ

注：私のHadoopバージョンは2.2.0です。Hadoopのバージョンに応じて変更できます。

他のHadoopバージョンの場合

＃Apache Hadoop 2.0.5-alpha

-Dhadoop.version = 2.0.5-alpha

# Cloudera CDH 4.2.0

-Dhadoop.version = 2.0.0-cdh4.2.0

＃Apache Hadoop 0.23.x

-Phadoop-0.23 -Dhadoop.version = 0.23.7

＃Apache Hadoop 2.3.X

-Phadoop-2.3 -Dhadoop.version = 2.3.0

＃Apache Hadoop 2.4.X

-Phadoop-2.4 -Dhadoop.version = 2.4.0

コンパイルとパッケージングには時間がかかります。完了するまでお待ちください。

2つの瓶 spark-assembly-1.1.1-hadoop2.2.0.jar そして spark-examples-1.1.1-hadoop2.2.0.jar 作成されます。

のパス spark-assembly-1.1.1-hadoop2.2.0.jar ： /home/edureka/spark-1.1.1/assembly/target/scala-2.10/spark-assembly-1.1.1-hadoop2.2.0.jar

のパス spark-examples-1.1.1-hadoop2.2.0.jar： /home/edureka/spark-1.1.1/examples/target/scala-2.10/spark-examples-1.1.1-hadoop2.2.0.jar

おめでとうございます。SparkforHive＆Yarnの構築に成功しました。

質問がありますか？コメント欄にご記入ください。折り返しご連絡いたします。

関連記事：

Hadoopを使用したApacheSpark-なぜそれが重要なのですか？

ハイブと毛糸がSparkによって電化される

このApacheSparkとビッグデータのブログでは、特定のHadoopバージョン用にSparkを構築する方法を見てみましょう。また、YARNおよびHIVE用のSparkを構築する方法についても学習します。

カテゴリー

Popular Articles

Pokemon Go –DevOps原則の完璧なユースケース

PySparkチュートリアル–Pythonを使用してApacheSparkを学ぶ

Nagiosチュートリアル–Nagiosによる継続的な監視

Javaでアナグラムプログラムを実装する簡単な方法

Tableauとは何ですか？ Tableauを使用したデータの視覚化

Java EnumSet：JavaでEnumSetを使用する方法は？

Angularの長所と短所は何ですか？

Tableau Serverとそのコンポーネントとは何ですか？

Pythonでのファイル処理について知っておくべきことすべて

TableauとQlikView–どのデータ視覚化ツールを選択しますか？

iOS開発のキャリアについて知っておくべきことすべて

JavaのResultSetインターフェイスとは何ですか？