Rは最も人気のある分析ツールの1つです。しかし、分析に使用されることは別として、Rはプログラミング言語でもあります。IT業界での成長に伴い、熟練したまたは Rをデータ分析ツールとプログラミング言語の両方として理解している。このブログでは、Rプログラミングのさまざまな基礎を理解するのに役立ちます。私たちの中で p 復活 ブログ 、なぜアナリティクスが必要なのか、ビジネスアナリティクスとは何か、なぜ、誰がRを使用するのかについて説明しました。
このブログでは、Rプログラミングの以下のコアコンセプトを次の順序で理解します。
Rプログラミング言語のウェビナーレコーディングをご覧ください。インストラクターがトピックを詳細に説明し、Rプログラミングをよりよく理解するのに役立つ例を示しています。
初心者のためのRプログラミング| Rプログラミング言語チュートリアル|エドゥレカ
それでは、先に進んで、Rプログラミングの最初の概念である変数を見てみましょう。
Rプログラミング:変数
変数は、値を含むメモリ位置の名前に他なりません。 Rの変数は、数値、複素数値、単語、行列、さらにはテーブルを格納できます。意外ですよね?
図: 創造変数の
上の画像は、変数がどのように作成され、さまざまなメモリブロックにどのように格納されるかを示しています。 Rでは、Java、C、C ++などの他のプログラミング言語とは異なり、使用する前に変数を宣言する必要はありません。
先に進んで、データ型とは何か、およびRでサポートされているさまざまなデータ型を理解してみましょう。
Rプログラミング:データ型
Rでは、変数自体はどのデータ型でも宣言されておらず、割り当てられたRオブジェクトのデータ型を取得します。したがって、Rは動的型付け言語と呼ばれます。つまり、プログラムで使用するときに、同じ変数のデータ型を何度も変更できます。
データ型は、変数が持つ値のタイプと、エラーを発生させることなく変数に適用できる数学、リレーショナル、または論理演算のタイプを指定します。 Rには多くのデータ型がありますが、最も頻繁に使用されるデータ型は次のとおりです。
次に、ベクターから始めて、これらの各データ型について個別に説明します。
ベクトル
ベクトルは最も基本的なRデータオブジェクトであり、6種類の原子ベクトルがあります。以下は6つの原子ベクトルです。
論理的 :次のような論理値を格納するために使用されます TRUE または FALSE 。
数値 :実数を含む正の数と負の数の両方を格納するために使用されます。
例:25、7.1145、96547
整数 :すべての整数値、つまりすべての正と負の整数を保持します。
例:45.479、-856.479、0
繁雑 :これらはx + yiの形式です。ここで、xとyは数値であり、iは-1の平方根を表します。
例:4 + 3i
キャラクター :単一の文字、文字のグループ(単語)、または単語のグループのいずれかを一緒に格納するために使用されます。文字は一重引用符または二重引用符で定義できます。
例:「エドゥレカ」、「Rは学ぶのが楽しい」。
一般に、ベクトルは次の方法で定義および初期化されます。
Vtr = c(2、5、11、24) または Vtr<- c(2, 5, 11 , 24)
先に進み、Rの他のデータ型を理解しましょう。
リスト
リストはベクトルと非常に似ていますが、リストはRオブジェクトであり、&マイナス数、文字列、ベクトル、およびその中に別のリストなど、さまざまなタイプの要素を含めることができます。
例えば:
Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist
出力:
[[1]] [1] 'こんにちは' 'こんにちは' 'どのように やってますか '[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1]真
マトリックス
マトリックスは、要素が2次元の長方形のレイアウトに配置されたRオブジェクトです。
Rで行列を作成するための基本的な構文は&minusです。
matrix(data、nrow、ncol、byrow、dimnames)
どこ:
- データ は、行列のデータ要素となる入力ベクトルです。
- nrow 作成される行の数です。
- ncol 作成する列の数です。
- byrow 論理的な手がかりです。 TRUEの場合、入力ベクトル要素は行ごとに配置されます。
- dimname 行と列に割り当てられた名前です。
例:
Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix
出力:
[、1] [、2] [、3] [、4] [、5] [1、] 1 2 3 4 5 [2、] 6 7 8 9 10 [3、] 11 12 13 14 15 [4、 ] 16 17 18 19 20 [5、] 21 22 23 24 25
アレイ
Rの配列は、3次元以上のデータを格納するために使用できるデータオブジェクトです。入力としてベクトルを受け取り、の値を使用します 番号 配列を作成するためのパラメーター。
Rで配列を作成するための基本的な構文は&minusです。
array(data、dim、dimnames)
どこ:
- データ は、配列のデータ要素となる入力ベクトルです。
- 番号 は配列の次元であり、行数、列数、および言及された次元によって作成される行列の数を渡します。
- dimname 行と列に割り当てられた名前です。
例:
Myarray<- array( c(1:16), dim=(4,4,2)) Myarray
出力:
、 、 1 [、1] [、2] [、3] [、4] [1、] 1 5 9 13 [2、] 2 6 10 14 [3、] 3 7 11 15 [4、] 4 8 12 16 、、 2 [、1] [、2] [、3] [、4] [1、] 1 5 9 13 [2、] 2 6 10 14 [3、] 3 7 11 15 [4、] 4 8 12 16
データフレーム
データフレームは、テーブルまたは2次元配列のような構造であり、各列には1つの変数の値が含まれ、各行には1つの値のセットが含まれます。ために各列。以下は、データフレームを操作するたびに考慮する必要があるデータフレームの特性の一部です。
- 列名は空でない必要があります。
- 各列には、同じ量のデータ項目が含まれている必要があります。
- データフレームに格納されるデータは、数値、係数、または文字タイプにすることができます。
- 行名は一意である必要があります。
例:
emp_id = c(100:104)emp_name = c( 'John'、 'Henry'、 'Adam'、 'Ron'、 'Gary')dept = c( 'Sales'、 'Finance'、 'Marketing'、 'HR '、' R&D ')emp.data<- data.frame(emp_id, emp_name, dept) emp.data
出力:
emp_id emp_name dept 1100ジョンセールス 2101ヘンリーファイナンス 3102アダムマーケティング 4103ロンHR 5104ゲイリーR&D
Rの基本的なデータ型を理解したので、データ演算子の概念を理解してRについて深く掘り下げます。
Rプログラミング:データ演算子
Rには主に4つのデータ演算子があり、以下のようになります。
算術演算子 :これらの演算子は、加算、減算、乗算などの基本的な算術演算を実行するのに役立ちます。
次の例を考えてみましょう。
num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraction num3 = num1-num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modulus num3 = num1 %% #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #floor Division num3 = num1%/%num2 num3
出力:
[1] 35 [15 [1] 300 [1] 0.75 [1] 15 [1] 125 [十一
関係演算子 :これらの演算子は、変数が別の変数よりも大きいか、小さいか、または等しいかどうかを確認するなどの関係演算を実行するのに役立ちます。関係演算の出力は常に論理値です。
次の例を検討してください。
num1 = 15 num2 = 20#num3 =(num1 == num2)に等しいnum3#num3 =(num1!= num2)num3に等しくない= 20 num3 =(num1 = num2)num3
出力:
[1] FALSE [1]真 [1]真 [1] FALSE [1]真 [1] FALSE
代入演算子: これらの演算子は、Rの変数に値を割り当てるために使用されます。割り当ては、いずれかの割り当て演算子を使用して実行できます。((<-)または等しい演算子(=)。変数の値は、左割り当てと右割り当ての2つの方法で割り当てることができます。
論理的演算子: これらの演算子は2つのエンティティを比較し、通常、「and」、「or」などのブール(論理)値とともに使用されます。そして「ない」。
Rプログラミング:条件文
- Ifステートメント: Ifステートメントは、フローの一部として単一の式を評価するのに役立ちます。この評価を実行するには、Ifキーワードの後に、評価する式を記述する必要があります。以下のフロー図は、Ifステートメントがコードのフローをどのように制御するかを示しています。次の例を検討してください。
num1 = 10 num2 = 20 if(num1<=num2){ print('Num1 is less or equal to Num2')
出力:
[1] 'Num1はNum2以下'
- Else Ifステートメント: Else ifステートメントは、Ifステートメントによって作成されたフローにブランチを拡張するのに役立ち、フローの新しいブランチを作成することによって複数の条件を評価する機会を提供します。以下のフローは、elseifステートメントがコードのフローをどのように分岐するかを示しています。
次の例を考えてみましょう。Num1 = 5 Num2 = 20 if(Num1 Num2){print( 'Num2はNum1よりも小さい')} else if( 'Num1 == Num2){print(' Num1とNum2は等しい ')}
出力:
[1] 'Num1はNum2よりも小さい'
- 他のステートメント: elseステートメントは、他のすべての式がチェックされ、無効であることが判明した場合に使用されます。これは、If – Elseifブランチの一部として実行される最後のステートメントになります。以下のフローは、Elseがコードのフローをどのように変更するかについてのより良いアイデアを提供します。
次の例を考えてみましょう。
Num1 = 5 Num2 = 20 if(Num1 Num2){print( 'Num2はNum1よりも小さい')} else print( 'Num1とNum2は等しい')}
出力:
[1] 'Num1とNum2は等しい'
Rプログラミング:ループ
ループステートメントを使用すると、ステートメントまたはステートメントのグループを複数回実行できます。 Rには主に3つのタイプのループがあります。
- ループを繰り返す :指定された条件がTRUEである間、ステートメントまたはステートメントのグループを繰り返します。繰り返しループは、コードが最初に実行され、次に条件がチェックされて、コントロールがループ内にあるか、ループから出るかを決定する、終了制御ループの最良の例です。以下は、繰り返しループでの制御の流れです。
以下の例を見て、合計が100を超えるまで繰り返しループを使用してn個の数値を追加する方法を理解しましょう。x = 2リピート{x = x ^ 2 print(x)if(x> 100){ブレーク}
出力:
[1] 4 [1] 16 [1] 256
- whileループ : 私tは、指定された条件がTRUEである間、ステートメントまたはステートメントのグループを繰り返すのに役立ちます。 whileループは、繰り返しループと比較するとわずかに異なりますが、条件が最初にチェックされ、条件がtrueであることが判明した場合にのみ、コードを実行するためにループ内に制御が配信されるエントリ制御ループの例です。 。以下は、whileループでの制御の流れです。
以下の例を見て、最初の10個の数値の二乗和を加算し、whileループがどのように機能するかを理解しましょう。num = 1 sumn = 0 while(num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) }
出力:[十一 [15 [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
- forループ :ステートメントまたはグループを一定の回数繰り返すために使用されます。繰り返しループやwhileループとは異なり、forループは、コードを事前に実行する必要がある回数を認識している状況で使用されます。これは、条件が最初にチェックされ、次に内部に記述されたコードのみが実行されるwhileループに似ています。 forループの制御の流れを見てみましょう。
ここで、forループを使用して最初の10個の数値を出力する例を見てみましょう。
for(x in 1:10){print(x)}
出力:
UbuntuにHadoopを設定する
[十一 [1] 2 [1] 3 [1] 4 [15 [1] 6 [1] 7 [1] 8 [1] 9 [1] 10
Rプログラミング:関数
関数は、単一の関連するアクションを実行するために使用される、整理された再利用可能なコードのブロックです。 Rには主に2つのタイプの関数があります。
事前定義された関数 :これらは、ユーザーが作業を行うために使用できる組み込み関数です。 easier。例:mean(( バツ) 、sum(( バツ) 、sqrt( バツ )、toupper(( バツ )など。
ユーザー定義の 機能: これらの関数は、ユーザーの特定の要件を満たすためにユーザーによって作成されます。以下は、で関数を作成するための構文です。R:
func tion_name <– 関数 (arg_1、arg_2、およびhellip){{ //関数本体 }
二乗和を生成するための単純な関数の次の例を考えてみましょう。の2つの数字:
sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4)
出力:[1] 25
このRプログラミングブログを楽しんでいただけたでしょうか。このチュートリアルではRの基本をすべて説明したので、今すぐ練習を開始できます。このRプログラミングブログの後、R for Analyticsに関するブログをさらに作成する予定ですので、ご期待ください。
Rの基本を理解したので、 25万人以上の満足した学習者のネットワークを持つ信頼できるオンライン学習会社であるEdurekaが世界中に広がっています。 EdurekaのRトレーニングを使用したデータ分析は、Rプログラミング、データ操作、探索的データ分析、データ視覚化、データマイニング、回帰、感情分析、および小売、ソーシャルメディアの実際のケーススタディのためのRStudioの使用に関する専門知識を習得するのに役立ちます。
質問がありますか?この「Rプログラミング」ブログのコメントセクションでそれについて言及してください。できるだけ早くご連絡いたします。