Rは、オープンソースで柔軟性があり、複数のパッケージを提供し、巨大なコミュニティを持っているため、最も人気のあるデータ分析ツールです。これは、ソフトウェアプログラマー、統計学者、データマイニング担当者向けに設計されているため、 。このRチュートリアルのブログでは、例を使用してRに関する完全な洞察を提供します。
以下は、このRチュートリアルブログのトピックであり、次の順序で説明します。
Rチュートリアル:なぜ分析が必要なのですか?
質問に答える前に、複数のドメインのRにおけるいくつかの問題とその解決策について簡単に説明します。
銀行 :
銀行では毎日大量の顧客データが生成されます。 W定期的に何百万もの顧客と取引している間、彼らの住宅ローンを追跡することは難しくなります。
解決 :
Rは、個々の顧客に提供されるローンを維持するカスタムモデルを構築します。これは、時間の経過とともに顧客が支払う金額を決定するのに役立ちます。
保険 :
保険は予測に大きく依存しています。それはすることは困難ですどのポリシーを受け入れるか拒否するかを決定します。
解決:
継続的な信用報告書を入力として使用することにより、リスク選好を評価するだけでなく、予測予測も行うRのモデルを作成できます。
健康管理:
毎年何百万人もの人々が病院に入院し、入院プロセスだけで毎年何十億人もの人々が費やされています。
解決 :
患者の病歴と病歴を考慮して、予測モデルを構築して、入院のリスクがある人と、医療機器をどの程度拡張する必要があるかを特定できます。
これで、データ分析が組織がデータを活用し、それを使用して新しい機会を特定するのにどのように役立つかがわかりました。組織における分析の必要性について話す場合、次の4つの側面に出くわす必要があります。
次に、Rチュートリアルブログに進みましょう。ここでは、ビジネス分析とは何かを最初に理解します。
Rチュートリアル:ビジネス分析とは何ですか?
ビジネス分析は、大量のデータセットを調査し、隠れたパターン、相関関係、およびその他の洞察を実現するプロセスです。基本的に、組織データ、市場または製品の調査データ、その他の種類のデータなど、収集したすべてのデータを理解するのに役立ちます。より良い意思決定、より良い製品、より良いマーケティング戦略などを簡単に行うことができます。理解を深めるために、以下の画像を参照してください。
上の図を見ると、最初の画像のデータが散らばっています。さて、データベース内の特定のレコードなど、特定のものが必要な場合は、面倒になります。これを単純化するには、分析が必要です。分析を行うと、データ間の相関関係を簡単に見つけることができます。何をすべきかを確立すると、どのパスをたどりたいか、またはビジネス分析の観点から、どのパスが組織の改善につながるかなどの決定を行うことが非常に簡単になります。
ただし、上記のチェーンの人々が、分析後に提供する生データを常に理解することを期待することはできません。したがって、このギャップを克服するために、 データの視覚化 。
データの視覚化 :データの視覚化は、分析後に生成した膨大な量のデータへの視覚的なアクセスです。人間の精神は視覚画像を処理し、視覚グラフィックは生データと比較するよりも優れています。生の数値と比較して、円グラフや棒グラフを理解するのはいつでも簡単です。すでに分析したデータから、このデータの視覚化をどのように実現できるのか疑問に思われるかもしれません。
データ視覚化のために市場で利用可能なさまざまなツールがあります。
データの視覚化と一定量の分析を実現するのに役立つツールがすでにたくさんあるのではないかと疑問に思われるかもしれませんが、なぜRを使用するのでしょうか。
したがって、Rチュートリアルブログの次のトピックでは、「なぜR」と「誰がRを使用するか」について説明します。
Rチュートリアル:なぜRで誰がRを使用するのですか?
なぜR?
Rはプログラミングおよび統計言語です。
Rは、データの分析と視覚化に使用されます。
Rはシンプルで、習得、読み取り、書き込みが簡単です。
Rは、FLOSS(Free Libre and Open Source Software)の例であり、このソフトウェアのコピーを自由に配布したり、ソースコードを読んだり、変更したりすることができます。
誰がRを使用しますか?
- 消費者金融保護局はデータ分析にRを使用しています
- John Deereの統計学者は、信頼性と再現性のある方法で時系列モデリングと地理空間分析にRを使用しています。
- Bank of Americaは、レポートにRを使用しています。
- Rは、Foursquareの有名なレコメンデーションエンジンの背後にあるテクノロジースタックの一部です。
- オーストラリアで4番目に大きい銀行であるANZは、信用リスク分析にRを使用しています。
- GoogleはRを使用して経済活動を予測します。
- Firefox Webブラウザを担当する財団であるMozillaは、Rを使用してWebアクティビティを視覚化します。
以下は、Rが使用されるドメインの一部です。
それでは、Rチュートリアルブログを進めて、Rをインストールしましょう。
Rチュートリアル:Rのインストール
システムにRをインストールするプロセスをご案内します。以下の手順に従ってください。
ステップ1 :リンクに移動します-https://cran.r-project.org/
ステップ2 :R3.3.3をダウンロードしてシステムにインストールします。
理解を深めるには、以下のスクリーンショットを参照してください。
上記の手順に従うことで、Rのインストール部分は完了です。これで、RStudio IDEをダウンロードして、Rで直接コーディングを開始できます。これをダウンロードするには、以下の手順に従ってください。
ステップ1 :リンクにアクセス-https://www.rstudio.com/
ステップ2 :システムにRstudioをダウンロードしてインストールします。
すべてをインストールしたら、コードを作成する準備が整います。
sqlおよびplsqlチュートリアル
初心者のためのRチュートリアル| Rプログラミングチュートリアル|エドゥレカ
次に、Rチュートリアルのブログに進み、Rのデータ演算子とは何かを理解しましょう。
Rチュートリアル:Rのデータ演算子
主に5種類の演算子があり、以下にリストされています。
- 算術演算子 :加算、減算、乗算、除算などの算術演算を実行します。
- 代入演算子 :代入演算子は、値を代入するために使用されます。例えば:
- 代入演算子=
構文: 変数名=値
> x = 5 >>バツ
出力:[1] 5
代入演算子<-
構文: 変数名<- value> x<- 15 > x
出力:[1] 15
- 代入演算子<<-
構文: 変数名<<- value
> x<<- 2 > x
出力:[1] 2
- 代入演算子->
構文: 値->変数名> 25-> x > x
出力:[1] 25
3.関係演算子 :2つのエンティティ間の関係を定義します。例えば: 、<=,!= etc.
> xx!= 2
出力:[1]真
4.論理演算子 :これらの演算子は2つのエンティティを比較し、通常、&、|などのブール(論理)値で使用されます。および!。
> x2&3
出力:[1]真
5.特別なオペレーター :これらの演算子は、論理計算ではなく、特定の目的で使用されます。例えば:
- ベクトルの一連の数値を順番に作成します。
> xx
出力:[1] 2 3 4 5 6 7 8
- %in%この演算子は、要素がベクトルに属しているかどうかを識別するために使用されます。
例> xyy%in%x
出力:[1] TRUE
Rチュートリアル:データ型
データ型は情報を格納するために使用されます。 Rでは、変数をデータ型として宣言する必要はありません。変数にはR-Objectが割り当てられ、R-objectのデータ型が変数のデータ型になります。Rには主に6つのデータ型があります。
それらのそれぞれについてさらに詳しく見ていきましょう。
ベクター :ベクトルは、同じ基本タイプのデータ要素のシーケンスです。例:
vtr =(1、3、5、7 9)
または
vtr<- (1, 3, 5 ,7 9)
5つのクラスのベクトルとも呼ばれる5つの原子ベクトルがあります。
リスト :リストは、&マイナス数、文字列、ベクトル、およびその中に別のリストなど、さまざまなタイプの要素を含むRオブジェクトです。
> n = c(2、3、5) > s = c( 'aa'、 'bb'、 'cc'、 'dd'、 'ee') > x = list(n、s、TRUE) > x
出力 -
[[1]] [1] 2 3 5 [[2]] [1] 'aa''bb''cc''dd''ee' [[3]] [1] TRUE
配列 :配列は、3次元以上のデータを格納できるRデータオブジェクトです。ベクトルを入力として受け取り、dimパラメーターの値を使用して配列を作成します。
vector1<- c(5,9,3) vector2<- c(10,11,12,13,14,15) 結果<- array(c(vector1,vector2),dim = c(3,3,2))
出力 -
、、 1 [、1] [、2] [、3] [1、] 5 10 13 [2、] 9 11 14 [3、] 3 12 15 、、 2 [、1] [、2] [、3 ] [1、] 5 10 13 [2、] 9 11 14 [3、] 3 12 15
配列 :行列は、要素が2次元の長方形のレイアウトに配置されたRオブジェクトです。マトリックスは、matrix()関数を使用して作成されます。例: matrix(data、nrow、ncol、byrow、dimnames) どこ、
データ は、行列のデータ要素となる入力ベクトルです。
nrow 作成される行の数です。
ncol 作成する列の数です。
byrow 論理的な手がかりです。 TRUEの場合、入力ベクトル要素は行ごとに配置されます。
dimname 行と列に割り当てられた名前です。
>マット<- matrix(c(1:16), nrow = 4, ncol = 4 ) >マット出力 :
[、1] [、2] [、3] [、4] [1、] 1 5 9 13 [2、] 2 6 10 14 [3、] 3 7 11 15 [4、] 4 8 12 16
要因 :ファクターは、データを分類してレベルとして保存するために使用されるデータオブジェクトです。文字列と整数の両方を格納できます。これらは、統計モデリングのデータ分析に役立ちます。
>データ<- c('East','West','East','North','North','East','West','West“,'East“) > factor_data<- factor(data) > factor_data
出力 :
[1] East West East North North East West West East レベル:東北西
データフレーム :データフレームは、テーブルまたは2次元配列のような構造であり、各列には1つの変数の値が含まれ、各行には各列の値のセットが1つ含まれます。
> std_id = c(1:5) > std_name = c( 'Rick'、 'Dan'、 'Michelle'、 'Ryan'、 'Gary') >マーク= c(623.3,515.2,611.0,729.0,843.25) > std.data<- data.frame(std_id, std_name, marks) > std.data
出力 :
std_idstd_nameマーク 11リック623.30 22そして515.20 33ミシェル611.00 44ライアン729.00 55ゲイリー843.25
これで、Rのさまざまなデータ型の終わりに到達しました。次に、Rチュートリアルのブログに進み、別の重要な概念であるフロー制御ステートメントを理解しましょう。
Rチュートリアル:フロー制御ステートメント
フロー制御ステートメントは、関数内のスクリプトの実行フローを制御できるため、非常に重要な役割を果たします。最も一般的に使用されるフロー制御ステートメントは、次の画像に示されています。
それでは、それぞれについて例を挙げて説明しましょう。
Rチュートリアル:セレクターステートメント
- 制御ステートメントの場合 :この制御ステートメントは、単一の条件を評価します。単一のキーワード「if」の後に条件が続き、それがtrueの場合に実行する必要がある特定のステートメントのセットがあるため、非常に簡単です。理解を深めるには、以下のフローチャートを参照してください。
このフローチャートでは、コードは次のように応答します。
- まず、条件をチェックするループに入ります。
- 条件が真の場合、条件付きコードまたは記述されたステートメントが実行されます。
- 条件がfalseの場合、ステートメントは無視されます。
以下はの例です もし Rでの制御ステートメント。この例をRStudioで実行してみてください。
x = 2リピート{x = x ^ 2 print(x)if(x> 100){ブレーク}
出力:
[1] 4 [1] 16 [1] 256
- それ以外の場合は制御ステートメント :試験s制御ステートメントのタイプ条件のグループを評価し、ステートメントを選択します。理解を深めるには、以下のフローチャートを参照してください。
このフローチャートでは、コードは次のように応答します。
- まず、条件をチェックするループに入ります。
- 条件が真の場合、最初の「if」ステートメントが実行されます。
- 条件がfalseの場合、「else if」条件になり、trueの場合、「elseif」コードが実行されます。
- 最後に、「else if」コードもfalseの場合、「else」コードに移動して実行されます。これは、これらの条件のいずれも当てはまらない場合、「else」ステートメントが実行されることを意味します。
以下はの例です それ以外の場合 Rでの制御ステートメント。この例をRStudioで実行してみてください。
x5){print( 'xは5より大きい')} elseif(x == 5){print( 'xは5に等しい')} else {print( 'xは5より大きい')}
出力:
[1] 'xは5に等しい'
- Switchステートメント :これらの制御ステートメントは、基本的に特定の式を既知の値と比較するために使用されます。理解を深めるには、以下のフローチャートを参照してください。
このSwitchケースのフローチャートでは、コードは次の手順で応答します。
- まず、式のあるswitchケースに入ります。
- 次に、ケース1の条件に進み、条件に渡された値を確認します。 trueの場合、Statementブロックが実行されます。その後、そのスイッチケースから壊れます。
- falseの場合、次のケースに切り替わります。ケース2の条件が真の場合、ステートメントを実行してそのケースから抜け出します。そうでない場合は、再び次のケースにジャンプします。
- ここで、大文字と小文字を指定していないか、ユーザーからの入力が間違っているとすると、デフォルトの大文字と小文字が区別され、デフォルトのステートメントが出力されます。
以下は、Rでのswitchステートメントの例です。この例をRStudioで実行してみてください。
vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) )
出力:
[1] 275
Rチュートリアル:ループステートメント
ループを使用すると、特定の一連のアクションを繰り返すことができるため、繰り返し実行する必要がありません。 10回の操作が必要だと想像してみてください。毎回コードを書き始めると、プログラムの長さが長くなり、後で理解するのが難しくなります。しかし同時に、ループを使用することで、ループ内に同じステートメントを記述すると、時間が節約され、コードが読みやすくなります。また、コード効率に関してさらに最適化されます。
c c#c ++
上の画像では、「 繰り返す' および「 一方 「ステートメントは、条件が真になるまで特定のルールセットを実行するのに役立ちますが」 ために' ステートメントのブロックを何回繰り返すかがわかっている場合に使用されるループステートメントです。ここで、10回繰り返すことがわかっている場合は、「for」ステートメントを使用しますが、コードを何回繰り返すかわからない場合は、「repeat」またはを使用します。 'while'ループ。
それぞれについて例を挙げて説明しましょう。
- 繰り返す :繰り返しループは、停止条件が満たされるまで、同じコードセットを何度も実行するのに役立ちます。理解を深めるには、以下のフローチャートを参照してください。
上記のフローチャートでは、コードは次の手順で応答します。
- まず、一連のコードを入力して実行します。
- 次に、条件をチェックします。trueの場合は、falseになるまで戻って、同じコードセットを再度実行します。
- falseであることが判明した場合、ループを直接終了します。
- 一方 :whileステートメントは、停止条件が満たされるまで、同じコードセットを何度も実行するのにも役立ちます。理解を深めるには、以下のフローチャートを参照してください。
上記のフローチャートでは、コードは次の手順で応答します。
- まずは状態をチェックします。
- trueであることが判明した場合、一連のコードが実行されます。
- 次に、条件を再度チェックし、trueの場合、同じコードを再度実行します。条件がfalseであることが判明するとすぐに、ループを終了します。
以下は、Rでのwhileステートメントの例です。この例をRStudioで実行してみてください。
x = 2 while(x<1000) { x=x^2 print(x) }
出力:
4 16256 65536
では、これら2つのステートメントがどのように異なるのか疑問に思われるでしょうか。あなたの疑問を解消させてください!
ここで、repeatステートメントとwhileステートメントの主な違いは、条件によって変化することです。 一方 ループは基本的に、ステートメントを実行するためにループに入るタイミングを定義し、 繰り返す loopは、ステートメントの実行後にループを終了するタイミングを定義します。したがって、これら2つのステートメントは、入口制御ループおよび出口制御ループと呼ばれます。そのように、whileステートメントとrepeatステートメントは異なります。
- Forループ: forループは、コードのブロックを数回実行する必要がある場合に使用されます。理解を深めるには、以下のフローチャートを参照してください。
上記のフローチャートでは、コードは次の手順で応答します。
- まず、ループを繰り返す回数を指定する初期化があります。
- 次に、状態をチェックします。条件が真の場合、指定された回数だけコードのセットを実行します。
- 条件がfalseであることが判明するとすぐに、ループを終了します。
以下は、Rでのforステートメントの例です。この例をRStudioで実行してみてください。
vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) }
出力:
7 19 25 65 45
次に、Rチュートリアルブログの最後のステートメントセット、つまりジャンプステートメントに移りましょう。
Rチュートリアル:ジャンプステートメント
Breakステートメント :Breakステートメントは、プログラムを終了し、ループに続く次のステートメントに制御を再開するのに役立ちます。これらのステートメントは、switchcaseでも使用されます。理解を深めるには、以下のフローチャートを参照してください。
上記のフローチャートでは、コードは次の手順で応答します。
- まず、条件をチェックするループに入ります。
- ループ条件がfalseの場合、ループを直接終了します。
- 条件が真の場合、ブレーク条件をチェックします。
- ブレーク条件が真の場合、ループから存在します。
- ブレーク条件がfalseの場合、ループに残っているステートメントを実行してから、同じ手順を繰り返します。
以下は、Rでのジャンプステートメントの例です。この例をRStudioで実行してみてください。
バツ<- 1:5 for (val in x) { if (val == 3){ break } print(val) }
出力:
[1] 1 [1] 2
次のステートメント :次のステートメントは、ループの現在の反復を終了せずにスキップする場合に使用されます。次のステートメントは、他のプログラミング言語の「続行」と非常によく似ています。理解を深めるには、以下のフローチャートを参照してください。
上記のフローチャートでは、コードは次の手順で応答します。
まず、条件をチェックするループに入ります。
ループ条件がfalseの場合、ループを直接終了します。
ループ条件が真の場合、ブロック1ステートメントが実行されます。
その後、「次の」ステートメントをチェックします。存在する場合、その後のステートメントはループの同じ反復で実行されません。
「next」ステートメントが存在しない場合、それ以降のすべてのステートメントが実行されます。
以下は、Rでの次のステートメントの例です。この例をRStudioで実行してみてください。
for(i in 1:15){if((i %% 2)== 0){next} print(i)}
出力:
1 3 5 7 9 11 13 15
これでRチュートリアルブログは終わりです。私が上で議論したすべての概念について皆さんが明確であることを願っています。しばらくお待ちください。次のブログはRトレーニングに関するもので、Rの概念について詳しく説明します。十分な。
Rの基本を理解したので、 25万人以上の満足した学習者のネットワークを持つ信頼できるオンライン学習会社であるEdurekaが世界中に広がっています。 EdurekaのRトレーニングを使用したデータ分析は、Rプログラミング、データ操作、探索的データ分析、データ視覚化、データマイニング、回帰、感情分析、および小売、ソーシャルメディアの実際のケーススタディのためのRStudioの使用に関する専門知識を習得するのに役立ちます。
質問がありますか?この「Rチュートリアル」ブログのコメントセクションでそれについて言及してください。できるだけ早くご連絡いたします。