Rを使用したビジネス分析における予測分析プロセス



ブログでは、Rを使用したビジネス分析の予測分析プロセスについて簡単に説明しています。

典型的なモデリングプロセス:

典型的なモデリングプロセスでは、仮説を立て始めることが重要です。 RFP(提案依頼書)を受信し、仮説を立てます。





  1. 適切なデータソースを決定する –ここで、顧客はデータソースを提供する場合がありますが、そうでない場合は、データソースを探す必要があります。誰が選挙に勝つかを評価しようとするシナリオを考えると、データの公開分析は、ソーシャルメディア、ニュースチャンネル、または世論を含むソースを使用して行われます。また、問題を分析するために必要なデータの量を理解する必要があります。この場合、選挙の場合であるため、通常は大きなサンプルを探します。一方、ヘルスケアで分析を行うと、仮説を検証するのに十分な人数が得られない可能性があるため、大規模な人口を対象とすることは困難です。また、データの品質は非常に重要です。
  2. データの抽出 –たとえば、人口サンプルを取得する場合、高収入、低収入、年齢、労働人口(オフサイト/オンサイト)、居住者、NRI、病院のカバレッジなどの属性を調べて、調査を開始できます。 。ここでは、仮説にそれほど多くの属性は必要ないかもしれません。高収入や低収入などの属性は、誰が選挙に勝つかを決定する要因ではない可能性があることを理解しています。しかし、年齢は投票する人の数を直接数えるので、違いを生む可能性があります。多くの場合、あまり使用されていない属性を除外したり、有用な属性を含めたりすることがあります。どちらの場合もうまくいかない可能性があります。それが分析が課題である理由です。
  3. ツールに合うようにデータをマッサージする –これは、すべてのツールがすべてのデータを受け入れることができるわけではないためです。特定のツールは、CSVデータまたはExcelデータのみを受け入れます。ツールの欠如は課題です。
  4. 分析を実行する –この操作は、分析の多くの手法を使用して実行できます。
  5. 結論を導き出す –分析により、正確な数値が得られます。しかし、これらの数値から結論を導き出すのはユーザー次第です。たとえば、10%または20%と表示されている場合、それが何を意味するのかを理解する必要がありますか?属性Aと属性Bの間の相関関係を導き出しますか?
  6. 結果を実装する –ビジネスで結果を確認するには、結論を実装することが重要です。たとえば、次のように結論付けることができます。 「人々は梅雨の時期に傘を買う」 より多くのビジネスにつながる可能性があります。ここでは、傘を店頭で販売するという結論を出す必要がありますが、そうすると管理上の問題が発生する可能性があります。統計が結果を出す瞬間、実装がうまくいかない可能性があります。
  7. 進捗状況の監視 –ここでの最後のステップでは、監視が重要な役割を果たします。多くの組織が進捗状況を監視したくないため、監視がうまくいかない可能性があり、それは無視できるステップと見なされます。しかし、私たちの研究と結論が正しい方向に向かっているかどうかを理解できるので、監視は重要です。

この記事もチェックしてください' 相関関係は因果関係を意味するものではありません 'これにより、アナリストがどのように失敗する可能性があるかについての洞察が得られます。このチャートで注意すべき重要な点は、分析の実行は、マシンが責任を負う唯一のステップであり、それを超えて、研究がどのように行われるかを最終的に決定するのは人間次第であるということです。

Pythonを学ぶ必要がある理由

質問がありますか?コメントセクションでそれらに言及してください。折り返しご連絡いたします。



関連記事: