LinkedInの2人のアナリストは、2008年に「データサイエンティスト」という用語を作り出しました。彼らは自分たちの仕事を説明しようとしていました。つまり、ウェブサイトによって生成された膨大なデータからビジネス価値を引き出していました。その過程で、彼らは、今後数年間で信じられないほどの需要が見込まれ、さらには次のように呼ばれるであろう役職に名前を付けることになりました。 「21の最もセクシーな仕事st世紀。'
現在、「データ」を貴重な資産と見なしている組織は、これらのデータの専門家または「科学者」を探して、彼らを未来に導きます。
では、優れたデータサイエンティストになるには何が必要ですか?……… さまざまなスキルセット!
和集合節は
データサイエンティストのコアスキルを簡単に見てみましょう。
データサイエンスのプロセスには、3つの段階があります。
- データ収集
- データ分析
- プレゼンテーション
これらの各段階におけるデータサイエンティストの役割を詳しく見ていきましょう。
データ収集
- プログラミングとデータベースのスキル
データマイニングの最初のステップは、適切なデータをキャプチャすることです。したがって、データサイエンティストになるには、ツールとテクノロジー、特にHadoop、Java、Python、C ++などのオープンソーステクノロジー、およびSQL、NoSQL、HBaseなどのデータベーステクノロジーに精通していることが非常に重要です。
- ビジネスドメインと専門知識
データは事業によって異なります。したがって、ビジネスデータを理解するには、特定のデータドメインで作業することによってのみ得られる専門知識が必要です。
例:医療分野から収集されたデータは、衣料品小売店のデータとはまったく異なります。
- データモデリング、ウェアハウス、非構造化データのスキル
組織は、さまざまなリソースを通じて膨大な量のデータを収集しています。この方法でキャプチャされたデータは構造化されていないため、分析前に整理する必要があります。したがって、データサイエンティストは、非構造化データのモデリングに習熟している必要があります。
データ分析
- 統計ツールスキル
データサイエンティストの基本的なスキルは、R、Excel、SASなどの統計ツールの使用方法を知ることです。これらのツールは、キャプチャされたデータを粉砕して分析するために必要です。
JavaScriptで配列の長さを取得します
- 数学のスキル
コンピュータサイエンスの知識だけでは、データサイエンティストになるには十分ではありません。データサイエンティストのプロファイルには、熟練した統計学者でありながら、大規模な機械学習アルゴリズムとプログラミングを理解できる人が必要です。これには、コンピューター言語以外の他の科学的および数学的な分野の専門知識が必要です。
プレゼンテーション
- 視覚化ツールのスキル
収集したデータをマイニングしてモデル化できる場合もありますが、それを視覚化することはできますか?
成功するデータサイエンティストになりたい場合は、いくつかのデータ視覚化ツールを使用して、データ分析を視覚的に表現できる必要があります。これらには、R、Flare、HighCharts、AmCharts、D3.js、Processing、Google VisualizationAPIなどが含まれます。
しかし、これで終わりではありません!データサイエンティストになりたいと思っている場合は、次のスキルも必要です。
- コミュニケーションスキル: 統計とExcelは扱いが難しいものです。データサイエンティストは、結果をビジネスユーザーに伝達する方法でデータを提示できる必要があります。
- ビジネススキル :データサイエンティストは複数の役割を果たす必要があります。彼らは組織内の多様な人々とコミュニケーションをとる必要があります。したがって、コミュニケーション、計画、編成、管理などの強力なビジネススキルを持つことは非常に役立ちます。これには、ビジネスとアプリケーションの要件を理解し、それに応じて情報を解釈することが含まれます。また、彼は業界の主要な課題を全体的に理解し、より良い意思決定のために財務比率を認識している必要があります。 結論として、「ビジネス」も考えるデータサイエンティスト。
- 問題解決スキル: データサイエンスは問題解決がすべてであるため、これは明らかなようです。効率的なデータサイエンティストは、時間をかけて問題を深く調査し、ユーザーに適した実行可能な解決策を考え出す必要があります。
- 予測スキル: データサイエンティストも効率的な予測因子である必要があります。彼は、データモデルに適切に適合する適切なアルゴリズムを選択するためのアルゴリズムに関する幅広い知識を持っている必要があります。これには、データを賢く使用および表現するためのある程度の創造性が含まれます。
- ハッキング: 怖いように聞こえますが、コマンドラインでのテキストファイルの操作、ベクトル化された操作の理解、アルゴリズム的思考などのさまざまなハッキングスキルにより、より優れたデータサイエンティストになります。
上記のスキルセットを見ると、データサイエンティストであるということは、データに関するすべてを知ることだけではないことは明らかです。これは、データスキル、数学スキル、ビジネススキル、コミュニケーションスキルが融合した仕事のプロファイルです。これらすべてのスキルを組み合わせることで、データサイエンティストはIT分野のロックスターと当然呼ばれることができます。
素晴らしく効率的なデータサイエンティストになるためのチェックリスト:
Javaの選択ソートプログラム
データサイエンティストになるために必要なスキルについて説明しました。データサイエンティストになって、素晴らしく効率的なデータサイエンティストになることには、大きな違いがあります。次のスキルと上記のスキルにより、通常のデータサイエンティストや平凡なデータサイエンティストとは一線を画すことができます。
- 数学的スキル –微積分、行列演算、数値最適化、確率論的方法など。
- 統計スキル –回帰モデル、トレス、分類、診断、適用された統計など。
- コミュニケーション –視覚化、プレゼンテーション、および執筆。
- データベース – CouchDBに加えて、MongoDBやVerticaなどの非伝統的なデータベースに関する知識。
- プログラミング言語 – Pig、Hive、Java、Pythonなど。
- 自然言語処理と データマイニング。
エドゥレカは特別にキュレーションされています これは、K-Meansクラスタリング、ディシジョンツリー、ランダムフォレスト、ナイーブベイズなどの機械学習アルゴリズムの専門知識を習得するのに役立ちます。統計、時系列、テキストマイニングの概念、およびディープラーニングの概要も学習します。このコースの新しいバッチがまもなく開始されます!!