機械学習の前提条件は何ですか?



機械学習の前提条件に関するこのブログは、機械学習を開始する前に知っておく必要のある基本的な概念を理解するのに役立ちます。

機械学習は間違いなく、その時代で最も需要の高いテクノロジーです。機械学習を始めたばかりの初心者の場合は、機械学習の前提条件を知っておくことが重要です。このブログは、機械学習を始める前に知っておく必要のあるさまざまな概念を理解するのに役立ちます。

人工知能と機械学習の詳細な知識を得るには、ライブに登録できます 24時間年中無休のサポートと生涯アクセスを備えたEdurekaによる。





これがトピックのリストです このブログで取り上げられています:

  1. 機械学習の前提条件
  2. ユースケースで機械学習を理解する

機械学習の前提条件

はじめに機械学習では、次の概念に精通している必要があります。



  1. 統計学
  2. 線形代数
  3. 微積分
  4. 確率
  5. プログラミング言語

統計学

統計には、データから何らかの結果を得るのに使用できるツールが含まれています。いくつかの重要な情報の生データを変換するために使用される記述統計があります。また、完全なデータセットを使用する代わりに、推論統計を使用してデータのサンプルから重要な情報を取得できます。

詳細については 次のブログで確認できる統計:

線形代数

線形代数のお得な情報ベクトル、行列、線形変換を使用します。データセットの変換と操作の実行に使用できるため、機械学習では非常に重要です。



微積分

微積分は数学の重要な分野であり、多くの機械学習アルゴリズムで不可欠な役割を果たしています。複数の機能を持つデータセットは機能は複数の多変数微積分であるため、機械学習モデルの構築に使用されます。機械学習モデルの構築には重要な役割を果たします。統合と差別化は必須です。

確率

確率は、発生の可能性を予測するのに役立ちます。状況が再び発生する場合と発生しない場合があると推論するのに役立ちます。機械学習の場合、確率は 財団。

Mathematics

確率の詳細については、こちらをご覧ください。 ブログ。

プログラミング言語

機械学習プロセス全体を実装するには、RやPythonなどのプログラミング言語を知っていることが不可欠です。 PythonとRはどちらも、機械学習アルゴリズムの実装を非常に簡単にする組み込みライブラリを提供します。

基本的なプログラミングの知識があるだけでなく、データを抽出、処理、分析する方法を知っていることも重要です。これは、機械学習に必要な最も重要なスキルの1つです。

配列javascriptのサイズを取得します

プログラミングの詳細については 機械学習の言語については、次のブログをご覧ください。

  1. データサイエンスと機械学習に最適なPythonライブラリ

機械学習のユースケース

機械学習とは、データから学習して、画像に含まれるオブジェクトの種類などの予測を行うアルゴリズム、または特定の病気やスパムフィルタリングを治療するための薬物の最適な組み合わせであるレコメンデーションエンジンを作成することです。

機械学習は数学の前提条件に基づいて構築されており、機械学習で数学が使用される理由を知っていれば、楽しくなります。使用する関数の背後にある数学と、データに適したモデルとその理由を知る必要があります。

それでは、さまざまな機能と価格の履歴を含むデータセットを使用して、住宅価格を予測するという興味深い問題から始めましょう。ここでは、平方フィート単位の居住空間の面積と価格について検討します。

これで、次のように2つの列を含むデータセットができました。

住宅の価格を予測できるモデルを構築する必要があることを知るには、これら2つの変数の間に何らかの相関関係がなければなりません。どうすればよいでしょうか。

このデータをグラフ化して、どのように見えるかを見てみましょう。

ここで、X軸は居住空間の平方フィートあたりの価格であり、Y軸は家の価格です。すべてのデータポイントをプロットすると、上の図に示すように線で表すことができる散布図が得られます。データを入力すると、結果が予測されます。理想的には、最大データポイントと交差する線を見つける必要があります。

ここでは、次のように呼ばれる線を作成しようとしています。

Y = mX + c

ターゲット(従属変数)と予測変数(独立変数)の間の線形関係を予測するこの方法は、線形回帰と呼ばれます。これにより、2つの変数間の関係を調べて要約することができます。

  • X =独立変数
  • Y =従属変数
  • c = y切片
  • m =線の傾斜

方程式を考えると、独立変数であるXの値があるので、Yの値を予測するためにmとcの値を計算するだけです。

では、これらの変数をどのように見つけるのでしょうか?

これらの変数を見つけるために、一連の値を試し、データポイントの最大数と交差する線を見つけようとすることができます。しかし、どうすれば最適な線を見つけることができますか?

したがって、最適な線を見つけるために、yの実数値と予測値y`の間の誤差を見つける最小二乗誤差関数を使用できます。

最小二乗誤差関数は、次の式を使用して表すことができます。

この関数を使用して、データポイントの実際の値と比較することにより、予測された各データポイントのエラーを見つけることができます。次に、これらすべてのエラーの合計を取り、それらを2乗して、予測の偏差を見つけます。

考えられるすべてのエラー値を含む3番目の軸をグラフに追加し、それを3次元空間にプロットすると、次のようになります。

上の画像では、理想的な値は実際のデータポイントに近い価格を予測する下部の黒い部分にあります。次のステップは、mとcの可能な限り最良の値を見つけることです。これは、勾配降下法と呼ばれる最適化手法を使用して実行できます。

最急降下法は反復法であり、変数の値のセットを初期化することから始め、実際の値と予測値の間の誤差を最小化することによってそれらをゆっくりと改善します。

さて、実際にアパートの価格が平方フィートあたりの価格だけに依存しているのではないと考えると、寝室やバスルームの数など、多くの要因があります。これらの特徴も考慮すると、方程式は次のようになります。このような

Y = b0 + b1x1 + b2x2 +&hellip .. + bnxn + c

これは、線形代数に属する多重線形回帰です。ここでは、サイズmxnの行列を使用できます。ここで、mは特徴であり、nはデータポイントです。

確率を使って家の状態を見つけ、状態が良いか悪いかに基づいて家を分類できる別の状況を考えてみましょう。このためには、シグモイド関数で表される発生の確率に作用するロジスティック回帰と呼ばれる手法を使用する必要があります。

この記事では、機械学習の前提条件と、それらが機械学習にどのように適用されるかについて説明しました。つまり、基本的には、統計、微積分、線形代数、確率論で構成されています。微積分には最適化に使用される手法があり、線形代数には巨大なデータセットを処理できるアルゴリズムがあり、発生の可能性を予測できる確率があり、統計はデータセットのサンプルから有用な洞察を推測するのに役立ちます。

機械学習の前提条件がわかったので、もっと知りたいと思っていると思います。データサイエンスを始めるのに役立つブログをいくつか紹介します。

人工知能と機械学習の完全なコースに登録したい場合は、Edurekaが特別にキュレーションします これにより、教師あり学習、教師なし学習、自然言語処理などの手法に習熟できます。これには、ディープラーニング、グラフィカルモデル、強化学習など、人工知能と機械学習の最新の進歩と技術的アプローチに関するトレーニングが含まれます。