機械学習の統計:初心者向けガイド



機械学習の統計に関するこの記事は、統計に関するさまざまな概念と例に関する包括的なガイドです。

データを理解し、そこから価値を生み出すことができるのは、10年のスキルです。機械学習は、企業がそれを実現するのに役立つコアスキルの1つです。ただし、開始するには、基盤を正しく構築する必要があります。そのため、この記事では、いくつかの基本的な概念を取り上げ、機械学習の旅を始めるためのガイドラインを提供します。したがって、機械学習の統計に関するこの記事では、次のトピックについて説明します。

  1. 確率
  2. 統計学
  3. 線形代数

機械学習の確率と統計:





確率とは何ですか?

確率は、イベントが発生する可能性を定量化します。たとえば、公平で偏りのないサイコロを振った場合、 1 上向きは1/6です 。さて、あなたが疑問に思っているならwなに?そうすれば答えはとても簡単です!

これは、6つの可能性があり、すべてが同じように発生する可能性があるためです(フェアダイ)。したがって、追加できます 1 + 1 + 1 + 1 + 1 + 1 = 6。 しかし、私たちは興味があるので 1が現れるイベント 。有る イベントが発生する可能性がある唯一の方法。 したがって、



1ターンアップの確率= 1/6

すべてのイベントが同じように発生する可能性があるため、他のすべての数値の場合も同様です。簡単ですよね?

さて、この例の確率の頻度論的定義は次のように聞こえます– 1が上がる確率は、ダイが無限に回転した場合に、ダイが回転した合計回数に対する1が回転した回数の比率です。回数。これはどのように意味がありますか?



もっと面白くしましょう。 2つのケースを考えてみましょう–あなたは公正なサイコロを5回振った。あるケースでは、数字の順番は– [1,4,2,6,4,3]です。他の場合、次のようになります– [2,2,2,2,2,2]。どちらがより可能性が高いと思いますか?

どちらも同じように可能性があります。奇妙に思えますよね?

ここで、それぞれの場合の5つのロールすべてが 独立 。つまり、1つのロールが他のロールに影響を与えることはありません。最初のケースでは、6が現れたとき、2がその前に現れたことを知りませんでした。したがって、5つのロールすべてが同じように発生する可能性があります。

同様に、2番目のケースのストレート2は、一連の独立したイベントとして理解できます。そして、これらすべてのイベントは同じように発生する可能性があります。全体的に、私たちは同じサイコロを持っているので、 ケース1の場合に特定の番号が現れる確率はケース2と同じです。 次に、機械学習の統計に関するこの記事では、用語を理解しましょう 独立。

独立

2つのイベント Aの発生がイベントBに影響を与えない場合、AとBは独立していると言われます。 。たとえば、コインを投げてサイコロを振った場合、サイコロの結果は、コインが表か裏かには影響しません。また、 2つの独立したイベントAとBAとBが一緒に発生する可能性 。したがって、たとえば、コインが頭を示し、サイコロが3を示す確率が必要な場合。

P(AおよびB)= P(A)* P(B)

したがって、P =&frac12(頭が上に上がる確率)*⅙(3が上に上がる確率)= 1/12

前の例では、どちらの場合も、P =⅙*⅙*⅙*⅙*⅙*⅙です。

Javaのハッシュマップとは

それでは、独立していないイベントについて話しましょう。次の表を検討してください。

肥満 肥満ではない
心臓の問題フォーファイブ15
心臓の問題はありません1030

100人の調査が行われました。 60人は心臓に問題があり、40人はそうではありませんでした。心臓に問題のある60人のうち、45人は肥満でした。心臓に問題のない40人のうち、10人は肥満でした。誰かがあなたに尋ねたら–

  1. 心臓に問題がある確率はどれくらいですか?
  2. 心臓に問題があり、肥満にならない確率はどれくらいですか?

最初の質問への答えは簡単です–60/100。 2つ目は、15/100になります。次に、3番目の質問を考えてみましょう–人がランダムに選ばれました。彼は心臓病を患っていることがわかった。彼が肥満である確率はどれくらいですか?

今あなたに与えられた情報について考えてください–彼が心臓病を持っていることが知られています。したがって、彼は心臓病を患っていない40歳からではありえません。可能なオプションは60個のみです(表の一番上の行)。さて、これらの減少した可能性の中で、彼が肥満である確率は45/60です。さて、あなたが知っているので、独立したイベントとは何ですか、次の機械学習の統計に関するこの記事では、条件付き確率を理解しましょう。

条件付き確率

条件付き確率を理解するために、上記の例で説明を続けましょう。肥満の状態と心臓の問題に苦しんでいる状態は独立していません。肥満であることが心臓の問題に影響を与えなかったならば、心臓の問題を抱えている人々の肥満と非肥満の症例の数は同じだったでしょう。

また、心臓に問題があるとのことで、肥満の可能性を探さなければなりませんでした。したがって、この場合の確率は、彼が心臓の問題を抱えているという事実を条件としていると言われています。イベントAが発生する確率がイベントBを条件としている場合、次のように表します。

P(A | B)

ここで、この条件付き確率を計算するのに役立つ定理があります。それはと呼ばれています ベイズの定理

P(A | B)= P(AおよびB)/ P(B)

この定理は、先ほど説明した例をプラグインすることで確認できます。これまでに理解している場合は、次のことから始めることができます - ナイーブベイズ 。条件付き確率を使用して、電子メールがスパムであるかどうかを分類します。他の多くの分類タスクを実行できます。しかし、本質的に、条件付き確率はの中心にあります 。

統計学:

統計は 多数のデータポイントを要約して推論するために使用されます。 データサイエンスと機械学習では、次の用語に出くわすことがよくあります。

  • 中心性対策
  • 分布(特に通常)

中心性の測定とスプレッドの測定

平均:

平均はただ 数の平均 。平均を見つけるには、数値を合計し、数値で割る必要があります。たとえば、[1,2,3,4,5]の平均は15/5 = 3です。

mean-statistics-for-machine-learning

中央値:

中央値は 一連の数値の中央の要素 それらが昇順で配置されている場合。たとえば、番号[1,2,4,3,5]は昇順[1,2,3,4,5]に配置されます。これらの真ん中の1つは3です。したがって、中央値は3です。しかし、数字の数が偶数であり、したがって中央値がない場合はどうなるでしょうか。その場合、真ん中の2つの数値の平均を取ります。昇順の2n個の数値のシーケンスの場合、n番目と(n + 1)を平均します。th中央値を取得するための数値。例– [1,2,3,4,5,6]の中央値は(3 + 4)/ 2 = 3.5

モード:

モードは単に 一連の数字の中で最も頻繁な数字 。たとえば、[1,2,3,3,4,5,5,5]のモードは5です。

分散:

分散は中心性の尺度ではありません。それは測定します データが平均値の周りにどのように広がっているか 。それは次のように定量化されます

バツN個の数の平均です。あなたはポイントを取り、平均を引き、この差の二乗を取ります。 N個の数すべてに対してこれを行い、それらを平均します。分散の平方根は標準偏差と呼ばれます。次に、機械学習の統計に関するこの記事では、正規分布について理解しましょう。

正規分布

配布は私たちを助けます データがどのように拡散しているかを理解する 。たとえば、年齢のサンプルでは、​​高齢者よりも若者が多いため、年齢の値が小さいほど大きい値よりも大きい場合があります。しかし、どのように分布を定義するのでしょうか?以下の例を検討してください

y軸は密度を表します。この分布の最頻値は30です。これは、ピークであり、したがって最も頻繁であるためです。中央値を見つけることもできます。中央値は、曲線の下の領域の半分がカバーされるx軸上の点にあります。すべてのイベントの確率の合計が1であるため、正規分布の下の面積は1です。たとえば、

インフォマティカを段階的に学習する

上記の場合の中央値は約4です。これは、4の前の曲線の下の領域が4の後の領域と同じであることを意味します。別の例を考えてみましょう。

3つの正規分布が見られます。青と赤は同じ意味です。赤い方の分散が大きくなります。したがって、それは青いものよりも広がっています。ただし、面積は1でなければならないため、面積を一定に保つために、赤い曲線のピークは青い曲線よりも短くなります。

基本的な統計と正規分布を理解していただければ幸いです。さて、機械学習の統計に関するこの記事の次の記事では、線形代数について学びましょう。

線形代数

現代のAIは、線形代数なしでは不可能です。それはのコアを形成します ディープラーニング のような単純なアルゴリズムでも使用されています 。それ以上遅れることなく、始めましょう。

あなたはベクトルに精通している必要があります。それらは、空間における一種の幾何学的表現です。たとえば、ベクトル[3,4]には、x軸に3単位、y軸に4単位があります。次の画像を検討してください–

ベクトルd1は、x軸に0.707単位、y軸に0.707単位あります。ベクトルには1次元があります。それは必然的に大きさと方向性を持っています。例えば、

文字列を日付に変換する方法

上の画像にはベクトル(4,3)があります。その大きさは5で、x軸で36.9度になります。

さて、行列とは何ですか?行列は、数値の多次元配列です。何に使われるの?先を見ます。しかし、最初に、それがどのように使用されるかを見てみましょう。

マトリックス

行列は多くの次元を持つことができます。 2次元の行列を考えてみましょう。行(m)と列(n)があります。したがって、m * n個の要素があります。

例えば、

このマトリックスには、5行5列があります。これをAと呼びましょう。したがって、A(2,3)は、2行3列目のエントリである8です。

これで、行列とは何かがわかったので、行列のさまざまな操作を調べてみましょう。

行列演算

行列の追加

の2つの行列 同じ 寸法を追加することができます。 追加は要素ごとに行われます。

スカラー倍算

行列はスカラー量で乗算できます。このような乗算により、行列のすべてのエントリにスカラーが乗算されます。スカラーは単なる数値です

行列転置

行列の転置は簡単です。行列A(m、n)の場合、A ’をその転置とします。次に

A '(i、j)= A(j、i)

例えば、

行列の乗算

これはおそらく他の操作よりも少し注意が必要です。それに飛び込む前に、2つのベクトル間の内積を定義しましょう。

ベクトルX = [1,4,6,0]およびベクトルY = [2,3,4,5]を考えます。次に、XとYの間の内積は次のように定義されます。

X.Y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38

つまり、要素ごとの乗算と加算です。さて、2つの行列A(m、n)とB(n、k)について考えてみましょう。ここで、m、n、kは次元であり、したがって整数です。行列の乗算を次のように定義します

上記の例では、積(44)の最初の要素は、左行列の最初の行と右行列の最初の列の内積によって取得されます。同様に、72は、左行列の最初の行と右行列の2番目の列の内積によって取得されます。

左側の行列の場合、列の数は右側の列の行の数と同じである必要があることに注意してください。この場合、mがkと等しくないため、積ABは存在しますが、BAは存在しません。 2つの行列A(m、n)とB(n、k)の場合、積ABが定義され、積の次元は(m、k)((m、n)、(n、kの最も外側の次元)です。 ))。ただし、m = kでない限り、BAは定義されません。

これで、機械学習の統計に関するこの記事は終わりです。機械学習の専門用語についてご理解いただけたでしょうか。しかし、これで終わりではありません。業界での準備が整っていることを確認するには、データサイエンスとAIに関するEdurekaのコースをご覧ください。それらは見つけることができます