ApacheMahoutでの教師あり学習

教師あり学習は機械学習の手法であり、ラベル付けされたトレーニングデータの例から関数が推測されます。

教師あり学習は、トレーニングデータに入力と目的の結果の両方が含まれる方法です。例を使用してシステムをトレーニングすることを、教師あり学習と呼びます。または、教師と一緒にアルゴリズムをトレーニングすることも、教師あり学習として扱うことができます。ターゲット変数に両方の予測子があるすべてのサンプルデータまたはラベル付きデータを使用してアルゴリズムをトレーニングした後、アルゴリズムをトレーニングし、見えない例を使用してさらに分類することができます。





Javaサンプルコードのコマンドライン引数

Mahoutの教師あり学習の重要な機能のいくつかを次に示します。

  • 適切なトレーニング、検証、およびテストセット(Bok)の構築は非常に重要です。
  • これらの方法は通常、高速で正確です。
  • 教師あり学習の方法は、一般化できる必要があります。
  • 新しいデータが知らないうちに入力で与えられた場合、それらは正しい結果を与えます。先験的に目標。
  • 場合によっては、正しい結果(ターゲット)がわかっており、学習プロセス中にモデルへの入力で与えられます。

教師あり学習の例

ミッションをトレーニングしたい場合、ラベル付きデータとともに2つの異なる画像グループが提供されます。上の写真では、一方のグループには象の画像があり、もう一方のグループにはライオンの画像があります。ラベル付きデータは、各データセットがターゲット値を持っていることを意味します。上記の例では、データセットは象の画像ですが、それに付けられたラベル、つまり「Elephant」はデータセットのターゲット値です。このようなラベル付きデータセットはトレーニングプロセスに使用されるため、トレーニングアルゴリズムはこのデータセットを活用してモデルを構築し、ラベル付きデータやターゲット変数なしで見えない例を分類するためにさらに使用できます。



オブジェクトを象またはライオンとして識別するのに役立つ機能を特定しましょう。

タイプキャストdoubleからintjava

特徴 になり得る - サイズ、色、高さ、耳のサイズ、トランク、牙

これは機能セットと呼ばれ、トレーニング目的で使用されます。この機能セットは、最終的なターゲット変数に影響を与えます。これらの変数は、 予測変数 、彼らは私たちが決定するのに役立つので 最終ターゲット変数 。最後の変数はラベルと呼ぶこともできます。最終変数 こちらがエレファント/ライオンです。



table-word

この例では、カテゴリ、サイズ、色、高さ、耳のサイズ、胴体、牙の各レコードが予測変数であり、象とライオンがターゲット変数です。これらの変数は、それぞれトレーニング例とトレーニングデータセットとして扱うことができます。

Javaでの明示的な型キャスト

したがって、教師あり学習は、ラベルと一緒にトレーニングする方法であり、アルゴリズムに特定の特徴を抽出するように依頼します。それに基づいて、目に見えない例が表示されるたびに、アルゴリズムはそれを分類できます。適切なクラスに。

質問がありますか?コメントセクションでそれらに言及してください。折り返しご連絡いたします。

関連記事: