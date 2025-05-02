教師あり学習は、ラベル付けされたデータセットを使用してAI モデルをトレーニングし、データ ポイント全体の基礎パターンを識別する機械学習手法です。ラベル付きデータには、特徴量とラベル、そしてモデルがこの2つの間の関係を理解するために使用する、対応するアウトプットが含まれます。

多くの企業は、人間のデータ・アノテーターの大規模なチームを雇用しており、機械の支援を受けることもあります。これらのアノテーターは、データが適切にラベル付けされることを保証するために、しばしば固有の分野の専門知識を必要とします。たとえば、法的データにラベルを付ける場合、アノテーターに法律の知識が必要になる場合があります。人間のアノテーターを利用するプロセスは、「ヒューマン・イン・ザ・ループ」と呼ばれることもあります。

教師あり学習の古典的な例は、スパム検知です。モデルにスパムを識別するように教えるために、人間が「スパム」か「非スパム」かというラベルを付けた何千件ものEメールで構成されるデータセットをモデルに渡します。モデルはEメール内のパターンをレビューし、さまざまなパターンに気づきます。たとえば、件名に「無料」という言葉が含まれているEメールはスパムである可能性が高くなります。モデルは、件名内の「無料」という単語が「スパム」というラベルに対応する統計的尤度を計算します。その後、ラベルのない新しいEメールが与えられると、モデルはその計算を他の多くの計算とともに適用して、新しいEメールがスパムかどうかを判断できます。

このタイプの機械学習は、すべてのデータにラベルを付けるために人間の監督が必要なため、「教師あり」と呼ばれます。