物体検出モデルのデータセット
物体検出モデルをトレーニングするためのデータセットを準備する場合、以下の要件が満たされていることを確認してください。
正確なトレーニングの条件
- データセットには少なくとも5つの画像がある。
- 定義されたすべてのオブジェクトはオブジェクト・ラベルを持つ。 オブジェクト・ラベルを持たない画像はモデルの訓練には使用されない。
例
あなたは車を認識するために物体検出モデルをトレーニングしており、データセットには以下のパラメータが含まれています:
- 5枚の画像少なくとも5つの画像で、車をオブジェクトとして定義し、ラベル付けしてください。
- 画像3枚とビデオ1本:3枚の画像と少なくとも2コマの動画で、車をオブジェクトとして定義し、ラベル付けしてください。 1 個のイメージに 5 個の car のラベルを付けるのは適切ではありません。
データセットに画像が十分でない場合や、学習に十分な多様性がない場合は、 データセットを拡張してデータ量を増やしてください。
検証
例えば、200 のイメージを含むデータ・セットが、オブジェクト検出モデルのトレーニングに使用されるとします。 モデルのトレーニングのデフォルト構成では、イメージの 20% (40 個のイメージ) がモデルのテストに選択されます。 ラベル LabelA がデータセット内のオブジェクトを識別するために使用される場合、オブジェクトのラベルが貼られた画像の数がテストデータセットよりも少ない場合、例えば、オブジェクトのラベルが貼られた画像が LabelAとして 20枚しかない場合、次のようなシナリオが考えられます:
- を持つ画像はすべて "訓練 "データセットに含まれ LabelA を持つ画像はすべて "トレーニング "データセットにあり、どの画像もモデルのテストには使われない。 この結果unknownLabelAの精度はテストされていない。
- 同様に、オブジェクトが写っている20枚の画像すべてが LabelA オブジェクトを含む20枚の画像はテストデータセットに含まれるが、88のトレーニングには使用されない。 このような状況では、オブジェクトの精度が低いか0%になる。 LabelA オブジェクトを含む画像で学習されていないためです。
データセットに画像が少ない場合や、学習に十分な多様性がない場合は、データセットを拡張するためにデータ拡張の使用を検討してください。
オブジェクト検出モデルに関する特別な考慮事項
オブジェクト検出モデルの精度は、特にバウンディングボックスの代わりにセグメンテーションを使用するモデルの場合、ユニオンを超えるインターセクション( IoU )が含まれるため、より困難になる可能性があります。
IoU、 グラウンド トゥルース境界ボックスと予測境界ボックスの交差部分を両方の境界ボックスの和集合で割って計算されます。交差部分は重複領域、 グラウンド トゥルース境界ボックスは手描きのボックス、 予測境界ボックスは IBM® Maximo® Visual Inspection によって描画されます。
オブジェクト検出の場合、オブジェクトは正しく識別される可能性がありますが、モデルによって生成された境界の重なり合いは正確でないため、IOU メトリックの正確度は低くなります。 この指標は、背景ノイズを低減するためのより精密な物体ラベリング、モデルのより長い期間にわたる訓練、あるいはその両方によって改善される可能性がある。
異常最適化モデルをトレーニングするために使用するデータ・セットには、非異常オブジェクトのイメージのみが含まれている必要があります。 これらのイメージは、オブジェクトを認識し、異なる特性を持つ類似のオブジェクトを識別するモデルのトレーニングに使用されます。 モデルをトレーニングおよびテストする際には、最適な結果を得るために、オブジェクトを一貫して表示するイメージを使用してください。 つまり、オブジェクトの角度、センタリング、およびスケールが似ていて、イメージの背景が似ていることを確認してください。