Conjuntos de datos para modelos de detección de objetos
Cuando prepare un conjunto de datos para entrenar un modelo de detección de objetos, asegúrese de que se cumplen los siguientes requisitos.
Requisitos para una formación precisa
- El conjunto de datos tiene al menos cinco imágenes.
- Cada objeto definido tiene una etiqueta de objeto. Las imágenes que no tienen etiquetas de objetos no se utilizan para entrenar el modelo.
Ejemplo
Está entrenando un modelo de detección de objetos para reconocer coches, y el conjunto de datos contiene los siguientes parámetros:
- Cinco imágenes: Asegúrate de definir y etiquetar un coche como objeto en al menos cinco imágenes.
- Tres imágenes y un vídeo: Asegúrate de definir y etiquetar un coche como objeto en tres imágenes y en al menos dos fotogramas del vídeo. Etiquetar cinco automóviles en una imagen no es adecuado.
Si su conjunto de datos no tiene muchas imágenes o una variedad suficiente para el entrenamiento, utilice los conjuntos de datos de ampliación para aumentar el conjunto de datos.
Validación
Por ejemplo, considere un conjunto de datos que se utilizará para el entrenamiento de un modelo de detección de objetos que tiene 200 imágenes. Con la configuración predeterminada del entrenamiento de modelo, se seleccionarán el 20% de las imágenes, es decir, 40 imágenes, para probar el modelo. Si una etiqueta LabelA se utiliza para identificar un objeto en el conjunto de datos, son posibles los siguientes escenarios si el número de imágenes etiquetadas con el objeto es menor que el conjunto de datos de prueba, por ejemplo, si sólo 20 imágenes con objetos están etiquetadas como EtiquetaA :
- Es posible que todas las imágenes con LabelA estén en el conjunto de datos de "entrenamiento", y ninguna de las imágenes se utilice para probar el modelo. Esta situación da lugar aunknownprecisión para LabelA, ya que no hay pruebas de la precisión.
- Del mismo modo, es posible que las 20 imágenes con LabelA objetos estén en el conjunto de datos de prueba, pero no se utilice ninguna imagen para 88 el entrenamiento. Esta situación da como resultado una precisión baja o del 0% para el objeto porque el modelo no se entrenó con ninguna imagen que contuviera los LabelA objetos.
Si tu conjunto de datos no tiene muchas imágenes o variedad suficiente para el entrenamiento, considera utilizar los conjuntos de datos de aumento para aumentar el conjunto de datos.
Consideraciones especiales sobre los modelos de detección de objetos
La precisión de los modelos de detección de objetos puede ser más difícil porque incluye la intersección sobre la unión ( IoU ), especialmente para los modelos que utilizan segmentación en lugar de cuadros delimitadores.
IoU se calcula mediante la intersección entre un cuadro delimitador de verdad fundamental y un cuadro delimitador previsto, dividido por la unión de ambos cuadros delimitadores, donde la intersección es el área de superposición, un cuadro delimitador de verdad fundamental es el cuadro dibujado a mano y el cuadro delimitador previsto es dibujado por IBM® Maximo® Visual Inspection.
En el caso de la detección de objetos, el objeto podría identificarse correctamente, pero el solapamiento del límite generado por el modelo no es preciso, lo que resulta en una métrica de IoU de baja calidad. Esta métrica podría mejorarse mediante un etiquetado más preciso de los objetos para reducir el ruido de fondo, entrenando el modelo durante más tiempo, o ambas cosas.
Asegúrese de que los conjuntos de datos que utiliza para entrenar modelos optimizados de anomalía contienen solo imágenes de objetos no anómalos. Estas imágenes se utilizan para entrenar un modelo que reconoce un objeto e identifica objetos similares que tienen características diferentes. Cuando entrene y pruebe el modelo, para obtener mejores resultados utilice imágenes que presenten el objeto de forma consistente. Es decir, asegúrese de que el ángulo del objeto, el centrado y la escala sean similares y que los fondos de la imagen sean similares.