Los desarrolladores utilizan una serie de métricas de evaluación para el resumen del texto. Las diferencias en las métricas generalmente dependen del tipo de resumen, así como de la característica del resumen que se desea medir.
El BLEU (suplente de evaluación bilingüe) es una métrica de evaluación que se utiliza habitualmente en la traducción automática. Mide la similitud entre la verdad básica y la salida del modelo para una secuencia de n palabras, conocidas como n-gramas. En el resumen de texto, el BLEU mide con qué frecuencia y en qué medida los n-gramas de un resumen automático se solapan con los de un resumen generado por humanos, teniendo en cuenta las repeticiones de palabras erróneas en el primero. A continuación, utiliza estas puntuaciones de precisión para n-gramas individuales para calcular una precisión general del texto, conocida como precisión media geométrica. Este valor final está entre 0 y 1, lo que indica una alineación perfecta entre los resúmenes de texto generados por la máquina y los humanos15.
El ROUGE (suplente orientado a la recuperación para la evaluación de Gisting) se deriva del BLEU específicamente para evaluar tareas de resumen. Al igual que el BLEU, compara resúmenes de máquinas con resúmenes generados por humanos utilizando n-gramas. Pero mientras que el BLEU mide la precisión de la máquina, el ROUGE mide la recuperación de la misma. En otras palabras, el ROUGE calcula la precisión de un resumen automático en función del número de n-gramas del resumen generado por humanos que se encuentran en el resumen automático. La puntuación ROUGE, al igual que la BLEU, es cualquier valor entre 0 y 1; este último indica una alineación perfecta entre los resúmenes de texto generados por máquinas y humanos16.
Tenga en cuenta que estas métricas evalúan el resultado final del texto resumido. Son distintos de los innumerables métodos de puntuación de frases utilizados en los algoritmos de resumen de textos que seleccionan oraciones y palabras clave adecuadas a partir de las cuales se produce el resultado final resumido.