Métrica de avaliação ROUGE

A métrica ROUGE mede a qualidade dos resumos ou traduções gerados em comparação com os resultados de referência.

Detalhes da métrica

O ROUGE (Recall-Oriented Understudy for Gisting Evaluation) é uma métrica de avaliação de qualidade de IA generativa que mede a capacidade dos ativos de IA generativa de executar tarefas.

Escopo

A métrica ROUGE avalia apenas os ativos de IA generativa.

Tipos de ativos de IA : Modelos de prompts
Tarefas de IA generativa :
- Resumo de textos
- Geração de conteúdo
- Resposta à pergunta
- Extração de entidade
- Geração aumentada de recuperação (RAG)
Idiomas suportados : Inglês

Pontuações e valores

A pontuação da métrica ROUGE indica a similaridade entre o resumo gerado e os resultados de referência. Pontuações mais altas indicam maior similaridade entre o resumo e a referência.

Faixa de valores : 0.0-1.0
Melhor pontuação possível : 1.0

Configurações

Limiares :
- Limite inferior: 0.8
- Limite superior: 1
Parâmetros :
- Use stemmer: Se verdadeiro, os usuários usarão o stemmer para remover os sufixos das palavras. O padrão é false.

Tópico principal: Métricas de avaliação