SARI评估标准

SARI指标将预测的句子输出与参考句子输出进行比较,以衡量模型生成句子时所用单词的质量。

度量详细信息

SARI(系统输出与参考和输入句子的对比)是一种生成式人工智能质量评估指标,用于衡量生成式人工智能资产执行任务的能力。

作用域

SARI指标仅评估生成式人工智能资产。

  • 人工智能资产的类型 :即时模板
  • 生成式人工智能任务 :文本摘要
  • 支持的语言 :英语

分数和数值

SARI评分用于衡量用于生成句子的单词的质量。 分数越高,表示生成句子的单词质量越高。

设置

  • 门槛:
    • 下限:0
    • 上限:100