SARI评估标准
SARI指标将预测的句子输出与参考句子输出进行比较,以衡量模型生成句子时所用单词的质量。
度量详细信息
SARI(系统输出与参考和输入句子的对比)是一种生成式人工智能质量评估指标,用于衡量生成式人工智能资产执行任务的能力。
作用域
SARI指标仅评估生成式人工智能资产。
- 人工智能资产的类型 :即时模板
- 生成式人工智能任务 :文本摘要
- 支持的语言 :英语
分数和数值
SARI评分用于衡量用于生成句子的单词的质量。 分数越高,表示生成句子的单词质量越高。
设置
- 门槛:
- 下限:0
- 上限:100