SARI评估标准

SARI指标将预测的句子输出与参考句子输出进行比较，以衡量模型生成句子时所用单词的质量。

度量详细信息

SARI（系统输出与参考和输入句子的对比）是一种生成式人工智能质量评估指标，用于衡量生成式人工智能资产执行任务的能力。

SARI指标仅评估生成式人工智能资产。

SARI评分用于衡量用于生成句子的单词的质量。分数越高，表示生成句子的单词质量越高。