出力メタデータのドリフト評価指標

出力メタデータドリフトメトリックは、LLM出力テキストメタデータの分布の変化を測定します。

メトリックの詳細

出力メタデータのドリフトは、 v2 評価指標であり、モデルの一貫した結果を確保するために、時間の経過とともにデータに生じる変化を測定するのに役立ちます。

LLMの出力テキストのメタデータで、出力メタデータのドリフトが測定されるのは、以下の種類です

文字数 : 出力テキストの合計文字数
単語数 : 出力テキスト内の単語の総数
トークン数 : 出力テキスト内のトークンの総数
文数 : 出力テキスト内の文の総数
平均単語長 : 出力テキスト内の単語の平均長
総単語長 : 出力テキスト内の単語の合計長
平均文長 : 出力テキスト内の文の平均長

有効範囲 (Scope)

出力メタデータのドリフトは、生成型AI 資産のみを評価します。

AI 資産の種類: テンプレートを即座に表示
生成型AIのタスク ：
- テキストの要約
- テキストの分類
- コンテンツの生成
- 質問への回答
対応言語 ：英語

スコアと価値

出力メタデータドリフトスコアは、LLM出力テキストメタデータの分布の変化を示します。

値の範囲 ： 0.0-1.0
最高得点 ： 0.0
比率：
- 0：変化は検出されません。
- 0以上：変化が増加していることが検出された。

評価プロセス

Watsonx.governance メタデータ列の分布の変化を測定することで、出力メタデータのドリフトを計算します。ペイロードに存在する場合、出力トークンカウントの列は出力メタデータのドリフトを計算するためにも使用されます。また、ペイロードテーブルにレコードを追加する際に任意のメタフィールドを指定することもできます。これらのメタフィールドは、出力メタデータのドリフトを計算するためにも使用されます。

計算

離散的な数値出力メタデータ列を特定するために、以下の2進対数式が使用されます

2進対数表記が表示されます

If the `distinct_values_count` is less than the binary logarithm of the `total_count`, the feature is identified as discrete.

For discrete output metadata columns, watsonx.governance uses the [Jensen Shannon distance](#jensen-shannon-distance) formula to calculate output metadata drift.

For continuous output metadata columns, watsonx.governance uses the [total variation distance](#total-variation-distance) and [overlap coefficient](#overlap-coefficient) formulas to calculate output metadata drift:

離散的な出力メタデータ列の出力メタデータのドリフトを計算するには、以下のJensen Shannon距離の公式を使用します

Jensen Shannonの距離公式が表示されます