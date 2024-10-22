2つの観点からこれに対処することができます。まず、このプロジェクトを開始するにあたり、一部の企業から報告された数値の妥当性について疑問を投げかけました。私たちは、これらの数値が選択的なテスト・セットやベンチマークから導き出されていないことを確認したいと考えていました。これで、研究コミュニティ内の信頼のレベルが浮き彫りになります。

私たちのモデルの場合は、データへのアクセスを提供し、モデルがどのように評価されるかを示すので、それは簡単です。この透明性により、データの中に何があるか、モデルがどのようにトレーニングされたかが明確になります。また、トレーニングの中間段階であるさまざまなチェックポイントもリリースしています。研究者は、これらのチェックポイントを使用して、時間の経過とともに知識と改善がどのように進化していくかを観察できます。そして一部の研究者はすでに私たちのチェックポイントを活用して、この進化を研究しています。

最後に、一般の信頼という観点からも、同様のアプローチが適用されます。多くの人は、言語モデルが単にハルシネーションを起こすと考えています。私たちはそのアウトプットを学習データに接続し、意思決定プロセスを説明することで信頼性を高めることができます。まだ完璧ではありませんが、トレーニング・データの透明性を向上させることは、社会の信頼を築く大きな機会を提供します。