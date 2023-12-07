重機業界はここ数年、AIモデルを使用してプロセスを最適化してきました。通常、回帰モデルはプロセスの動作を把握するために使用されますが、各回帰モデルは、プロセスの一部の動作を捉えます。このモデル グループは、オプティマイザーと組み合わせて、プロセスの全体的な動作を表します。これらの10～20台のモデルのグループは、オーケストラのようにオプティマイザーによって統合され、プラントに対する最適化運用ポイントの推奨を生成します。しかし、このアプローチでは、特に中断中のランプアップやランプダウンなどのプロセスのダイナミクスを捉えることができませんでした。また、多数の回帰モデルのトレーニングと維持は簡単ではなく、加速したスケーリングにおけるボトルネックとなっています。

今日、基盤モデルは主に自然言語処理で使用されています。Transformerアーキテクチャーを使用して、テキスト本文内の単語間の長期的な関係（生成AI用語でトークン）を把握します。これらの関係はベクトルとしてエンコードされます。これらの関係ベクトルは、特定のコンテキスト（レンタル契約など）のコンテンツを生成するために使用されます。ChatGPTが実証するように、これらのマッピングされたベクトルから生成されたコンテンツの精度は驚くべきものです。時系列データをトークンの一連のシーケンスとして表現できたらどうなるでしょうか？並列化されたTransformerアーキテクチャーを使用して多変量時系列データをエンコードし、変数間の長期および短期の関係を捉えることができたらどうなるでしょうか？

IBM Researchは、IBM Consultingと協力して、TransformerアーキテクチャーをTime Seriesデータに適応させ、有望な成果を導き出しました。このテクノロジーを使用すると、産業プロセス全体、たとえばセメント窯を 1 つの基盤モデルだけでモデル化できます。基盤モデルはプロセス・ドメイン用にトレーニングされており、資産およびプロセス・クラス全体の動作を取り込むことができます。例えば、セメント工場基盤モデルは、セメント工場のいくつかの能力の動作を捉えることができます。したがって、当社がデプロイする後続のすべての工場では、トップダウンのトレーニング プロセスではなく、「セメント工場基盤モデル」の微調整のみを行う必要があります。これにより、モデルのトレーニングとデプロイメントの時間が半分に短縮され、大規模なロールアウトに対応可能なテクノロジーとなります。これらの基盤モデルは回帰モデルの7倍の精度であることが確認されています。さらに、これらのモデルは高精度で多変量予測を行うため、プロセスの動向を捉えることができます。