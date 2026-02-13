最も難しいとされる問題を解決するために、テンソルと量子回路を連携して利用する新しいアルゴリズムが、ここ数年で登場しています。そのうち最も注目すべきものの一つが、サンプル・ベースの量子対角化（SQD）技術です。これは、大規模化学や材料科学のシミュレーション精度を近い将来に向上する可能性があります。

AMDとオークリッジ国立研究所の私たちのパートナーによる新しい研究と、理研と行っている継続的な研究は、世界最速のGPUおよびIBM QPUやスーパーコンピューティング・クラスターを組み合わせて用いてSQDを実装するもので、コンピューティングの未来に対する私たちの最新ビジョンを提示しています。

化学反応を正確にシミュレートするのは非常に難しい問題です。ハミルトニアンという方程式で系の全体的な挙動を記述できますが、実際にハミルトニアンから情報を、例えば分子の異なる配置がどのように異なるエネルギーを持つかなどを抽出するには、非常に大きなテンソルが必要であり、世界最高のスーパーコンピューターでも近似解しか求めることができません。SQDは量子処理の助けを借りてより高い近似精度を実現することを目指しています。

SQDはまずハミルトニアンを量子回路に符号化し、量子コンピューター上で実行することで、研究すべき配置の候補リストを求めます。この情報を古典コンピューターに渡し、これらの配置を使って、系を記述するより単純なテンソルを作成し、それを対角化します。対角化とは、これらの配置に関する物理情報を意味ある形で抽出できるように、テンソルを再構成する操作です。この情報を量子コンピューターに返し、反復的にこのプロセスを繰り返して、最もエネルギーが低い配置とそれに対応するエネルギーを求めます。

回路とテンソル表現間で情報をやり取りするSQDの処理は、GPUとQPUを組み合わせた実装に最適であり、最近ではIBMのパートナーもこれらの実装を始めています。

こちらの論文では、IBM、オークリッジ国立研究所、AMDの研究者たちが、共有メモリ・マルチプロセッシングのプログラミングを行うのに、OpenMPのAPIを活用してAMDとNVIDIAのGPUを備えたFrontierスーパーコンピューターと、IBM QPU上にSQDを実装するプロセスを発表しています。彼らは、Frontier上でSQDを運用することで、CPUを使ったベースライン実装と比べて約100倍の速度向上を確認しました。そしてさらに最新のAMD MI300XやMI355X GPUや、NVIDIA H100のGB200 GPUを組み込むことで、1.8倍から3倍の速度向上が確認されています。これらの新しいワークフローは、パフォーマンスと柔軟性の向上をもたらします。このオークリッジでの成果を踏まえて、次にIBMは理研と協力し、Thrustライブラリーと NVIDIA GH200GPUを備えたMiyabiスーパークラスターを活用して、SQDワークフローのGPU対角化を最適化しました。その結果、OpenMP単独を20%上回るパフォーマンス向上が実現し、より高度なGPU実装を探求するための柔軟性が高まりました。