AIコード・レビュー

共同執筆者

Teaganne Finn

Staff Writer

IBM Think

Amanda Downie

Staff Editor

IBM Think

AIコード・レビュー

AI コードレビューとは、人工知能（AI）ツールとテクニックを使用して、コードの品質、スタイル、機能性をレビューすることです。

自動化されたプロセスでは、機械学習（ML）モデルを使用して、コーディング標準との不一致を識別し、セキュリティの問題と脆弱性を検知します。

AIコード・レビュー・ツールは多くの場合、提案や自動修正プログラムを提供しているので、開発者は時間を節約し、コードの品質を向上させられます。これを開発環境やバージョン管理システムに統合すれば、継続的統合と継続的デリバリー（CI/CD）の実践を促進できます。こうしたツールの例としては、GitHub Copilot、DeepCode、SonarQube、What the Diffなどがあります。

IBM Graniteモデルによるコードの要約

AIコード・レビューが重要な理由

絶え間なく変化し続けるソフトウェア開発のランドスケープでは、高品質のコードベースが求められています。そのため、チームはプロジェクトを加速するためにオープンソース・リポジトリを利用することが多くなっており、コードの変更を効果的に管理する必要が高まっています。

AIはコード・レビューにおいて変革的な役割を果たします。というのも、このアプローチにより、開発者がコードの品質を維持し、最終的にはソフトウェア開発の活気あるエコシステムをサポートする方法が変革されるからです。AIコード・レビューは、生成AIを使用して従来のコード・レビュー・プロセスを強化できる革新的なアプローチです。

膨大な量のオープンソースコードから学習する能力があるAIシステムは、パターンを認識し、潜在的なバグにフラグを立て、改善を提案できるため、コラボレーションと継続的な改善の文化を育みます。

AIコード・レビューの主要なコンポーネント

AIコード・レビューには4つの主要なコンポーネントがあり、そのすべてが重要な役割を果たします。¹

静的コード分析
動的コード分析
ルールに基づいたシステム
自然言語処理（NLP）と大規模言語モデル（LLM）

静的コード分析

これは、プログラムを実行する前にソースコードを分析する方法です。この方法の目的と主なメリットは、実行前に問題やエラーを特定することです。静的コード分析によりバグを早期に発見し、セキュリティー問題を特定し、保守性を向上させられるため、コード・レビュー・プロセスにとって重要なコンポーネントとなります。

静的コード分析ツールは、プログラミング言語レベルでソースコードを分析できるため、より複雑なコードベースで特に役立ちます。適切なツールを導入すれば、静的コード分析は数千行のコードを数秒でスキャンできるため、企業の貴重な時間と参考情報を節約できます。静的コード分析が実行されると、AIアルゴリズムはこの情報を取得し、改善や新しい行動方針を推奨できます。

動的コード分析

静的なコード解析とは異なり、動的なコード解析は、潜在的な問題やセキュリティ脆弱性について、コードをテストしたり、アプリケーションを実行したりするように設計されています。この方法のメリットは、ソフトウェアの実行中に問題をテストし、静的なコードでは発見できないような問題を発見できることです。

動的コード分析は、動的アプリケーション・セキュリティ・テスト（ DSAT）とも呼ばれています。これらのDSATツールには、アプリケーションの実行中に確認すべき既知の脆弱性の辞書が入っています。次に、これらのツールはインプットに対する応答を分析し、問題を記録します。動的コード解析ツールは、アプリケーションが顧客に提供される前に、性能のボトルネックやセキュリティの脆弱性を発見して、開発者に安心感をもたらします。

ルールに基づいたシステム

このコンピューター・システムは、コード分析のために事前定義されたルールとベスト・プラクティスを使用します。この方法のメリットは、インプットデータにロジックを適用して結論に達し、コード・レビュープロセス全体で重要な役割を果たしていることです。このルールは、コードが業界基準を満たし、会社のガイドラインを遵守していることを確認するのに役立ちます。

このルールベースのシステムは、コード解析の一貫したベースラインを確立し、開発チームに信頼性の高いコード解析ソースを提供できます。リンターのようなツールは、コードの構文エラーや特定のコーディングスタイルからの逸脱を検査し、アプリケーションを修正することができる。

自然言語処理（NLP）と大規模言語モデル（LLM）

大規模なコード・データ・セットでトレーニングされたNLPモデルは、AIコード・レビューの中核を構成しています。これらのモデルは、問題や非効率性を示している可能性のあるコード内のパターンを認識することを学習するため、AIのコード・レビューには欠かせません。目標は、長期的に使用すれば、エラーを発見して、より詳細な推奨事項を作成するNLPの能力が向上するようになることです。

これとは別に、GPT-4 のようなLLMがコード・レビュー・ツールに組み込まるようになっています。LLMは、従来の機械学習技術よりも複雑なレベルでコードの構造とロジックを理解できます。LLMメソッドは、より微妙な異常とエラーを特定できるため、より徹底したコード・レビューに役立ちます。

AIコード・レビューの主要なツール

watsonx Code Assistant™：watsonx Code Assistantソリューションは、信頼とセキュリティーの原則を維持しながら、生成AIを使用して開発を加速します。watsonx Code Assistantを使用すると、開発者はエラーを削減し、学習曲線を最小限に抑え、コード生成、コード・マッチング、コード・モダナイゼーションを通じて、高品質のコードを構築できます。

Codacy：Codacyは、JavaScriptやPythonなどの言語に対応した自動コード・レビューを提供し、開発者がプロジェクト全体でコードの品質を維持できるよう支援します。オンボーディング・プロセスはソフトウェア・ワークフローにシームレスに統合されるように設計されているため、チームは問題を早期に発見できます。

DeepCode：DeepCodeはAIを使用してリアルタイムでコードを分析し、オープンソース・プロジェクトに実行可能な洞察を提供します。このツールは、よくある落とし穴を特定し、ソフトウェア・エンジニアリングのベスト・プラクティスを促進することで、新規開発者のオンボーディング・エクスペリエンスを向上させます。

Bito AI：Bito AIは、直感的なインターフェースとAI搭載コード・レビューにより、ソフトウェア・エンジニアリング・チームのオンボーディングを合理化することに重点を置いています。フィードバックと実行可能な推奨事項を提供し、新しいチーム・メンバーが会社のコーディング標準とベスト・プラクティスにすばやく適応できるようにします。

PullRequest：PullRequestは、AI駆動型の洞察と人間の専門知識の両方を提供し、ソフトウェア・エンジニアリング・チームのスムーズなオンボーディング・プロセスを促進します。このプラットフォームは、新しい開発者が体験豊富なレビュアーから学ぶことを奨励して、コラボレーションと知識の共有を促進しています。

Coderabbit： Coderabbitは、AIツールを使用して分析と明確なフィードバックを生成するAIコード・レビュー・プラットフォームです。人間のようなレビューを提供し、あらゆるプログラミング言語で動作するようカスタマイズが可能です。

AIコード・レビューのメリット

AI搭載コード・レビューは、組織とその開発チームに次のようなさまざまなメリットをもたらします。

効率性
一貫性
エラー検知
学習の強化

効率性

AIによるコード・レビューの主なメリットの1つは、効率性です。従来のコード・レビュー・プロセスにはかなりの時間がかかり、多くの参考情報も必要となる場合があります。AIなどの自動コード・レビューを使えば、このプロセスは瞬時に完了できます。前述したAIコード・レビューの各方法は、アプリケーション開発プロセスの最初から最後まで重要な部分です。

このメリットの一例が、Z用のIBM watsonx Code Assistantです。この生成AIによる支援製品は、メインフレーム・アプリケーションのライフサイクルを加速し、モダナイゼーションを合理化し、効率と費用対効果を高めるように構築されました。開発者は、選択した要素を自動的にリファクタリングし、コードを最適化し、COBOLからJavaへのトランスフォーメーションによるモダナイゼーションを行えます。²

一貫性

人間のコード・レビューのチーム・メンバーは、疲労やバイアスといった外部の影響を受ける可能性があり、一貫性のないレビューにつながる場合があります。AIは量や複雑さに関係なく、コードを正確かつ一貫して分析できるため、AIコード・レビューの主要なメリットとなります。コード・レビューは時間のかかるプロセスですが、生成AIツールなどの高度なテクノロジーを適切に使用すれば、メリットを得られます。

一貫性の例としては、IBMのGraniteモデルがあります。このモデルは、115のプログラミング言語と1.63兆個のトークンで構成される大規模なコードベースでトレーニングされています。AI コード・レビューの方法は簡単で、さまざまなデータ・セットで学習できます。さらに、トレーニングで使用されるGraniteモデルは、設計されたガバナンス、リスク、コンプライアンス（GRC）レビュー・プロセスを受けます。

エラー検知

AI搭載のコード・レビュー・ツールはテクノロジーに基づいているため、コードの臭いなど、手作業によるレビューでは見落としがちな深刻なエラーをリアルタイムで検知するのに非常に効果的です。微妙なものであったり、特定のコード・レビュー手法によらなければ特定の条件下でしか発生しないものであったりするために、こうしたエラーは見逃されてしまうことがあります。

一例として、IBM ResearchはIBM AIOps Insightsプラットフォームを強化して、IT専門家がITの問題に対する解決策を見つける速度を向上させました。LLMと生成AIの力を活用することで、AIOps InsightsはクライアントのIT環境からデータを収集し、データ内の相関関係を見つけて潜在的な問題を特定できます。

学習の強化

AIのコード・レビューのメリットは、長期的なコーディング・スキルの向上を目指す開発者にとって、貴重な学習機会になり得る点です。AIの大きなメリットは、開発者が最終的に開発ワークフローを変更し、確実に質の高いコードを作成できるように、多くのフィードバックや推奨事項を提供する点です。

前の例を基に、IBM AIOps Insightsは人間の洞察とAI搭載コーディングを組み合わせられます。開発者は、インテリジェントな修復モジュールを活用して、システムの速度低下や技術的な問題の原因を突き止めるために必要な措置を講じることができます。これにより、開発者が修復を実行するために独自のスクリプトを作成する必要がなくなります。

AIコード・レビューの課題

AIへの過度の依存

開発者は、コード・レビュー・プロセスを合理化するためにAIツールに過度に依存するようになるため、個人の専門知識やクリティカル思考にに重点を置く力が低下する可能性があります。このような依存により、開発者が人間の監視を必要とする深い問題を見落とすことになると、技術的負債が調査されないままとなる可能性があります。

これらの課題を克服する方法は、コード・レビュー・プロセスに倫理基準を導入し、すべての開発者がこれらのルールに従うようにすることです。組織は、不正使用を防ぐために境界を設定し、倫理とスピードのバランスを取るように努める必要があります。最も重要なのは、コード・レビューにおいては、人的要素は依然として最も重要な要素であり、AIはプロセスを強化するだけであるということです。

コンテキストを理解する際の限界

AIツールは、APIやアーキテクチャー全体の複雑さなど、プロジェクトの特定のコンテキストで苦労することがよくあります。このようなコンテキスト理解が欠如していると、コード品質の検証が不十分になり、プロジェクト目標に沿った最適化の機会を逃すことにつながります。

大量のデータがある場合は、組織がターゲットにしようとしているすべてのグループを表す多様なトレーニング・データ・セットを使用することが重要です。こうした限界を克服するもうひとつの方法は、自動監視によってAIシステムに偏りがないか定期的にチェックし、生成AIが従うべき厳格なガイドラインを設定することです。

偽陽性と偽陰性

AIコード・レビュー・システムでは、偽陽性が発生したり、問題のあるコードや偽陰性のフラグが誤って付けられたり、実際の欠陥が見落とされたりすることがあります。こうした不正確さは、コード・レビュー・プロセスを複雑にし、不必要な修正や未対処の問題に時間を浪費することから、技術的負債の増加の一因につながる可能I22I22 性があります。

この課題の解決策として考えられるのは、MLアルゴリズムを使用して大量のデータを監視し、時間をかけて各メトリクスの動作を学習することです。参照するベースラインがあれば、誤った成果を減らせて、最終的に開発者が偽陰性の重大度レベルを調整するのに役立ちます。これとは別に、この AI コード・レビューの課題を克服する方法の 1 つは、同じデータ・セットでモデルを再トレーニングし、アウトプット値を以前の成果とより一致するように変更することです。

The latest AI News + Insights  

Expertly curated insights and news on AI, cloud and more in the weekly Think Newsletter.

AIコード・レビューを試用する方法

AIコード・レビューを始めると、チームは高いコード品質と効率性を維持できるため、ソフトウェア開発プロセスを大幅に向上させられます。ビジネスのコード・レビューのワークフローにAI駆動型のツールを効果的に統合するには、いくつかの一般的な手順があります。³

適切なAIコード・レビュー・ツールを選択する： まず、組織のニーズに合ったAIコード・レビュー・ツールを選択します。人気の高いオプションの多くは、複数のプログラミング言語のサポートや既存のワークフローとの統合など、さまざまな機能を提供しています。組織は、コードの複雑さ、重複率、コーディング標準への準拠など、コードの品質を評価するためのメトリクスを提供するツールを探す必要があります。これらのメトリクスは、組織が開発プロセスのベンチマークを設定するのに役立ちます。
オンボーディングと設定のセットアップ：ツールを選択したら、次のステップはチームのオンボーディングです。そのためには、ツールの主要な機能と能力を全員に理解してもらうための明確な文書化とトレーニング・セッションが必要です。組織は、コーディング標準や特定のプロジェクト要件に合わせてツールを構成する必要があります。それには、特定のメトリクスのカスタム・ルールやしきい値の設定が入る場合があります。
レビュー・プロセスへのAIの組み込み：次のステップは、AIツールを組織の既存のコード・レビュー・プロセスに統合することです。AIが分析に基づいてレビュー・コメントを生成し、潜在的な問題を強調表示して改善を提案します。このプロセスにより、開発者はレビュー・プロセスが合理化されるだけでなく、開発者は時間の経過とともにフィードバックから学習できるようになります。
メトリクスを使用した改善の推進： 組織は、AIコード・レビューから得た情報を、チームのパフォーマンスを追跡するためのメトリクスに利用する必要があります。コード品質の傾向を経時的に監視することで、開発チームは改善点を指摘できます。さらに、チームはチーム・ミーティングでこれらの洞察を活用し、繰り返し発生する問題に対処し、コーディング・プラクティスを改善するためのアイデアを生み出せます。
AIと人間の洞察のバランスを取る： AI駆動型のコード・レビュー・ツールはコード・レビュー・プロセスを大幅に改善できますが、自動フィードバックと人間の洞察のバランスをとることが不可欠です。組織は、チームメンバーでAIによって生成されたフィードバックをレビューし、独自の視点を共有するよう奨励する必要があります。この協力的なアプローチにより、レビュー・プロセスを強化するだけでなく、チームメンバーの学習と継続的な改善の文化も育めます。

脚注

1. AIコード・レビュー：仕組みと知っておくべき5つのツール、『Swim』、2024年10月（リンクは IBM.com外部にあります）

2. ソフトウェアが世界を席巻。これからどうなるのか？、IBM ブログ、2024年1月17日

3. AIベースのレビューとアセスメントによるコード品質の向上、『Medium』、2024年3月29日（リンクはIBMcom外部にあります）

企業向け生成AI+ML

理想的なエンタープライズAIプラットフォームの4つの重要な要素について学びましょう。