AI 代码审查

作者

Teaganne Finn

Staff Writer

IBM Think

Amanda Downie

Staff Editor

IBM Think

AI 代码审查

AI 代码审查是指使用人工智能 (AI) 工具和技术协助审查代码的质量、样式和功能。

该自动化流程使用机器学习 (ML) 模型来识别与编码标准的不一致之处，并检测安全问题和漏洞。

AI 代码审查工具通常提供建议甚至自动修复，帮助开发人员节省时间并提高代码质量。它们可以集成到开发环境和版本控制系统中，以促进持续集成和持续交付 (CI/CD) 实践。这些工具的示例包括 GitHub Copilot、DeepCode、SonarQube 和 What the Diff。

使用 IBM Granite 模型生成代码摘要

为什么 AI 代码审查很重要？

不断变化的软件开发态势需要高质量代码库。因此，团队越来越多地转向开放源代码存储库，以加速项目，并且需要有效地管理代码变更。

AI 在代码审查中发挥着变革性作用，因为此方法正在改变开发人员维护代码质量以及最终助力实现蓬勃发展的软件开发生态系统的方式。AI 代码审查是一种创新方法，它可使用生成式 AI 来提升传统的代码审查流程。

凭借从大量开源代码中学习的能力，AI 系统可识别模式、标记潜在错误并提出改进建议，从而培育出协作与持续改进的文化。

AI 代码审查有哪些关键组成部分？

AI 代码审查有四个关键组件，它们都发挥着至关重要的作用。¹

静态代码分析
动态代码分析
基于规则的系统
自然语言处理 (NLP) 和大型语言模型 (LLM)

静态代码分析

这是一种在运行程序之前先分析源代码的方法。其目的和主要优点是在运行之前识别问题或错误。静态代码分析可及早发现错误、识别安全问题并提高可维护性，从而使其成为代码审查流程的一项关键组成部分。

静态代码分析工具可在编程语言级别分析源代码，因而其对于较复杂的代码库尤其有用。通过使用适当的工具，静态代码分析可在几秒钟内扫描数千行代码，从而为公司节省宝贵的时间和资源。执行静态代码分析后，AI 算法便可利用此信息提出改进建议或新的行动方案。

动态代码分析

与静态代码分析不同，动态代码分析旨在测试代码或运行应用，确认是否存在潜在问题或安全漏洞。这种方法的优点在于，它可以在软件运行时测试问题，发现代码静态时可能无法发现的问题。

动态代码分析也称为动态应用安全测试 (DSAT)。这些 DSAT 工具具有已知漏洞字典，可以在应用运行时查找。然后，这些工具分析对输入的响应并记录任何问题。动态代码分析工具可以在向客户上线应用之前发现性能瓶颈和安全漏洞，从而让开发人员高枕无忧。

基于规则的系统

该计算机系统使用预定义规则和最佳实践进行代码分析。此方法的好处在于：它会应用逻辑来输入数据以得出结论，并在整个代码审查流程中发挥关键作用。这些规则有助于确保相关代码符合行业标准和公司准则。

这种基于规则的系统可为代码分析建立一致的基线，并可为开发团队提供可靠的代码分析来源。类似 linters 的工具可检查代码是否存在语法错误或与特定编码风格的偏差，并可纠正应用程序，从而帮助确保实现良好的代码质量。

自然语言处理 (NLP) 和大型语言模型 (LLM)

通过大型代码数据集来训练的 NLP 模型构成了 AI 代码审查的核心。这些模型对于 AI 代码审查至关重要，因为它们能学会如何识别代码中可能表示存在低效问题或其他问题的模式。其目标在于，如果能长期使用，NLP 便可开始更好地捕捉错误并提出更详细的建议。

另外，GPT-4 等 LLM 已开始被纳入到代码审查工具中。较之传统机器学习技术，LLM 可在更复杂的层面上理解代码的结构和逻辑。此 LLM 方法可识别更细微的异常和错误，从而有助于更彻底地进行代码审查。

AI 代码审查的关键工具

watsonx Code Assistant：watsonx Code Assistant 解决方案使用生成式 AI 加快开发，同时保持信任和安全原则。借助 watsonx Code Assistant，开发人员可以减少错误，最大限度地缩短学习曲线，并通过代码生成、代码匹配和代码现代化来构建高质量代码。

Codacy：Codacy 提供支持 JavaScript 和 Python 等语言的自动代码审查功能，帮助开发人员维护项目中的代码质量。入职流程旨在无缝集成到软件工作流程中，使团队能够尽早发现问题。

DeepCode： DeepCode 使用 AI 来实时分析代码，从而为开源项目提供可操作的的洞察信息。该工具可通过识别常见的陷阱以及推广软件工程的最佳实践来增强新开发人员的上手体验。

Bito AI：Bito AI 专注于通过其直观的界面以及人工智能驱动式代码审查功能来简化软件工程团队的上手流程。它可提供即时反馈以及可操作的建议，并帮助新团队成员快速适应公司的编码标准和最佳实践。

PushRequest：PullRequest 提供 AI 驱动的洞察分析和人类专业知识，从而促进软件工程团队顺利完成入职流程。该平台提倡协作和知识共享，以鼓励新的开发人员向经验丰富的审查者学习。

Coderabbit：Coderabbit 是一个 AI 代码审查平台，它使用 AI 工具来生成分析和清晰的反馈。它可提供类似人类的审查功能，并可进行自定义，因为它适用于所有编程语言。

AI 代码审查的优点

人工智能驱动式代码审查可为组织及其开发团队带来诸多优点，其中包括：

高效率
一致性
错误检测
增强式学习

高效率

AI 代码审查的主要优点之一是效率。传统的代码审查过程可能需要相当长的时间并且也会耗费大量资源。借助 AI 等自动代码审查，整个过程可以在短时间内完成。前面讨论的每种 AI 代码审查方法都是应用开发流程从开始到结束的重要组成部分。

IBM watsonx Code Assistant for Z 便是体现此类优点的一个示例。这款生成式 AI 辅助产品旨在加快大型机应用生命周期并简化现代化过程，从而提高效率和成本效益。开发人员可以自动重构选定元素、优化代码并通过 COBOL 到 Java 的转型实现现代化。²

一致性

人工代码审查团队成员可能会受到外界影响，例如疲劳或偏见，从而导致审查不一致。无论数量或复杂程度如何，AI 都能够准确、一致地分析代码，这是 AI 代码审查的一个主要优点。代码审查是一个耗时的过程，如果使用得当，可以通过生成式 AI 工具等先进技术获益。

IBM 的 Granite模型是涉及一致性的其中一例，该模型会通过由 115 种编程语言以及 1.63 万亿个标记组成的大型代码库进行训练。此 AI 代码审查方法十分简单，且会通过各种数据集进行训练。此外，训练中使用的 Granite 模型还需经历专门设计的治理、风险和合规 (GRC) 审查流程。

错误检测

由于人工智能驱动式代码审查工具均基于科技，因此这些工具能非常有效地实时检测到手动审查中常被忽视的深度错误，例如代码异味。有时，审查时会错过此类问题，因为它们十分细微或仅会在特定条件下出现，除非通过某些代码审查方法来运行审查。

例如，IBM Research 已增强其 IBM AIOps Insights 平台，以加快 IT 专家找到 IT 问题解决方案的速度。借助 LLM 和生成式 AI 的强大功能，AIOps Insights 可从客户 IT 环境中收集数据并查找这些数据中的相关关系，从而识别潜在问题。

增强式学习

AI 代码审查的一个优点在于：对于寻求长期提高编码技能的开发人员，它可能是一个宝贵的学习机会。AI 的一大优点在于，它可为开发人员提供大量的反馈和建议，而这些反馈和建议最终可改变开发工作流程，并有助于确保开发人员掌握如何生成高质量的代码。

基于前一个示例，IBM AIOps Insights 可以将人类洞察分析和 AI 驱动的编码结合在一起。借助智能修复模块，开发人员可以采取必要步骤，追踪系统速度变慢或技术问题的原因。这样，开发人员无需编写自己的脚本来执行修复。

AI 代码审查面临的挑战

过度依赖 AI

开发人员可能会过度依赖 AI 工具简化代码审查流程，从而降低对个人专业知识和关键思维的重视。这种依赖可能导致无法控制的技术债务，因为开发人员会忽视需要人工监督的深层次问题。

克服这些挑战的一种方法是，为代码审查过程制定道德标准，并确保所有开发人员遵守这些规则。组织应设定界限，防止任何滥用行为，并努力在道德和速度之间取得平衡。最重要的是，人为因素仍然是代码审查中最重要的因素，而 AI 只是增强了流程。

了解背景的局限性

AI 工具经常难以应对项目的特定情境，其中包括 API 和整体架构的复杂性。缺乏对情境理解会导致代码质量验证不足，并错失与项目目标相一致的优化机会。

当有大量数据时，使用具备多样化且能代表组织试图针对的所有群体的训练数据集非常重要。克服这些限制的另一方法是：通过自动监控并制定生成式 AI 需遵循的严格准则来定期检查该 AI 系统是否存在偏差。

假阳性和假阴性

AI 代码审查系统可能生成假阳性，错误地将代码标记为有问题或出现假阴性，从而忽略实际缺陷。这些不准确性可能会使代码审查过程复杂化，导致在不必要的修复或未解决的问题上浪费时间，从而增加技术债务。

应对这一挑战的一个可能解决方案是，使用 ML 算法监控大量数据，并花时间来了解每个指标的行为方式。当有基线可以参考时，它可以减少任何错误结果，并最终帮助开发人员调整假阴性的严重性级别。另外，克服此 AI 代码审查挑战的一种方法是在相同的数据集上重新训练模型，但改变输出值，以更好地与之前的结果保持一致。

The latest AI News + Insights  

Expertly curated insights and news on AI, cloud and more in the weekly Think Newsletter.

如何开始进行 AI 代码审查

开始使用 AI 代码审查可以帮助团队保持高质量代码和效率，从而显著增强软件开发过程。有几个常规步骤可以有效地将 AI 驱动的工具集成到企业代码审查工作流程中。³

选择合适的 AI 代码审查工具：首先，选择一个符合组织需求的 AI 代码审查工具。很多热门选项均可提供各种功能，其中包括对多种编程语言的支持，以及与现有工作流程的整合。组织应寻找能提供代码质量评估指标的工具，例如代码复杂性、重复率以及对编码标准的遵守情况。这些指标可帮助组织为其开发流程设定基准。
安排入职和配置：选择工具后，下一步是团队入职。这需要清晰的文档和培训课程，使每个人熟悉该工具的特性和功能。组织需要配置工具以符合编码标准和特定项目要求，其中可能包括为特定指标设置自定义规则或阈值。
将 AI 纳入审查流程：下一步骤是将 AI 工具集成到组织现有的代码审查流程中。AI 会根据其分析来生成审查意见，从而突显潜在的问题并提出改进建议。此流程不仅能简化审查流程，还可让开发人员随时间的推移不断从反馈中吸取经验教训。
使用指标来推动改进：组织应从 AI 代码审查中获取信息，并使用这些指标来跟踪团队的绩效。通过监控代码质量的长期趋势，开发团队可指出需改进的领域。此外，团队还可在团队会议上使用这些洞察信息，并就如何解决重复出现的问题和改进编码实践集思广益。
平衡 AI 与人类洞察分析：AI 驱动式代码评论工具可极大地改进代码审查流程，但必须在自动反馈与人类洞察信息之间取得平衡。组织应鼓励团队成员查看 AI 生成的反馈，并提出自己的观点。此协作方式可加强审查流程，并培育出团队成员的学习与持续改进的文化。

脚注

1. AI Code Review: How It Works and 5 Tools You Should Know，Swim，2024 年 10 月（ibm.com 外部链接）

2. 软件已吞噬全世界。现在该如何应对？，IBM 博客，2024 年 1 月 17 日

3. Boosting Code Quality with AI-Based Review and Assessment，Medium，2024 年 3 月 29 日（ibm.com 外部链接）

面向企业的生成式 AI + ML

了解构成理想企业 AI 平台的四个关键要素。