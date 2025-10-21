对智能体式应用程序和 LLM 支持的应用程序进行故障排除与治理
IBM® Instana GenAI Observability 能够将 AI 监控功能融入团队现有的全栈应用程序高效工作流中。它可以自动发现并映射代理、链和任务，随后将这些数据与基础设施的其他部分进行连接。借助内置的提示、输出、词元、延迟、成本以及错误可视化功能，团队能够快速追踪问题、优化性能，并轻松运行 AI 驱动的应用程序。
Instana 基于 OpenLLMetry 标准构建，可支持领先的提供商和框架，包括 IBM watsonx.ai、Amazon Bedrock、OpenAI、Anthropic、Groq、DeepSeek、LangChain、LangGraph 和 CrewAI，以及 vLLM 和 GPU 等运行时。这一开放式生态系统方案，可确保您的 AI 可观测性具备可移植性、成本意识和治理就绪能力，为您提供从模型到基础设施的端到端清晰洞察，且无需切换工具。
通过跨代理、工具、模型和服务的统一跟踪（无需切换上下文）来加速根本原因分析。
借助针对每个请求、用户、模型或租户的词元与建模成本可视化功能，控制费用支出和意外情况。
利用策略就绪信号（包括延迟、错误、提示和输出）提高可靠性和治理能力。
Instana 能够自动发现 AI 组件，包括代理、链和任务，并将其关系映射到服务和基础设施。此功能涵盖任务分层建模与监控，可实现流程可视化并准确定位问题根源。
跟踪代理、工具调用、检索和模型调用中的每一个步骤，同时关联传统 APM 信号。实时事件调查可将 AI 跨度与微服务、数据库和网络纳入同一时间线。
以细粒度方式跟踪词元使用量和建模成本，从而优化模型、提示和租户配置。运用此类洞察分析来避免预算超支，并协调实际支出与性能目标。
借助 OpenLLMetry 规范捕获提示和输出（支持可配置编校）、延迟、吞吐量、错误率以及模型或提供商元数据。这类操作信号能够驱动仪表板和警报，有助于检测风险行为并将其路由至相应的所有者。
利用原生 OpenLLMetry（跟踪循环）检测方案，覆盖主流模型提供商和框架、GPU 和 vLLM 等运行时。维持 AI 数据的可移植性和供应商中立性，同时将其与 Instana 成熟的 APM 和基础设施监控相结合。