扩展生成式 AI 需要利用智能仪器进行自主故障排除、实时 LLM 监控和有效编排。数据集、模型输出和 LLM 响应的优化，以及通过优化管道和实时 LLM 测试实现的强大模型性能维护，对于聊天机器人等各种用例的流畅用户体验至关重要。开源 LLM 和机器学习工作流的使用不断增长，并利用嵌入技术，通过使用各种工具监控 LLM 调用。OpenTelemetry 等工具以及将复杂的 LLM 可观测性工具集成到集成式可观测性平台和仪表盘中的其他工具，对于构建稳定的可扩展 AI 系统、提供最佳模型性能至关重要。9，10