2. 构建数据
可观测性平台收集的遥测数据可分为以下几种类型:
指标——在给定时间段内对应用程序性能、资源利用率和整体系统运行状况的数值评估。
跟踪 – 是指当事务从一项服务转移到另一项服务时,每个用户请求的端到端服务记录。
依赖关系 – 是指关于每个应用程序组件对其他组件、应用程序和 IT 资源的依赖程度的评估。
运行状况检查 – 是指定期对特定服务进行轮询。如果运行状况检查失败,就会导致问题。
警报 – 是指超出特定的预定义阈值时触发通知。
仪表板——提供具体预定指标的可视化、交互式和可理解展示的应用程序视角。
日志 – 是指关于系统内应用程序事件的详细、带时间戳、完整且不可变的记录。
收集这些信息后,可观测性工具会进行实时关联,以提供上下文信息 – 可能指示、导致或用于解决应用程序性能问题的任何事件的内容、地点和原因。
最先进的可观测性平台还将自动发现应用程序中可能出现的新遥测源。由于这些平台比标准 APM 解决方案处理更多的实时数据,因此许多平台都包含 AIOps(智能运维)和 ML(机器学习)功能,可以将信号(实际问题的指示)与噪声(与问题无关的数据)分开。
3. 将关键实践和原则落实到位
为了正常运行,可观测性依赖数据和 AI 来推动获得自动化可行洞察。借助这些关键组件,您可以快速、大规模地有效管理和观察复杂环境中的大量服务和系统。因此,为了通过可观测性平台实现您的目标,您需要采取几个关键实践和原则:
系统优化:可观测性映射 IT 架构中存在的所有资源之间的交互并提供上下文,以便优化整个 IT 环境。
提供完整上下文:必须为每个可观测性数据单元提供完整上下文。需要对每个指标进行端到端跟踪并提供上下文。
云原生部署:可观测性部署和检测流程实现完全自动化,以便可观测性工具无缝集成到云原生应用程序环境中。
对数据摄取的全面支持:可观测性支持现代应用程序环境公开数据的多种方式——从标准输出和传统日志到遥测(例如 OpenTracing)。
整个管道的可观测性:左移可观测性在预生产中使用可观测性平台来优化 CI/CD 管道并发现问题,以便不会将这些问题发布到生产中。