容器平台监控资源

验证目标后, Turbonomic 会使用它发现的实体来更新供应链。 下表描述了目标与 Turbonomic之间的实体映射。

容器平台 Turbonomic
服务 服务
Container 容器
容器规范 容器规格
卸货港 容器 Pod
控制器 工作负载控制器
名称空间 名称空间
集群 容器平台集群
节点 虚拟机
持久卷 (PV) 体积
注意:如果容器 pod 连接到Turbonomic会将其视为持久卷 (PV),并显示哪些 pod 连接到 PV。
虚拟机 工作负载控制器
注意: 此监控资源仅适用于带有 Red Hat OpenShift 虚拟化功能的目标配置。

监测服务资源

涡轮工程学 监视以下资源:

  • 响应时间

    响应时间是指从一个请求到对该请求做出响应之间所经过的时间。 响应时间通常以秒(s)或毫秒(ms)为单位。

    对于 LLM 推理工作负载,响应时间是每个请求的周转时间,包括排队时间和服务时间。 没有请求时,响应时间不可用。

  • 事务

    事务是一个值,表示分配给给定实体的事务的每秒利用率。

    对于 LLM 推断工作负载,事务是每秒的令牌总数,包括输入令牌和生成的令牌。 当没有请求时,事务为零。

  • 副本数

    副本数量是指在给定时间段内运行的应用组件副本数量。

  • 并发查询

    对于 LLM 推理工作负载,并发查询是指工作负载的并发查询次数。 没有请求时,并发查询次数为零。

  • 排队时间

    对于 LLM 推理工作负载,排队时间是指请求在队列中被处理前所花费的时间。 没有请求时,排队时间为零。

  • 服务时间

    对于 LLM 推理工作负载,服务时间 SLO 是生成下一个标记所需的处理时间。 对于给定的模型和 GPU 资源,此度量相对稳定。 没有请求时,服务时间不可用。

受监控的容器资源

涡轮工程学 监视以下资源:

  • 虚拟内存 vMem

    虚拟内存 vMem ) 是容器在内存限制范围内使用的虚拟内存。 如果未设置限制,那么将使用节点容量。

  • vMem 请求

    如果适用, vMem 请求是容器根据内存请求使用的虚拟内存。

  • vCPU

    vCPU 是容器在 CPU 限制范围内使用的虚拟 CPU(以 mCores 为单位)。 如果未设置限制,那么将使用节点容量)。

  • vCPU 请求

    如果适用, vCPU 请求是容器针对 CPU 请求使用的虚拟 CPU(以 mCores 为单位)。

  • vCPU 调速

    vCPU 节流是对可能影响响应时间的容器虚拟 CPU 的节流,以与容器规格相关联的所有容器的节流百分比表示。 在容器的 "容量和使用情况" 图表中, 已用利用率 值反映实际调速百分比,而 容量 值始终为 100%。

容器规格的监控资源

监视为工作负载运行的任何容器实例的历史使用情况 (假定工作负载名称保持不变)。 图表显示使用趋势,即使重新启动或重新部署也是如此。

容器 pod 的受监控资源

Turbonomic可在Kubernetes和Red Hat OpenShift中发现具有以下状态的 pod,并将它们与Turbonomic 中的特定状态相匹配。

Kubernetes状态 湍流状态
正在运行 活动
ImagePullBackOff 未知
CrashLoopBackoff 未知
错误 未知

因此,集群中 pod 的总数预计与Turbonomic中的不一致。 因为Turbonomic也不会发现 "待处理 pod "或 "已完成作业 pod"。

涡轮工程学 监视以下资源:

  • vMem

    vMem 是 pod 利用的虚拟内存与节点物理容量的对比。

  • vMem 请求

    vMem 请求是 pod 根据节点可分配容量分配的虚拟内存请求。

  • vCPU

    vCPU 是 pod 使用的虚拟 CPU(以 mCores 为单位)与节点物理容量的对比。

  • vCPU 请求

    vCPU 请求是 pod 根据节点可分配容量分配的虚拟 CPU 请求(以 mCores 为单位)。

  • VMem 请求配额

    如果适用, vMem 请求配额是 pod 根据命名空间配额分配的虚拟内存请求量。

  • VCPU 请求配额

    如果适用, vCPU 请求配额是 pod 根据命名空间配额分配的虚拟 CPU 请求量(以 mCores 为单位)。

  • VMem 限制配额

    如果适用, vMem limit 配额是 pod 根据命名空间配额分配的虚拟内存限制量。

  • VCPU 限制配额

    如果适用, vCPU 限制配额是 pod 根据命名空间配额分配的虚拟 CPU 限制量(以 mCores 为单位)。

工作负载控制器的监控资源

透平工程学 监控 和 的配额(限制和请求),并根据所有副本关联每个工作负载控制器对配额的贡献。 vCPU vMem, 这允许 Turbonomic 生成正确的大小调整决策,并将配额作为正确大小调整的约束进行管理。 有关资源使用情况的度量值显示在 "容器规范" , "容器" 和 "容器 Pod" 视图中。

命名空间的受监控资源

涡轮工程学 监视以下资源:

  • VMem 请求配额

    vMem 申请配额是分配给命名空间的所有 pod 的虚拟内存申请总量与命名空间配额的比较。

  • VCPU 请求配额

    vCPU 请求配额是分配给命名空间的所有 pod 的虚拟 CPU 请求总量(以 mCores 为单位)与命名空间配额的比较。

  • VMem 限制配额

    vMem limit 配额是根据命名空间配额分配给命名空间的所有 pod 的虚拟内存限制总量。

  • VCPU 限制配额

    vCPU 限制配额是根据命名空间配额分配给命名空间的所有 pod 的虚拟 CPU 限制总量(以 mCores 为单位)。

容器平台集群的监控资源

监视集群中的容器, pod ,节点 (VM) 和卷的资源。

节点(虚拟机)的监控资源

监视托管 pod 的节点的以下资源。 将监视这些资源以及来自基础结构探测器 (例如 vCenter 或公共云调解探测器) 的资源。

  • vMem

    vMem 是节点上所有容器当前使用的虚拟内存。 此资源的容量是节点物理容量。

  • vCPU

    vCPU 是节点上所有容器当前使用的虚拟 CPU。 此资源的容量是节点物理容量。

  • 内存请求分配

    内存请求分配是节点可用的内存,以支持给定 Kubernetes 命名空间或 Red Hat OpenShift 项目的 ResourceQuota 请求参数。

  • CPU 请求分配

    CPU 请求分配是节点可用来支持给定 Kubernetes 命名空间或 Red Hat OpenShift 项目的 ResourceQuota 请求参数的 CPU。

  • 虚拟内存请求

    虚拟内存请求是提出内存请求的节点上所有容器当前保证使用的内存。 此资源的容量是节点可分配容量,即可用于 pod 的资源量,并且可以小于物理容量。

  • 虚拟 CPU 请求

    虚拟 CPU 请求是节点上所有容器当前保证使用的 CPU。 该资源的容量是节点可分配容量,即 pod 可用的资源量,可能小于物理容量。

  • 内存分配

    内存分配是指定 Kubernetes 命名空间或 Red Hat OpenShift 项目的内存 ResourceQuota 限制参数。

  • CPU 分配

    CPU 分配是给定 Kubernetes 命名空间或 Red Hat OpenShift 项目的 CPU ResourceQuota 限制参数。

受监控的虚拟机资源

如果在 Red Hat OpenShift 虚拟化的目标配置中包含了 Red Hat OpenShift ,则会对虚拟机的以下资源进行监控:

  • 虚拟内存 vMem

    虚拟内存 vMem ) 是容器在内存限制范围内使用的虚拟内存。 如果未设置限制,那么将使用节点容量。

  • vCPU

    vCPU 是容器在 CPU 限制范围内使用的虚拟 CPU(以 mCores 为单位)。 如果未设置限制,那么将使用节点容量)。

有关详细信息,请参阅 Red Hat OpenShift 虚拟化