配置监视服务

您可以在安装 IBM® Cloud Private 时定制监视服务。

将以下代码行添加到 config.yaml 文件中,此文件位于 /<installation_directory>/cluster 文件夹内。 根据需要定制参数。 请参阅定制参数。 然后,保存并退出该文件。

monitoring:
  prometheus:
    scrapeInterval: 1m
    evaluationInterval: 1m
    retention: 24h
    persistentVolume:
      enabled: false
      storageClass: "-"
    resources:
      limits:
        cpu: 500m
        memory: 2048Mi
      requests:
        cpu: 100m
        memory: 128Mi
  alertmanager:
    persistentVolume:
      enabled: false
      storageClass: "-"
    resources:
      limits:
        cpu: 200m
        memory: 256Mi
      requests:
        cpu: 10m
        memory: 64Mi
  grafana:
    persistentVolume:
      enabled: false
      storageClass: "-"
    resources:
      limits:
        cpu: 500m
        memory: 512Mi
      requests:
        cpu: 100m
        memory: 128Mi

定制参数

您可以根据需要定制参数值。

有关所有可用参数,请参阅参数

存储类参数

storageClass 参数值是监视服务所使用的存储类的名称。

您可以指定任何有效的 Kubernetes 存储类。 请参阅 Kubernetes 文档中的 Storage Classes 在新选项卡中打开重要事项:对于 IBM Cloud Private 的高可用性安装,请配置共享存储器。 请参阅高可用性 IBM® Cloud Private 集群。 如果未配置共享存储器,那么在主要主节点发生故障时,监视服务可能会变得不可访问。

参数

下表列出 Prometheus 参数及其缺省值。您可以根据需要配置这些参数。

表 1. 参数
参数 描述 缺省值
environment 部署的目标环境。有效选项为 openshiftnon-openshift non-openshift
mode 部署方式。有效选项为 managedstandard standard
tls.enabled 启用图表安全性 false
tls.issuer 证书签发者的名称 icp-ca-issuer
tls.issuerKind 证书签发者的类型。有效选项为 IssuerClusterIssuer ClusterIssuer
tls.ca.secretName CA 证书的密钥 cluster-ca-cert
tls.ca.certFieldName 密钥中使用的 CA 证书的名称 tls.crt
tls.server.existingSecretName 服务器证书的现有密钥 ""
tls.server.certFieldName 密钥中使用的服务器证书的名称 tls.crt
tls.server.keyFieldName 密钥中服务器密钥的名称 tls.key
tls.exporter.existingSecretName 导出器证书的现有密钥 ""
tls.exporter.certFieldName 密钥中使用的导出器证书的名称 tls.crt
tls.exporter.keyFieldName 密钥中使用的导出器密钥的名称 tls.key
tls.client.existingSecretName 客户机证书的现有密钥 ""
tls.client.certFieldName 密钥中使用的客户机证书的名称 tls.crt
tls.client.keyFieldName 密钥中使用的客户机密钥的名称 tls.key
imagePullPolicy 用于拉取已部署映像的策略 IfNotPresent
imagePullSecrets 用于从专用存储库拉取映像的映像密钥 ""
clusterAddress 用于访问集群的 IP 地址或 DNS 名称 127.0.0.1
clusterPort 用于访问集群的端口 8443
clusterDomain 集群的域名 cluster.local
clusterName 目标集群的名称 mycluster
prometheus.image.repository Prometheus 服务器容器的映像名称 ibmcom/prometheus
prometheus.image.tag Prometheus 服务器容器的映像标记 v2.0.0
prometheus.port Prometheus 服务器服务的端口号 80
prometheus.scrapeInterval 报废度量值的时间间隔 1m
prometheus.evaluationInterval 警报规则的评估时间间隔 1m
prometheus.retention Prometheus 存储保留时间 24h
prometheus.args Prometheus 容器的自变量 {}
prometheus.persistentVolume.enabled 如果想要创建卷来存储数据,请设置为 true false
prometheus.persistentVolume.useDynamicProvisioning 如果想要动态供应持久性卷,请设置为 true true
prometheus.persistentVolume.size 持久性卷声明的容量 10Gi
prometheus.persistentVolume.storageClass Prometheus 持久性卷的存储类 ""
prometheus.persistentVolume.existingClaimName 如果想要使用现有持久性卷声明,请指定名称 ""
prometheus.persistentVolume.selector.label 如果想要使用特定卷,请指定标签的名称 ""
prometheus.persistentVolume.selector.value 如果想要使用特定卷,请指定标签的值 ""
prometheus.probe.enabled 如果要针对 Prometheus 启用运行状况探测,请设置为 true true
prometheus.probe.readiness.args 就绪探测器的自变量 {}
prometheus.probe.liveness.args 活动探测器的自变量 {}
prometheus.resources.limits.cpu Prometheus CPU 限制 500m
prometheus.resources.limits.memory Prometheus 内存限制 512Mi
prometheus.resources.requests.cpu Prometheus CPU 请求 100m
prometheus.resources.requests.memory Prometheus 内存请求 128Mi
prometheus.alertRuleFiles Prometheus 警报规则模板 alertRules
prometheus.configFiles Prometheus 配置模板 prometheusConfig
prometheus.rbacRoleCreation 如果想要创建基于角色的访问 (RBAC) 角色和角色绑定,请设置为 true true
prometheus.ingress.enabled 如果想要创建 Promethues 入口,请设置为 true false
prometheus.ingress.annotations Prometheus 入口的注释 {}
prometheus.service.type Prometheus 服务的类型 NodePort
prometheus.etcdTarget.enabled 如果设置为 true,那么在 Prometheus 配置中添加 etcd报废目标 false
prometheus.etcdTarget.etcdAddress etcd 服务器列表 ["127.0.0.1"]
prometheus.etcdTarget.etcdPort etcd 服务器的端口 4001
prometheus.etcdTarget.secret 用于访问 etcd 指标端点的密钥 etcd-secret
prometheus.etcdTarget.tlsConfig etcd 报废配置的 TLS 配置 {}
alertmanager.image.repository Alertmanager 容器映像名称 ibmcom/alertmanager
alertmanager.image.tag Alertmanager 容器映像标记 v0.13.0
alertmanager.port Alertmanager 服务端口 80
alertmanager.persistentVolume.enabled 如果设置为 true,那么创建一个卷来存储数据 false
alertmanager.persistentVolume.useDynamicProvisioning 如果设置为 true,那么动态供应持久性卷 true
alertmanager.persistentVolume.size 持久性卷声明的大小 1Gi
alertmanager.persistentVolume.storageClass Alertmanager 持久性卷的存储类 ""
alertmanager.persistentVolume.existingClaimName 如果想要使用现有持久性卷声明,请指定名称 ""
alertmanager.persistentVolume.selector.label 如果想要使用特定卷,请指定标签的名称 ""
alertmanager.persistentVolume.selector.value 如果想要使用特定卷,请指定标签的值 ""
alertmanager.probe.enabled 如果设置为 true,那么针对 Alertmanager 启用运行状况探测 true
alertmanager.probe.readiness.args 就绪探测器的自变量 {}
alertmanager.probe.liveness.args 活动探测器的自变量 {}
alertmanager.resources.limits.cpu Alertmanager CPU 限制 200m
alertmanager.resources.limits.memory Alertmanager 内存限制 256Mi
alertmanager.resources.requests.cpu Alertmanager CPU 请求 10m
alertmanager.resources.requests.memory Alertmanager 内存请求 64Mi
alertmanager.configFiles Alertmanager 配置文件名 alermanagerConfig
alertmanager.ingress.enabled 如果设置为 true,那么创建 Alertmanager 入口 false
alertmanager.ingress.annotations Alertmanager 入口的注释 {}
alertmanager.service.type Alertmanager 服务的类型 NodePort
kubeStateMetrics.enabled 如果设置为 true,那么安装 Kubernetes 指标导出器 false
kubeStateMetrics.image.repository kube-state-metrics 容器映像名称 ibmcom/kube-state-metrics
kubeStateMetrics.image.tag kube-state-metrics 容器映像标记 v1.2.0
kubeStateMetrics.port kube-state-metrics 服务端口 80
kubeStateMetrics.probe.enabled 如果设置为 true,那么针对 kubeStateMetrics 启用运行状况探测 true
kubeStateMetrics.probe.readiness.args 就绪探测器的自变量 {}
kubeStateMetrics.probe.liveness.args 活动探测器的自变量 {}
nodeExporter.enabled 如果设置为 true,那么安装节点导出器 false
nodeExporter.image.repository node-exporter 容器映像名称 ibmcom/node-exporter
nodeExporter.image.tag node-exporter 容器映像标记 v0.15.2
nodeExporter.port node-exporter 服务端口 9100
nodeExporter.probe.enabled 如果设置为 true,那么针对 nodeExporter 启用运行状况探测 true
nodeExporter.probe.readiness.args 就绪探测器的自变量 {}
nodeExporter.probe.liveness.args 活动探测器的自变量 {}
grafana.image.repository Grafana Docker 映像名称 ibmcom/grafana
grafana.image.tag Grafana Docker 映像标记 4.6.3
grafana.port Grafana 容器公开的端口 3000
grafana.user Grafana 用户的名称 "admin"
grafana.password Grafana 用户的密码 ""
grafana.persistentVolume.enabled 如果设置为 true,那么创建一个卷来存储数据 false
grafana.persistentVolume.useDynamicProvisioning 如果设置为 true,那么动态供应持久性卷 true
grafana.persistentVolume.size 持久性卷声明的大小 1Gi
grafana.persistentVolume.storageClass 持久性卷的存储类 ""
grafana.persistentVolume.existingClaimName 如果想要使用现有持久性卷声明,请指定名称 ""
grafana.persistentVolume.selector.label 如果想要使用特定卷,请指定标签的名称 ""
grafana.persistentVolume.selector.value 如果想要使用特定卷,请指定标签的值 ""
grafana.probe.enabled 如果设置为 true,那么针对 Grafana 启用运行状况探测 true
grafana.probe.readiness.args 就绪探测器的自变量 {}
grafana.probe.liveness.args 活动探测器的自变量 {}
grafana.resources.limits.cpu Grafana CPU 限制 500m
grafana.resources.limits.memory Grafana 内存限制 512Mi
grafana.resources.requests.cpu Grafana CPU 请求 100m
grafana.resources.requests.memory Grafana 内存请求 128Mi
grafana.configFiles Grafana 配置文件 grafanaConfig
grafana.ingress.enabled 如果设置为 true,那么创建 Grafana 入口 false
grafana.ingress.annotations Grafana 入口的注释 {}
grafana.service.type Grafana 服务的类型 NodePort
grafana.elasticsearchDash.enabled 如果设置为 true,那么添加 Elasticsearch 仪表板 false
collectdExporter.enabled 如果设置为 true,那么安装 collectd 导出器 false
collectdExporter.image.repository Collectd 导出器映像名称 ibmcom/collectd-exporter
collectdExporter.image.tag Collectd 导出器映像标记 0.3.1
collectdExporter.service.serviceMetricsPort 指标服务公开的端口 9103
collectdExporter.service.serviceCollectorPort 收集器服务公开的端口 25826
collectdExporter.probe.enabled 如果设置为 true,那么针对 collectd 导出器启用运行状况探测 true
collectdExporter.probe.readiness.args 就绪探测器的自变量 {}
collectdExporter.probe.liveness.args 活动探测器的自变量 {}
configmapReload.image.repository configmapReload Docker 映像名称 ibmcom/configmap-reload
configmapReload.image.tag configmapReload Docker 映像标记 v0.1
router.image.repository 路由器 Docker 映像名称 ibmcom/icp-router
router.image.tag 路由器 Docker 映像标记 2.2.0
router.subjectAlt 针对 SSL 密钥的主题备用 DNC 或 IP 地址 127.0.0.1
elasticsearchExporter.enabled 如果设置为 true,那么安装 Elasticsearch 导出器 false
elasticsearchExporter.image.repository Elasticsearch 导出器 Docker 映像名称 ibmcom/elasticsearch_exporter
elasticsearchExporter.image.tag Elasticsearch 导出器 Docker 映像标记 1.0.2
elasticsearchExporter.esUri Elasticsearch URL https://elasticsearch:9200
elasticsearchExporter.tls.enabled 针对导出器启用 TLS 以请求 Elasticsearch 端点 true
elasticsearchExporter.tls.ca.secretName CS 证书的密钥 cluster-ca-cert
elasticsearchExporter.tls.ca.certFieldName 密钥中 CA 证书的字段名称 tls.crt
elasticsearchExporter.tls.client.existingSecretName 客户机证书的现有密钥 ""
elasticsearchExporter.tls.client.certFieldName 密钥中客户机证书的字段名称 tls.crt
elasticsearchExporter.tls.client.keyFieldName 密钥中客户机密钥的字段名称 tls.key
elasticsearchExporter.port Elasticsearch 导出器公开的端口 9108
elasticsearchExporter.probe.enabled 如果设置为 true,那么针对 Elasticsearch 导出器启用运行状况探测 true
elasticsearchExporter.probe.readiness.args 就绪探测器的自变量 {}
elasticsearchExporter.probe.liveness.args 活动探测器的自变量 {}
curl.image.repository curl Docker 映像名称 ibmcom/curl
curl.image.tag curl Docker 映像标记 4.0.0
certGen.image.repository 用于生成证书的 Docker 映像名称 ibmcom/icp-cert-gen
certGen.image.tag 用于生成证书的 Docker 映像标记 1.0.0
init.image.repository init Docker 映像名称 ibmcom/icp-cert-gen
init.image.tag init Docker 映像标记 1.0.0