配置监视服务
您可以在安装 IBM® Cloud Private 时定制监视服务。
将以下代码行添加到 config.yaml 文件中,此文件位于 /<installation_directory>/cluster 文件夹内。 根据需要定制参数。 请参阅定制参数。 然后,保存并退出该文件。
monitoring:
prometheus:
scrapeInterval: 1m
evaluationInterval: 1m
retention: 24h
persistentVolume:
enabled: false
storageClass: "-"
resources:
limits:
cpu: 500m
memory: 2048Mi
requests:
cpu: 100m
memory: 128Mi
alertmanager:
persistentVolume:
enabled: false
storageClass: "-"
resources:
limits:
cpu: 200m
memory: 256Mi
requests:
cpu: 10m
memory: 64Mi
grafana:
persistentVolume:
enabled: false
storageClass: "-"
resources:
limits:
cpu: 500m
memory: 512Mi
requests:
cpu: 100m
memory: 128Mi
定制参数
您可以根据需要定制参数值。
monitoring.prometheus部分包含下列参数:prometheus.scrapeInterval是 Prometheus 中擦除目标的频率。prometheus.evaluationInterval是 Prometheus 中评估规则的频率。prometheus.retention是将监视数据保留的持续时间。prometheus.persistentVolume.enabled是您设置的一个标志,用于指示是否对 Prometheus 使用持久卷。 标志false表示您不使用持久卷。prometheus.persistentVolume.storageClass是 Prometheus 要使用的存储类。 请参阅存储类参数。prometheus.resources.limits.cpu是您为 Prometheus 容器设置的 CPU 限制。 缺省值为 500 millicpu。prometheus.resources.limits.memory使您为 Prometheus 容器设置的内存限制。 缺省值为 512 百万字节。
monitoring.alertmanager部分包含下列参数:alertmanager.persistentVolume.enabled是您设置的一个标志,用于指示是否对 Alertmanager 使用持久卷。 标志false表示您不使用持久卷。alertmanager.persistentVolume.storageClass是 Alertmanager 要使用的存储类。 请参阅存储类参数。alertmanager.resources.limits.cpu是您为 Alertmanager 容器设置的 CPU 限制。 缺省值为 200 millicpu。alertmanager.resources.limits.memory是您为 Alertmanager 容器设置的内存限制。 缺省值为 256 百万字节。
monitoring.grafana部分包含下列参数:grafana.user是用于访问 Grafana 的用户名。grafana.password是grafana.user参数中指定的用户的密码。grafana.persistentVolume.enabled是您设置的一个标志,用于指示是否对 Grafana 使用持久卷。 标志false表示您不使用持久卷。grafana.persistentVolume.storageClass是 Grafana 要使用的存储类。 请参阅存储类参数。grafana.resources.limits.cpu是您为 Grafana 容器设置的 CPU 限制。 缺省值为 500 millicpu。grafana.resources.limits.memory是您为 Grafana 容器设置的内存限制。 缺省值为 512 百万字节。
有关所有可用参数,请参阅参数。
存储类参数
storageClass 参数值是监视服务所使用的存储类的名称。
- 要不使用存储类,请输入
-。 数据存储在容器文件系统中,如果容器崩溃,那么所有数据都将丢失。 - 要使用共享存储器,请输入存储类的名称(例如
glusterfs)。 如果您使用共享存储,那么在容器崩溃时将保留您的数据。 要使用此选项,必须配置网络存储器提供商。 请参阅存储。
您可以指定任何有效的 Kubernetes 存储类。 请参阅 Kubernetes 文档中的 Storage Classes 。
重要事项:对于 IBM Cloud Private 的高可用性安装,请配置共享存储器。 请参阅高可用性 IBM® Cloud Private 集群。 如果未配置共享存储器,那么在主要主节点发生故障时,监视服务可能会变得不可访问。
参数
下表列出 Prometheus 参数及其缺省值。您可以根据需要配置这些参数。
| 参数 | 描述 | 缺省值 |
|---|---|---|
environment |
部署的目标环境。有效选项为 openshift 和 non-openshift。 |
non-openshift |
mode |
部署方式。有效选项为 managed 和 standard。 |
standard |
tls.enabled |
启用图表安全性 | false |
tls.issuer |
证书签发者的名称 | icp-ca-issuer |
tls.issuerKind |
证书签发者的类型。有效选项为 Issuer 和 ClusterIssuer。 |
ClusterIssuer |
tls.ca.secretName |
CA 证书的密钥 | cluster-ca-cert |
tls.ca.certFieldName |
密钥中使用的 CA 证书的名称 | tls.crt |
tls.server.existingSecretName |
服务器证书的现有密钥 | "" |
tls.server.certFieldName |
密钥中使用的服务器证书的名称 | tls.crt |
tls.server.keyFieldName |
密钥中服务器密钥的名称 | tls.key |
tls.exporter.existingSecretName |
导出器证书的现有密钥 | "" |
tls.exporter.certFieldName |
密钥中使用的导出器证书的名称 | tls.crt |
tls.exporter.keyFieldName |
密钥中使用的导出器密钥的名称 | tls.key |
tls.client.existingSecretName |
客户机证书的现有密钥 | "" |
tls.client.certFieldName |
密钥中使用的客户机证书的名称 | tls.crt |
tls.client.keyFieldName |
密钥中使用的客户机密钥的名称 | tls.key |
imagePullPolicy |
用于拉取已部署映像的策略 | IfNotPresent |
imagePullSecrets |
用于从专用存储库拉取映像的映像密钥 | "" |
clusterAddress |
用于访问集群的 IP 地址或 DNS 名称 | 127.0.0.1 |
clusterPort |
用于访问集群的端口 | 8443 |
clusterDomain |
集群的域名 | cluster.local |
clusterName |
目标集群的名称 | mycluster |
prometheus.image.repository |
Prometheus 服务器容器的映像名称 | ibmcom/prometheus |
prometheus.image.tag |
Prometheus 服务器容器的映像标记 | v2.0.0 |
prometheus.port |
Prometheus 服务器服务的端口号 | 80 |
prometheus.scrapeInterval |
报废度量值的时间间隔 | 1m |
prometheus.evaluationInterval |
警报规则的评估时间间隔 | 1m |
prometheus.retention |
Prometheus 存储保留时间 | 24h |
prometheus.args |
Prometheus 容器的自变量 | {} |
prometheus.persistentVolume.enabled |
如果想要创建卷来存储数据,请设置为 true | false |
prometheus.persistentVolume.useDynamicProvisioning |
如果想要动态供应持久性卷,请设置为 true | true |
prometheus.persistentVolume.size |
持久性卷声明的容量 | 10Gi |
prometheus.persistentVolume.storageClass |
Prometheus 持久性卷的存储类 | "" |
prometheus.persistentVolume.existingClaimName |
如果想要使用现有持久性卷声明,请指定名称 | "" |
prometheus.persistentVolume.selector.label |
如果想要使用特定卷,请指定标签的名称 | "" |
prometheus.persistentVolume.selector.value |
如果想要使用特定卷,请指定标签的值 | "" |
prometheus.probe.enabled |
如果要针对 Prometheus 启用运行状况探测,请设置为 true。 |
true |
prometheus.probe.readiness.args |
就绪探测器的自变量 | {} |
prometheus.probe.liveness.args |
活动探测器的自变量 | {} |
prometheus.resources.limits.cpu |
Prometheus CPU 限制 | 500m |
prometheus.resources.limits.memory |
Prometheus 内存限制 | 512Mi |
prometheus.resources.requests.cpu |
Prometheus CPU 请求 | 100m |
prometheus.resources.requests.memory |
Prometheus 内存请求 | 128Mi |
prometheus.alertRuleFiles |
Prometheus 警报规则模板 | alertRules |
prometheus.configFiles |
Prometheus 配置模板 | prometheusConfig |
prometheus.rbacRoleCreation |
如果想要创建基于角色的访问 (RBAC) 角色和角色绑定,请设置为 true |
true |
prometheus.ingress.enabled |
如果想要创建 Promethues 入口,请设置为 true |
false |
prometheus.ingress.annotations |
Prometheus 入口的注释 | {} |
prometheus.service.type |
Prometheus 服务的类型 | NodePort |
prometheus.etcdTarget.enabled |
如果设置为 true,那么在 Prometheus 配置中添加 etcd报废目标 |
false |
prometheus.etcdTarget.etcdAddress |
etcd 服务器列表 | ["127.0.0.1"] |
prometheus.etcdTarget.etcdPort |
etcd 服务器的端口 | 4001 |
prometheus.etcdTarget.secret |
用于访问 etcd 指标端点的密钥 | etcd-secret |
prometheus.etcdTarget.tlsConfig |
etcd 报废配置的 TLS 配置 | {} |
alertmanager.image.repository |
Alertmanager 容器映像名称 | ibmcom/alertmanager |
alertmanager.image.tag |
Alertmanager 容器映像标记 | v0.13.0 |
alertmanager.port |
Alertmanager 服务端口 | 80 |
alertmanager.persistentVolume.enabled |
如果设置为 true,那么创建一个卷来存储数据 |
false |
alertmanager.persistentVolume.useDynamicProvisioning |
如果设置为 true,那么动态供应持久性卷 |
true |
alertmanager.persistentVolume.size |
持久性卷声明的大小 | 1Gi |
alertmanager.persistentVolume.storageClass |
Alertmanager 持久性卷的存储类 | "" |
alertmanager.persistentVolume.existingClaimName |
如果想要使用现有持久性卷声明,请指定名称 | "" |
alertmanager.persistentVolume.selector.label |
如果想要使用特定卷,请指定标签的名称 | "" |
alertmanager.persistentVolume.selector.value |
如果想要使用特定卷,请指定标签的值 | "" |
alertmanager.probe.enabled |
如果设置为 true,那么针对 Alertmanager 启用运行状况探测 |
true |
alertmanager.probe.readiness.args |
就绪探测器的自变量 | {} |
alertmanager.probe.liveness.args |
活动探测器的自变量 | {} |
alertmanager.resources.limits.cpu |
Alertmanager CPU 限制 | 200m |
alertmanager.resources.limits.memory |
Alertmanager 内存限制 | 256Mi |
alertmanager.resources.requests.cpu |
Alertmanager CPU 请求 | 10m |
alertmanager.resources.requests.memory |
Alertmanager 内存请求 | 64Mi |
alertmanager.configFiles |
Alertmanager 配置文件名 | alermanagerConfig |
alertmanager.ingress.enabled |
如果设置为 true,那么创建 Alertmanager 入口 |
false |
alertmanager.ingress.annotations |
Alertmanager 入口的注释 | {} |
alertmanager.service.type |
Alertmanager 服务的类型 | NodePort |
kubeStateMetrics.enabled |
如果设置为 true,那么安装 Kubernetes 指标导出器 |
false |
kubeStateMetrics.image.repository |
kube-state-metrics 容器映像名称 | ibmcom/kube-state-metrics |
kubeStateMetrics.image.tag |
kube-state-metrics 容器映像标记 | v1.2.0 |
kubeStateMetrics.port |
kube-state-metrics 服务端口 | 80 |
kubeStateMetrics.probe.enabled |
如果设置为 true,那么针对 kubeStateMetrics 启用运行状况探测 |
true |
kubeStateMetrics.probe.readiness.args |
就绪探测器的自变量 | {} |
kubeStateMetrics.probe.liveness.args |
活动探测器的自变量 | {} |
nodeExporter.enabled |
如果设置为 true,那么安装节点导出器 |
false |
nodeExporter.image.repository |
node-exporter 容器映像名称 | ibmcom/node-exporter |
nodeExporter.image.tag |
node-exporter 容器映像标记 | v0.15.2 |
nodeExporter.port |
node-exporter 服务端口 | 9100 |
nodeExporter.probe.enabled |
如果设置为 true,那么针对 nodeExporter 启用运行状况探测 |
true |
nodeExporter.probe.readiness.args |
就绪探测器的自变量 | {} |
nodeExporter.probe.liveness.args |
活动探测器的自变量 | {} |
grafana.image.repository |
Grafana Docker 映像名称 | ibmcom/grafana |
grafana.image.tag |
Grafana Docker 映像标记 | 4.6.3 |
grafana.port |
Grafana 容器公开的端口 | 3000 |
grafana.user |
Grafana 用户的名称 | "admin" |
grafana.password |
Grafana 用户的密码 | "" |
grafana.persistentVolume.enabled |
如果设置为 true,那么创建一个卷来存储数据 |
false |
grafana.persistentVolume.useDynamicProvisioning |
如果设置为 true,那么动态供应持久性卷 |
true |
grafana.persistentVolume.size |
持久性卷声明的大小 | 1Gi |
grafana.persistentVolume.storageClass |
持久性卷的存储类 | "" |
grafana.persistentVolume.existingClaimName |
如果想要使用现有持久性卷声明,请指定名称 | "" |
grafana.persistentVolume.selector.label |
如果想要使用特定卷,请指定标签的名称 | "" |
grafana.persistentVolume.selector.value |
如果想要使用特定卷,请指定标签的值 | "" |
grafana.probe.enabled |
如果设置为 true,那么针对 Grafana 启用运行状况探测 |
true |
grafana.probe.readiness.args |
就绪探测器的自变量 | {} |
grafana.probe.liveness.args |
活动探测器的自变量 | {} |
grafana.resources.limits.cpu |
Grafana CPU 限制 | 500m |
grafana.resources.limits.memory |
Grafana 内存限制 | 512Mi |
grafana.resources.requests.cpu |
Grafana CPU 请求 | 100m |
grafana.resources.requests.memory |
Grafana 内存请求 | 128Mi |
grafana.configFiles |
Grafana 配置文件 | grafanaConfig |
grafana.ingress.enabled |
如果设置为 true,那么创建 Grafana 入口 |
false |
grafana.ingress.annotations |
Grafana 入口的注释 | {} |
grafana.service.type |
Grafana 服务的类型 | NodePort |
grafana.elasticsearchDash.enabled |
如果设置为 true,那么添加 Elasticsearch 仪表板 |
false |
collectdExporter.enabled |
如果设置为 true,那么安装 collectd 导出器 |
false |
collectdExporter.image.repository |
Collectd 导出器映像名称 | ibmcom/collectd-exporter |
collectdExporter.image.tag |
Collectd 导出器映像标记 | 0.3.1 |
collectdExporter.service.serviceMetricsPort |
指标服务公开的端口 | 9103 |
collectdExporter.service.serviceCollectorPort |
收集器服务公开的端口 | 25826 |
collectdExporter.probe.enabled |
如果设置为 true,那么针对 collectd 导出器启用运行状况探测 |
true |
collectdExporter.probe.readiness.args |
就绪探测器的自变量 | {} |
collectdExporter.probe.liveness.args |
活动探测器的自变量 | {} |
configmapReload.image.repository |
configmapReload Docker 映像名称 | ibmcom/configmap-reload |
configmapReload.image.tag |
configmapReload Docker 映像标记 | v0.1 |
router.image.repository |
路由器 Docker 映像名称 | ibmcom/icp-router |
router.image.tag |
路由器 Docker 映像标记 | 2.2.0 |
router.subjectAlt |
针对 SSL 密钥的主题备用 DNC 或 IP 地址 | 127.0.0.1 |
elasticsearchExporter.enabled |
如果设置为 true,那么安装 Elasticsearch 导出器 |
false |
elasticsearchExporter.image.repository |
Elasticsearch 导出器 Docker 映像名称 | ibmcom/elasticsearch_exporter |
elasticsearchExporter.image.tag |
Elasticsearch 导出器 Docker 映像标记 | 1.0.2 |
elasticsearchExporter.esUri |
Elasticsearch URL | https://elasticsearch:9200 |
elasticsearchExporter.tls.enabled |
针对导出器启用 TLS 以请求 Elasticsearch 端点 | true |
elasticsearchExporter.tls.ca.secretName |
CS 证书的密钥 | cluster-ca-cert |
elasticsearchExporter.tls.ca.certFieldName |
密钥中 CA 证书的字段名称 | tls.crt |
elasticsearchExporter.tls.client.existingSecretName |
客户机证书的现有密钥 | "" |
elasticsearchExporter.tls.client.certFieldName |
密钥中客户机证书的字段名称 | tls.crt |
elasticsearchExporter.tls.client.keyFieldName |
密钥中客户机密钥的字段名称 | tls.key |
elasticsearchExporter.port |
Elasticsearch 导出器公开的端口 | 9108 |
elasticsearchExporter.probe.enabled |
如果设置为 true,那么针对 Elasticsearch 导出器启用运行状况探测 |
true |
elasticsearchExporter.probe.readiness.args |
就绪探测器的自变量 | {} |
elasticsearchExporter.probe.liveness.args |
活动探测器的自变量 | {} |
curl.image.repository |
curl Docker 映像名称 | ibmcom/curl |
curl.image.tag |
curl Docker 映像标记 | 4.0.0 |
certGen.image.repository |
用于生成证书的 Docker 映像名称 | ibmcom/icp-cert-gen |
certGen.image.tag |
用于生成证书的 Docker 映像标记 | 1.0.0 |
init.image.repository |
init Docker 映像名称 | ibmcom/icp-cert-gen |
init.image.tag |
init Docker 映像标记 | 1.0.0 |