使用Prometheus和Grafana监视Kubernetes的CronJob

2 年 ago

科, 颖

1 minute

我一直在使用Prometheus + Grafana进行监控，但是无法监控Kubernetes的CronJob，因此我进行了相应的配置来解决这个问题。这里不涉及安装等步骤。

环境

Grafana: 4.5系

Prometheus的配置

在获取Prometheus的kube-state-metrics值时，配置如下所示。由于relabel_configs较长，被省略。

    - job_name: 'kubernetes-pods'

      kubernetes_sd_configs:
      - role: pod

      relabel_configs:
        ...

      metric_relabel_configs:
      - source_labels: [exported_job]
        action: replace
        regex: ([a-z\-]+)-(\d+)
        replacement: $1
        target_label: exported_job_short

在metric_relabel_configs中，将kube-state-metrics的job metrics的job标签重命名为exported_job_short，并将其值缩写为正则表达式([a-z\-]+)-(\d+)中的短名称。

kube-state-metrics的job=的job-name会以cron-name-1520746800的形式显示出来。在Grafana中，我们希望用这个cron-name来进行归类，因此进行了重命名。
source_labels被设置为exported_job是因为在Prometheus这一侧，job已经被用作标签，并被重命名为exported_job。