《普罗米修斯东京聚会＃1》的个人笔记

2 年 ago

科, 雅

1 minute

普罗米修斯东京聚会#1

Prometheus Tokyo Meetup #1に参加してきました。
自分が興味を持った部分を備忘録的にメモしています。
ハッシュタグ：#prometheustokyo

BlackboxExporter

あ、これは知らなかった
ブラックボックスでアクセスして、APIの死活監視とかレスポンスチェックに使えるらしい
AlertManager

まだ触れてないけど、アラートをIF文で細かく制御できる
アラートをまとめるのが楽

日本で使っているところが少ない
BlackboxExporterがchartsが対応していない
k8sの監視をするのにk8s環境下のコンテナーで監視するの嫌じゃない？

クラスター組んでるのである程度信じている
でも死なないことはないので、k8sの別環境の監視でやる
クラスター分ける

Prometheusがシングルポイントになってない？どうするの？監視がいっぱいだと？

pull先を分けるとか…
正直経験ないのでわからない。
保存は一ヶ月。
PrometheusをHAにしたいはissueでCloseしてる

For HA, simply run the two Prometheus servers independently with the same configuration. They’ll have the same data, modulo sample timings.

面白い意見。

We generally recommend running Prometheus servers in the same failure domain as the jobs they monitor.

公式によると標準対応しているみたい
「Include All」オプションを選択すると、良きように対応してくれる。
「=~」は「=」に勝手に置換してくれるからクエリはプレインテキストでいいよ

mtail でいいんじゃないの？ってなってる。
fluentdはretry監視しないといけないけど、不足している。
足んないから作った！

prometheus_output_monitor
prometheus_tail_monitor

スクリプトを追加して収集するメトリックスを追加できる
なんと！便利そう。

sampleがここで提供されている

S.M.A.R.Tもあるらしいw

スライドのっけました