《普罗米修斯东京聚会#1》的个人笔记
普罗米修斯东京聚会#1
Prometheus Tokyo Meetup #1に参加してきました。
自分が興味を持った部分を備忘録的にメモしています。
ハッシュタグ:#prometheustokyo
监控 k8s
-
- NTT Communications のクラウドサービス開発をしている人
BlackboxExporter
あ、これは知らなかった
ブラックボックスでアクセスして、APIの死活監視とかレスポンスチェックに使えるらしい
AlertManager
まだ触れてないけど、アラートをIF文で細かく制御できる
アラートをまとめるのが楽
日本で使っているところが少ない
BlackboxExporterがchartsが対応していない
k8sの監視をするのにk8s環境下のコンテナーで監視するの嫌じゃない?
クラスター組んでるのである程度信じている
でも死なないことはないので、k8sの別環境の監視でやる
クラスター分ける
Prometheusがシングルポイントになってない?どうするの?監視がいっぱいだと?
pull先を分けるとか…
正直経験ないのでわからない。
保存は一ヶ月。
PrometheusをHAにしたいはissueでCloseしてる
For HA, simply run the two Prometheus servers independently with the same configuration. They’ll have the same data, modulo sample timings.
面白い意見。
We generally recommend running Prometheus servers in the same failure domain as the jobs they monitor.
好好地使用标签
-
- ラベルはカーディナリティ最大10個ぐらいがいいと思う
-
- Grafanaのtemplateのall困っているらしい。
公式によると標準対応しているみたい
「Include All」オプションを選択すると、良きように対応してくれる。
「=~」は「=」に勝手に置換してくれるからクエリはプレインテキストでいいよ
流畅的插件-普罗米修斯
-
- fluent-plugin-prometheus(https://github.com/kazegusuri/fluent-plugin-prometheus)
mtail でいいんじゃないの?ってなってる。
fluentdはretry監視しないといけないけど、不足している。
足んないから作った!
prometheus_output_monitor
prometheus_tail_monitor
对于k8s上的节点硬盘进行监控
-
- node_exporterはTEXTFILE COLLECTORがある
スクリプトを追加して収集するメトリックスを追加できる
なんと!便利そう。
sampleがここで提供されている
S.M.A.R.Tもあるらしいw
普罗米修斯最初遇到的三个问题
-
- 自分が登壇したLT
スライドのっけました