prometheus快速实现监控系统
下面开始介绍你应该学的重点,整个是围绕prometheus架构来的,每个部分都会讲解,并且还有些延伸,涉及的地址、程序都给你准备好,多么的贴心。来看看架构吧。
1. 架构介绍
整体讲解架构以及各个涉及的组件,让你快速了解各个组件的用途。优劣势介绍,以及适用场景
2. server端安装
2.1 prometheus server端安装
讲解server安装方法,如何进行配置,利用grafana进行数据浏览,想要很绚丽的浏览,可以看看《grafana运维监控》
3. Jobs/exporter
3.1 node_exporter安装 - 实现系统指标获取
讲解如何抓取系统监控指标,聚合展示,grafana的dashboard也已经给大家准备好了,直接用。
3.2 mysqld_exporter安装 - 实现MySQL指标获取
讲解如何抓取数据库监控指标,聚合展示,grafana的dashboard也已经给大家准备好了,直接用。
3.3 prometheus pushgateway - 解决跨网段问题
讲解了pushgateway方式获取数据,解决跨网段问题,间接讲解自定义job采集端
3.4 prometheus自定义exporter - 实现指标自定义
讲解自定义exporter程序,因为有些指标官方写的exporter程序中没有,利用这个知识就可以了。
4. PromQL
这部分也是prometheus的核心部分,它存储的数据是其他关系型数据库所不能比拟的,给我们节省了很多计算。
4.1 PromQL基本概念
讲解了指标的数据格式、类型。Histogram与Summary存在价值
4.2 PromQL基本查询
讲解了基本的查询方法,正则,时间位移,内置简单聚合操作
4.3 PromQL操作符
讲解了数学运算,布尔类型,匹配模式处理
4.4 PromQL聚合操作
讲解了内置的聚合运算,增长率问题,预测,分位数。动态标签替换
4.5 PromQL HTTP查询
基于http方式进行固定查询以及范围查询
5. 告警机制
5.1 prometheus告警规则设置
讲解了告警规则配置,如何让prometheus server触发告警
5.2 prometheus关联alertmanager、实现邮件告警
将prometheus server告警关联altermanager,实现邮件告警
5.3 prometheus路由route详解
讲解了分组机制,路由特性,这块认真学习,是告警的核心,能实现将多个告警合并成一个,以及将告警发给指定的组织。
5.4 prometheus抑制规则inhibit与临时静默
讲解了抑制特性与临时静默,实现告警进一步处理。也很重要,比如系统宕机了,只会发一个宕机的告警,其他就被抑制了,想想看这个功能是不是给你排查问题节约了不少时间。
5.5 prometheus钉钉告警
讲解了如何进行webhook-dingding编译,实现钉钉告警。编译是难点,我已经编译好了,你可以直接用我的。
6. 自动发现
6.1 prometheus基于文件的自动发现
讲解了如何利用文件的方式实现服务的自动发现。每次新增服务手动修改文件,就可以了,无需重启server。
6.2 prometheus基于consul的自动发现
讲解了如何利用http方式实现服务的自动发现。修改文件也很烦人,可以利用接口方式。
OK,欢迎评论区交流,或者去我的课程中进一步学习。