基于grafana+prometheus构建Flink监控

topswim

2020-03-04

关注关注

先上一个架构图：

基于grafana+prometheus构建Flink监控

Flink App

：通过report 将数据发出去

Pushgateway : Prometheus 生态中一个重要工具

Prometheus : 一套开源的系统监控报警框架（Prometheus 入门与实践）

Grafana：一个跨平台的开源的度量分析和可视化工具，可以通过将采集的数据查询然后可视化的展示，并及时通知（可视化工具Grafana：简介及安装）

Node_exporter : 跟Pushgateway一样是Prometheus 的组件，采集到主机的运行指标如CPU, 内存，磁盘等信息

以下安装，大部分参考博客： https://www.cnblogs.com/xiao987334176/p/9930517.html#autoid-0-0-0

1、docker pull 镜像

docker pull prom/node-exporter
docker pull prom/pushgateway
docker pull prom/prometheus
docker pull grafana/grafana

查看下载的镜像

$ docker images
REPOSITORY           TAG                 IMAGE ID            CREATED             SIZE
prom/prometheus      latest              d5b9d7ed160a        2 weeks ago         138MB
grafana/grafana      latest              a6e14b4109af        2 weeks ago         253MB
prom/pushgateway     latest              20e6dcae675f        4 weeks ago         19.2MB
prom/node-exporter   latest              e5a616e4b9cf        2 months ago        22.9MB

2、编辑prometheus.yml 、创建 Grafana 数据存储目录

$ mkdir /opt/grafana-storage  # grafana 数据存储目录$ cat /opt/prometheus/prometheus.yml # prometheus 配置

global:
  scrape_interval:     60s
  evaluation_interval: 60s
 
scrape_configs:
  - job_name: prometheus
    static_configs:
      - targets: [‘localhost:9090‘]
        labels:
          instance: prometheus
 
  - job_name: linux
    static_configs:
      - targets: [‘venn:9100‘]
        labels:
          instance: localhost
  - job_name: ‘pushgateway‘
    static_configs:
      - targets: [‘venn:9091‘]
        labels:
          instance: ‘pushgateway‘

3、启动各个组件

docker run -d -p 3000:3000   --name=grafana   -v /opt/grafana-storage:/var/lib/grafana   grafana/grafana
docker run -d -p 9100:9100  -v "/proc:/host/proc:ro"  -v "/sys:/host/sys:ro"  -v "/:/rootfs:ro"  --net="host"  prom/node-exporter
docker run -d -p 9090:9090  -v /opt/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml  prom/prometheus
docker run -d -p 9091:9091 prom/pushgateway

查看docker进程

$ docker ps
CONTAINER ID        IMAGE                COMMAND                  CREATED             STATUS              PORTS                    NAMES
4a689cf48e10        prom/pushgateway     "/bin/pushgateway"       5 days ago          Up 5 days           0.0.0.0:9091->9091/tcp   infallible_goldstine
fcc40433bf75        grafana/grafana      "/run.sh"                5 days ago          Up 5 days           0.0.0.0:3000->3000/tcp   grafana
8ba942d0cf35        prom/prometheus      "/bin/prometheus --c…"   5 days ago          Up 5 days           0.0.0.0:9090->9090/tcp   quizzical_colden
b84b0f4be2b2        prom/node-exporter   "/bin/node_exporter"     5 days ago          Up 5 days                                    fervent_poitras

查看端口

$ netstat -apn | grep -E ‘9091|3000|9090|9100‘
(Not all processes could be identified, non-owned process info
 will not be shown, you would have to be root to see it all.)
tcp        0      0 172.17.0.1:39028        172.17.0.4:9091         ESTABLISHED -                   
tcp6       0      0 :::9100                 :::*                    LISTEN      -                   
tcp6       0      0 :::3000                 :::*                    LISTEN      -                   
tcp6       0      0 :::9090                 :::*                    LISTEN      -                   
tcp6       0      0 :::9091                 :::*                    LISTEN      -                   
tcp6       0      0 192.168.229.129:45864   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.129:45856   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.129:45824   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.129:45874   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.129:45854   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.129:45836   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.129:45814   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.128:9100    192.168.229.1:13405     ESTABLISHED -                   
tcp6       0      0 192.168.229.129:45826   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.129:45844   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.128:9091    172.17.0.2:53930        ESTABLISHED -                   
tcp6       0      0 192.168.229.129:45846   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.128:9100    172.17.0.2:54776        ESTABLISHED -                   
tcp6       0      0 192.168.229.129:45816   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.129:45876   192.168.229.128:9091    ESTABLISHED 40846/java          
tcp6       0      0 192.168.229.129:45834   192.168.229.128:9091    TIME_WAIT   -                   
tcp6       0      0 192.168.229.129:45866   192.168.229.128:9091    TIME_WAIT   -

4、查看组件页面

node_exporter:  ip:9100/metrics

基于grafana+prometheus构建Flink监控

查看 prometheus： ip:9090/targets

基于grafana+prometheus构建Flink监控

如果state 不是 UP 的，等一会就起来了

查看Grafana：

基于grafana+prometheus构建Flink监控

默认用户名密码： amin/admin

此处不再赘述，配置数据源、创建系统负载监控参考博客：https://www.cnblogs.com/xiao987334176/p/9930517.html#autoid-0-0-0

5、配置Flink report ：

在Flink 配置文件 flink-conf.yml 中添加如下内容：

##metrics
metrics.reporter.promgateway.class: org.apache.flink.metrics.prometheus.PrometheusPushGatewayReporter
metrics.reporter.promgateway.host: venn
metrics.reporter.promgateway.port: 9091
metrics.reporter.promgateway.jobName: myJob
metrics.reporter.promgateway.randomJobNameSuffix: true
metrics.reporter.promgateway.deleteOnShutdown: false

启动一个任务（上一篇博客的案例迟到数据处理）：

flink run -m yarn-cluster -ynm LateDataProcess -yn 1 -c com.venn.stream.api.sideoutput.lateDataProcess.LateDataProcess jar/flinkDemo-1.0.jar

查看任务webUI：

基于grafana+prometheus构建Flink监控

PS：任务已经跑了一段时间了

6、Grafana 中配置Flink监控

由于上面一句配置好Flink report、 pushgateway、prometheus，并且在Grafana中已经添加了prometheus 数据源，所以Grafana中会自动获取到 flink job的metrics 。

Grafana 首页，点击New dashboard，创建一个新的dashboard

基于grafana+prometheus构建Flink监控

选中之后，即会出现对应的监控指标

基于grafana+prometheus构建Flink监控

至此，Flink 的metrics 的指标展示在Grafana 中了

flink 指标对应的指标名比较长，可以在Legend 中配置显示内容，在{{key}} 将key换成对应需要展示的字段即可，如： {{job_name}},{{operator_name}}

对应显示如下：

基于grafana+prometheus构建Flink监控

grafana prometheus

topswim

0 关注 0 粉丝 0 动态

关注关注

linux(centos8):为prometheus安装grafana(grafana-7.0.3)

grafana 是用 go 语言编写的开源应用，3，检查安装是否成功?左侧菜单->Configuration->Data Sources->点 add data source 按钮。手动添加dashboard,需要一个个手动操作，但事实上

wenwst 2020-06-07

Grafana+Prometheus+Node_exporter监控Linux系统

下面针对这三个组件进行具体的说明。prometheus是一套开源的监控与报警与时间序列数据库的组合。grafana是一个跨平台的开源的度量分析和可视化工具，可以通过将采集的数据查询然后可视化的展示，并及时通知。node_exporter是采集器，负责将采集

地下库 2020-05-29

prometheus快速实现监控系统

目前主流的监控系统prometheus，相比zabbix确实，prometheus确实很轻量级，很多功能都帮你做好，直接配置启动使用就好了。我写这个目的就是让你快速学会prometheus，两个小时，大家可以去腾讯课堂、网易云课堂搜索-《Prometheu

wenwst 2020-05-16

基于docker-compose部署Prometheus + Grafana监控系统

更新yum源缓存，安装docker-ce. 普通用户需要加入docker组。如果下载很慢可手动下载，再上传至系统。- 23333:9090 # prometheus的访问地址被我改成了23333. 修改Prometheus配置文件，增加node-expo

kuzilala 2020-05-14

Prometheus监控docker服务

docker run -d --restart=always --name=grafana -p 3000:3000 grafana/grafana. 小结：推荐个garafan比较好用的监控容器的模版模版号：3125架构： cadvisor

砥砺前行 2020-03-04

普罗米修斯Prometheus介绍

Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库。SoundCloud是音频分享中的YouTube。Prometheus和Heapster(Heapster是K8S的一个子项目，用于获取集群的性能数据。)相比功能更完善、更

aolia000 2020-02-20

Prometheus + Grafana 监控系统搭

本文主要介绍基于Prometheus + Grafana 监控Linux服务器。Zabbix 使用的是 C 和 PHP, Prometheus 使用 Golang, 整体而言 Prometheus 运行速度更快一点。Zabbix 属于传统主机监控，主要用于

wenwst 2020-02-13

k8s+Prometheus+Grafana的监控部署

[ k8s-prometheus-grafana]# kubectl expose deployment apache --port=88 --target-port=80 --type=NodePort. ~~~以上就全部部署，有不清楚的，或有不足的地方

wenwst 2020-01-12

Prometheus + Grafana 部署说明之安装

在前面的Prometheus学习系列文章里，大致介绍说明了Prometheus和Grafana的一些使用，现在开始介绍如何从头开始部署Prometheus+Grafana，来监控各个相关的指标数据来进行展示。Prometheus基于Golang编写，编译后

aolia000 2020-01-03

k8s实践17:监控利器prometheus helm方式部署配置测试

后面使用helm部署grafana和prometheus,因此首先需要部署helm,保证helm能正常使用.% Total % Received % Xferd Average Speed Time Time Time Curr

砥砺前行 2019-12-25

kube-prometheus部署

登录任意node节点可使用对应端口可查看相关监控信息

aolia000 2019-12-17

Prometheus + Grafana

apt安装prometheus和prometheus-node-exporter之后便带有基本配置，无需修改。此外由于mongodb开启了密码验证，需要注意mongodb用户的权限：mongodb_exporter github链接。如果 username

aolia000 2019-11-09

阿里云监控看起来不连贯？那就看看Grafana的解决方案

最近上云的应用越来越多，我们也不例外，最近有很多应用上云，但是随之而来的问题就是监控的统一展现，最近查阅阿里云文档，阿里可以提供API接口，但是得到的数据比较复杂，需要修整，这样还不如自己开发算了，但是发现阿里云提供一个grafana插件，能够用grafa

aolia000 2020-09-11

可视化监控大型集群，这一个工具就够了！

许多企业使用Kubernetes来快速发布新功能并提高服务的可靠性。Rancher使团队能够减少管理其云原生工作负载的操作成本——但获得这些环境的持续可见性可能是一个挑战。在这篇文章中，我们将探讨如何利用Rancher内置支持的Prometheus和Gra

MrFuWen 2020-08-15

elk7版本，收集nginx日志，grafana进行展示

上面说明我们的es已经搭建完成了，安装一个es的插件用来展示elasticsearch-head-chrome-master，安装这个可以自己百度，但是下载之后需要修改完成之后然后通过index.html就可以看到了

Timor 2020-06-25

Ceph Dashboard Promethus+Grafana监控

Ceph 的监控可视化界面方案很多----grafana、Kraken。但是从Luminous开始，Ceph 提供了原生的Dashboard功能，通过Dashboard可以获取Ceph集群的各种基本状态信息。如果是需要安装 ceph-mgr-dashb

matthewhan 2020-06-08

K8S 中的 Grafana 数据持久化

自从将 Grafana 部署到 K8S 中以后，带来了很多的便利性，但是也有一个问题一直困扰着我，那就是 Grafana 中的数据无法持久化，经常配置好的 Datasource 和 Dashboards 在运行一段时间后就丢失了，有时候刚要排查问题，结果什

loveandroid0 2020-06-08

grafana设置告警

我们在做性能测试，尤其是7*24小时的稳定性测试的时候，当服务器资源达到瓶颈时，如果可以自动告警，就可以省去我们很多的工作。下面介绍用grafana设置告警。grafana的安装其他博客有提及，不再赘述。首先要进行在grafana的安装目录中进行邮件告警的

topswim 2020-06-02

Centos7.X 搭建Grafana+Jmeter+Influxdb 性能实时监控平台（不使用docker）

graphitePort：端口；默认就是2003，除非你自己安装InfluxDB时设置了其他端口是哦。transaction：在Jmeter配置好的sampleList，譬如我只发了get、post请求，这里就只会给你选get、post；可以滑到页面下面看

aolia000 2020-05-29

06-k8s服务层event监控及报警

应用或服务部署到k8s集群时，首先会经过k8s的调度，这个过程可能会出现一些问题，比如 volume 无法正常挂载，没有足够的资源部署服务，服务异常退出等。应用或服务部署到k8s集群时，k8s服务层会产生一系列的event事件，通过监控这些事件的类型，可以

matthewhan 2020-05-25

安科网

基于grafana+prometheus构建Flink监控

topswim

topswim

相关推荐

linux(centos8):为prometheus安装grafana(grafana-7.0.3)

Grafana+Prometheus+Node_exporter监控Linux系统

prometheus快速实现监控系统

基于docker-compose部署Prometheus + Grafana监控系统

Prometheus监控docker服务

普罗米修斯Prometheus介绍

Prometheus + Grafana 监控系统搭

k8s+Prometheus+Grafana的监控部署

Prometheus + Grafana 部署说明之安装

k8s实践17:监控利器prometheus helm方式部署配置测试

kube-prometheus部署

Prometheus + Grafana

阿里云监控看起来不连贯？那就看看Grafana的解决方案

可视化监控大型集群，这一个工具就够了！

elk7版本，收集nginx日志，grafana进行展示

Ceph Dashboard Promethus+Grafana监控

K8S 中的 Grafana 数据持久化

grafana设置告警

Centos7.X 搭建Grafana+Jmeter+Influxdb 性能实时监控平台（不使用docker）

06-k8s服务层event监控及报警

topswim