cadvisor+prometheus+Grafana
1、时间同步
#di.time sync
/usr/sbin/ntpdate time.apple.com
echo ‘#time sync by oldboy at 2019-3-30‘ >> /var/spool/cron/root
echo ‘*/5 * * * * /usr/sbin/ntpdate ntp2.aliyun.com >/dev/null 2>&1‘ >> /var/spool/cron/root
crontab -l
更改默认最大连接数
修改以下配置文件:
编辑/etc/security/limits.conf
vi /etc/security/limits.conf
* soft nofile 65535
* hard nofile 65535
* soft nproc 65535
* hard nproc 65535
sudo sed -i.ori ‘$a * soft nofile 65535\n* hard nofile 65535\n* soft nproc 65535\n* hard nproc 65535‘ /etc/security/limits.conf
ulimit -n
时区同步
ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
提前准备
阿里云docker源
wget http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
或
docker 官方源
wget https://download.docker.com/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
yum install docker-ce -y
yum install python-pip -y
yum install docker-compose -y 单机编排工具
或
curl -L https://github.com/docker/compose/releases/download/1.24.1/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose chmod +x /usr/local/bin/docker-compose
首先在被控端安装cadvisor 采集工具
Docker部署cAdvisor:
docker run -d \
--volume=/:/rootfs:ro \
--volume=/var/run:/var/run:ro \
--volume=/sys:/sys:ro \
--volume=/var/lib/docker/:/var/lib/docker:ro \
--volume=/dev/disk/:/dev/disk:ro \
--publish=8080:8080 \
--detach=true \
--name=cadvisor \
google/cadvisor:latest
监控端
prometheus安装
Docker部署Prometheus:
docker run -d \
--name=prometheus \
-p 9090:9090 \
-v /tmp/prometheus.yml:/etc/prometheus/prometheus.yml \
prom/prometheus
Grafana 安装
Docker部署Prometheus:
docker run -d \
--name=prometheus \
-p 9090:9090 \
-v /tmp/prometheus.yml:/etc/prometheus/prometheus.yml \
prom/prometheus
查看被监控端和 监控端的信息
例如 我的被监控端为 192.168.0.242 和192.168.0.243.这里以192.168.0.242为例查看 cadvisor采集信息
端口8080,可以自定义修改
有界面显示 ,并有监控信息输出 则表示 安装成功
下面看 监控端:
监控端,IP为 192.168.0.244
首先查看 prometheus信息 并添加 监控项 和查看界面信息
端口9090 可以自定义
配置文件
[ prometheus]# vim prometheus.yml
http://192.168.0.244:9090 登入界面
红色框子里有数据 说明成功 。
下面我们 配置 Grafana 信息
端口3000
登入 默认用户名及密码都是 admin 第一次登入需要修改密码
进入界面后首先是添加数据源我们用的是prometheus
保存后 返回到主页面
下面添加主机组变量
变量参数: label_values(up,instance)
保存退出
在每个监控项参数里添加 组变量参数 instance="$node"
完成