前言
刚刚接手一套监控系统的时候,可能存在这样那样的问题。那么如何从零开始梳理并优化zabbix呢。本文记录了整个梳理优化过程。
了解基本信信
架构
zabbix监控系统当前架构,监控项目是否涉及多个机房节点
用途
网络
问题
分析原因
网络不稳定住要出现以下几种情况:
1 公网实现和IDC互联,被检查设备和server 不在同一个IDC,这种情况建议增加 proxy,对网络设备的检测都在内网进行
网络设备问题的情况:
1 设备性能: 网络设备上 debug snmp 信息 看每个包都回了 还是 报错了,这种情况将 snmp 的采集间隔加大
2 对端server连接的端口带宽打满了
poller排队处理:
poller 数量是由 zabbix_server 配置文件中的 startpollers 指定 , poller.c 主要做的事
a 从队列中获取 item 的数据
b 获取item的监控数据
c 把数据放入缓存
poller只会处理被动状态的监控项:
如果你是服务器出现此类日志:解决方法一种是增大poller的数量,一种是把被动模式改为主动模式,
如果你是网络设备:改用脚本实现,或者增大poller数量
关于Timeout
将服务器的检查时间调长为30s,这种设置如果检查设备少没关系,数量比较多我不建议这样调整,超过2s的检测项可以在agentd改用脚本实现
优化过程
系统优化
#安装工具
yum -y install net-tools.x86_64 vim lsof
#修改默认系统限制
vim /etc/sysctl.conf
vm.overcommit_memory = 1
vim /etc/security/limits.conf
* soft nofile 1048576
* hard nofile 1048576
* soft nproc unlimited
* soft nproc unlimited
#终端显示ip地址
vim /root/.bash_profile
#开启防火墙,进行访问控制
vim iptablesforserver.sh
#更新规则
#执行
sh iptablesforserver.sh
#扩大swap 分区
dd if=/dev/zero of=/data1/swap bs=1024 count=6485760
mkswap /data1/swap
swapon /data1/swap
zabbix优化
#主配置文件
cat /etc/zabbix/zabbix_server.conf | grep -v '#' | grep -v '^$'
#调整超时时间
#Timeout=4 //原先为4s,调整为30s
Timeout=30
#修改VMwareCacheSize与CacheSize参数
VMwareCacheSize=1G
CacheSize=2G
#修改系统时间,和zabbix 时间
评论 (2)