基于centos8的zabbix监控系统优化过程记录

行云流水
2022-07-08 / 2 评论 / 470 阅读 / 正在检测是否收录...

前言

刚刚接手一套监控系统的时候,可能存在这样那样的问题。那么如何从零开始梳理并优化zabbix呢。本文记录了整个梳理优化过程。

了解基本信信

架构

用途

网络

问题

分析原因

网络不稳定住要出现以下几种情况:
1 公网实现和IDC互联,被检查设备和server 不在同一个IDC,这种情况建议增加 proxy,对网络设备的检测都在内网进行

网络设备问题的情况:
1 设备性能: 网络设备上 debug snmp 信息 看每个包都回了 还是 报错了,这种情况将 snmp 的采集间隔加大
2 对端server连接的端口带宽打满了

poller排队处理:
poller 数量是由 zabbix_server 配置文件中的 startpollers 指定 , poller.c 主要做的事
a 从队列中获取 item 的数据
b 获取item的监控数据
c 把数据放入缓存

poller只会处理被动状态的监控项:
如果你是服务器出现此类日志:解决方法一种是增大poller的数量,一种是把被动模式改为主动模式,
如果你是网络设备:改用脚本实现,或者增大poller数量

关于Timeout 
将服务器的检查时间调长为30s,这种设置如果检查设备少没关系,数量比较多我不建议这样调整,超过2s的检测项可以在agentd改用脚本实现

优化过程

系统优化

#安装工具
yum -y install net-tools.x86_64 vim lsof

#修改默认系统限制
vim /etc/sysctl.conf
vm.overcommit_memory = 1

vim /etc/security/limits.conf
* soft nofile 1048576
* hard nofile 1048576
* soft    nproc       unlimited
* soft    nproc      unlimited

#终端显示ip地址
vim /root/.bash_profile

#开启防火墙,进行访问控制
vim iptablesforserver.sh
#更新规则

#执行
sh iptablesforserver.sh

#扩大swap 分区
dd if=/dev/zero of=/data1/swap  bs=1024 count=6485760
mkswap /data1/swap 
swapon /data1/swap

zabbix优化

#主配置文件
cat /etc/zabbix/zabbix_server.conf  | grep -v '#' | grep -v '^$'

#调整超时时间
#Timeout=4  //原先为4s,调整为30s
Timeout=30  

#修改VMwareCacheSize与CacheSize参数
VMwareCacheSize=1G
CacheSize=2G

#修改系统时间,和zabbix 时间

参考

评论 (2)

取消
只有登录/注册用户才可评论