前言

刚刚接手一套监控系统的时候，可能存在这样那样的问题。那么如何从零开始梳理并优化zabbix呢。本文记录了整个梳理优化过程。

了解基本信信

架构

用途

网络

问题

分析原因

网络不稳定住要出现以下几种情况：
1 公网实现和IDC互联，被检查设备和server 不在同一个IDC，这种情况建议增加 proxy，对网络设备的检测都在内网进行

网络设备问题的情况：
1 设备性能： 网络设备上 debug snmp 信息 看每个包都回了 还是 报错了，这种情况将 snmp 的采集间隔加大
2 对端server连接的端口带宽打满了

poller排队处理：
poller 数量是由 zabbix_server 配置文件中的 startpollers 指定 ， poller.c 主要做的事
a 从队列中获取 item 的数据
b 获取item的监控数据
c 把数据放入缓存

poller只会处理被动状态的监控项:
如果你是服务器出现此类日志:解决方法一种是增大poller的数量，一种是把被动模式改为主动模式，
如果你是网络设备:改用脚本实现，或者增大poller数量

关于Timeout 
将服务器的检查时间调长为30s，这种设置如果检查设备少没关系，数量比较多我不建议这样调整，超过2s的检测项可以在agentd改用脚本实现

优化过程

系统优化

#安装工具
yum -y install net-tools.x86_64 vim lsof

#修改默认系统限制
vim /etc/sysctl.conf
vm.overcommit_memory = 1

vim /etc/security/limits.conf
* soft nofile 1048576
* hard nofile 1048576
* soft    nproc       unlimited
* soft    nproc      unlimited

#终端显示ip地址
vim /root/.bash_profile

#开启防火墙，进行访问控制
vim iptablesforserver.sh
#更新规则

#执行
sh iptablesforserver.sh

#扩大swap 分区
dd if=/dev/zero of=/data1/swap  bs=1024 count=6485760
mkswap /data1/swap 
swapon /data1/swap

zabbix优化

#主配置文件
cat /etc/zabbix/zabbix_server.conf  | grep -v '#' | grep -v '^$'

#调整超时时间
#Timeout=4  //原先为4s，调整为30s
Timeout=30  

#修改VMwareCacheSize与CacheSize参数
VMwareCacheSize=1G
CacheSize=2G

#修改系统时间，和zabbix 时间

基于centos8的zabbix监控系统优化过程记录

前言

了解基本信信

架构

用途

网络

问题

分析原因

优化过程

系统优化

zabbix优化

参考

zabbix交换机端口流量手动查询

zabbix监控项列表

基于docker的zabbix5.4 配置Cloud Alert报警方式

centos8安装zabbix监控系统

评论 (2)