官方文档地址
官方文档地址
服务状态检测
# 检测所有服务
cd /data/install
echo bkssm bkiam usermgr paas cmdb gse job consul | xargs -n 1 ./bkcli check
# 单独模块检测
./bkcli check job
# 检查脚本可用性
./bkcli install dbcheck
./bkcli check dbcheck
# 检查开源组件状态
echo redis rabbitmq mongodb consul zk | xargs -n 1 ./bkcli status
重启服务器后排查
saas模块重新部署
#登录中控机
cd /data/install/
./bk_install saas-o bk_user_manage
删除模块过程
#重启 cmdb ges 和 job
./bkcli restart cmdb
./bkcli restart gse
./bkcli restart job
通过日志分析问题
#具体服务日志
journalctl -u bk-iam
#只看最新50行
journalctl -u bk-iam -n 50 --no-pager
#加上时间范围
journalctl -u bk-iam.service --since "2021-01-14 11:00" --until "2021-01-14 11:05"
# 登陆至监控模块所在的机器
source /data/install/utils.fc
ssh $BK_MONITORV3_IP0
# 修改配置文件
vim /data/bkce/etc/supervisor-bkmonitorv3-monitor.conf
#修改 [program:kernel_api] 配置下的 stdout_logfile 的值为一个临时路径
/data/bkce/logs/kernel_api_stdout.log
#重启监控平台
systemctl restart bk-monitor
#查看日志,定位问题并分析解决
tailf /data/bkce/logs/kernel_api_stdout.log
评论 (0)