首页> 自动化运维> 蓝鲸平台Agent常见问题处理

[文章]蓝鲸平台Agent常见问题处理

收藏
0 3080 0


【摘要】

       在运维蓝鲸平台的过程中,我们经常遇到因为Agent问题,无法对Windows服务器进行管理。本文将针对几个常见windows服务器的Agent问题,给出相应的处理措施。

【正文】

一、     Agent安装后无数据上报

现象描述:

成功安装Agent,在配置平台上看不到服务器的信息。


排查过程:

检查发现gse的两个进程已启动,但是baseport.exe进程未能正常启动。


C:\gse\gseagentw\conf文件夹下,查看配置文件procinfo.json


可能的原因有:

1)本地管理员账号更改,不再是administrator,需要将配置文件中的管理员名称改为相应的名称;

2type的值为4的时候,basereport进程将不能正常重启,需要更改为1

二、     Agent进程被其他用户控制(社区版)

现象描述:

在使用Windows巡检APP过程中,发现无法巡检服务器

排查过程:

发现gae_win_agent.exegae_daemon_agent.exe两个进程不是被system控制的,由于有些功能需要使用系统用户system运行。

需要用其他用户将运行agent的账户注销,然后重启gse服务,在注销所有用户,即可将gae_win_agent.exegae_daemon_agent.exe两个进程转到system控制下。

 

三、     蓝鲸平台升级后Agent状态异常

现象描述:

蓝鲸平台升级后,看到之前装的所有agent状态在job上均显示为“未安装agent

排查过程:

查看C:\gse\logs下最新的日志文件,发现报错信息:


从报错信息可以看出,是证书验证有问题。由于是之前安装好的agent,不难判断出是更新时用的证书文件有问题。

解决方案即,将证书还原为正确的证书即可。将备份的证书文件替代中控机上/data/src/cert文件夹下的文件,执行以下步骤:

.更新证书(在中控机执行)

$ ./bkeec update cert

$ ./bkeec stop fta

$ ./bkeec stop paas

$ ./bkeec stop gse

$ ./bkeec stop bkdata

$ ./bkeec stop gse_agent

$ ./bkeec install gse

$ ./bkeec start gse

$ ./bkeec install gse_agent

$ ./bkeec start paas

$ ./bkeec start bkdata

$ ./bkeec start fta

 

自动化运维
最近热帖
{{item.Title}} {{item.ViewCount}}
近期热议
{{item.Title}} {{item.PostCount}}