cita-monitor 的 agent 部分接口无法访问。

我根据这个步骤配置,然后

#citamon_agent_host_exporter
curl http://localhost:1920/metrics/host

#citamon_agent_process_exporter
curl http://localhost:1920/metrics/process

上面这两个端口访问正常。

#citamon_agent_rabbitmq_exporter
curl http://localhost:1920/metrics/rabbitmq

#citamon_agent_cita_exporter
curl http://localhost:1920/metrics/cita

上面这两个报错:

最后排查因为没有理解RPC端口设置,这个节点的RPC接口应该是1338,但是正确的设置好RPC接口之后,仍然下面两个接口无法访问:



链级配置这里,显示rabbitmq端口是4369。不清楚是否和这个有关系。

然后看报错提示:

UnboundLocalError: local variable 'hex_number' referenced before assignment

应该是:

推测是 hex_number 没有初始化导致

我修改了cita_monitor_agent.py 里面两个变量的初始化位置后,/metrics/cita/ 接口可以拿到数据了:


但是可以看 log,http 状态码先是 499,然后才是 200。对应到浏览器访问这个接口的表现是,先加载了15s左右加载不出来,然后后续才跳出来了。

而且此时 rabbitmq 仍然查询不到:

curl node-ip:9419/metrics ,看看是否能查询到数据

问题出在 agent,把 agent 的 .env 里面的 NODE_IP 设置为内网地址,然后把server/config/prometheus.yml 的alertManager 端口改了。cita 以及 rabbitMQ 就正常了。Grafana 显示也正常了

配置不够顺畅是文档说明不够清楚吗?

文档其实很清楚了,主要是我之前没接触过 prometheus 框架。然后文档里在 单个容器部署 部分说了要用内网 IP,但是我第一次直接只读了前面的整体部署的步骤。那里能提一下用内网 IP 就更完美了。