我根据这个步骤配置,然后
#citamon_agent_host_exporter curl http://localhost:1920/metrics/host #citamon_agent_process_exporter curl http://localhost:1920/metrics/process
上面这两个端口访问正常。
#citamon_agent_rabbitmq_exporter curl http://localhost:1920/metrics/rabbitmq #citamon_agent_cita_exporter curl http://localhost:1920/metrics/cita
上面这两个报错:
最后排查因为没有理解RPC端口设置,这个节点的RPC接口应该是1338,但是正确的设置好RPC接口之后,仍然下面两个接口无法访问:
然后看报错提示:
UnboundLocalError: local variable 'hex_number' referenced before assignment
应该是:
推测是 hex_number 没有初始化导致
我修改了cita_monitor_agent.py 里面两个变量的初始化位置后,/metrics/cita/ 接口可以拿到数据了:
但是可以看 log,http 状态码先是 499,然后才是 200。对应到浏览器访问这个接口的表现是,先加载了15s左右加载不出来,然后后续才跳出来了。
而且此时 rabbitmq 仍然查询不到:
curl node-ip:9419/metrics ,看看是否能查询到数据
问题出在 agent,把 agent 的 .env 里面的 NODE_IP 设置为内网地址,然后把server/config/prometheus.yml 的alertManager 端口改了。cita 以及 rabbitMQ 就正常了。Grafana 显示也正常了
配置不够顺畅是文档说明不够清楚吗?
文档其实很清楚了,主要是我之前没接触过 prometheus 框架。然后文档里在 单个容器部署 部分说了要用内网 IP,但是我第一次直接只读了前面的整体部署的步骤。那里能提一下用内网 IP 就更完美了。