n9e默认监控指标

分析collector组件的源码,查看一下n9e默认采集的一些指标,并尽可能理解含义。

系统指标 #

CPU #

metric 说明 必要性 采集来源
cpu.idle 空闲
cpu.util 使用率
cpu.user 用户使用率
cpu.sys 系统使用率
cpu.nice 低优先级使用率
cpu.iowait iowait使用率 并不一定反应io繁忙程度
cpu.irq 中断请求
cpu.softirq 软中断请求
cpu.steal
cpu.guest
cpu.switches 上下文切换
cpu.core.* 各个核心的指标

磁盘 #

metric 说明 必要性 采集来源
disk.bytes.total 某盘总空间 du
disk.bytes.free 剩余空间 du
disk.bytes.used 已使用 du
disk.bytes.used.percent 已使用百分比 du
disk.inodes.total
disk.inodes.free
disk.inodes.used
disk.inodes.used.percent
disk.cap.bytes.total 某实例总空间
disk.cap.bytes.used
disk.cap.bytes.free
disk.cap.bytes.used.percent
disk.io.read.request 每秒读请求数 读iops
disk.io.write.request 每秒写请求数 写iops
disk.io.read.bytes 读吞吐 读吞吐
disk.io.write.bytes 写吞吐 写吞吐
disk.io.avgrq_sz 平均每I/O操作数据大小 delta(rsect+wsect)/delta(rio+wio)
disk.io.avgqu_sz 平均I/O队列长度 delta(aveq)/s/1000
disk.io.await 平均每次设备I/O操作的等待时间 (毫秒) 队列+磁盘操作 delta(ruse+wuse)/delta(rio+wio)
disk.io.svctm 平均每次设备I/O操作的服务时间 (毫秒) 磁盘操作 delta(use)/delta(rio+wio)
disk.io.util
disk.rw.error 磁盘是否可读写 读写文件测试

内存 #

metric 说明 必要性 采集来源
mem.bytes.total 总内存
mem.bytes.used 总使用
mem.bytes.free 总剩余
mem.bytes.used.percent 使用率
mem.bytes.buffers 缓冲占用
mem.bytes.cached 缓存占用
mem.swap.bytes.total swap总
mem.swap.bytes.used swap使用
mem.swap.bytes.free swap剩余
mem.swap.bytes.used.percent swap使用率

网络 #

metric 说明 必要性 采集来源
net.in.bits 入站bps
net.out.bits 出站bps
net.in.dropped 入丢弃bps
net.out.dropped 出丢弃bps
net.in.pps 入包转发率
net.out.pps
net.in.errs 入错误率
net.out.errs 出错误率
net.in.percent 入带宽占比
net.out.percent 出带宽占比
net.bandwidth.mbits 网卡带宽/速率
net.bandwidth.mbits.total 网卡总带宽
net.in.bits.total 总入站
net.out.bits.total 总出站
net.in.bits.total.percent 总入使用率
net.out.bits.total.percent 总出使用率
sockets.used 已使用socks数量
sockets.tcp.inuse tcp使用的数量
sockets.tcp.timewait timewait的数量

系统 #

metric 说明 必要性 采集来源
cpu.loadavg.1 1分钟均载
cpu.loadavg.5 5分钟均载
cpu.loadavg.15 15分钟均载
sys.net.netfilter.nf_conntrack_max
sys.net.netfilter.nf_conntrack_count
sys.net.netfilter.nf_conntrack_count.percent
sys.ntp.offset.ms ntp偏移
sys.fs.files.max
sys.fs.files.free
sys.fs.files.used
sys.fs.files.used.percent
sys.ps.process.total
sys.ps.entity.total

进程 #

metric 说明 必要性 采集来源
proc.port.listen
proc.num

日志 #

其他 #

组件指标 #

metric 说明 必要性 采集来源
proc.agent.alive collector存活指标 collector是否存活 固定值