实例监控与报警为您提供实时实例监控管理服务,支持不同监控维度,在实例成功创建后即开始采集数据,以图表方式直观展现,方便您掌握实例资源使用情况、运行状态等信息,同时您可设置不同的报警规则,当触发该类条件后则触发报警通知,使您轻松定位故障。
京东云为您提供云主机实例的CPU、内存、磁盘、网络等类型的监控指标,其中云主机监控指标分为基础指标和扩展指标:
指标类型 | 指标英文名 | 指标中文名 | 单位 | 说明 | 上报维度 |
---|---|---|---|---|---|
CPU | vm.cpu.util | CPU使用率 | % | 非空闲vCPU所占的百分比 | 实例 |
vm.avg.load1 | CPU平均负载(1min) | 无 | 1分钟内的系统平均负载 仅Linux系统有此指标 | 实例 | |
vm.avg.load5 | CPU平均负载(5min) | 无 | 5分钟内的系统平均负载 仅Linux系统有此指标 | 实例 | |
vm.avg.load15 | CPU平均负载(15min) | 无 | 15分钟内的系统平均负载 仅Linux系统有此指标 | 实例 | |
内存 | vm.memory.usage | 内存使用率 | % | 已用内存量占总内存总量百分比 | 实例 |
vm.memory.used.bytes | 内存使用量 | Bytes | 系统已用内存容量 | 实例 | |
磁盘 | vm.disk.bytes.read | 磁盘读吞吐量(Host) | Bps | 全部磁盘每秒读取的字节数 | 实例 |
vm.disk.bytes.write | 磁盘写吞吐量(Host) | Bps | 全部磁盘每秒写入的字节数 | 实例 | |
vm.disk.dev.bytes.read | 磁盘读吞吐量 | Bps | 磁盘每秒读取的字节数 | 设备文件名:devName | |
vm.disk.dev.bytes.write | 磁盘写吞吐量 | Bps | 磁盘每秒写入的字节数 | ||
vm.disk.dev.io.read | 磁盘读IOPS | Count/s | 磁盘每秒读请求数量 | ||
vm.disk.dev.io.write | 磁盘写IOPS | Count/s | 磁盘每秒写请求数量 | ||
vm.disk.dev.used | 磁盘使用率 | % | 磁盘已使用空间容量 | 挂载点:mountPoint | |
vm.disk.dev.used.bytes | 磁盘使用量 | Bytes | 磁盘已使用空间容量 | ||
vm.disk.dev.inode.used | 磁盘inode使用率 | % | 磁盘文件系统inode使用百分比 仅Linux系统有此指标 | ||
网络 | vm.network.bytes.incoming | 网络入带宽(Host) | bps | 全部网卡每秒接收的比特数 | 实例 |
vm.network.bytes.outgoing | 网络出带宽(Host) | bps | 全部网卡每秒接收的比特数 | 实例 | |
vm.network.dev.bytes.in | 网络入带宽 | bps | 网卡每秒接收的比特数 | 网卡:devName | |
vm.network.dev.bytes.out | 网络出带宽 | bps | 网卡每秒发送的比特数 | ||
vm.network.dev.packets.in | 网络入包量 | pps | 网卡每秒入包量 | ||
vm.network.dev.packets.out | 网络出包量 | pps | 网卡每秒出包量 | ||
vm.netstat.tcp.established | TCP连接数 | Count | 处于 ESTABLISHED 状态的 TCP 连接数量 | 实例 | |
GPU | vm.gpu.power | GPU功耗 | Wt | GPU功耗 | GPU卡:gpu_index |
vm.gpu.temperature | GPU温度 | ℃ | GPU温度 | ||
vm.gpu.util.gpu | GPU核心使用率 | % | GPU核心使用率 | ||
vm.gpu.util.encoder | GPU编码器使用率 | % | GPU编码器使用率 | ||
vm.gpu.util.decoder | GPU解码器使用率 | % | GPU解码器使用率 | ||
vm.gpu.util.mem | GPU内存使用率 | % | GPU内存使用率 | ||
vm.gpu.used.mem.bytes | GPU内存使用量 | Bytes | GPU内存使用量 |
指标类型 | 指标英文名 | 指标中文名 | 单位 | 说明 | 上报维度 |
---|---|---|---|---|---|
CPU | vm.cpu.cores.user | CPU使用率(user) | % | CPU在用户态进程和低优先级进程的时间百分比 仅Linux系统有此指标 | 实例 |
vm.cpu.cores.iowait | CPU使用率(iowait) | % | CPU由于系统IO而处于等待状态的时间百分比 仅Linux系统有此指标 | 实例 | |
磁盘 | vm.disk.dev.io.util | 磁盘IO繁忙百分比 | % | 磁盘IO繁忙百分比 | 设备名:devName |
vm.disk.dev.io.await | 磁盘IO等待百分比 | % | 磁盘IO等待百分比 | ||
TCP连接数 | vm.netstat.tcp.last_ack | last_ack | Count | 处于last_ack状态下的TCP连接数量 | 实例 |
vm.netstat.tcp.syn_recv | syn_recv | Count | 处于syn_recv状态下的TCP连接数 | 实例 | |
vm.netstat.tcp.fin_wait1 | fin_wait1 | Count | 处于fin_wait1状态下的TCP连接数量 | 实例 | |
vm.netstat.tcp.fin_wait2 | fin_wait2 | Count | 处于fin_wait2状态下的TCP连接数量 | 实例 | |
vm.netstat.tcp.closing | closing | Count | 处于closing状态下的TCP连接数量 | 实例 | |
vm.netstat.tcp.time_wait | time_wait | Count | 处于time_wait状态下的TCP连接数量 | 实例 |
您可以按照下方步骤进行扩展指标的采集配置:
ps -ef|grep MonitorPlugin
cd /usr/local/share/jcloud/agent/plugins/MonitorPlugin-[version]
namespace长度不可超过255字节,只允许英文、数字、下划线、点., [0-9][a-z] [A-Z] [. ])。
{ "agent": { "namespace": "vm_extend_metric" }, "metrics": { "disk-io": { "measurement-white-list": ["vm.disk.dev.io.util", "vm.disk.dev.io.await"] }, "netstat": { "measurement-white-list": [ "vm.netstat.tcp.last_ack", "vm.netstat.tcp.syn_recv", "vm.netstat.tcp.fin_wait1", "vm.netstat.tcp.fin_wait2", "vm.netstat.tcp.closing", "vm.netstat.tcp.time_wait", "vm.netstat.tcp.retrans_segs" ] }, "cpu": { "measurement-white-list": ["vm.cpu.cores.user", "vm.cpu.cores.iowait"] } }}
ps -ef | grep -i MonitorPlugin //查看监控进程id kill [pid] //指定进程id kill
云主机监控数据的采集和上报依赖于官方镜像系统组件'JCS-Agent'中的'MonitorPlugin'插件,当前官方镜像均默认安装'ifrit'工具,实现对JCS-Agent的自动升级。如您基础指标或扩展指标监控数据缺失,可能是由于JCS-Agent/ifrit状态异常或版本过低,请确认JCS-Agent/ifrit状态及版本。
注意: 'MonitorPlugin'插件版本需不低于“3.0.1086”才支持扩展指标的上报
ps -ef|grep MonitorPlugin
wmic process where caption="MonitorPlugin.exe" get caption,commandline /value
单位是监控指标的基本度量,下方为云监控所支持的指标单位:
单位 | 说明 |
---|---|
% | 百分比 |
Bytes | 字节数,用于表示数据的大小。1Byte = 8bit |
Bps | 每秒字节数(bytes per second) |
bps | 每秒比特数(bits per second) |
pps | 每秒包数(packets per second) |
Count | 次数 |
Count/s | 每秒操作的次数(counts per second) |
Wt | 电功率,每秒消耗的电能 |
℃ | 摄氏度 |