实例监控与告警为您提供实时实例监控管理服务,支持不同监控维度,在实例成功创建后即开始采集数据,以图表方式直观展现,方便您掌握实例资源使用情况、运行状态等信息,同时您可设置不同的报警规则,当触发该类条件后则触发报警通知,使您轻松定位故障。
京东智联云为实例提供以下监控指标,按采集上报的前提条件来区分,可以分为三类:
监控指标 | 指标含义 | 单位 | 上报依赖 | 说明 | |
---|---|---|---|---|---|
CPU | CPU使用率 vm.cpu.util |
非空闲vCPU所占的百分比 | % | 官方镜像内置的Agent,所有版本均支持此指标采集 | 维度:无 |
CPU平均负载(1min) vm.avg.load1 |
采样时刻过去1分钟的系统平均负载 | 无 | 不低于'3.0.989'版本的JCS-Agent | 维度:无 仅Linux系统有此组指标 |
|
CPU平均负载(5min) vm.avg.load5 |
采样时刻过去5分钟的系统平均负载 | 无 | |||
CPU平均负载(15min) vm.avg.load15 |
采样时刻过去15分钟的系统平均负载 | 无 | |||
内存 | 内存使用率 vm.memory.usage |
已用内存量占总内存总量百分比 | % | 官方镜像内置的Agent,所有版本均支持此指标采集 | 维度:无 |
内存使用量 vm.memory.used.bytes |
系统已用内存情况 | Bytes | 不低于'3.0.989'版本的JCS-Agent | 维度:无 | |
磁盘 | 磁盘读吞吐量(Host) vm.disk.bytes.read |
磁盘每秒读取的字节数(全部磁盘) | Bps | 无 | 维度:无 宿主机采集,实例整体磁盘吞吐 |
磁盘写吞吐量(Host) vm.disk.bytes.write |
磁盘每秒写入的字节数(全部磁盘) | Bps | |||
磁盘读吞吐量 vm.disk.dev.bytes.read |
磁盘每秒读取的字节数 | Bps | 不低于'3.0.989'版本的JCS-Agent | 维度:设备文件名(以'devName'为tag上报)如: * Linux:'devName'='/vda','/vdb1', ... * Windows:‘devName’='C','D', ... Linux系统如磁盘有分区,则按分区统计上报,若无分区则按磁盘统计上报;Windows系统均按盘符统计上报 |
|
磁盘写吞吐量 vm.disk.dev.bytes.write |
磁盘每秒写入的字节数 | Bps | |||
磁盘读IOPS vm.disk.dev.io.read |
磁盘每秒读请求数量 | Count/s | |||
磁盘写IOPS vm.disk.dev.io.write |
磁盘每秒写请求数量 | Count/s | |||
磁盘使用率 vm.disk.dev.used |
磁盘已使用空间百分比 | % | 维度:挂载点(以‘mountPoint’为tag上报)如: * Linux:'mountPoint'='/','/mnt', ... * Windows:‘mountPoint’='C','D', ... Linux系统按挂载点统计上报;Windows系统按盘符统计上报 仅Linux系统提供'磁盘inode使用率'指标 |
||
磁盘使用量 vm.disk.dev.used.bytes |
磁盘已使用空间容量 | Bytes | |||
磁盘inode使用率 vm.disk.dev.inode.used |
磁盘文件系统inode使用百分比 | % | |||
网络 | 网络入带宽(Host) vm.network.bytes.incoming |
网卡每秒接收的比特数(全部网卡之和) | bps | 无 | 维度:无 宿主机采集,实例整体网络带宽,不分区网卡和内外网 |
网络出带宽(Host) vm.network.bytes.outgoing |
网卡每秒发送的比特数(全部网卡之和) | bps | |||
网络入带宽 vm.network.dev.bytes.in |
网卡每秒接收的比特数 | bps | 不低于'3.0.989'版本的JCS-Agent | 维度:网卡(以‘devName’为tag上报)如: * Linux/Windows:'devName'='eth0','eth1', ... 网卡整体数据指标,不分区内外网 |
|
网络出带宽 vm.network.dev.bytes.out |
网卡每秒发送的比特数 | bps | |||
网络入包量 vm.network.dev.packets.in |
网卡每秒入包量 | pps | |||
网络出包量 vm.network.dev.packets.out |
网卡每秒出包量 | pps | |||
TCP连接数 vm.netstat.tcp.established |
处于 ESTABLISHED 状态的 TCP 连接数量 | Count | 维度:无 | ||
GPU | GPU功耗 vm.gpu.power |
GPU功耗 | Wt | 不低于'3.0.989'版本的JCS-Agent | 维度:GPU卡(以‘gpu_index’为tag上报)如: * Linux/Windows:'gpu_index‘=’0’,’1’,’2’,’3’, ... 仅GPU实例规格有此组指标 |
GPU温度 vm.gpu.temperature |
GPU温度 | ℃ | |||
GPU核心使用率 vm.gpu.util.gpu |
GPU核心使用率 | % | |||
GPU编码器使用率 vm.gpu.util.encoder |
GPU编码器使用率 | % | |||
GPU解码器使用率 vm.gpu.util.decoder |
GPU解码器使用率 | % | |||
GPU内存使用率 vm.gpu.util.mem |
GPU内存使用率 | % | |||
GPU内存使用量 vm.gpu.used.mem.bytes |
GPU内存使用量 | Bytes |
云主机监控数据的采集和上报依赖于官方镜像系统组件'JCS-Agent'中的'MonitorPlugin'插件,官方镜像在2019年5月-7月期间进行升级默认安装了升级工具'ifrit'以实现JCS-Agent的自动升级。
如您当前实例中未安装JCS-Agent或已安装但版本过低不具备自动升级能力,可在确保已卸载早期系统组件cloud-init和QGA的前提下,直接安装ifrit,安装完成10分钟内,JCS-Agent会被自动安装/更新为最新版本。
ps -ef|grep MonitorPlugin
wmic process where caption="MonitorPlugin.exe" get caption,commandline /value