通用监控指标
本文介绍了监控 StarRocks 的重要通用指标。
有关物化视图和存算分离集群专属监控指标,请参考对应章节:
关于为您的 StarRocks 集群设置监控报警服务的详细说明,请参阅 监控警报。
监控项说明
be_broker_count
- 单位:个
- 类型:平均值
- 描述:Broker的数量。
be_brpc_endpoint_count
- 单位:个
- 类型:平均值
- 描述:bRPC 中 StubCache 的数量。
be_bytes_read_per_second
- 单位:Byte/秒
- 类型:平均值
- 描述:BE 读取速度。
be_bytes_written_per_second
- 单位:Byte/秒
- 类型:平均值
- 描述:BE 写入速度。
be_base_compaction_bytes_per_second
- 单位:Byte/秒
- 类型:平均值
- 描述:BE 的基线合并速率。
be_cumulative_compaction_bytes_per_second
- 单位:Byte/秒
- 类型:平均值
- 描述:BE 的增量合并速率。
be_base_compaction_rowsets_per_second
- 单位:个/秒
- 类型:平均值
- 描述:BE 的基线合并 rowsets 合并速率。
be_cumulative_compaction_rowsets_per_second
- 单位:个/秒
- 类型:平均值
- 描述:BE 的增量合并 rowsets 合并速率。
be_base_compaction_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 基线合并失败。
be_clone_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 克隆失败
be_create_rollup_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 创建物化视图失败。
be_create_tablet_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 创建 tablet 失败。
be_cumulative_compaction_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 增量合并失败。
be_delete_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 删除失败。
be_finish_task_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE task 失败。
be_publish_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 版本发布失败。
be_report_tables_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 表上报失败。
be_report_disk_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 磁盘上报失败。
be_report_tablet_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 分片上报失败。
be_report_task_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 任务上报失败。
be_schema_change_failed
- 单位:个/秒
- 类型:平均值
- 描述:BE 修改表结构失败。
be_base_compaction_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 基线合并请求。
be_clone_total_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 克隆请求。
be_create_rollup_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 创建物化视图请求。
be_create_tablet_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 创建分片请求。
be_cumulative_compaction_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 增量合并请求。
be_delete_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 删除请求。
be_finish_task_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 完成任务请求。
be_publish_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 版本发布请求。
be_report_tablets_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 分片上报请求。
be_report_disk_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 磁盘上报请求。
be_report_tablet_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 任务上报请求。
be_report_task_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 任务上报请求。
be_schema_change_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 表结构修改请求。
be_storage_migrate_requests
- 单位:个/秒
- 类型:平均值
- 描述:BE 迁移请求。
be_fragment_endpoint_count
- 单位:个
- 类型:平均值
- 描述:BE DataStream 数量。
be_fragment_request_latency_avg
- 单位:m s
- 类型:平均值
- 描述:fragment 请求响应时间。
be_fragment_requests_per_second
- 单位:个/秒
- 类型:平均值
- 描述:fragment 请求数。
be_http_request_latency_avg
- 单位:毫秒
- 类型:平均值
- 描述:HTTP 请求响应时间。
be_http_requests_per_second
- 单位:个/秒
- 类型:平均值
- 描述:HTTP 请求数。
be_http_request_send_bytes_per_second
- 单位:Byte/秒
- 类型:平均值
- 描述:HTTP 请求发送字节数。
fe_connections_per_second
- 单位:个/秒
- 类型:平均值
- 描述:FE 的新增连接速率。
fe_connection_total
- 单位:个
- 类型:累计值
- 描述:FE 的总连接数量。
fe_edit_log_read
- 单位:个/秒
- 类型:平均值
- 描述:FE edit log 读取速率。
fe_edit_log_size_bytes
- 单位:Byte/秒
- 类型:平均值
- 描述:FE edit log 大小。
fe_edit_log_write
- 单位:Byte/秒
- 类型:平均值
- 描述:FE edit log 写入速率。
fe_checkpoint_push_per_second
- 单位:个/秒
- 类型:平均值
- 描述:FE checkpoint 数。
fe_pending_hadoop_load_job
- 单位:个
- 类型:平均值
- 描述:Pending 的 hadoop job 数量。
fe_committed_hadoop_load_job
- 单位:个
- 类型:平均值
- 描述:提交的 hadoop job 数量。
fe_loading_hadoop_load_job
- 单位:个
- 类型:平均值
- 描述:加载中的 hadoop job 数量。
fe_finished_hadoop_load_job
- 单位:个
- 类型:平均值
- 描述:完成的 hadoop job 数量。
fe_cancelled_hadoop_load_job
- 单位:个
- 类型:平均值
- 描述:取消的 hadoop job 数量。
fe_pending_insert_load_job
- 单位:个
- 类型:平均值
- 描述:Pending 的 insert job 数量。
fe_loading_insert_load_job
- 单位:个
- 类型:平均值
- 描述:提交的 insert job 数量。
fe_committed_insert_load_job
- 单位:个
- 类型:平均值
- 描述:加载中的 insert job 数量。
fe_finished_insert_load_job
- 单位:个
- 类型:平均值
- 描述:完成的 insert job 数量。
fe_cancelled_insert_load_job
- 单位:个
- 类型:平均值
- 描述:取消的 insert job 数量。
fe_pending_broker_load_job
- 单位:个
- 类型:平均值
- 描述:Pending 的 broker job 数量。
fe_loading_broker_load_job
- 单位:个
- 类型:平均值
- 描述:提交的 broker job 数量。
fe_committed_broker_load_job
- 单位:个
- 类型:平均值
- 描述:加载中的 broker job 数量。
fe_finished_broker_load_job
- 单位:个
- 类型:平均值
- 描述:完成的 broker job 数量。
fe_cancelled_broker_load_job
- 单位:个
- 类型:平均值
- 描述:取消的 broker job 数量。
fe_pending_delete_load_job
- 单位:个
- 类型:平均值
- 描述:Pending 的 delete job 数量。
fe_loading_delete_load_job
- 单位:个
- 类型:平均值
- 描述:提交的 delete job 数量。
fe_committed_delete_load_job
- 单位:个
- 类型:平均值
- 描述:加载中的 delete job 数量。
fe_finished_delete_load_job
- 单位:个
- 类型:平均值
- 描述:完成的 delete job 数量。
fe_cancelled_delete_load_job
- 单位:个
- 类型:平均值
- 描述:取消的 delete job 数量。
fe_rollup_running_alter_job
- 单位:个
- 类型:平均值
- 描述:rollup 创建中的 job 数量。
fe_schema_change_running_job
- 单位:个
- 类型:平均值
- 描述:表结构变更中的 job 数量。
cpu_util
- 单位:-
- 类型:平均值
- 描述:CPU 百分比使用率。
cpu_system
- 单位:-
- 类型:平均值
- 描述:cpu_system 百分比使用率。
cpu_user
- 单位:-
- 类型:平均值
- 描述:cpu_user 百分比使用率。
cpu_idle
- 单位:-
- 类型:平均值
- 描述:cpu_idle 百分比使用率。
cpu_guest
- 单位:-
- 类型:平均值
- 描述:cpu_guest 百分比使用率。
cpu_iowait
- 单位:-
- 类型:平均值
- 描述:cpu_iowait 百分比使用率。
cpu_irq
- 单位:-
- 类型:平均值
- 描述:cpu_irq 百分比使用率。
cpu_nice
- 单位:-
- 类型:平均值
- 描述:cpu_nice 百分比使用率。
cpu_softirq
- 单位:-
- 类型:平均值
- 描述:cpu_softirq 百分比使用率。
cpu_steal
- 单位:-
- 类型:平均值
- 描述:cpu_steal 百分比使用率。
disk_free
- 单位:Byte
- 类型:平均值
- 描述:空闲磁盘容量。
disk_io_svctm
- 单位:毫秒
- 类型:平均值
- 描述:磁盘 IO 服务时间。
disk_io_util
- 单位:-
- 类型:平均值
- 描述:磁盘百分比使用率。
disk_used
- 单位:Byte
- 类型:平均值
- 描述:已用磁盘容量。
encryption_keys_created
- 单位:个
- 类型:累计值
- 描述:加密文件时创建密钥的次数
encryption_keys_unwrapped
- 单位:个
- 类型:累计值
- 描述:解密文件时解码密钥的次数
encryption_keys_in_cache
- 单位:个
- 类型:瞬时值
- 描述:当前密钥缓存中密钥的个数
starrocks_fe_query_resource_group
- 单位:个
- 类型:累计值
- 描述:该资源组中查询任务的数量
starrocks_fe_query_resource_group_latency
- 单位:秒
- 类型:平均值
- 描述:该资源组的查询延迟百分位数
starrocks_fe_query_resource_group_err
- 单位:个
- 类型:累计值
- 描述:该资源组中报错的查询任务的数量
starrocks_fe_meta_log_count
- 单位:个
- 类型:瞬时值
- 描述:未做 Checkpoint 的 Edit Log 数量,该值在
100000
以内为合理
starrocks_be_resource_group_cpu_limit_ratio
- 单位:-
- 类型:瞬时值
- 描述:该资源组 CPU 百分比配额比率的瞬时值
starrocks_be_resource_group_cpu_use_ratio
- 单位:-
- 类型:平均值
- 描述:该资源组 CPU 使用时间占所有资源组 CPU 时间的百分比