存算分离集群监控指标
StarRocks 为存算分离集群提供以下两种 Dashboard 模板:
Shared-data Dashboard 监控项
Shared-data Dashboard 包括以下监控指标类别:
Publish Version
Latency / QPS
- 描述 Public Version 任务的 Quantile 分位数延 迟、平均延迟和 QPS。
Queued Tasks
- 描述 Public Version 队列中的任务数量。
Metadata
Get Tablet Metadata
- 描述 Get Tablet Metadata 任务的 Quantile 分位数延迟、平均延迟和 QPS。
Put Tablet Metadata
- 描述 Put Tablet Metadata 任务的 Quantile 分位数延迟、平均延迟和 QPS。
Get Txn Log
- 描述 Get Txn Log 任务的 Quantile 分位数延迟、平均延迟和 QPS。
Put Txn Log
- 描述 Put Txn Log任务的 Quantile 分位数延迟、平均延迟和 QPS。
Metacache
Metacache Usage
- 描述 Metacache 利用率。
Delvec Cache Miss Per Minute
- 描述 Delvec Cache 每分钟 Miss 的次数。
Metadata Cache Miss Per Minute
- 描述 Metadata Cache 每分钟 Miss 的次数。
Txn Log Cache Miss Per Minute
- 描述 Txn Log Cache 每分钟 Miss 的次数。
Segment Cache Miss Per Minute
- 描述 Segment Cache 每分钟 Miss 的次数。
Vacuum
Vacuum Deletes
- 描述 Vacuum Deletes 任务的 Quantile 分位数延迟、平均延迟和 QPS。
Errors
- 描述 Vacuum Deletes 操作失败的次数。
Loading
Queue Size
- 描述 BE Async Delta Writer 的队列长度。
Starlet Dashboard 监控项
Starlet Dashboard 包括以下监控指标类别:
FSLIB READ IO METRICS
fslib read io_latency (quantile)
- 类型:Histogram
- 描述 S3 读取的 Quantile 分位延迟。
fslib read io_latency (average)
- 类型:Counter
- 描述 S3 读取的平均延迟。
fslib total read data
- 类型:Counter
- 描述 S3 读取的总数据大小。
fslib read iosize (quantile)
- 类型:Histogram
- 描述 S3 读取的 Quantile 分位 I/O 大小。
fslib read iosize (average)
- 类型:Counter
- 描述 S3 读取的平均 I/O 大小。
fslib read throughput
- 类型:Counter
- 描述 S3 读取的每秒 I/O 吞吐量。
fslib read iops
- 类型:Counter
- 描述 S3 读取的每秒 I/O 操作次数。
FSLIB WRITE IO METRICS
fslib write io_latency (quantile)
- 类型:Histogram
- 描述 应用写入的 Quantile 分位延迟。请注意,该值仅监控写入缓冲区的数据,因此观察到的值会相比实际较低。
fslib write io_latency (average)
- 类型:Counter
- 描述 应用写入的平均延迟。请注意,该值仅监控写入缓冲区的数据,因此观察到的值会相比实际较低。
fslib total write data
- 类型:Counter
- 描述 应用写入的总数据大小。