一般的なモニタリングメトリクス
このトピックでは、StarRocks の重要な一般メトリクスを紹介します。
マテリアライズドビューや共有データクラスタに特化したメトリクスについては、該当するセクションを参照してください。
StarRocks クラスタのモニタリングサービスの構築方法については、モニタリングとアラートを参照してください。
メトリック項目
be_broker_count
- 単位: Count
- タイプ: Average
- 説明: ブローカーの数。
be_brpc_endpoint_count
- 単位: Count
- タイプ: Average
- 説明: bRPC の StubCache の数。
be_bytes_read_per_second
- 単位: Bytes/s
- タイプ: Average
- 説明: BE の読み取り速度。
be_bytes_written_per_second
- 単位: Bytes/s
- タイプ: Average
- 説明: BE の書き込み速度。
be_base_compaction_bytes_per_second
- 単位: Bytes/s
- タイプ: Average
- 説明: BE のベース Compaction 速度。
be_cumulative_compaction_bytes_per_second
- 単位: Bytes/s
- タイプ: Average
- 説明: BE の累積 Compaction 速度。
be_base_compaction_rowsets_per_second
- 単位: Count
- タイプ: Average
- 説明: BE のベース Compaction の rowset 速度。
be_cumulative_compaction_rowsets_per_second
- 単位: Count
- タイプ: Average
- 説明: BE の累積 Compaction の rowset 速度。
be_base_compaction_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE のベース Compaction の失敗。
be_clone_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE のクローン失敗。
be_create_rollup_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE のマテリアライズドビュー作成失敗。
be_create_tablet_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE の tablet 作成失敗。
be_cumulative_compaction_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE の累積 Compaction の失敗。
be_delete_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE の削除失敗。
be_finish_task_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE のタスク失敗。
be_publish_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE のバージョンリリース失敗。
be_report_tables_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE のテーブルレポート失敗。
be_report_disk_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE のディスクレポート失敗。
be_report_tablet_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE の tablet レポート失敗。
be_report_task_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE のタスクレポート失敗。
be_schema_change_failed
- 単位: Count/s
- タイプ: Average
- 説明: BE の schema change 失敗。
be_base_compaction_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE のベース Compaction リクエスト。
be_clone_total_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE のクローンリクエスト。
be_create_rollup_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE のマテリアライズドビュー作成リクエスト。
be_create_tablet_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE の tablet 作成リクエスト。
be_cumulative_compaction_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE の累積 Compaction リクエスト。
be_delete_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE の削除リクエスト。
be_finish_task_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE のタスク完了リクエスト。
be_publish_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE のバージョン公開リクエスト。
be_report_tablets_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE の tablet レポートリクエスト。
be_report_disk_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE のディスクレポートリクエスト。
be_report_tablet_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE の tablet レポートリクエスト。
be_report_task_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE のタスクレポートリクエスト。
be_schema_change_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE の schema change レポートリクエスト。
be_storage_migrate_requests
- 単位: Count/s
- タイプ: Average
- 説明: BE の移行リクエスト。
be_fragment_endpoint_count
- 単位: Count
- タイプ: Average
- 説明: BE DataStream の数。
be_fragment_request_latency_avg
- 単位: ms
- タイプ: Average
- 説明: フラグメントリクエストのレイテンシー。
be_fragment_requests_per_second
- 単位: Count/s
- タイプ: Average
- 説明: フラグメントリクエストの数。
be_http_request_latency_avg
- 単位: ms
- タイプ: Average
- 説明: HTTP リクエストのレイテンシー。
be_http_requests_per_second
- 単位: Count/s
- タイプ: Average
- 説明: HTTP リクエストの数。
be_http_request_send_bytes_per_second
- 単位: Bytes/s
- タイプ: Average
- 説明: HTTP リクエストで送信されたバイト数。
fe_connections_per_second
- 単位: Count/s
- タイプ: Average
- 説明: FE の新しい接続率。
fe_connection_total
- 単位: Count
- タイプ: Cumulative
- 説明: FE の接続の総数。
fe_edit_log_read
- 単位: Count/s
- タイプ: Average
- 説明: FE 編集ログの読み取り速度。
fe_edit_log_size_bytes
- 単位: Bytes/s
- タイプ: Average
- 説明: FE 編集ログのサイズ。
fe_edit_log_write
- 単位: Bytes/s
- タイプ: Average
- 説明: FE 編集ログの書き込み速度。
fe_checkpoint_push_per_second
- 単位: Count/s
- タイプ: Average
- 説明: FE チェックポイントの数。
fe_pending_hadoop_load_job
- 単位: Count
- タイプ: Average
- 説明: 保留中の hadoop ジョブの数。
fe_committed_hadoop_load_job
- 単位: Count
- タイプ: Average
- 説明: コミットされた hadoop ジョブの数。
fe_loading_hadoop_load_job
- 単位: Count
- タイプ: Average
- 説明: ロード中の hadoop ジョブの数。
fe_finished_hadoop_load_job
- 単位: Count
- タイプ: Average
- 説明: 完了した hadoop ジョブの数。
fe_cancelled_hadoop_load_job
- 単位: Count
- タイプ: Average
- 説明: キャンセルされた hadoop ジョブの数。
fe_pending_insert_load_job
- 単位: Count
- タイプ: Average
- 説明: 保留中の insert ジョブの数。
fe_loading_insert_load_job
- 単位: Count
- タイプ: Average
- 説明: ロード中の insert ジョブの数。
fe_committed_insert_load_job
- 単位: Count
- タイプ: Average
- 説明: コミットされた insert ジョブの数。
fe_finished_insert_load_job
- 単位: Count
- タイプ: Average
- 説明: 完了した insert ジョブの数。
fe_cancelled_insert_load_job
- 単位: Count
- タイプ: Average
- 説明: キャンセルされた insert ジョブの数。
fe_pending_broker_load_job
- 単位: Count
- タイプ: Average
- 説明: 保留中の broker ジョブの数。
fe_loading_broker_load_job
- 単位: Count
- タイプ: Average
- 説明: ロード中の broker ジョブの数。
fe_committed_broker_load_job
- 単位: Count
- タイプ: Average
- 説明: コミットされた broker ジョブの数。
fe_finished_broker_load_job
- 単位: Count
- タイプ: Average
- 説明: 完了した broker ジョブの数。
fe_cancelled_broker_load_job
- 単位: Count
- タイプ: Average
- 説明: キャンセルされた broker ジョブの数。
fe_pending_delete_load_job
- 単位: Count
- タイプ: Average
- 説明: 保留中の delete ジョブの数。
fe_loading_delete_load_job
- 単位: Count
- タイプ: Average
- 説明: ロード中の delete ジョブの数。
fe_committed_delete_load_job
- 単位: Count
- タイプ: Average
- 説明: コミットされた delete ジョブの数。
fe_finished_delete_load_job
- 単位: Count
- タイプ: Average
- 説明: 完了した delete ジョブの数。
fe_cancelled_delete_load_job
- 単位: Count
- タイプ: Average
- 説明: キャンセルされた delete ジョブの数。
fe_rollup_running_alter_job
- 単位: Count
- タイプ: Average
- 説明: rollup で作成されたジョブの数。
fe_schema_change_running_job
- 単位: Count
- タイプ: Average
- 説明: schema change のジョブの数。
cpu_util
- 単位: -
- タイプ: Average
- 説明: CPU 使用率。
cpu_system
- 単位: -
- タイプ: Average
- 説明: cpu_system 使用率。
cpu_user
- 単位: -
- タイプ: Average
- 説明: cpu_user 使用率。
cpu_idle
- 単位: -
- タイプ: Average
- 説明: cpu_idle 使用率。
cpu_guest
- 単位: -
- タイプ: Average
- 説明: cpu_guest 使用率。
cpu_iowait
- 単位: -
- タイプ: Average
- 説明: cpu_iowait 使用率。
cpu_irq
- 単位: -
- タイプ: Average
- 説明: cpu_irq 使用率。
cpu_nice
- 単位: -
- タイプ: Average
- 説明: cpu_nice 使用率。
cpu_softirq
- 単位: -
- タイプ: Average
- 説明: cpu_softirq 使用率。
cpu_steal
- 単位: -
- タイプ: Average
- 説明: cpu_steal 使用率。
disk_free
- 単位: Bytes
- タイプ: Average
- 説明: 空きディスク容量。
disk_io_svctm
- 単位: ms
- タイプ: Average
- 説明: ディスク IO サービス時間。
disk_io_util
- 単位: -
- タイプ: Average
- 説明: ディスク使用率。
disk_used
- 単位: Bytes
- タイプ: Average
- 説明: 使用済みディスク容量。
encryption_keys_created
- 単位: Count
- タイプ: Cumulative
- 説明: ファイル暗号化のために作成されたファイル暗号化キーの数。
encryption_keys_unwrapped
- 単位: Count
- タイプ: Cumulative
- 説明: ファイル復号化のためにアンラップされた暗号化メタの数。
encryption_keys_in_cache
- 単位: Count
- タイプ: Instantaneous
- 説明: 現在キーキャッシュにある暗号化キーの数。
starrocks_fe_meta_log_count
- 単位: Count
- タイプ: Instantaneous
- 説明: チェックポイントのない Edit Log の数。
100000以内の値が合理的とされます。
starrocks_fe_query_resource_group
- 単位: Count
- タイプ: Cumulative
- 説明: 各リソースグループのクエリ数。
starrocks_fe_query_resource_group_latency
- 単位: Seconds
- タイプ: Average
- 説明: 各リソースグループのクエリレイテンシーのパーセンタイル。
starrocks_fe_query_resource_group_err
- 単位: Count
- タイプ: Cumulative
- 説明: 各リソースグループの誤ったクエリ数。
starrocks_be_resource_group_cpu_limit_ratio
- 単位: -
- タイプ: Instantaneous
- 説明: リソースグループの CPU クォータ比率の瞬時値。
starrocks_be_resource_group_cpu_use_ratio
- 単位: -
- タイプ: Average
- 説明: リソースグループが使用した CPU 時間の比率。
starrocks_be_resource_group_mem_limit_bytes
- 単位: Bytes
- タイプ: Instantaneous
- 説明: リソースグループのメモリクォータの瞬時値。
starrocks_be_resource_group_mem_allocated_bytes
- 単位: Bytes
- タイプ: Instantaneous
- 説明: リソースグループのメモリ使用量の瞬時値。
starrocks_be_pipe_prepare_pool_queue_len
- 単位: Count
- タイプ: Instantaneous
- 説明: パイプライン準備スレッドプールタスクキューの長さの瞬時値。
starrocks_fe_safe_mode
- 単位: -
- タイプ: Instantaneous
- 説明: セーフモードが有効かどうかを示します。有効な値:
0(無効) と1(有効)。セーフモードが有効になると、クラスタはロードリクエストを受け付けなくなります。
starrocks_fe_unfinished_backup_job
- 単位: Count
- タイプ: Instantaneous
- 説明: 特定のウェアハウスで実行中の BACKUP タスクの数を示します。共有なしクラスタの場合、この項目はデフォルトのウェアハウスのみを監視します。共有データクラスタの場合、この値は常に
0です。
starrocks_fe_unfinished_restore_job
- 単位: Count
- タイプ: Instantaneous
- 説明: 特定のウェアハウスで実行中の RESTORE タスクの数を示します。共有なしクラスタの場合、この項目はデフォルトのウェアハウスのみを監視します。共有データクラスタの場合、この値は常に
0です。
starrocks_fe_memory_usage
- 単位: Bytes または Count
- タイプ: Instantaneous
- 説明: 特定のウェアハウスのさまざまなモジュールのメモリ統計を示します。共有なしクラスタの場合、この項目はデフォルトのウェアハウスのみを監視します。
starrocks_fe_unfinished_query
- 単位: Count
- タイプ: Instantaneous
- 説明: 特定のウェアハウスで現在実行中のクエリの数を示します。共有なしクラスタの場合、この項目はデフォルトのウェアハウスのみを監視します。
starrocks_fe_last_finished_job_timestamp
- 単位: ms
- タイプ: Instantaneous
- 説明: 特定のウェアハウスでの最後のクエリまたはロードの終了時間を示します。共有なしクラスタの場合、この項目はデフォルトのウェアハウスのみを監視します。
starrocks_fe_query_resource_group
- 単位: Count
- タイプ: Cumulative
- 説明: 特定のリソースグループで実行されたクエリの総数を示します。
starrocks_fe_query_resource_group_err
- 単位: Count
- タイプ: Cumulative
- 説明: 特定のリソースグループで失敗したクエリの数を示します。
starrocks_fe_query_resource_group_latency
- 単位: ms
- タイプ: Cumulative
- 説明: 特定のリソースグループでのクエリのレイテンシー統計を示します。
starrocks_fe_tablet_num
- 単位: Count
- タイプ: Instantaneous
- 説明: 各 BE ノード上の tablet の数を示します。
starrocks_fe_tablet_max_compaction_score
- 単位: Count
- タイプ: Instantaneous
- 説明: 各 BE ノード上の最高の Compaction Score を示します。
starrocks_fe_slow_lock_held_time_ms
- 単位: ミリ秒
- タイプ: Summary
- 説明: スローロックが検出されたときのロック保持時間(ミリ秒)を追跡するヒストグラムメトリクス。このメトリクスは、ロック待機時間が
slow_lock_threshold_ms設定パラメータを超えた ときに更新されます。スローロックイベントが検出されたときのすべてのロック所有者の中で最大のロック保持時間を追跡します。各メトリクスには、分位数値(0.75、0.95、0.98、0.99、0.999)、_sum、および_count出力が含まれます。注意: このメトリクスは、高競合下では正確なロック保持時間を反映しない場合があります。これは、待機時間がしきい値を超えた時点でメトリクスが更新されますが、所有者が操作を完了してロックを解放するまで保持時間が増加し続ける可能性があるためです。ただし、デッドロックが発生した場合でも、このメトリクスは更新できます。
starrocks_fe_slow_lock_wait_time_ms
- 単位: ミリ秒
- タイプ: Summary
- 説明: スローロックが検出されたときのロック待機時間(ミリ秒)を追跡するヒストグラムメトリクス。このメトリクスは、ロック待機時間が
slow_lock_threshold_ms設定パラメータを超えたときに更新されます。ロック競合シナリオでスレッドがロックを取得するために待機する時間を正確に追跡します。各メトリクスには、分位数値(0.75、0.95、0.98、0.99、0.999)、_sum、および_count出力が含まれます。このメトリクスは正確な待機時間測定を提供します。注意: デッドロックが発生した場合、このメトリクスは更新できないため、デッドロック状況の検出には使用 できません。
update_compaction_outputs_total
- 単位: Count
- 説明: 主キーテーブルの Compaction の総数。
update_del_vector_bytes_total
- 単位: Bytes
- 説明: 主キーテーブルで DELETE ベクトルをキャッシュするために使用されるメモリの総量。
push_request_duration_us
- 単位: us
- 説明: Spark Load に費やされた総時間。
writable_blocks_total (Deprecated)
disks_data_used_capacity
- 説明: 各ディスクの使用済み容量(ストレージパスで表される)。
query_scan_rows
- 単位: Count
- 説明: スキャンされた行の総数。
update_primary_index_num
- 単位: Count
- 説明: メモリにキャッシュされた主キーインデックスの数。
result_buffer_block_count
- 単位: Count
- 説明: 結果バッファ内のブロック数。
query_scan_bytes
- 単位: Bytes
- 説明: スキャンされたバイトの総数。
starrocks_be_files_scan_num_files_read
- 単位: Count
- 説明: 外部ストレージ(CSV, Parquet, ORC, JSON, Avro)から読み取られたファイルの数。ラベル:
file_format,scan_type。
starrocks_be_files_scan_num_bytes_read
- 単位: Bytes
- 説明: 外部ストレージから読み取られた総バイト数。ラベル:
file_format,scan_type。
starrocks_be_files_scan_num_raw_rows_read
- 単位: Count
- 説明: フィルタリング前に外部ストレージから読み取られた生の総行数。ラベル:
file_format,scan_type。
starrocks_be_files_scan_num_valid_rows_read
- 単位: Count
- 説明: 読み取られた有効な行数(フォーマットが無効な行を除く)。ラベル:
file_format,scan_type。
starrocks_be_files_scan_num_rows_return
- 単位: Count
- 説明: 述語フィルタリング後に返された行数。ラベル:
file_format,scan_type。
disk_reads_completed
- 単位: Count
- 説明: 正常に完了したディスク読み取りの数。
query_cache_hit_count
- 単位: Count
- 説明: クエリキャッシュのヒット数。
jemalloc_resident_bytes
- 単位: Bytes
- 説明: アロケータによってマッピングされた物理的に存在するデータページの最大バイト数で、アロケータメタデータ、アクティブな割り当てをサポートするページ、および未使用のダーティページを含みます。
blocks_open_writing (Deprecated)
disk_io_time_weigthed
- 単位: ms
- 説明: I/O に費やされた加重時間。
update_compaction_task_byte_per_second
- 単位: Bytes/s
- 説明: 主キーテーブルの Compaction の推定速度。
blocks_open_reading (Deprecated)
tablet_update_max_compaction_score
- 単位: -
- 説明: 現在の BE における主キーテーブルの最高の Compaction スコア。
segment_read
- 単位: Count
- 説明: セグメント読み取りの総数。
disk_io_time_ms
- 単位: ms
- 説明: I/O に費やされた時間。
load_mem_bytes
- 単位: Bytes
- 説明: データロードのメモリコスト。
delta_column_group_get_non_pk_total
- 単位: Count
- 説明: デルタカラムグループを取得する総回数(非主キーテーブルのみ)。
query_scan_bytes_per_second
- 単位: Bytes/s
- 説明: 秒あたりのスキャンされたバイトの推定速度。
active_scan_context_count
- 単位: Count
- 説明: Flink/Spark SQL によって作成されたスキャンタスクの総数。
fd_num_limit
- 単位: Count
- 説明: ファイルディスクリプタの最大数。
update_compaction_task_cost_time_ns
- 単位: ns
- 説明: 主キーテーブルの Compaction に費やされた総時間。
delta_column_group_get_hit_cache
- 単位: Count
- 説明: デルタカラムグループキャッシュのヒット総数(主キーテーブルのみ)。