共有データクラスタの Compaction
このトピックでは、StarRocks 共有データクラスタでの compaction の管理方法について説明します。
概要
StarRocks における compaction とは、異なるバージョンのデータファイルをより大きなファイルにマージするプロセスを指し、小さなファイルの数を減らし、クエリ効率を向上させます。共有なしクラスタと比較して、共有データクラスタは新しい compaction スケジューリングメカニズムを導入しています。特徴は以下の通りです:
- Compaction は FE によってスケジュールされ、CN によって実行されます。FE はパーティション単位で compaction タスクを開始します。
- 各 compaction は、データロードの完全なトランザクションプロセス(書き込み、コミット、公開)に従って、新しいデータバージョンを生成します。