GCS を使用して StarRocks をデプロイする
このトピックでは、共有データ StarRocks クラスタのデプロイと使用方法について説明します。この機能は、S3 互換ストレージでは v3.0 から、Azure Blob Storage では v3.1 からサポートされています。
注意
- StarRocks バージョン 3.1 では、共有データのデプロイと構成にいくつかの変更があります。バージョン 3.1 以上を使用している場合は、このドキュメントを使用してください。
- バージョン 3.0 を使用している場合は、3.0 ドキュメント を使用してください。
- 共有データ StarRocks クラスタは、データのバックアップとリストアをサポートしていません。
共有データ StarRocks クラスタは、ストレージとコンピュートの分離の前提に基づいてクラウド向けに特別に設計されています。データはオブジェクトストレージ(例えば、AWS S3、Google GCS、Azure Blob Storage、MinIO)に保存されます。これにより、より安価なストレージと優れたリソース分離だけでなく、クラスタの弾力的なスケーラビリティも実現できます。共有データ StarRocks クラスタのクエリパフォーマンスは、ローカルディスクキャッシュがヒットした場合、共有なし StarRocks クラスタと一致します。
バージョン 3.1 以降では、StarRocks 共有データクラスタは Frontend Engines (FEs) と Compute Nodes (CNs) で構成されています。CNs は、共有データクラスタにおける従来の Backend Engines (BEs) に取って代わります。
従来の共有なし StarRocks アーキテクチャと比較して、ストレージとコンピュートの分離は幅広い利点を提供します。これらのコンポーネントを分離することで、StarRocks は以下を提供します:
- 安価でシームレスにスケーラブルなストレージ。
- 弾力的にスケーラブルなコンピュート。データが Compute Nodes (CNs) に保存されないため、ノード間でのデータ移行やシャッフルなしにスケーリングが可能です。
- クエリパフォーマンスを向上させるためのホットデータ用ローカルディスクキャッシュ。
- オブジェクトストレージへの非同期データ取り込みにより、ロードパフォーマンスが大幅に向上します。
アーキテクチャ

共有データ StarRocks クラスタをデプロイする
共有データ StarRocks クラスタのデプロイは、共有なし StarRocks クラスタのデプロイと似ています。唯一の違いは、共有データクラスタでは BEs の代わりに CNs をデプロイする必要があることです。このセクションでは、共有データ StarRocks クラスタをデプロイする際に、FE と CN の構成ファイル fe.conf と cn.conf に追加する必要がある追加の FE と CN の構成項目のみをリストします。StarRocks クラスタのデプロイに関する詳細な手順については、 Deploy StarRocks を参照してください。
注意
このドキュメントの次のセクションで共有ストレージ用に構成されるまで、クラスタを 開始しないでください。
共有データ StarRocks 用の FE ノードを構成する
クラスタを開始する前に、FEs と CNs を構成します。以下に例として構成を示し、その後に各パラメータの詳細を示します。
GCS 用の FE 構成例
fe.conf に対する共有データの追加例は、各 FE ノードの fe.conf ファイルに追加できます。GCS ストレージは Cloud Storage XML API を使用してアクセスされるため、パラメータはプレフィックス aws_s3 を使用します。
run_mode = shared_data
cloud_native_meta_port = <meta_port>
cloud_native_storage_type = S3
# 例: testbucket/subpath
aws_s3_path = <s3_path>
# 例: us-east1
aws_s3_region = <region>
# 例: https://storage.googleapis.com
aws_s3_endpoint = <endpoint_url>
aws_s3_access_key = <HMAC access_key>
aws_s3_secret_key = <HMAC secret_key>