データレイク
🗃️ カタログ
10項目
📄️ 外部テーブル
v3.0以降、Hive、Iceberg、Hudiからデータをクエリするために、catalogを使用することを推奨します。Hive catalog、Iceberg catalog、Hudi catalogを参照してください。
📄️ ファイル外部テーブル
ファイル外部テーブルは、特別なタイプの外部テーブルです。データを StarRocks にロードすることなく、外部ストレージシステムにある Parquet および ORC データファイルを直接クエリできます。さらに、ファイル外部テーブルはメタストアに依存しません。現在のバージョンでは、StarRocks は以下の外部ストレージシステムをサポートしています: HDFS、Amazon S3、およびその他の S3 互換ストレージシステム。
📄️ Data Cache
このトピックでは、Data Cache の動作原理と、外部データのクエリパフォーマンスを向上させるために Data Cache を有効にする方法について説明します。
📄️ データレイク FAQ
このトピックでは、データレイクに関するよくある質問 (FAQ) とそれらの問題に対する解決策を説明します。このトピックで言及されているいくつかのメトリクスは、SQL クエリのプロファイルからのみ取得できます。SQL クエリのプロファイルを取得するには、set enable_profile=true を指定する必要があります。
📄️ Feature Support
v2.3以降、StarRocksは外部カタログを介して外部データソースの管理とデータレイク内のデータ分析をサポートしています。