バージョン: Latest-4.1

Iceberg DDL 操作

このドキュメントでは、StarRocksにおけるIcebergカタログのデータ定義言語（DDL）操作について説明します。これには、データベース、テーブル、およびビューの作成と管理が含まれます。

DDL操作を実行するには、適切な権限が必要です。権限の詳細については、権限を参照してください。

データベースの作成

Icebergカタログにデータベースを作成します。この機能はv3.1以降でサポートされています。

構文

CREATE DATABASE [IF NOT EXISTS] <database_name>
[PROPERTIES ("location" = "<prefix>://<path_to_database>/<database_name.db>/")]

パラメータ

location: データベースが作成されるファイルパスを指定します。HDFSとクラウドストレージの両方がサポートされています。指定しない場合、データベースはIcebergカタログのデフォルトファイルパスに作成されます。

prefixは使用するストレージシステムに基づいて異なります：

HDFS: hdfs
Google GCS: gs
Azure Blob Storage (HTTP): wasb
Azure Blob Storage (HTTPS): wasbs
Azure Data Lake Storage Gen1: adl
Azure Data Lake Storage Gen2 (HTTP): abfs
Azure Data Lake Storage Gen2 (HTTPS): abfss
AWS S3またはS3互換ストレージ: s3

例

CREATE DATABASE iceberg_db
PROPERTIES ("location" = "s3://my_bucket/iceberg_db/");

データベースの削除

Icebergカタログから空のデータベースを削除します。この機能はv3.1以降でサポートされています。

注記

空のデータベースのみを削除できます。データベースを削除しても、ストレージ上のファイルパスは削除されません。

構文

DROP DATABASE [IF EXISTS] <database_name>

例

DROP DATABASE iceberg_db;

テーブルの作成

Icebergデータベースにテーブルを作成します。この機能はv3.1以降でサポートされています。

構文

CREATE TABLE [IF NOT EXISTS] [database.]table_name
(
    column_definition1[, column_definition2, ...],
    partition_column_definition1, partition_column_definition2, ...
)
[partition_desc]
[ORDER BY sort_desc]
[PROPERTIES ("key" = "value", ...)]
[AS SELECT query]

パラメータ

column_definition

col_name col_type [COMMENT 'comment'] [DEFAULT default_value]

注記

非パーティション列にはすべて NULL をデフォルト値として使用する必要があります。パーティション列は非パーティション列の後に定義する必要があり、NULL をデフォルト値として使用することはできません。

デフォルト値

v4.1以降、StarRocksはIcebergテーブルの列にデフォルト値を設定することをサポートしています。この機能には、Icebergフォーマットバージョン3（"format-version" = "3"）が必要です。

用途：

書き込み時の補完: INSERT文を実行する際、列に値が指定されていない場合、システムは自動的にその列のデフォルト値を使用します。
スキーマ進化時の補完: 既存のテーブルに新しい列を追加した後、古いデータファイル（新しい列を含まない）を読み取る際、システムは新しい列のデフォルト値を使用します。

構文:

col_name col_type DEFAULT default_value

要件:

テーブルはIcebergフォーマットバージョン3（"format-version" = "3"）を使用する必要があります。
数値型（INT、BIGINT、FLOAT、DOUBLE）、BOOLEAN、DATE/TIMESTAMP型のデフォルト値は二重引用符で囲む必要があります。例：DEFAULT "18"、DEFAULT "100.0"、DEFAULT "true"。
数値型（INT、BIGINT、FLOAT、DOUBLE）、BOOLEAN、STRING、DATE/TIMESTAMP型のデフォルト値は引用符で囲む必要があります。例：DEFAULT "18"、DEFAULT "100.0"、DEFAULT "true"。

例:

デフォルト値を持つテーブルを作成する:

CREATE TABLE user_info (
    id INT,
    name STRING,
    age INT DEFAULT "18",
    score DOUBLE DEFAULT "100.0",
    status STRING DEFAULT 'active',
    is_active BOOLEAN DEFAULT "true"
) PROPERTIES ("format-version" = "3");

デフォルト値を持つ列を追加する:

ALTER TABLE user_info ADD COLUMN bonus DOUBLE DEFAULT "50.5";

列のデフォルト値を変更する:

ALTER TABLE user_info MODIFY COLUMN status STRING DEFAULT "inactive";

partition_desc

PARTITION BY (partition_expr[, partition_expr...])

各 partition_expr は以下のいずれかです：

column_name（識別変換）
transform_expr(column_name)
transform_expr(column_name, parameter)

StarRocksは、Apache Iceberg仕様で定義されたパーティション変換式をサポートしています。

注記

パーティション列は、FLOAT、DOUBLE、DECIMAL、およびDATETIMEを除くすべてのデータ型をサポートしています。

ORDER BY (v4.0+)

Icebergテーブルのソートキーを指定します：

ORDER BY (column_name [ASC | DESC] [NULLS FIRST | NULLS LAST], ...)

PROPERTIES

主要なテーブルプロパティ：

location: テーブルのファイルパス。データベースレベルの場所を指定せずにAWS Glueを使用する場合に必要です。
file_format: ファイル形式。parquet のみがサポートされています（デフォルト）。
compression_codec: 圧縮アルゴリズム。オプション：SNAPPY、GZIP、ZSTD、LZ4（デフォルト：zstd）。

例

非パーティションテーブルを作成する：

CREATE TABLE unpartition_tbl
(
    id int,
    score double
);

パーティションテーブルを作成する：

CREATE TABLE partition_tbl
(
    action varchar(20),
    id int,
    dt date
)
PARTITION BY (id, dt);

隠しパーティションを持つテーブルを作成する：

CREATE TABLE hidden_partition_tbl
(
    action VARCHAR(20),
    id INT,
    dt DATE
)
PARTITION BY bucket(id, 10), year(dt);

SELECTを使用してテーブルを作成する：

CREATE TABLE new_tbl
PARTITION BY (id, dt)
AS SELECT * FROM existing_tbl;

テーブルの変更（パーティション仕様の変更）

パーティション列を追加または削除して、Icebergテーブルのパーティション仕様を変更します。

構文

ALTER TABLE [catalog.][database.]table_name
ADD PARTITION COLUMN partition_expr [, partition_expr ...];

ALTER TABLE [catalog.][database.]table_name
DROP PARTITION COLUMN partition_expr [, partition_expr ...];

サポートされている partition_expr 形式：

列名（識別変換）
変換式：year()、month()、day()、hour()、truncate()、bucket()

例

パーティション列を追加する：

ALTER TABLE sales_data
ADD PARTITION COLUMN month(sale_date), bucket(customer_id, 10);

パーティション列を削除する：

ALTER TABLE sales_data
DROP PARTITION COLUMN day(sale_date);

テーブルの削除

Icebergテーブルを削除します。この機能はv3.1以降でサポートされています。

テーブルを削除しても、デフォルトではストレージ上のファイルパスとデータは削除されません。

構文

DROP TABLE [IF EXISTS] <table_name> [FORCE]

パラメータ

FORCE: 指定すると、ファイルパスを保持したまま、ストレージ上のテーブルのデータを削除します。

例

DROP TABLE iceberg_db.sales_data;

-- データ削除を伴う強制削除
DROP TABLE iceberg_db.temp_data FORCE;

ビューの作成

Icebergビューを作成します。この機能はv3.5以降でサポートされています。

構文

CREATE VIEW [IF NOT EXISTS]
[<catalog>.<database>.]<view_name>
(
    <column_name> [COMMENT 'column comment']
    [, <column_name> [COMMENT 'column comment'], ...]
)
[COMMENT 'view comment']
[PROPERTIES ("key" = "value", ...)]
AS <query_statement>

例

CREATE VIEW IF NOT EXISTS iceberg_db.sales_summary AS
SELECT region, SUM(amount) as total_sales
FROM iceberg_db.sales
GROUP BY region;

プロパティを使用する場合（v4.0.3以降）：

CREATE VIEW IF NOT EXISTS iceberg_db.sales_summary
PROPERTIES (
  "key1" = "value1"
)
AS
SELECT region, SUM(amount) as total_sales
FROM iceberg_db.sales
GROUP BY region;

ビューの変更

既存のIcebergビューにStarRocks方言を追加または変更します。この機能はv3.5以降でサポートされています。

注記

各Icebergビューに対して1つのStarRocks方言のみを定義できます。

構文

ALTER VIEW [<catalog>.<database>.]<view_name>
(
    <column_name> [, <column_name>]
)
{ ADD | MODIFY } DIALECT
<query_statement>

例

StarRocks方言を追加する：

ALTER VIEW iceberg_db.spark_view ADD DIALECT
SELECT k1, k2 FROM iceberg_db.source_table;

StarRocks方言を変更する：

ALTER VIEW iceberg_db.spark_view MODIFY DIALECT
SELECT k1, k2, k3 FROM iceberg_db.source_table;

データベースの作成​

構文​

パラメータ​

例​

データベースの削除​

構文​

例​

テーブルの作成​

構文​

パラメータ​

column_definition​

デフォルト値​

partition_desc​

ORDER BY (v4.0+)​

PROPERTIES​

例​

テーブルの変更（パーティション仕様の変更）​

構文​

例​

テーブルの削除​

構文​

パラメータ​

例​

ビューの作成​

構文​

例​

ビューの変更​

構文​

例​

このドキュメントについてどう思いましたか？

データベースの作成

構文

パラメータ

例

データベースの削除

構文

例

テーブルの作成

構文

パラメータ

column_definition

デフォルト値

partition_desc

ORDER BY (v4.0+)

PROPERTIES

例

テーブルの変更（パーティション仕様の変更）

構文

例

テーブルの削除

構文

パラメータ

例

ビューの作成

構文

例

ビューの変更

構文

例