CREATE PIPE
Description
指定されたソースデータファイルから宛先テーブルにデータをロードするために使用される INSERT INTO SELECT FROM FILES ステートメントを定義する新しいパイプを作成します。このコマンドは v3.2 以降でサポートされています。
Syntax
CREATE [OR REPLACE] PIPE [db_name.]<pipe_name>
[PROPERTIES ("<key>" = "<value>"[, "<key> = <value>" ...])]
AS <INSERT_SQL>
StarRocks は v3.2.3 以降で CREATE [OR REPLACE] PIPE をサポートしています。CREATE [OR REPLACE] PIPE を使用してパイプを作成し、pipe_name
に指定されたパイプ名が現在のデータベース内の既存のパイプ名と同じ場合、既存のデータベースは新しいパイプによって置き換えられます。
Parameters
db_name
パイプが属するデータベースのユニークな名前。
NOTICE
各パイプは特定のデータベースに属します。パイプが属するデータベースを削除すると、パイプもデータベースと共に削除され、データベースが復元されてもパイプは復元されません。
pipe_name
パイプの名前。パイプ名は、パイプが作成されるデータベース内でユニークでなければなりません。命名規則については、System limits を参照してください。
INSERT_SQL
指定されたソースデータファイルから宛先テーブルにデータをロードするために使用される INSERT INTO SELECT FROM FILES ステートメント。
FILES() テーブル関数の詳細については、FILES を参照してください。
PROPERTIES
パイプを実行する方法を指定するオプションのパラメータセット。形式: "key" = "value"
。
Property | Default value | Description |
---|---|---|
AUTO_INGEST | TRUE | 自動インクリメンタルデータロードを有効にするかどうか。 有効な値: TRUE と FALSE 。このパラメータを TRUE に設定すると、自動インクリメンタルデータロードが有効になります。このパラメータを FALSE に設定すると、ジョブ作成時に指定されたソースデータファイルの内容のみがロードされ、その後の新規または更新されたファイルの内容はロードされません。バルクロードの場合、このパラメータを FALSE に設定できます。 |
POLL_INTERVAL | 300 second | 自動インクリメンタルデータロードのポーリング間隔。 |
BATCH_SIZE | 1GB | バッチとしてロードされるデータのサイズ。このパラメータ値に単位を含めない場合、デフォルトの単位バイトが使用されます。 |
BATCH_FILES | 256 | バッチとしてロードされるソースデータファイルの数。 |
Examples
サンプルデータセット s3://starrocks-examples/user_behavior_ten_million_rows.parquet
のデータを user_behavior_replica
テーブルにロードするために、現在のデータベースに user_behavior_replica
という名前のパイプを作成します:
CREATE PIPE user_behavior_replica
PROPERTIES
(
"AUTO_INGEST" = "TRUE"
)
AS
INSERT INTO user_behavior_replica
SELECT * FROM FILES
(
"path" = "s3://starrocks-examples/user_behavior_ten_million_rows.parquet",
"format" = "parquet",
"aws.s3.region" = "us-east-1",
"aws.s3.access_key" = "AAAAAAAAAAAAAAAAAAAA",
"aws.s3.secret_key" = "BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB"
);
NOTE
上記のコマンドで
AAA
とBBB
の部分をあなたの資格情報に置き換えてください。オブジェクトは任意の AWS 認証ユーザーによって読み取り可能であるため、有効なaws.s3.access_key
とaws.s3.secret_key
を使用できます。
この例では、IAM ユーザー認証方法と、StarRocks テーブルと同じスキーマを持つ Parquet ファイルを使用しています。他の認証方法や CREATE PIPE の使用法については、Authenticate to AWS resources および FILES を参照してください。