loading_spark | StarRocks

バージョン: 3.1

📄️ Spark コネクタを使用したデータのロード (推奨)

StarRocks は、Apache Spark™ 用の StarRocks Connector（以下、Spark コネクタ）という独自開発のコネクタを提供しており、Spark を使用して StarRocks テーブルにデータをロードするのに役立ちます。基本的な原則は、データを蓄積し、STREAM LOAD を通じて一度にすべてのデータを StarRocks にロードすることです。Spark コネクタは Spark DataSource V2 に基づいて実装されています。DataSource は Spark DataFrames または Spark SQL を使用して作成できます。バッチモードと構造化ストリーミングモードの両方がサポートされています。

📄️ Spark Load を使用した大量データのロード

このロードは、外部の Apache Spark™ リソースを使用してインポートデータを事前処理し、インポートのパフォーマンスを向上させ、計算リソースを節約します。主に初期移行や大規模データのインポートに使用されます（データ量は TB レベルまで）。

📄️ Spark コネクタを使用したデータのロード (推奨)

📄️ Spark Load を使用した大量データのロード

このドキュメントについてどう思いましたか？