データロード
🗃️ ロード概要
5項目
🗃️ オブジェクトストレージからのロード
8項目
📄️ ローカルファイルシステムからデータをロードする
curl コマンドを使用してローカルファイルシステムから CSV、JSON、Parquet、ORC 形式でデータをロードする Stream Load の方法。
📄️ HDFS からのデータロード
HDFS から INSERT+FILES()、Broker Load、Spark Load を使用してデータをロードする方法。
🗃️ Apache Kafka からのデータロード
2項目
🗃️ Apache Spark からのデータロード
2項目
📄️ INSERT を使用したデータのロード
INSERT ステートメント(INSERT VALUES、INSERT INTO SELECT、INSERT OVERWRITE)を使用して StarRocks にデータをロードする方法。
📄️ SQL トランザクション
StarRocks で複数の DML ステートメント(INSERT、UPDATE、DELETE)を複数テーブル間で原子的にコミットする SQL トランザクションの使用方法。
📄️ Stream Load トランザクションインターフェースを使用したデータのロード
Flink または Kafka からのデータロード用に Stream Load トランザクションインターフェース(2 フェーズコミット)で複数テーブルトランザクションを実装する方法。
📄️ MySQL からのリアルタイム同期
Flink CDC を使用して MySQL の変更データをリアルタイムでキャプチャし、StarRocks Flink コネクタで StarRocks テーブルに同期する方法。
📄️ Apache Flink® からデータを継続的にロードする
StarRocks Flink コネクタは DataStream API・Table API & SQL・Python API に対応し、Flink から StarRocks への継続的なデータロードを実現します。
📄️ Apache® Pulsar™ からのデータを継続的にロードする
Routine Load を使用して Apache Pulsar トピックから CSV および JSON 形式でデータを継続的にロードする方法。
📄️ ロードによるデータ変更
Stream Load、Broker Load、Routine Load を使用して Primary Key テーブルで INSERT、UPDATE、DELETE、部分更新、条件付き更新を実行する方法。
📄️ ロード時のデータ変換
Stream Load・Broker Load・Routine Load で列マッピング・フィルタ条件・派生列式を使用したロード時のデータ変換が可能です。
📄️ ツールを使用したデータロード
SMT、DataX、DBT、CloudCanal などのサードパーティツールおよびエコシステム統合によるデータロード。
📄️ Strict mode
StarRocks データロード時の Strict mode:設定方法、制御内容、列型変換失敗時の行拒否タイミング。