Data loading
🗃️ 导入概览
4 个项目
🗃️ 从对象存储导入
4 个项目
📄️ 从本地文件系统导入
StarRocks 提供两种导入方式帮助您从本地文件系统导入数据:
📄️ 从 HDFS 导入
StarRocks 支持通过以下方式从 HDFS 导入数据:
📄️ 从云存储导入
StarRocks 支持通过两种方式从云存储系统导入大批量数据:Broker Load 和 INSERT。
🗃️ 从 Apache Kafka® 导入
2 个项目
🗃️ 从 Apache Spark™ 导入
2 个项目
📄️ 通过 INSERT 语句导入数据
本文介绍如何使用 INSERT 语句向 StarRocks 导入数据。
📄️ 使用 Stream Load 事务接口导入
为了支持和 Apache Flink®、Apache Kafka® 等其他系统之间实现跨系统的两阶段提交,并提升高并发 Stream Load 导入场景下的性能,StarRocks 自 2.4 版本起提供 Stream Load 事务接口。
📄️ 从 MySQL 实时同步
StarRocks 支持多种方式将 MySQL 的数据实时同步至 StarRocks,支撑实时分析和处理海量数据的需求。
📄️ 从 Apache Flink® 持续导入
StarRocks 提供 Apache Flink® 连接器 (以下简称 Flink connector),可以通过 Flink 导入数据至 StarRocks表。
📄️ 通过导入实现数据变更
StarRocks 的主键表支持通过 Stream Load、Broker Load 或 Routine Load 导入作业,对 StarRocks 表进行数据变更,包括插入、更新和删除数据。不支持通过 Spark Load 导入作业或 INSERT 语句对 StarRocks 表进行数据变更。
📄️ 导入过程中实现数据转换
StarRocks 支持在导入数据的过程中实现数据转换。
📄️ 使用工具导入
除了导入章节上面重点介绍的几种导入方式外,StarRocks 和生态伙伴还提供如下工具支持帮助您轻松实现 StarRocks 与外部数据库的集成。
📄️ 严格模式
严格模式 (Strict Mode) 是导入操作中的一个选配项,其设置会影响 StarRocks 对某些数据的导入行为和最终导入到 StarRocks 中的结果数据。