跳到主要内容

版本：Latest-4.1

导入数据

🗃️ 导入概览

5 个项目

🗃️ 从对象存储导入

8 个项目

📄️ 从本地文件系统导入数据

StarRocks 提供了两种从本地文件系统导入数据的方法：

📄️ 从 HDFS 导入

StarRocks 支持通过以下方式从 HDFS 导入数据：

🗃️ 从 Apache Kafka® 导入

2 个项目

🗃️ 从 Apache Spark™ 导入

2 个项目

📄️ 通过 INSERT 语句导入数据

本文介绍如何使用 INSERT 语句向 StarRocks 导入数据。

📄️ SQL 事务

通过简易的 SQL 事务批量提交多个 INSERT 语句。

📄️ 使用 Stream Load 事务接口导入

为了支持和 Apache Flink®、Apache Kafka® 等其他系统之间实现跨系统的两阶段提交，并提升高并发 Stream Load 导入场景下的性能，StarRocks 自 2.4 版本起提供 Stream Load 事务接口。

📄️ 从 MySQL 实时同步

StarRocks 支持多种方式将 MySQL 的数据实时同步至 StarRocks，支撑实时分析和处理海量数据的需求。

📄️ 从 Apache Flink® 持续导入

StarRocks 提供 Apache Flink® 连接器 (以下简称 Flink connector)，可以通过 Flink 导入数据至 StarRocks表。

📄️ 从 Apache® Pulsar™ 持续导入数据

从 StarRocks 2.5 版本开始，Routine Load 支持从 Apache® Pulsar™ 持续导入数据。Pulsar 是一个分布式的开源发布-订阅消息和流处理平台，具有存储与计算分离的架构。通过 Routine Load 从 Pulsar 导入数据与从 Apache Kafka 导入数据类似。本主题以 CSV 格式的数据为例，介绍如何通过 Routine Load 从 Apache Pulsar 导入数据。

📄️ 通过导入实现数据变更

StarRocks 的主键表支持通过 Stream Load、Broker Load 或 Routine Load 导入作业，对 StarRocks 表进行数据变更，包括插入、更新和删除数据。不支持通过 Spark Load 导入作业或 INSERT 语句对表进行数据变更。

📄️ 导入过程中实现数据转换

StarRocks 支持在导入数据的过程中实现数据转换。

📄️ 使用工具导入

除了导入章节上面重点介绍的几种导入方式外，StarRocks 和生态伙伴还提供如下工具支持帮助您轻松实现 StarRocks 与外部数据库的集成。

📄️ 严格模式

严格模式 (Strict Mode) 是导入操作中的一个选配项，其设置会影响 StarRocks 对某些数据的导入行为和最终导入到 StarRocks 中的结果数据。

文档是否有帮助？

Rocky the happy otter

StarRocks Assistant

AI generated answers are based on docs and other sources. Please test answers in non-production environments.