BE 配置项 - 查询引擎和导入导出
部分 BE 节点配置项为动态参数,您可以通过命令在线修改。其他配置项为静态参数,需要通过修改 be.conf 文件后重启 BE 服务使相关修改生效。
查看 BE 配置项
您可以通过以下命令查看 BE 配置项 :
SELECT * FROM information_schema.be_configs [WHERE NAME LIKE "%<name_pattern>%"]
配置 BE 参数
配置 BE 动态参数
您可以通过更新 information_schema.be_configs 中的值来配置 BE 节点的动态参数。
warning
设置无效的值可能会导致未知行为。在运行更新配置的命令之前,请务必仔细核对。
-- 将 <config_key> 替换为配置键,将 <config_value> 替换为配置值。
UPDATE information_schema.be_configs SET VALUE = <config_value> WHERE name = "<config_key>";
配置 BE 静态参数
BE 静态参数不支持在线修改,您需要在 be.conf 中修改并重启 BE 服务。
当前主题包含以下类型的 FE 配置:
查询引擎
dictionary_speculate_min_chunk_size
- 默认值:10000
- 类型:Int
- 单位:Rows
- 是否动态:否
- 描述:StringColumnWriter 和 DictColumnWriter 用于触发字典编码推测的最小行数(chunk 大小)。如果传入列(或累积缓冲区加上传入行)大小大于等于
dictionary_speculate_min_chunk_size,写入器将立即运行推测并设置一种编码(DICT、PLAIN 或 BIT_SHUFFLE),而不是继续缓冲更多行。对于字符串列,推测使用dictionary_encoding_ratio来决定字典编码是否有利;对于数值/非字符串列,使用dictionary_encoding_ratio_for_non_string_column。此外,如果列的 byte_size 很大(大于等于 UINT32_MAX),会强制立即进行推测以避免BinaryColumn<uint32_t>溢出。 - 引入版本:v3.2.0
disable_storage_page_cache
- 默认值:false
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:是否开启 PageCache。
- 开启 PageCache 后,StarRocks 会缓存最近扫描过的数据,
- 对于查询重复性高的场景,会大幅提升查询效率。
true表示不开启。- 自 2.4 版本起,该参数默认值由
true变更为false。自 3.1 版本起,该参数由静态变为动态。
- 引入版本:-
enable_bitmap_index_memory_page_cache
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:是否为 Bitmap index 开启 Memory Cache。使用 Bitmap index 加速点查时,可以考虑开启。
- 引入版本:v3.1
enable_compaction_flat_json
- 默认值:True
- 类型:Bool
- 单位:
- 是否动态:是
- 描述:控制是否为 Flat Json 数据进行 Compaction。
- 引入版本:v3.3.3
enable_json_flat
- 默认值:false
- 类型:Boolean
- 单位:
- 是否动态:是
- 描述:是否开启 Flat JSON 特性。开启后新导入的 JSON 数据会自动打平,提升 JSON 数据查询性能。
- 引入版本:v3.3.0
enable_lazy_dynamic_flat_json
- 默认值:True
- 类型:Bool
- 单位:
- 是否动态:是
- 描述:当查询在读过程中未命中 Flat JSON Schema 时,是否启用 Lazy Dynamic Flat JSON。当此项设置为
true时,StarRocks 将把 Flat JSON 操作推迟到计算流程,而不是读取流程。 - 引入版本:v3.3.3
enable_ordinal_index_memory_page_cache
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:是否为 Ordinal index 开启 Memory Cache。Ordinal index 是行号到数据 page position 的映射,可以加速 Scan。
- 引入版本:-
enable_string_prefix_zonemap
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:是否为字符串(CHAR/VARCHAR)列启用基于前缀的 Zonemap 索引。对于非键列,最小值/最大值会截断到由
string_prefix_zonemap_prefix_len配置的前缀长度。 - 引入版本:-
enable_zonemap_index_memory_page_cache
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:是否为 Zonemap index 开启 Memory Cache。使用 Zonemap index 加速 Scan 时,可以考虑开启。
- 引入版本:-
exchg_node_buffer_size_bytes
- 默认值:10485760
- 类型:Int
- 单位:Bytes
- 是否动态:是
- 描述:Exchange 算子中,单个查询在接收端的 Buffer 容量。这是一个软限制,如果数据的发送速度过快,接收端会触发反压来限制发送速度。
- 引入版本:-
exec_state_report_max_threads
- 默认值:2
- 类型:Int
- 单位:Threads
- 是否动态:是
- 描述:exec-state-report 线程池的最大线程数。该线程池由
ExecStateReporter用于将普通优先级的执行状态报告(如 Fragment 完成状态、错误状态等)从 BE 异步地通过 RPC 上报给 FE。启动时实际使用的线程数为max(1, exec_state_report_max_threads)。运行时修改此配置会触发对所有 Executor Set(共享和独占)中线程池调用update_max_threads。该线程池的任务队列大小固定为 1000,当所有线程繁忙且队列已满时,新的上报任务将被静默丢弃。高优先级线程池由priority_exec_state_report_max_threads控制。若在高并发查询场景下观察到执行状态上报延迟或丢失,可适当增大此值。 - 引入版本:v4.1.0, v4.0.8, v3.5.15
file_descriptor_cache_capacity
- 默认值:16384
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:文件描述符缓存的容量。
- 引入版本:-
flamegraph_tool_dir
- 默认值:
${STARROCKS_HOME}/bin/flamegraph - 类型:String
- 单位:-
- 是否动态:否
- 描述:火焰图工具的目录,该目录应包含 pprof、stackcollapse-go.pl 和 flamegraph.pl 脚本,用于从性能分析数据生成火焰图。
- 引入版本:-
fragment_pool_queue_size
- 默认值:2048
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:单 BE 节点上能够处理的查询请求上限。
- 引入版本:-
fragment_pool_thread_num_max
- 默认值:4096
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:最大查询线程数。
- 引入版本:-
fragment_pool_thread_num_min
- 默认值:64
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:最小查询线程数。
- 引入版本:-
hdfs_client_enable_hedged_read
- 默认值:false
- 类型:Boolean
- 单位:-
- 是否动态:否
- 描述:是否开启 Hedged Read 功能。
true表示开启,false表示不开启。 - 引入版本:v3.0
hdfs_client_hedged_read_threadpool_size
- 默认值:128
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:HDFS 客户端侧 Hedged Read 线程池的大小,即 HDFS 客户端侧允许有多少个线程用于服务 Hedged Read。该参数对应 HDFS 集群配置文件 hdfs-site.xml 中的
dfs.client.hedged.read.threadpool.size参数。 - 引入版本:v3.0
hdfs_client_hedged_read_threshold_millis
- 默认值:2500
- 类型:Int
- 单位:毫秒
- 是否动态:否
- 描述:发起 Hedged Read 请求前需要等待多少毫秒。例如,假设该参数设置为
30,那么如果一个 Read 任务未能在 30 毫秒内返回结果,则 HDFS 客户端会立即发起一个 Hedged Read,从目标数据块的副本上读取数据。该参数对应 HDFS 集群配置文件 hdfs-site.xml 中的dfs.client.hedged.read.threshold.millis参数。 - 引入版本:v3.0
io_coalesce_adaptive_lazy_active
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:根据谓词选择度,自适应决定是否将谓词列 IO 和非谓词列 IO 进行合并。
- 引入版本:v3.2
jit_lru_cache_size
- 默认值:0
- 类型:Int
- 单位:Bytes
- 是否动态:是
- 描述:JIT 编译的 LRU 缓存大小。如果设置为大于 0,则表示实际的缓存大小。如果设置为小于或等于 0,系统将自适应设置缓存大小,使用的公式为
jit_lru_cache_size = min(mem_limit*0.01, 1GB)(节点的mem_limit必须大于或等于 16 GB)。 - 引入版本:-
json_flat_column_max
- 默认值:100
- 类型:Int
- 单位:
- 是否动态:是
- 描述:控制 Flat JSON 时,最多提取的子列数量。该参数仅在
enable_json_flat为true时生效。 - 引入版本:v3.3.0
json_flat_create_zonemap
- 默认值:true
- 类型:Boolean
- 单位:
- 是否动态:是
- 描述:是否为打平后的 JSON 子列创建 Zonemap。仅当
enable_json_flat为true时生效。 - 引入版本:-
json_flat_null_factor
- 默认值:0.3
- 类型:Double
- 单位:
- 是否动态:是
- 描述:控制 Flat JSON 时,提取列的 NULL 值占比阈值,高于该比例不对该列进行提取,默认为 0.3。该参数仅在
enable_json_flat为true时生效。 - 引入版本:v3.3.0
json_flat_sparsity_factor
- 默认值:0.9
- 类型:Double
- 单位:
- 是否动态:是
- 描述:控制 Flat JSON 时,同名列的占比阈值,当同名列占比低于该值时不进行提取,默认为 0.9。该参数仅在
enable_json_flat为true时生效。 - 引入版本:v3.3.0
lake_tablet_ignore_invalid_delete_predicate
- 默认值:false
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:控制是否忽略 tablet rowset 元数据中可能由逻辑删除在列名重命名后引入到重复键(duplicate key)表中的无效 delete predicates 的布尔值。
- 引入版本:v4.0
max_hdfs_file_handle
- 默认值:1000
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:最多可以打开的 HDFS 文件描述 符数量。
- 引入版本:-
max_memory_sink_batch_count
- 默认值:20
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:Scan Cache 的最大缓存批次数量。
- 引入版本:-
max_pushdown_conditions_per_column
- 默认值:1024
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:单列上允许下推的最大谓词数量,如果超出数量限制,谓词不会下推到存储层。
- 引入版本:-
max_scan_key_num
- 默认值:1024
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:查询最多拆分的 Scan Key 数目。
- 引入版本:-
min_file_descriptor_number
- 默认值:60000
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:BE 进程中文件描述符的最小数量。
- 引入版本:-
object_storage_connect_timeout_ms
- 默认值:-1
- 类型:Int
- 单位:毫秒
- 是否动态:否
- 描述:对象存储 Socket 连接的超时时间。
-1表示使用 SDK 中的默认时间。 - 引入版本:v3.0.9
object_storage_request_timeout_ms
- 默认值:-1
- 类型:Int
- 单位:毫秒
- 是否动态:否
- 描述:对象存储 HTTP 连接的超时时间。
-1表示使用 SDK 中的默认时间。 - 引入版本:v3.0.9
parquet_late_materialization_enable
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:否
- 描述:是否使用延 迟物化优化 Parquet 读性能。
- 引入版本:-
parquet_page_index_enable
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:是否启用 Parquet 文件的 Bloom Filter 以提高性能。
true表示启用 Bloom Filter,false表示禁用。还可以使用系统变量enable_parquet_reader_bloom_filter在 Session 级别上控制这一行为。Parquet 中的 Bloom Filter 是在每个行组的列级维护的。如果 Parquet 文件包含某些列的 Bloom Filter,查询就可以使用这些列上的谓词来有效地跳过行组。 - 引入版本:v3.5
parquet_reader_bloom_filter_enable
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:控制是否启用 Parquet 文件的布隆过滤器以提升性能的布尔值。
true表示启用布隆过滤器,false表示禁用。也可以通过会话级别的系统变量enable_parquet_reader_bloom_filter控制此行为。Parquet 中的布隆过滤器是按“每个 row group 的列级别”维护的。如果 Parquet 文件为某些列维护了布隆过滤器,则对这些列的谓词可以高效地跳过不相关的 row group。 - 引入版本:v3.5
path_gc_check_step
- 默认值:1000
- 类型:Int
- 单位:-
- 是否动态:是
- 描述::单次连续 Scan 最大的文件数量。
- 引入版本:-
path_gc_check_step_interval_ms
- 默认值:10
- 类型:Int
- 单位:毫秒
- 是否动态:是
- 描述:多次连续 Scan 文件间隔时间。
- 引入版本:-
path_scan_interval_second
- 默认值:86400
- 类型:Int
- 单位:秒
- 是否动态:是
- 描述:GC 线程清理过期数据的间隔时间。
- 引入版本:-
pipeline_connector_scan_thread_num_per_cpu
- 默认值:8
- 类型:Double
- 单位:-
- 是否动态:是
- 描述:BE 节点中每个 CPU 核心分配给 Pipeline Connector 的扫描线程数量。自 v3.1.7 起变为动态参数。
- 引入版本:-
pipeline_poller_timeout_guard_ms
- 默认值:-1
- 类型:Int
- 单位:毫秒
- 是否动态:是
- 描述:当该值大于
0时,则在轮询器中,如果某个 Driver 的单次调度时间超过了pipeline_poller_timeout_guard_ms的时间,则会打印该 Driver 以及 Operator 信息。 - 引入版本:-
pipeline_prepare_thread_pool_queue_size
- 默认值:102400
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:Pipeline 执行引擎在线程池中执行 PREPARE Fragment 的队列长度。
- 引入版本:-
pipeline_prepare_thread_pool_thread_num
- 默认值:0
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:Pipeline 执行引擎准备片段线程池中的线程数。
0表示等于系统 VCPU 数量。 - 引入版本:-
priority_queue_remaining_tasks_increased_frequency
- 默认值:512
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:BlockingPriorityQueue 为避免任务饥饿提升剩余任务优先级的频率阈值(按获取次数计数)。累计弹出次数超过该值就会整体提升队列元素优先级并重建堆;值越小提升越频繁,减少饥饿但增加 CPU 开销。
- 引入版本:v3.2.0
pipeline_prepare_timeout_guard_ms
- 默认值:-1
- 类型:Int
- 单位:毫秒
- 是否动态:是
- 描述:当该值大于
0时,如果 PREPARE 过程中 Plan Fragment 超过pipeline_prepare_timeout_guard_ms的时间,则会打印 Plan Fragment 的堆栈跟踪。 - 引入版本:-
pipeline_scan_thread_pool_queue_size
- 默认值:102400
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:Pipeline 执行引擎扫描线程池任务队列的最大队列长度。
- 引入版本:-
pk_index_parallel_get_threadpool_size
- 默认值:1048576
- 类型:Int
- 单位:Tasks
- 是否动态:是
- 描述:设置用于 shared-data(cloud-native / lake)模式下 PK 索引并行获取操作的 "cloud_native_pk_index_get" 线程池的最大队列大小(待处理任务数量)。该池的实际线程数由
pk_index_parallel_get_threadpool_max_threads控制;此设置仅限制可排队等待执行的任务数量。非常大的默认值(2^20)实际上使队列近似无界;降低此值可以防止排队任务导致的内存过度增长,但在队列已满时可能导致任务提交阻塞或失败。应根据工作负载并发性和内存约束与pk_index_parallel_get_threadpool_max_threads一起调优。 - 引入版本:-
priority_exec_state_report_max_threads
- 默认值:2
- 类型:Int
- 单位:Threads
- 是否动态:是
- 描述:高优先级 exec-state-report 线程池的最大线程数。该线程池由
ExecStateReporter用于将高优先级执行状态报告(如紧急 Fragment 失败)从 BE 异步地通过 RPC 上报给 FE。与普通线程池不同,该线程池的任务队列无上限。启动时实际使用的线程数为max(1, priority_exec_state_report_max_threads)。运行时修改此配置会触发对所有 Executor Set(共享和独占)中优先级线程池调用update_max_threads。普通线程池由exec_state_report_max_threads控制。 - 引入版本:v4.1.0, v4.0.8, v3.5.15
query_cache_capacity
- 默认值:536870912
- 类型:Int
- 单位:Bytes
- 是否动态:否
- 描述:指定 Query Cache 的大小。默认为 512 MB。最小不低于 4 MB。如果当前的 BE 内存容量无法满足您期望的 Query Cache 大小,可以增加 BE 的内存容量,然后再设置合理的 Query Cache 大小。每个 BE 都有自己私有的 Query Cache 存储空间,BE 只 Populate 或 Probe 自己本地的 Query Cache 存储空间。
- 引入版本:-
query_pool_spill_mem_limit_threshold
- 默认值:1.0
- 类型:Double
- 单位:-
- 是否动态:否
- 描述:如果开启自动落盘功能, 当所有查询使用的内存超过
query_pool memory limit * query_pool_spill_mem_limit_threshold时,系统触发中间结果落盘。 - 引入版本:3.2.7
query_scratch_dirs
- 默认值:
${STARROCKS_HOME} - 类型:string
- 单位:-
- 是否动态:否
- 描述:用于查询执行在发生中间数据溢写(例如外部排序、哈希连接和其他算子)时的可写 scratch 目录的逗号分隔列表。指定一个或多个以
;分隔的路径(例如/mnt/ssd1/tmp;/mnt/ssd2/tmp)。这些目录应当对 BE 进程可访问且可写,并具有足够的可用空间;StarRocks 会在它们之间选择以分散溢写 I/O。更改此项需要重启才能生效。如果目录丢失、不可写或已满,溢写可能失败或导致查询性能下降。 - 引入版本:v3.2.0
result_buffer_cancelled_interval_time
- 默认值:300
- 类型:Int
- 单位:秒
- 是否动态:是
- 描述:BufferControlBlock 释放数据的等待时间。
- 引入版本:-
scan_context_gc_interval_min
- 默认值:5
- 类型:Int
- 单位:Minutes
- 是否动态:是
- 描述:Scan Context 的清理间隔。
- 引入版本:-
scanner_row_num
- 默认值:16384
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:每个扫描线程单次执行最多返回的数据行数。
- 引入版本:-
scanner_thread_pool_queue_size
- 默认值:102400
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:存储引擎支持的扫描任务数。
- 引入版本:-
scanner_thread_pool_thread_num
- 默认值:48
- 类型:Int
- 单位:-
- 是否动态 :是
- 描述:存储引擎并发扫描磁盘的线程数,统一管理在线程池中。
- 引入版本:-
max_hdfs_scanner_num
- 默认值:50
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:限制 ConnectorScanNode 可同时运行的远端扫描器(HDFS/对象存储等)数量上限。启动时会用此值裁剪估算并发,运行时调度 pending scanner 也会受其限制,用于控制线程、内存和文件句柄压力。
- 引入版本:v3.2.0
string_prefix_zonemap_prefix_len
- 默认值:16
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:启用
enable_string_prefix_zonemap时用于字符串 Zonemap 最小值/最大值的前缀长度。 - 引入版本:-
udf_thread_pool_size
- 默认值:1
- 类型:Int
- 单位:Threads
- 是否动态:否
- 描述:设置在 ExecEnv 中创建的 UDF 调用 PriorityThreadPool 的大小(用于执行用户自定义 函数/UDF 相关任务)。该值既作为线程池的线程数,也在构造线程池时作为队列容量(PriorityThreadPool("udf", thread_num, queue_size))。增大该值可以允许更多并发的 UDF 执行;保持较小可避免过度的 CPU 和内存争用。
- 引入版本:v3.2.0
update_memory_limit_percent
- 默认值:60
- 类型:Int
- 单位:Percent
- 是否动态:否
- 描述:BE 进程内存中为更新相关内存和缓存保留的比例。在启动期间,
GlobalEnv将更新的MemTracker计算为 process_mem_limit * clamp(update_memory_limit_percent, 0, 100) / 100。UpdateManager也使用该百分比来确定其 primary-index/index-cache 的容量(index cache capacity = GlobalEnv::process_mem_limit * update_memory_limit_percent / 100)。HTTP 配置更新逻辑会注册一个回调,在配置更改时调用 update managers 的update_primary_index_memory_limit,因此配置更改会应用到更新子系统。增加此值会为更新/primary-index 路径分配更多内存(减少其他内存池可用内存);减少它会降低更新内存和缓存容量。值会被限定在 0–100 范围内。 - 引入版本:v3.2.0
导入导出
clear_transaction_task_worker_count
- 默认值:1
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:清理事务的线程数。
- 引入版本:-
column_mode_partial_update_insert_batch_size
- 默认值:4096
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:列模式部分更新中处理插入行时的批次大小。如果设置为
0或负数,将会被限制为1以避免无限循环。该参数控制每次批量处理新插入行的数量,较大的值可以提高写入性能但会占用更多内存。 - 引入版本:v3.5.10, v4.0.2
partial_update_memory_limit_per_worker
- 默认值:1073741824
- 类型:Int
- 单位:Bytes
- 是否动态:是
- 描述:部分更新(partial update)每个工作线程的内存上限,用于限制单个 worker 在处理 partial update 时的内存占用。
enable_load_spill_parallel_merge
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:是否启用单个 Tablet 内部的并行 Spill Merge。启用后可以提高导入过程中 Spill Merge 的性能。
- 引入版本:-
enable_parallel_memtable_finalize
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:是否在存算分离(Lake)表导入数据时启用并行 MemTable Finalize。启用后,MemTable 的 Finalize 操作(排序/聚合)将从写入线程移至 Flush 线程执行,使写入线程可以继续向新的 MemTable 插入数据,同时前一个 MemTable 正在并行进行 Finalize 和 Flush。这可以通过重叠 CPU 密集型的 Finalize 操作与 I/O 密集型的 Flush 操作来显著提高导入吞吐量。注意:当需要填充自增列时,此优化会自动禁用,因为自增 ID 的分配必须在 MemTable 提交 Flush 之前完成。
- 引入版本:-
allow_list_object_for_random_bucketing_on_cache_miss
- 默认值:true
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:控制 random bucketing 大小检查在 Lake metadata 缓存未命中时是否允许回退到对象存储 LIST。
true表示回退到 LIST 元数据文件计算 base size(历史行为、估算更准确);false表示跳过 LIST,直接使用base_size = 0,可减少 LIST object 请求,但因大小估算精度下降,可能使 immutable 标记稍晚触发。 - 引入版本:4.1.0, 4.0.7, 3.5.15
enable_stream_load_verbose_log
- 默认值:false
- 类型:Boolean
- 单位:-
- 是否动态:是
- 描述:是否在日志中记录 Stream Load 的 HTTP 请求和响应信息。
true表示启用,false表示不启用。 - 引入版本:v2.5.17, v3.0.9, v3.1.6, v3.2.1
flush_thread_num_per_store
- 默认值:2
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:每个 Store 用以 Flush MemTable 的线程数。
- 引入版本:-
lake_flush_thread_num_per_store
- 默认值:0
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:在存算分离集群中,每个 Store 用以 Flush MemTable 的线程数。当该参数被设置为
0时,系统使用 CPU 核数的两倍。 当该参数被设置为小于0时,系统使用该参数的绝对值与 CPU 核数的乘积。 - 引入版本:3.1.12, 3.2.7
load_data_reserve_hours
- 默认值:4
- 类型:Int
- 单位:Hours
- 是否动态:否
- 描述:小批量导入生成的文件保留的时长。
- 引入版本:-
load_error_log_reserve_hours
- 默认值:48
- 类型:Int
- 单位:Hours
- 是否动态:是
- 描述:导入数据信息保留的时长。
- 引入版本:-
load_process_max_memory_limit_bytes
- 默认值:107374182400
- 类型:Int
- 单位:Bytes
- 是否动态:否
- 描述:单节点上所有的导入线程占据的内存上限。
- 引入版本:-
load_spill_memory_usage_per_merge
- 默认值:1073741824
- 类型:Int
- 单位:Bytes
- 是否动态:是
- 描述:Spill Merge 期间每次 Merge 操作的最大内存使用量。默认为 1GB (1073741824 字节)。该参数用于控制导入过程中 Spill Merge 时单个 Merge 任务的内存占用,避免内存使用过高。
- 引入版本:-
max_consumer_num_per_group
- 默认值:3
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:Routine load 中,每个 Consumer Group 内最大的 Consumer 数量。
- 引入版本:-
max_pulsar_consumer_num_per_group
- 默认值:1
- 类型:Int
- 单位:-
- 是否动态:否
- 描述:Pulsar Routine Load 每个 Consumer Group 允许的最大 Consumer 数量上限。
- 引入版本:-
max_runnings_transactions_per_txn_map
- 默认值:100
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:每个分区内部同时运行的最大事务数量。
- 引入版本:-
number_tablet_writer_threads
- 默认值:0
- 类型:Int
- 单位:-
- 是否动态:是
- 描述:导入用的 tablet writer 线程数, 用于 Stream Load、Broker Load、Insert 等。当参数设置为小于等于 0 时,系统使用 CPU 核数的二分之一,最小为 16。当参数设置为大于 0 时,系统使用该值。自 v3.1.7 起变为动态参数。
- 引入版本:-
push_worker_count_high_priority
- 默认值:3
- 类型:Int