使用标签管理 BE 节点
自 3.2.8 版本起,StarRocks 支持使用标签对 BE 节点进行分组。您在建表或创建异步物化视图时可以通过指定和 BE 节点相同标签来使数据副本分布到指定的标签所对应的 BE 节点上。数据副本在相同标签的节点下会均匀分布,该特性可以提高数据高可用和资源隔离性能。
使用方式
为 BE 节点添加标签
假设 StarRocks 集群中存在六个 BE 节点,平均分布在三个机架中,则您可以按 BE 节点所在机架,为 BE 节点添加标签。
ALTER SYSTEM MODIFY BACKEND "172.xx.xx.46:9050" SET ("labels.location" = "rack:rack1");
ALTER SYSTEM MODIFY BACKEND "172.xx.xx.47:9050" SET ("labels.location" = "rack:rack1");
ALTER SYSTEM MODIFY BACKEND "172.xx.xx.48:9050" SET ("labels.location" = "rack:rack2");
ALTER SYSTEM MODIFY BACKEND "172.xx.xx.49:9050" SET ("labels.location" = "rack:rack2");
ALTER SYSTEM MODIFY BACKEND "172.xx.xx.50:9050" SET ("labels.location" = "rack:rack3");
ALTER SYSTEM MODIFY BACKEND "172.xx.xx.51:9050" SET ("labels.location" = "rack:rack3");
添加标签后,可以执行 SHOW BACKENDS;
,在返回结果的 Location
字段中查看 BE 节点的标签。
如果需要修改 BE 节点的标签,可以执行 ALTER SYSTEM MODIFY BACKEND "172.xx.xx.48:9050" SET ("labels.location" = "rack:xxx");
。
使用标签指定表的数据在 BE 节点上的分布
如果您需要指定表的数据分布的位置,比如分布在两个机架中 rack1 和 rack2,则您可以为表添加标签。
添加标签后,表中相同 Tablet 的副本按 Round Robin 的方式选取所在的标签。并且同一标签中如果同一 Tablet 的副本存在多个,则这些同一 Tablet 的多个副本会尽可能均匀分布在该标签内的不同的 BE 节点上。
- 为表指定的标签所包含的 BE 节点数如果小于副本数,将会优先保 证数据的副本数满足要求,这种情况下并不能保证副本按照标签进行分布。
- 为表指定的标签必须已经存在,否则会报错
Getting analyzing error. Detail message: Cannot find any backend with location: rack:xxx
。
建表时
建表时指定表的数据分布在 rack 1 和 rack 2,可以通过设置表属性 "labels.location"
的值来指定数据分布的标签:
CREATE TABLE example_table (
order_id bigint NOT NULL,
dt date NOT NULL,
user_id INT NOT NULL,
good_id INT NOT NULL,
cnt int NOT NULL,
revenue int NOT NULL
)
PROPERTIES
("labels.location" = "rack:rack1,rack:rack2");
对于新建的表,表属性 labels.location
默认为 *
,表示副本在所有标签中均匀分布。
如果新建的表的数据分布无需感知集群中服务器的地理位置信息,可以手动设置表属性 "labels.location" = ""
。
建表后
建表后如果需要修改表的数据分布位置,例如修改为 rack 1、rack 2 和 rack 3,则可以执行如下语句:
ALTER TABLE example_table
SET ("labels.location" = "rack:rack1,rack:rack2,rack:rack3");
如果您升级 StarRocks 至 3.2.8 或者以后版本,对于升级前已经创建的历史表,默认不使用标签分布数据。如果需要按照标签分布历史表数据,则可以执行如下语句,为历史表添加标签:
ALTER TABLE example_table1
SET ("labels.location" = "rack:rack1,rack:rack2");
使用标签指定物化视图的数据在 BE 节点上的分布
如果您需要指定异步物化视图的数据分布的位置,比如分布在两个机架中 rack1 和 rack2,则您可以为物化视图添加标签。
添加标签后,物化视图中相同 Tablet 的副本按 Round Robin 的方式选取所在的标签。并且同一标签中如果同一 Tablet 的副本存在多个,则这些同一 Tablet 的多个副本会尽可能均匀分布在该标签内的不同的 BE 节点上。
- 为物化视图指定的标签所包含的 BE 节点数如果小于副本数,将会优先保证数据的副本数满足要求,这种情况下并不能保证副本按照标签进行分布。
- 为物化视图指定的标签必须已经存在,否则会报错
Getting analyzing error. Detail message: Cannot find any backend with location: rack:xxx
。
建物化视图时
建物化视图时指定物化视图的数据分布在 rack 1 和 rack 2,则可以执行如下语句:
CREATE MATERIALIZED VIEW mv_example_mv
DISTRIBUTED BY RANDOM
PROPERTIES (
"labels.location" = "rack:rack1,rack:rack2")
as
select order_id, dt from example_table;
对于新建的物化视图,属性 labels.location
默认为 *
,表示副本在所有标 签中均匀分布。
如果新建的物化视图的数据分布无需感知集群中服务器的地理位置信息,可以手动设置物化视图属性 "labels.location" = ""
。
建物化视图后
建物化视图后如果需要修改物化视图的数据分布位置,例如修改为 rack 1、rack 2 和 rack 3,则可以执行如下语句:
ALTER MATERIALIZED VIEW mv_example_mv
SET ("labels.location" = "rack:rack1,rack:rack2,rack:rack3");
如果您升级 StarRocks 至 3.2.8 或者以后版本,对于升级前已经创建的物化视图,默认不使用标签分布数据。如果需要按照标签分布历史物化视图的数据,则可以执行如下语句,为物化视图添加标签:
ALTER TABLE example_mv1
SET ("labels.location" = "rack:rack1,rack:rack2");