cardinality
功能
计算 Map 中元素的个数,返回值类型是 INT。MAP 中保存的是键值对 (key-value pair),比如 {"a":1, "b":2}
。一个键值对算作一个元素,{"a":1, "b":2}
的元素个数为 2。
该函数从 3.0 版本开始支持。函数别名为 map_size。
语法
INT cardinality(any_map)
参数说明
any_map
: 要获取元素个数的 MAP 值。
返回值说明
返回 INT 类型的值。如果输入参数是 NULL,结果也是 NULL。
MAP 中的 Key 和 Value 可以为 NULL,会正常计算。
示例
查询 StarRocks 本地表中的 MAP 数据
3.1 版本支持在建表时定义 MAP 类型的列,以创建表 test_map
为例。
CREATE TABLE test_map(
col_int INT,
col_map MAP<VARCHAR(50),INT>
)
DUPLICATE KEY(col_int);
INSERT INTO test_map VALUES
(1,map{"a":1,"b":2}),
(2,map{"c":3}),
(3,map{"d":4,"e":5});
SELECT * FROM test_map ORDER BY col_int;
+---------+---------------+
| col_int | col_map |
+---------+---------------+
| 1 | {"a":1,"b":2} |
| 2 | {"c":3} |
| 3 | {"d":4,"e":5} |
+---------+---------------+
计算 col_map
列每行的元素个数。
SELECT cardinality(col_map) FROM test_map ORDER BY col_int;
+----------------------+
| cardinality(col_map) |
+----------------------+
| 2 |
| 1 |
| 2 |
+----------------------+
查询外部数据湖中的 MAP 数据
假设 Hive 中有表 hive_map
,数据如下:
SELECT * FROM hive_map ORDER BY col_int;
+---------+---------------+
| col_int | col_map |
+---------+---------------+
| 1 | {"a":1,"b":2} |
| 2 | {"c":3} |
| 3 | {"d":4,"e":5} |
+---------+---------------+
3 rows in set (0.05 sec)
通过在 StarRocks 集群中创建 Hive catalog 来访问该表,计算 col_map
列每行的元素个数。
SELECT cardinality(col_map) FROM hive_map ORDER BY col_int;
+----------------------+
| cardinality(col_map) |
+----------------------+
| 2 |
| 1 |
| 2 |
+----------------------+
3 rows in set (0.05 sec)