StarRocks version 4.1
4.1.0-RC
リリース日:2026年2月28日
共有データアーキテクチャ
- 新しいマルチテナントデータ管理 共有データクラスタで、レンジベースのデータ分散および Tablet の自動分割をサポートしました。Tablet が肥大化した場合やホットスポットが発生した場合でも、スキーマ変更や SQL 修正、データ再投入なしで自動分割が可能です。マルチテナント環境におけるデータスキューやホットスポット問題を直接的に緩和します。 #65199 #66342 #67056 #67386 #68342 #68569 #66743
- 大容量 Tablet サポート(フェーズ1) 共有データクラスタで、Tablet あたりのデータ容量を大幅に拡張しました(長期目標:100GB/Tablet)。フェーズ1では、単一 Lake Tablet 内での並列 Compaction と並列 MemTable Finalize を実装し、Tablet サイズ増加時の取り込みおよび Compaction のオーバーヘッドを削減します。 #66586 #68677
- Fast Schema Evolution V2 秒単位で DDL を実行可能な Fast Schema Evolution V2 を共有データクラスタでサポートし、マテリアライズドビューにも対応しました。 #65726 #66774 #67915
- [Beta] 共有データ向け転置インデックス 共有データクラスタで組み込み転置インデックスを利用可能にし、テキストフィルタや全文検索ワークロードを高速化します。 #66541
- キャッシュ可観測性の向上 監査ログおよび監視システムにキャッシュヒット率を公開し、キャッシュの可視性とレイテンシ予測性を向上しました。メモリ/ディスククォータ、ページキャッシュ統計、テーブル別ヒット率などの詳細な Data Cache 指標を提供します。 #63964
- Lake テーブルでソートキー範囲に基づく Segment メタデータフィルタを追加し、レンジ条件クエリ時の I/O を削減。 #68124
- Lake DeltaWriter の高速キャンセルをサポートし、キャンセルされた取り込みジョブの遅延を削減。 #68877
- 自動クラスタスナップショットの間隔ベーススケジューリングをサポート。 #67525
データレイク分析
- Iceberg DELETE サポート Iceberg テーブルに対して position delete ファイルを書き込み可能にし、StarRocks から直接 DELETE を実行可能にしました。Plan、Sink、Commit、Audit の全パイプラインに対応します。 #67259 #67277 #67421 #67567
- Hive および Iceberg テーブルの TRUNCATE 外部 Hive および Iceberg テーブルに対する TRUNCATE TABLE をサポート。 #64768 #65016
- Iceberg および Paimon に対する増分マテリアライズドビュー Iceberg append-only テーブルおよび Paimon テーブルで増分リフレッシュをサポートし、フルリフレッシュなしでクエリ高速化を実現。 #65469 #62699
- Iceberg テーブルのファイルパスおよび行位置メタデータ列を読み取り可能。 #67003
- Iceberg v3 テーブルの
_row_idをサポート し、global late materialization に対応。 #62318 #64133 - カスタムプロパティ付き Iceberg ビューの作成をサポートし、SHOW CREATE VIEW に表示。 #65938
- Paimon テーブルを branch、tag、version、timestamp 指定でクエリ可能。 #63316
- ETL 実行モード最適化をデフォルト有効化し、INSERT INTO SELECT や CTAS の性能を向上。 #66841
- Iceberg テーブルの INSERT/DELETE にコミット監査情報を追加。 #69198
- Iceberg REST Catalog の view endpoint 操作の有効/無効を切替可能。 #66083
- CachingIcebergCatalog のキャッシュ検索効率を改善。 #66388
- 各種 Iceberg catalog タイプに対する EXPLAIN をサポート。 #66563
クエリエンジン
- ASOF JOIN 時系列およびイベント相関クエリ向けに ASOF JOIN を導入。時間または順序キーに基づき、2つのデータセット間で最も近いレコードを効率的にマッチングします。 #63070 #63236
- 半構造化データ向け VARIANT 型 Schema-on-read に対応した VARIANT 型を導入。読み書き、型変換、Parquet 統合をサポート。 #63639 #66539
- 再帰 CTE 階層探索、グラフクエリ、反復 SQL 計算向けに再帰 Common Table Expression をサポート。 #65932
- Skew Join v2 を改善し、統計ベースのスキュー検出、ヒストグラム対応、NULL スキュー認識を実装。 #68680 #68886
- ウィンドウ関数での COUNT DISTINCT を改善し、複数 DISTINCT 集約の融合をサポート。 #67453
関数および SQL 構文
- 新規関数:
array_top_n:値順に並べた配列から上位 N 要素を返します。 #63376arrays_zip:複数配列を要素単位で結合し、構造体配列を生成します。 #65556json_pretty:JSON 文字列を整形してインデントを付与します。 #66695json_set:JSON 文字列内の指定パスに値を設定します。 #66193initcap:各単語の先頭文字を大文字に変換します。 #66837sum_map:同一キーを持つ MAP 値を行間で合計します。 #67482current_timezone:現在のセッションのタイムゾーンを返します。 #63653current_warehouse:現在の Warehouse 名を返します。 #66401sec_to_time:秒数を TIME 型に変換します。 #62797ai_query:SQL から外部 AI モデルを呼び出して推論を実行します。 #61583
- 構文拡張:
管理と可観測性
- リソースグループで
warehouses、cpu_weight_percent、exclusive_cpu_weightをサポートし、CPU 分離を強化。 #66947 - FE スレッド状態を確認できる
information_schema.fe_threadsシステムビューを追加。 #65431 - クラスタレベルで特定クエリパターンをブロックする SQL Digest ブラックリストをサポートしました。 #66499
- ネットワーク制約で直接アクセスできないノードから Arrow Flight によるデータ取得をサポートしました。 #66348
- 再接続なしで既存接続へグローバル変数変更を反映する REFRESH CONNECTIONS コマンドを導入しました。 #64964
- クエリプロファイル分析および整形済み SQL 表示を行う組み込み UI 機能を追加しました。 #63867
- 構造化されたクラスタ概要を提供する
ClusterSummaryActionV2API エンドポイントを実装しました。 #68836 - 現在のクラスタ実行モード(shared-data または shared-nothing)を確認できる読み取り専 用システム変数
@@run_modeを追加しました。 #69247