StarRocks version 4.1
ダウングレードに関する注意事項
-
StarRocks を v4.1 にアップグレードした後、v4.0.6 未満の v4.0 バージョンにはダウングレードしないでください。
v4.1 で導入されたデータレイアウトの内部変更(タブレットの分割および分散メカニズムに関連)により、v4.1 にアップグレードされたクラスターは、以前のバージョンと完全に互換性のないメタデータおよびストレージ構造を生成する可能性があります。その結果、v4.1 からのダウングレードは v4.0.6 以降のみサポートされます。v4.0.6 より前のバージョンへのダウングレードはサポートされていません。この制限は、以前のバージョンがタブレットのレイアウトと分散メタデータを解釈する方法における後方互換性の制約によるものです。
4.1.0
リリース日: 2026年4月13日
共有データアーキテクチャ
-
新しいマルチテナントデータ管理
共有データクラスターは、範囲ベースのデータ分散とタブレットの自動分割およびマージをサポートするようになりました。タブレットは、スキーマ変更、SQL変更、またはデータ再取り込みを必要とせずに、サイズが大きくなりすぎたりホットスポットになったりした場合に自動的に分割できます。この機能は、マルチテナントワークロードにおけるデータスキューとホットスポットの問題に直接対処することで、使いやすさを大幅に向上させることができます。#65199 #66342 #67056 #67386 #68342 #68569 #66743 #67441 #68497 #68591 #66672 #69155
-
大容量タブレットサポート(フェーズ1)
共有データクラスター向けに、タブレットあたりのデータ容量を大幅に拡大し、長期的な目標としてタブレットあたり100 GBを目指します。フェーズ1では、単一のLakeタブレット内での並列コンパクションと並列MemTableファイナライズを可能にすることに焦点を当て、タブレットサイズが大きくなるにつれて取り込みとコンパクションのオーバーヘッドを削減します。#66586 #68677
-
高速スキーマ進化 V2
共有データクラスターは、スキーマ操作の秒単位のDDL実行を可能にし、マテリアライズドビューにもサポートを拡張する高速スキーマ進化 V2 をサポートするようになりました。#65726 #66774 #67915
-
[ベータ版] 共有データ上の転置インデックス
共有データクラスター向けに組み込みの転置インデックスを有効にし、テキストフィルタリングと全文検索ワークロードを高速化します。#66541
-
キャッシュの可観測性
クエリレベルのキャッシュヒット率が監査ログと監視システムで公開されるようになり、キャッシュの透明性とレイテンシー診断が向上しました。追加のデータキャッシュメトリクスには、メモリとディスクのクォータ使用状況、およびページキャッシュ統計が含まれます。#63964
-
Lakeテーブルにセグメントメタデータフィルターを追加し、スキャン中にソートキー範囲に基づいて関連性のないセグメントをスキップすることで、範囲述語クエリのI/Oを削減します。#68124
-
Lake DeltaWriterの高速キャンセルをサポートし、共有データクラスターにおけるキャンセルされた取り込みジョブのレイテンシーを削減します。#68877
-
自動クラスター・スナップショットの間隔ベースのスケジューリングをサポートしました。#67525
-
MemTableのフラッシュとマージのパイプライン実行をサポートし、共有データクラスターにおけるクラウドネイティブテーブルの取り込みスループットを向上させます。#67878
-
クラウドネイティブテーブルの修復のための
dry_runモードをサポートし、ユーザーが実行前に修復アクションをプレビューできるようにします。#68494 -
共有なしクラスターにおけるパブリッシュトランザクション用のスレッドプールを追加し、パブリッシュスループットを向上させました。#67797
-
クラウドネイティブテーブルの
datacache.enableプロパティの動的な変更をサポートします。#69011
データレイク分析
-
Iceberg DELETEのサポート
Icebergテーブルの位置削除ファイルの書き込みをサポートし、StarRocksから直接Icebergテーブルに対するDELETE操作を可能にします。このサポートは、Plan、Sink、Commit、Auditの完全なパイプラインをカバーします。#67259 #67277 #67421 #67567
-
HiveおよびIcebergテーブルのTRUNCATE
外部HiveおよびIcebergテーブルに対するTRUNCATE TABLEをサポートします。#64768 #65016
-
Iceberg上の増分マテリアライズドビュー
増分マテリアライズドビューのリフレッシュのサポートをIcebergの追記専用テーブルに拡張し、テーブル全体の再読み込みなしでクエリの高速化を可能にします。#65469 #62699
-
Icebergにおける半構造化データのためのVARIANT型
IcebergカタログにおけるVARIANTデータ型をサポートし、半構造化データの柔軟なスキーマオンリードストレージとクエリを可能にします。読み取り、書き込み、型キャスト、Parquet統合をサポートします。#63639 #66539
-
Iceberg v3のサポート
-
Icebergテーブルのメンテナンス手順
rewrite_manifestsプロシージャのサポートを追加し、expire_snapshotsおよびremove_orphan_filesプロシージャを、よりきめ細やかなテーブルメンテナンスのための追加引数で拡張しました。#68817 #68898 -
Iceberg
$propertiesメタデータテーブル$propertiesメタデータテーブルを介した Iceberg テーブルプロパティのクエリのサポートを追加しました。#68504 -
Iceberg テーブルからのファイルパスと行位置メタデータ列の読み取りをサポートします。#67003
-
Iceberg v3 テーブルからの
_row_idの読み取りをサポートし、Iceberg v3 のグローバル遅延具現化をサポートします。#62318 #64133 -
カスタムプロパティを持つ Iceberg ビューの作成をサポートし、SHOW CREATE VIEW 出力にプロパティを表示します。#65938
-
特定のブランチ、タグ、バージョン、またはタイムスタンプを持つ Paimon テーブルのクエリをサポートします。#63316
-
Paimon テーブルの複合型 (ARRAY, MAP, STRUCT) をサポートします。#66784
-
Paimon ビューをサポートします。#56058
-
Paimon テーブルの TRUNCATE をサポートします。#67559
-
Iceberg テーブル作成時の括弧構文によるパーティション変換をサポートします。#68945
-
Iceberg テーブルの ALTER TABLE REPLACE PARTITION COLUMN をサポートします。#70508
-
データ編成を改善するために、Transform Partition に基づく Iceberg グローバルシャッフルをサポートします。#70009
-
Iceberg テーブルシンクのグローバルシャッフルを動的に有効にすることをサポートします。#67442
-
同時コミットの競合を避けるために、Iceberg テーブルシンクにコミットキューを導入しました。#68084
-
データ編成と読み取りパフォーマンスを向上させるために、Iceberg テーブルシンクにホストレベルのソートを追加しました。#68121
-
ETL 実行モードで追加の最適化をデフォルトで有効にし、明示的な設定なしで INSERT INTO SELECT、CREATE TABLE AS SELECT、および同様のバッチ操作のパフォーマンスを向上させました。#66841
-
Iceberg テーブルでの INSERT および DELETE 操作のコミット監査情報を追加しました。#69198
-
Iceberg REST Catalog でのビューエンドポイント操作の有効化または無効化をサポートします。#66083
-
CachingIcebergCatalog でのキャッシュルックアップ効率を最適化しました。#66388
-
さまざまな Iceberg カタログタイプでの EXPLAIN をサポートします。#66563
-
AWS Glue Catalog テーブル内のテーブルのパーティションプロジェクションをサポートします。#67601
-
AWS Glue
GetDatabasesAPI のリソース共有タイプサポートを追加しました。#69056 -
エンドポイントインジェクション (
azblob/adls2) を使用した Azure ABFS/WASB パスマッピングをサポートします。#67847 -
リモートRPCのオーバーヘッドと外部システム障害の影響を軽減するため、JDBCカタログにデータベースメタデータキャッシュを追加しました。#68256
-
カスタムスキーマ解決をサポートするため、JDBCカタログに
schema_resolverプロパティを追加しました。#68682 -
information_schemaのPostgreSQLテーブルの列コメントをサポートします。#70520
クエリエンジン
-
再帰的CTE
階層トラバーサル、グラフクエリ、反復SQL計算のための再帰的共通テーブル式 (CTE) をサポートします。#65932
-
統計ベースのスキュー検出、ヒストグラムサポート、NULLスキュー認識により、Skew Join v2のリライトを改善しました。#68680 #68886
-
ウィンドウに対するCOUNT DISTINCTを改善し、結合された複数DISTINCT集計のサポートを追加しました。#67453
-
ウィンドウ関数に対する明示的なスキューヒントをサポートし、スキューしたパーティションキーを持つウィンドウ関数をUNIONに分割することで自動最適化します。#68739 #67944
-
CTEの具現化ヒントをサポートします。#70802
-
グローバル遅延具現化をデフォルトで有効にし、必要な時まで列の読み取りを延期することでクエリパフォーマンスを向上させました。#70412
-
TrinoパーサーにおけるINSERTステートメントのEXPLAINおよびEXPLAIN ANALYZEをサポートします。#70174
-
クエリキューの可視性のためのEXPLAINをサポートします。#69933
関数とSQL構文
- 以下の関数を追加しました:
array_top_n: 値でランク付けされた配列の上位N要素を返します。#63376arrays_zip: 複数の配列を要素ごとに結合し、構造体の配列にします。#65556json_pretty: JSON文字列をインデントでフォーマットします。 #66695json_set: JSON文字列内の指定されたパスに値を設定します。 #66193initcap: 各単語の最初の文字を大文字に変換します。 #66837sum_map: 同じキーを持つ行のMAP値を合計します。 #67482current_timezone: 現在のセッションのタイムゾーンを返します。 #63653current_warehouse: 現在のウェアハウスの名前を返します。 #66401sec_to_time: 秒数をTIME値に変換します。 #62797ai_query: 推論ワークロードのためにSQLから外部AIモデルを呼び出します。 #61583min_n/max_n: 上位N個の最小/最大値を返す集計関数。 #63807regexp_position: 文字列内の正規表現の一致の位置を返します。 #67252is_json_scalar: JSON値がスカラーであるかどうかを返します。 #66050get_json_scalar: JSON文字列からスカラー値を抽出します。 #68815raise_error: SQL式でユーザー定義エラーを発生させます。 #69661uuid_v7: 時間順のUUID v7値を生成します。 #67694STRING_AGG: GROUP_CONCATの糖衣構文。 #64704
- 以下の関数または構文拡張を提供します:
array_sortでカスタムソート順序のためのラムダコンパレータをサポートします。 #66607- SQL標準セマンティクスを持つFULL OUTER JOINのUSING句をサポートします。 #65122
- ORDER BY/PARTITION BYを持つフレーム化されたウィンドウ関数でのDISTINCT集計をサポートします。 #65815 #65030 #67453
lead/lag/first_value/last_valueウィンドウ関数でARRAY型をサポートします。 #63547- count distinctのような集計関数でVARBINARYをサポートします。#68442
- インターバル操作で
MULTIPLY/DIVIDEをサポートします。#68407 - IN式での日付型と文字列型のキャストをサポートします。#61746
- BEGIN/START TRANSACTIONでWITH LABEL構文をサポートします。#68320
- SHOWステートメントでのWHERE/ORDER/LIMIT句をサポートします。#68834
- タスク管理のための
ALTER TASKステートメントをサポートします。#68675 CREATE FUNCTION ... AS <sql_body>を介したSQL UDFの作成をサポートします。#67558- S3からのUDFのロードをサポートします。#64541
- Scala関数での名前付きパラメータをサポートします。#66344
- CSVファイルのエクスポートで複数の圧縮形式(GZIP/SNAPPY/ZSTD/LZ4/DEFLATE/ZLIB/BZIP2)をサポートします。#68054
- 名前ベースの構造体フィールドマッチングのための
STRUCT_CAST_BY_NAMESQLモードをサポートします。#69845 - 簡単なクエリプロファイル分析のために
ANALYZE PROFILEでlast_query_id()をサポートします。#64557
管理と可観測性
- マルチウェアハウスのCPUリソース分離を改善するために、リソースグループの
warehouses、cpu_weight_percent、およびexclusive_cpu_weight属性をサポートします。#66947 - FEスレッドの状態を検査するための
information_schema.fe_threadsシステムビューを導入します。#65431 - クラスタレベルで特定のクエリパターンをブロックするためのSQL Digest Blacklistをサポートします。#66499
- ネットワークトポロジの制約によりアクセスできないノードからのArrow Flightデータ取得をサポートします。#66348
- 再接続せずにグローバル変数の変更を既存の接続に伝播するREFRESH CONNECTIONSコマンドを導入します。#64964
- クエリプロファイルを分析し、フォーマットされたSQLを表示するための組み込みUI機能を追加し、クエリチューニングをより利用しやすくしました。#63867
- 構造化されたクラスタ概要を提供するために
ClusterSummaryActionV2APIエンドポイントを実装します。#68836 - グローバルな読み取り専用システム変数
@@run_modeを追加し、現在のクラスター実行モード(shared-dataまたはshared-nothing)を照会できるようにしました。#69247 - クエリキュー管理を改善するため、
query_queue_v2をデフォルトで有効にしました。#67462 - Stream LoadおよびMerge Commit操作において、ユーザーレベルのデフォルトウェアハウスをサポートしました。#68106 #68616
- 必要に応じてバックエンドのブラックリスト検証をバイパスするためのセッション変数
skip_black_listを追加しました。#67467 - メトリクスAPIに
enable_table_metrics_collectオプションを追加しました。#68691 - クエリ詳細HTTP APIにユーザーの偽装サポートを追加しました。#68674
table_query_timeoutをテーブルレベルのプロパティとして追加しました。#67547- 設定可能なレイテンシしきい値を持つFEプロファイルロギングを追加しました。#69396
- FEオブザーバーノードの追加をサポートしました。#67778
- ロードジョブの可視性を向上させるため、
information_schema.loadsでのマージコミット情報をサポートしました。#67879 - トラブルシューティングを改善するため、クラウドネイティブテーブルでのタブレットステータス表示をサポートしました。#69616
- 外部カタログの可観測性を高めるため、カタログタイプごとのクエリメトリクスを追加しました。#70533
- FEおよびBE向けにDebian (.deb) パッケージングサポートを追加しました。#68821
セキュリティ
- [CVE-2026-33870] [CVE-2026-33871] AWSバンドルを置き換え、Nettyを4.1.132.Finalに更新しました。#71017
- [CVE-2025-27821] Hadoopをv3.4.2にアップグレードしました。#68529
- [CVE-2025-54920]
spark-core_2.12を3.5.7にアップグレードしました。#70862
バグ修正
以下の問題が修正されました:
- 範囲分散タブレットのデータファイル削除をスキップすることで、タブレット分割後のデータ損失を修正しました。#71135
- 複雑な型における
DefaultValueColumnIteratorのメモリリークを修正しました。#71142 BatchUnitとFetchTaskContext間のshared_ptrサイクルによって引き起こされるメモリリークを修正しました。#71126- エラーパスでの並列セグメント/rowsetロードにおけるuse-after-freeを修正しました。#71083
- 集計スピル
set_finishingにおけるハッシュテーブルのデータ損失の可能性を修正しました。#70851 - 同時getlineアクセスによるSystemMetricsでのdouble-freeクラッシュを修正しました。#71040
- eager mergeがすべてのブロックを消費した際のSpillMemTableSinkでのクラッシュを修正しました。#69046
- 辞書バッキングテーブルが削除された際の
visitDictionaryGetExprにおけるNPEを修正しました。#71109 - 参照される列が欠落している場合に、Stream Load/Broker Loadで生成された列を分析する際のNPEを修正しました。#71116
- TTLクリーナーによって自動作成されたパーティションが削除された際のNPEを修正しました。#68257
- スナップショットが期限切れになった際の
IcebergCatalog.getPartitionLastUpdatedTimeにおけるNPEを修正しました。#68925 - 定数側の列参照を持つ外部結合に対する不正確な述語書き換えを修正しました。#67072
- ディスク再移行 (A→B→A) 中のGC競合によって引き起こされるPKタブレットrowsetメタ損失を修正しました。#70727
- SharedDataStorageVolumeMgrにおけるDB読み取りロックリークを修正しました。#70987
- 共有データでCHAR列の長さを変更した後の誤ったクエリ結果を修正しました。#68808
- 複数のテーブルの場合のMVリフレッシュバグを修正しました。#61763
- 強制リフレッシュされた場合のMVリサイクル時間の誤りを修正しました。#68673
- 同期MVにおけるすべてのnull値処理バグを修正しました。#69136
- 高速スキーマ変更ADD COLUMN後にMVをクエリする際の重複列IDエラーを修正しました。#71072
- IVMリフレッシュが不完全なPCTパーティションメタデータを記録する問題を修正しました。#71092
- 共有DecodeInfoによって引き起こされる低カーディナリティ書き換えNPEを修正しました。#68799
- 低カーディナリティ結合述語の型不一致を修正しました。#68568
- Parquetページインデックスフィルターで
null_countsが空の場合のセグメンテーション違反を修正しました。#68463 - JSONのフラット化における、同一パスでの配列とオブジェクトの競合を修正しました。#68804
- Icebergキャッシュの重み付けの不正確さを修正しました。#69058
- Icebergテーブルキャッシュのメモリ制限を修正しました。#67769
- Icebergの削除列のNULL許容性の問題を修正しました。#68649
- Azure ABFS/WASB FileSystemのキャッシュキーにコンテナを含めるように修正しました。#68901
- HMS接続プールが満杯の際のデッドロックを修正しました。#68033
- PaimonカタログにおけるVARCHARフィールドタイプの誤った長さを修正しました。#68383
- Paimonカタログのリフレッシュ時にObjectTableでClassCastExceptionが発生してクラッシュする問題を修正しました。#70224
- PaimonViewがPaimonカタログではなくdefault_catalogに対してテーブル参照を解決する問題を修正しました。#70217
- 定数サブクエリを使用するFULL OUTER JOIN USINGを修正しました。#69028
- CTEスコープでの結合ON句のバグを修正しました。#68809
- ショートサーキットポイントルックアップにおけるパーティション述語の欠落を修正しました。#71124
- bindScope()パターンを使用することでConnectContextのメモリリークを修正しました。#68215
- 共有なしクラスターにおける
CatalogRecycleBin.asyncDeleteForTablesのメモリリークを修正しました。#68275 - Thriftのacceptスレッドが例外に遭遇した際に終了する問題を修正しました。#68644
- ルーチンロード列マッピングにおけるUDF解決を修正しました。#68201
DROP FUNCTION IF EXISTSがifExistsフラグを無視する問題を修正しました。#69216- 辞書ページが大きすぎる場合のスキャン結果エラーを修正しました。#68258
- 範囲パーティションの重複を修正しました。#68255
- クエリキューの割り当て時間と保留中のタイムアウトを修正しました。#65802
- nullリテラル配列の処理時に発生する
array_mapクラッシュを修正しました。#70629 to_base64のスタックオーバーフローを修正しました。#70623- オプティマイザのタイムアウトの問題を修正しました。#70605
- LDAP認証における大文字小文字を区別しないユーザー名の正規化を修正しました。#67966
- API
proc_fileに対するSSRFリスクを軽減しました。#68997 - 監査およびSQLリダクションでユーザー認証文字列をマスクしました。#70360
動作の変更
- ETL実行モードの最適化がデフォルトで有効になりました。これにより、明示的な設定変更なしで、INSERT INTO SELECT、CREATE TABLE AS SELECT、および同様のバッチワークロードにメリットがあります。#66841
lag/leadウィンドウ関数の3番目の引数が、定数値に加えて列参照をサポートするようになりました。#60209- FULL OUTER JOIN USINGはSQL標準のセマンティクスに従うようになり、USING列は出力に2回ではなく1回表示されます。#65122
- グローバル遅延具現化がデフォルトで有効になりました。#70412
query_queue_v2がデフォルトで有効になりました。#67462- SQLトランザクションは、デフォルトでセッション変数
enable_sql_transactionによってゲートされます。#63535