StarRocks Connector for Flink のリリース
通知
ユーザーガイド:
ソースコード: starrocks-connector-for-apache-flink
JAR ファイルの命名形式:
- Flink 1.15 以降:
flink-connector-starrocks-${connector_version}_flink-${flink_version}.jar
- Flink 1.15 より前:
flink-connector-starrocks-${connector_version}_flink-${flink_version}_${scala_version}.jar
JAR ファイルを取得する方法:
- Maven Central Repository から直接 Flink コネクタ JAR ファイルをダウンロードします。
- Flink コネクタを Maven プロジェクトの
pom.xml
ファイルに依存関係として追加し、ダウンロードします。具体的な手順は ユーザーガイド を参照してください。 - ソースコードをコンパイルして Flink コネクタ JAR ファイルを作成します。具体的な手順は ユーザーガイド を参照してください。
バージョン要件:
コネクタ | Flink | StarRocks | Java | Scala |
---|---|---|---|---|
1.2.9 | 1.15,1.16,1.17,1.18 | 2.1 以降 | 8 | 2.11,2.12 |
1.2.8 | 1.13,1.14,1.15,1.16,1.17 | 2.1 以降 | 8 | 2.11,2.12 |
1.2.7 | 1.11,1.12,1.13,1.14,1.15 | 2.1 以降 | 8 | 2.11,2.12 |
注意
一般に、Flink コネクタの最新バージョンは、Flink の最新の 3 つのバージョンとのみ互換性があります。
リリースノート
1.2
1.2.10
機能
- JSON カラムの読み取りをサポートします。#334
- ARRAY、STRUCT、および MAP カラムの読み取りをサポートします。#347
- JSON 形式でデータをシンクする際の LZ4 圧縮をサポートします。#354
- Flink 1.19 をサポートします。#379
改善
- ソケットタイムアウトの設定をサポートします。#319
- Stream Load トランザクションインターフェースが非同期の
prepare
およびcommit
操作をサポートします。#328 - StarRocks テーブルのカラムのサブセットを Flink ソーステーブルにマッピングすることをサポートします。#352
- Stream Load トランザクションインターフェースを使用する際に特定のウェアハウスを設定することをサポートします。#361
バグ修正
以下の問題を修正しました:
StarRocksDynamicLookupFunction
内のStarRocksSourceBeReader
がデータ読み取り完了後に閉じられない問題。#351- 空の JSON 文字列を JSON カラムにロードする際に例外が発生する問題。#380
1.2.9
このリリースにはいくつかの機能とバグ修正が含まれています。注目すべき変更は、Flink コネクタが Flink CDC 3.0 と統合され、CDC ソース(MySQL や Kafka など)から StarRocks へのストリーミング ELT パイプラインを簡単に構築できるようになったことです。詳細は Flink CDC 3.0 とのデータ同期 (schema change 対応) を参照してください。
機能
- Flink CDC 3.0 をサポートするために catalog を実装します。#295
- Flink CDC 3.0 をサポートするために新しいシンク API を FLP-191 で実装します。#301
- Flink 1.18 をサポートします。#305
バグ修正
1.2.8
このリリースにはいくつかの改善とバグ修正が含まれています。注目すべき変更は以下の通りです:
- Flink 1.16 および 1.17 をサポートします。
- シンクが設定されている場合に
sink.label-prefix
を設定して、正確に一度のセマンティクスを保証することを推奨します。具体的な手順は Exactly Once を参照してください。
改善
- Stream Load トランザクションインターフェースを使用して少なくとも一度の保証をするかどうかを設定することをサポートします。#228
- シンク V1 のリトライメトリクスを追加します。#229
- EXISTING_JOB_STATUS が FINISHED の場合、getLabelState を取得する必要はありません。#231
- シンク V1 の不要なスタックトレースログを削除します。#232
- [リファクタリング] StarRocksSinkManagerV2 を stream-load-sdk に移動します。#233
- Flink テーブルのスキーマに基づいて部分更新を自動的に検出し、ユーザーが明示的に指定する
sink.properties.columns
パラメータを不要にします。#235 - [リファクタリング] probeTransactionStreamLoad を stream-load-sdk に移動します。#240
- stream-load-sdk に git-commit-id-plugin を追加します。#242
- DefaultStreamLoader#close に info ログを使用します。#243
- 依存関係なしで stream-load-sdk JAR ファイルを生成することをサポートします。#245
- stream-load-sdk で fastjson を jackson に置き換えます。#247
- update_before レコードを処理することをサポートします。#250
- ファイルに Apache ライセンスを追加します。#251
- stream-load-sdk で例外を取得することをサポートします。#252
strip_outer_array
とignore_json_size
をデフォルトで有効にします。#259- Flink ジョブが復元され、シンクセマンティクスが正確に一度の場合に、残存するトランザクションをクリーンアップしようとします。#271
- リトライが失敗した後、最初の例外を返します。#279
バグ修正
テスト
- Kafka から StarRocks へのロードのためのテストフレームワークを追加します。#249
ドキュメント