Dataphin
Dataphin は、Alibaba Group の OneData データガバナンス手法の内部実践をクラウドベースで提供するものです。ビッグデータのライフサイクル全体を通じて、データの統合、構築、管理、利用のワンストップソリューションを提供し、企業がデータガバナンスのレベルを大幅に向上させ、高品質で信頼性が高く、便利に消費でき、安全で経済的な生産を実現する企業レベルのデータミドルプラットフォームを構築することを目指しています。Dataphin は、さまざまな業界の企業のプラットフォーム技術アーキテクチャと特定の要件を満たすために、さまざまなコンピューティングプラットフォームのサポートと拡張可能なオープン機能を提供します。
Dataphin を StarRocks と統合する方法はいくつかあります。
-
データ統合のソースまたは宛先データソースとして。データは StarRocks から読み取られ、他のデータソースにプッシュされるか、他のデータソースからプルされて StarRocks に書き込まれます。
-
Flink SQL およびデータストリーム開発のソーステーブル(無限スキャン)、ディメンションテーブル(有限スキャン)、または結果テーブル(ストリーミングシンクおよびバッチシンク)として。
-
データウェアハウスまたはデータマートとして。StarRocks はコンピュートソースとして登録でき、SQL スクリプトの開発、スケジューリング、データ品質検出、セキュリティ識別、その他のデータ研究およびガバナンスタスクに使用できます。
データ統合
StarRocks データソースを作成し、オフライン統合タスクでソースデータベースまたは宛先データベースとして使用できます。手順は以下の通りです。
StarRocks データソースを作成する
基本情報

-
Name: 必須。データソース名を入力します。中国語の文字、アルファベット、数字、アンダースコア (_)、ハイフン (-) のみを含むことができます。長さは 64 文字を超えることはできません。
-
Data source code: 任意。データソースコードを設定した後、
data source code.tableまたはdata source code.schema.table形式を使用してデータソース内の Flink SQL を参照できます。対応する環境でデータソースに自動的にアクセスしたい場合は、${data source code}.tableまたは${data source code}.schema.table形式を使用してアクセスします。NOTE
現在、MySQL、Hologres、および MaxCompute データソースのみがサポートされています。
-
Support scenerios: データソースが適用されるシナリオ。
-
Description: 任意。データソースの簡単な説明を入力できます。最大 128 文字まで許可されます。
-
Environment: ビジネスデータソースがプロダクションデータソースと開発データソースを区別する場合は、Prod and Dev を選択します。ビジネスデータソースがプロダクションと開発データソースを区別しない場合は、Prod を選択します。
-
Tags: データソースにラベルを付けるためのタグを選択できます。
設定情報

-
JDBC URL: 必須。形式は
jdbc:mysql://<host>:<port>/<dbname>です。hostは StarRocks クラスター内の FE (Front End) ホストの IP アドレス、portは FE のクエリポート、dbnameはデータベース名です。 -
Load URL: 必須。形式は
fe_ip:http_port;fe_ip:http_portです。fe_ipは FE (Front End) のホスト、http_portは FE のポートです。 -
Username: 必須。データベースのユーザー名です。
-
Password: 必須。データベースのパスワードです。
高度な設定

-
connectTimeout: データベースの接続タイムアウト(ミリ秒単位)。デフォルト値は 900000 ミリ秒(15 分)です。
-
socketTimeout: データベースのソケットタイムアウト(ミリ秒単位)。デフォルト値は 1800000 ミリ秒(30 分)です。