TPC-H ベンチマーク
TPC-H は、Transaction Processing Performance Council (TPC) によって開発された意思決定支援ベンチマークです。ビジネス指向のアドホッククエリと同時データ変更のスイートで構成されています。TPC-H は、実際の生産環境に基づいてモデルを構築し、販売システムのデータウェアハウスをシミュレートするために使用できます。このテストでは、データサイズが 1 GB から 3 TB の 8 つのテーブルを使用します。合計 22 のクエリがテストされ、主なパフォーマンス指標は各クエリの応答時間であり、クエリが送信されてから結果が返されるまでの時間です。
1. テスト結論
TPC-H 100G スケールデータセットで合計 22 のクエリを使用して比較テストを実施しました。結果は以下の通りです。

StarRocks は、ローカルストレージと Hive テーブルクエリの 2 つの方法をテストしました。StarRocks Hive テーブルと Trino は同じデータをクエリします。データは ORC 形式で保存され、zlib 形式で圧縮されています。
StarRocks がそのネイティブストレージからデータをクエリするのにかかる時間は 21 秒、StarRocks が Hive 外部テーブルをクエリするのにかかる時間は 92 秒、Trino が Hive 外部テーブルをクエリするのにかかった時間は 187 秒でした。
2. テスト準備
2.1 ハードウェア環境
| マシン | 4 クラウドホスト |
|---|---|
| CPU | 16core Intel(R) Xeon(R) Platinum 8269CY CPU @ 2.50GHz |
| メモリ | 64 GB |
| ネットワーク帯域幅 | 5 Gbits/s |
| ディスク | ESSD クラウドディスク |
2.2 ソフトウェア環境
StarRocks と Trino は同じ構成のマシンにデプロイされています。StarRocks には 1 FE と 3 BEs がデプロイされ、Trino には 1 コーディネーターと 3 ワーカーがデプロイされています。
-
カーネルバージョン: Linux 3.10.0-1127.13.1.el7.x86_64
-
オペレーティングシステムバージョン: CentOS Linux release 7.8.2003
-
ソフトウェアバージョン: StarRocks Community Edition 3.0, Trino-419, Hive-2.3.9
3 テストデータと結果
3.1 テストデータ
| テーブル | 行数 |
|---|---|
| customer | 1500 万 |
| lineitem | 6 億 |
| nation | 25 |
| orders | 1 億 5000 万 |
| part | 2000 万 |
| partsupp | 8000 万 |
| region | 5 |
| supplier | 100 万 |