TPC-H ベンチマーク
TPC-H は、トランザクション処理性能評議会 (TPC) によって開発された意思決定支援ベンチマークです。ビジネス指向のアドホッククエリと同時データ修正のスイートで構成されています。TPC-H は、実際の生産環境に基づいたモデルを構築し、販売システムのデータウェアハウスをシミュレートするために使用できます。このテストでは、データサイズが 1 GB から 3 TB の 8 つのテーブルを使用します。合計 22 のクエリがテストされ、主な性能指標は各クエリの応答時間であり、クエリが送信されてから結果が返されるまでの時間です。
1. テスト結論
TPC-H 100G スケールデータセットで合計 22 のクエリを使用して比較テストを実施しました。結果は以下の通りです。

StarRocks はローカルストレージと Hive テーブルクエリの 2 つの方法をテストしました。StarRocks Hive テーブルと Trino は同じデータをクエリします。データは ORC 形式で保存され、zlib 形式で圧縮されています。
StarRocks がネイティブストレージからデータをクエリするレイテンシーは 21 秒、StarRocks が Hive 外部テーブルをクエリするレイテンシーは 92 秒、Trino が Hive 外部テーブルをクエリするレイテンシーは 187 秒でした。