技术对比

Apache Doris vs ClickHouse

Apache Doris 和 ClickHouse 都是全球领先的实时数据仓库,均支持列式存储与极速查询。此外,Doris 具备更高的并发处理能力、更高效的 Join 查询、更简便的运维,并兼容 MySQL 的语法,使其更易于使用和部署。

精选案例

kwai

“利用 Apache Doris 替换 ClickHouse 后,快手成功升级为湖仓一体架构,实现统一存储并简化数据链路,无需数据导入,Doris 可直接访问湖仓数据。结合 Doris 的物化视图改写与自动物化服务,实现了高性能查询与灵活的数据治理。”

icon

直接访问湖仓数据,缩短数据链路

icon

查询性能提升,满足多场景查询加速

icon

借助物化视图,实现更灵活数据治理

tencent-music

“内容库数据平台经过分析引擎从 ClickHouse 到 Apache Doris 的替换、数据架构语义层的初步引入到深度应用,有效提高了数据时效性、降低了运维成本、解决了数据管理割裂等问题 ”

icon

具备多表查询和联邦查询性能特性

icon

兼容 MySQL 协议,降低运维成本

icon

支持部分列更新,满足多种数据更新方式

wangyiyun

“我们用 Apache Doris 替换了 ClickHouse,构建了新的日志平台,目前规模已达 50 台服务器、2PB 数据量。此次架构升级后,系统在查询响应、并发处理、稳定性及运维效率等多方面均取得了显著提升。”

icon

全文检索性能提升 3-7 倍

icon

万亿写入下吞吐达秒级 GB/s

icon

支持 500+ 并发查询,较 ClickHouse 提升超 2 倍

为什么选择 Apache Doris

Apache Doris

  • 系统架构
    基于 MPP 架构
    兼容 MySQL 协议,提供标准 SQL
  • 查询能力
    支持分布式 Joins
    提供基于成本的查询优化器(Cost-Based Optimization)
    支持查询重写与多表物化视图性能
    提供更高的并发性能
  • 实时更新
    具有强一致性主键存储模型,支持同步数据更新与删除
  • 数据 API
    提供基于 Arrow-Flight 协议的高吞吐量读取 API,便于与其他引擎集成(如数据科学 / AI 工具)
  • 湖仓能力
    作为数据湖查询引擎,支持对 Hive、Hudi、Iceberg 和Parquet 等数据湖格式查询
  • 运维
    支持自动扩缩容与多副本平衡
  • 性能测试
    在 ClickBench 测试中, Apache Doris 分别在 2022 年与 2024 年 十月进入榜单前三,测试结果超过ClickHouse
    在 TPC-H 和 TPC-DS 测试中性能领先
  • 部署模式

    Doris 全托管云原生服务由商业化公司SelectDB提供,支持 SaaS 和 BYOC 两种模式,当前已上线阿里云、华为云、腾讯云和亚马逊云科技

    由商业化公司 SelectDB 提供长周期、更稳定的本地企业版部署服务

ClickHouse

  • 系统架构
    Scatter-Gather 架构
    类 SQL 语法且非标准 SQL 查询
  • 查询能力
    Join 性能较差
    不支持查询优化器
    仅支持单表物化视图
    并发性能较低
  • 实时更新
    仅支持异步更新,更新后可读取到旧值
  • 数据 API
    仅支持低效的 JDBC API 进行数据读取
  • 湖仓能力
    湖仓集成能力有限
  • 运维
    扩缩容期间需要手动平衡
  • 性能测试
    在 ClickBench 测试中,ClickHouse 与 Doris 轮流领先
    在 TPC-H 和 TPC-DS 测试中,ClickHouse 出现查询内存溢出(OOM)的问题
  • 部署模式
    当前,ClickHouse BYOC 版本仍在内测阶段
    不提供本地企业版部署服务

性能对比

ClickBench 性能测试

ClickBench 是专用于评估分析型数据库性能的基准测试工具,其核心验证场景聚焦于海量宽表处理效能,而非复杂多表关联场景。该性能测试采用头部网络分析平台真实业务数据构建,覆盖点击流分析、结构化日志处理等典型 OLAP 应用场景。

测试体系由特定查询集合构成,重点验证聚合运算能力与单表处理性能(不涉及复杂表关联操作),因此该测试成为评估实时数据库的标准之一,尤其适用于验证系统在 PB 级数据规模下的数据处理与实时分析能力。

ClickBench  Benchmark

SSB-Flat SF100 性能测试

SSB-Flat SF100 是专为测试分析型数据库大宽表处理能力设计的性能测试。

该测试基于星型模式基准(SSB)改造,通过将星型结构扁平化为单一宽表,聚焦单表查询性能验证。其中 SF100 代表数据规模为基准量的 100 倍,可有效评估系统在超大规模数据下的查询效率与扩展能力。

ClickBench  Benchmark

TPC-H SF100 性能测试

TPC-H SF100 是业界公认的数据库性能测试标准,包含 22 条模拟真实企业场景的复杂 SQL 查询。SF100 代表数据规模为基准量的 100 倍,适用于在大规模数据场景下,检验查询性能的验证、评估系统扩展能力。

注:由于 ClickHouse 在测试过程中存在 7 个未能完成的查询,最终测试的总耗时结果为 Doris 完整执行 22 个查询的时间、ClickHouse 仅为成功执行 15 个查询的时间。

ClickBench  Benchmark

TPC-DS 1TB 性能测试

TPC-DS 1TB 是数据仓库与分析型数据库的权威性能测试,采用约 1TB 数据集(24 张表共约 63.5 亿条数据)构建雪花模型。

测试中涵盖 99 条复杂查询,以全面检验数据库在关联查询、聚合计算及嵌套子查询等场景的性能表现,模拟网络销售、门店销售等真实业务场景。

注:由于 TPC-DS 性能测试中使用了大量关联子查询,而 ClickHouse 在测试时(2024 年 9 月)尚未支持该功能,导致约半数查询无法执行。

TPC-DS 1TB 性能测试

更多用户故事