随着时代的发展,数据的类型越来越多,催生了数据架构的不断革新,也衍生了更复杂的技术形态,推动现代数据架构向融合统一的方向发展,Lakehouse 也由此诞生。
Apache Doris 自 0.15 版本开始尝试与数据湖能力结合,经过多个版本的优化迭代,目前已进入稳定发展期,并在 Apache Doris 2.1 版本对数据湖分析能力进行了全面增强。具体而言,性能方面进行了大幅优化,相较于 Trino 和 Spark 有 4-6 倍的提升;引入了 SQL Convertor,用户可便捷的从原有系统无缝切换至 Apache Doris;引入 Arrow Flight 高速读取接口,在数据科学及大规模数据读取场景下,数据传输效率提升 100 倍。
5 月 14 日(明天)19:30,Apache Doris PMC 成员陈明雨、Apache Doris Committer 邹新一 将携手分享基于 Apache Doris 的最新湖仓一体方案,包括 Apache Iceberg、Apache Hudi 和 Apache Paimon 等数据湖表格式的结合实践,并现场实测 Doris 与 Trino 的性能表现。此外,还将详细讲解 SQL Convertor 和 Arrow Flight 数据传输原理,并进行功能演示。
![讲师海报](https://cdn.selectdb.com/static/_48f94f9f42.jpg)