活动介绍
作为一款高性能、实时的 MPP 分析型数据库,Doris 持续在湖仓融合、半结构化分析、存算分离、实时分析等方向快速演进。3.1 版本在 3.0 的基础上进一步夯实核心能力,带来半结构化分析、湖仓一体、存储层等方面多项关键特性升级,助力企业构建更高效、更灵活的数据分析系统。3.1 版本是 Apache Doris 在半结构化分析上的一个里程碑版本。
- 在 VARIANT 类型上,3.1 版本新增了稀疏列能力,使得 VARIANT 可以轻松应对数万子列的场景。同时,
- 引入了模板化 Schema 能力,让 VARIANT 类型在关键路径上,查询更快、索引更稳、成本可控,同时不丢失灵活性。
- 在倒排索引能力上,3.1 版本引入了 Index V3 版本的索引格式,相比较于 V2 版本存储空间节省可达 20%。
- 支持更为丰富的分词手段,提供了三种全新的分词器:ICU Tokenizer、IK Tokenizer 和 Basic Tokenizer。
- 支持自定义分词器,可以突破内置分词器的局限性,根据业务场景定制,显著提升搜索召回率。
9 月 16 日(周二) 19:30-20:30,飞轮科技资深技术专家、Apache Doris Committer 姜凯,和飞轮科技资深技术专家、Apache Doris Committer 李航宇 将带来半结构化能力升级的深度介绍,参与直播互动还有机会获得 SelectDB & Apache Doris 定制周边与精选案例集,敬请锁定 SelectDB 视频号!