Enterprise Core

Enterprise Core 3.0.x

Enterprise Core 3.0.7

发布日期：2025 年 8 月 25 日

行为变更

调整 show frontends 和 show backends 的权限需求，使其与对应的 RESTful API 保持一致，即需要 information_schema 库的 SELECT_PRIV 权限
指定 domain 的 admin 和 root 用户不再视为系统用户
存储：单库默认并发事务数调整为 10000

新特性

查询优化器
- 支持 MySQL 的聚合上卷语法 GROUP BY ... WITH ROLLUP
查询执行
- 新增数据函数：cot/sec/cosec
- Like 语句支持 escape 语法
半结构化数据管理
- 通过设置会话变量 enable_add_index_for_new_data=true，支持仅对新增数据构建不分词倒排索引和 NGram bloomfilter 索引

改进

导入
- 优化 SHOW CREATE LOAD 错误信息提示
主键
- 新增 segment key bounds 截断能力，避免单次大导入失败的问题
存储
- 增强 Compaction 和导入数据的可靠性
- 优化 balance 速度
- 优化建表速度
- 优化 compaction 默认参数及可观测性
- 优化查询报错 -230 的问题
- 增加系统表 backend_tablets
- 优化 Cloud 模式下从 follower 节点查询 information_schema.tables 的性能
存算分离
- 增强 Meta-service recycler 可观测性
- 支持导入 compaction 过程进行跨 compute group 增量预热
- 优化 Storage vault 连通性检查
- 支持通过 MS API 更新存储后端信息
Lakehouse
- 优化 x86 环境下 ORC zlib 的解压性能并修复潜在问题
- 优化外表读取的默认并发线程数
- 优化不支持 DDL 操作的 Catalog 的报错信息
异步物化视图
- 优化透明改写规划的性能
查询优化器
- group_concat 函数现在允许参数为非字符串类型
- sum 和 avg 函数允许参数为非数值类型
- 扩展 TOP-N 查询延迟物化的支持范围，当查询部分列时也能延迟物化
- 创建分区时，list 分区允许包含 MAX_VALUE
- 优化采样收集聚合模型表统计信息的性能
- 优化采样收集统计信息时 NDV 值的准确性
倒排索引
- 统一 show create table 中倒排索引展示的 properties 顺序
- 为倒排索引过滤条件新增逐条件的 profile 指标（如命中行数与执行时间），便于性能分析
- 增强 profile 中倒排索引相关信息展示
权限
- Ranger 支持设置 storage vault 和 compute group 的权限

缺陷修复

导入
- 修复导入 CSV 文件使用多字符分隔符可能导致的正确性问题
- 修复修改任务属性后显示 ROUTINE LOAD 任务结果不正确的问题
- 修复主节点重启或 Leader 切换后一流多表导入计划失效的问题
- 修复 ROUTINE LOAD 任务因找不到可用 BE 节点导致所有调度任务阻塞的问题
- 修复 runningTxnIds 并发读写冲突问题
主键
- 优化 mow 表在高频并发导入下的导入性能
- mow 表 full compaction 释放被删除数据的空间
- 修复 mow 表在极端场景下可能出现的导入失败问题
- 优化 mow 表 compaction 性能
- 修复 mow 表在有并发导入和 sc 时可能的正确性问题
- 修复 mow 空表执行 schema change 可能导致导入卡住或 schema change 失败的问题
- 修复 mow delete bitmap cache 内存泄漏问题
- 修复 mow 表在 sc 后可能的正确性问题
存储
- 修复 compaction 导致的 clone 过程 missing rowset 问题
- 修复 autobucket 计算 size 不准确及默认值问题
- 修复分桶列可能导致的正确性问题
- 修复单列表不能 rename 的问题
- 修复 memtable 可能的内存泄漏问题
- 修复空表事务写对不支持行为的报错不统一问题
存算分离
- File cache 相关修复
- 修复 schema 过程中 cumulative point 可能回滚的问题
- 修复后台任务影响自动重启的问题
- 修复 azure 环境中数据回收过程未处理的异常问题
- 修复单 rowset 做 compaction 未及时清理 file cache 的问题
Lakehouse
- 修复 Kerberos 环境下 Iceberg 表写入事务提交失败的问题
- 修复 kerberos 环境下查询 hudi 的问题
- 修复多 Catalog 情况下潜在的死锁问题
- 修复某些情况下并发刷新 Catalog 导致元数据不一致的问题
- 修复 ORC footer 某些情况下会被多次读取的问题
- 修复 Table Valued Function 无法读取压缩格式 json 文件的问题
- SQL Server Catalog 支持识别 IDENTITY 列信息
- SQL Convertor 支持指定多个 url 以实现高可用
异步物化视图
- 修复当查询被优化为空集结果时，可能错误进行分区补偿的问题
查询优化器
- 修复 sql_select_limit 以外的影响 DML 执行结果的问题
- 修复开始 local shuffle 时，物化的 CTE 在极端情况下可能执行报错的问题
- 修复 prepare 的 insert 语句无法在非 master 节点执行的问题
- 修复 cast ipv4 到 string 的结果错误问题
权限
- 当一个用户拥有多个角色时，会合并多个角色的权限后再执行鉴权
查询执行
- 修复部分 json 函数问题
- 修复异步线程池满时可能导致 BE Core 的问题
- 修复 hll_to_base64 结果不正确的问题
- 修复 decimal256 转换为 float 时结果错误的问题
- 修复两处内存泄漏问题
- 修复 bitmap_from_base64 导致的 be core 问题
- 修复 array_map 函数可能导致的 be core 问题
- 修复 split_by_regexp 函数可能的错误问题
- 修复超大数据量下 bitmap_union 函数可能的结果错误问题
- 修复 format round 函数在部分边界值下可能 core 的问题
倒排索引
- 修复倒排索引在异常情况下产生的内存泄漏问题
- 修复写入和查询空索引文件时报错的问题
- 捕获倒排索引字符串读取中的 IO 异常，避免因异常导致进程崩溃
复杂数据类型
- 修复 Variant Nested 嵌套数据类型冲突时可能导致的类型推断错误
- 修复 map 函数参数类型推导错误
- 修复 jsonpath 中指定 '$.' 作为 path 导致数据错误变为 NULL 的问题
- 修复 Variant 的子字段包含 . 时，序列化格式无法还原的问题
其他
- 修复 auditlog 表 IP 字段长度不足的问题
- 修复 SQL 解析错误时，审计日志中记录的 query id 为上一次执行查询的 query id 的问题

Enterprise Core 3.0.6

发布日期：2025 年 6 月 20 日

行为变更

禁止 Unique 表使用时序 Compaction
存算分离场景下 Auto Bucket 单分桶容量调整为 10GB 新特性
Lakehouse
- 支持访问 AWS S3 Table Buckets 中的 Iceberg 表格式
存储
- 对象存储访问支持 IAM Role 授权适用于导入/导出、备份恢复及存算分离场景
新增函数
- json_extract_no_quotes
- unhex_null
- xpath_string
- str_to_map
- months_between
- next_day
- format_round 改进
导入
- 引入黑名单机制：避免 Routine Load 将元信息分发至不可用 BE 节点
- 提高负载优先级阈值：load_task_high_priority_threshold_second 默认值增大
主键模型
- 减少冗余日志输出
存储优化
- 精简 Compaction Profile 及日志
- 优化调度策略提升 Compaction 吞吐量
存算分离
- 启动优化：加速 File Cache 初始化
- 查询加速：优化 File Cache 查询性能
- 元数据获取优化：解决 get_version 导致的性能瓶颈
- 对象回收加速：提升存算分离模式垃圾回收效率
- 稳定性提升：优化对象存储重试策略
- Profile 细化：增强 Tablet/Segment Footer 维度统计
- Schema Change 容错：默认启用 New Tablet Compaction 规避 -230 错误
Lakehouse
- Hive Catalog 支持分区缓存 TTL 控制（partition.cache.ttl-second）
- 支持 Hive 表 skip.header.line.count 属性
- 兼容 org.openx.data.jsonserde.JsonSerDe 格式的 Hive 表
- Paimon 版本升级至 1.0.1
- Iceberg 版本升级至 1.6.1
- 支持阿里云 OSS-HDFS Root Policy 功能
- 方言兼容：返回 Hive 格式查询结果
- 详情参考文档：SQL 转换器
异步物化视图
- 内存优化：降低透明改写内存占用
查询优化器
- 分桶剪枝性能提升
- Lambda 表达式增强：支持引用闭包外部 Slot
查询执行
- TopN 查询加速：优化存算分离场景性能
- 函数扩展：substring_index 支持变量参数
- 地理信息函数：新增 ST_CONTAINS/ST_INTERSECTS/ST_TOUCHES/ST_DISJOINT
核心组件
- 内存追踪优化：高并发场景性能提升约 10%
- 审计日志增强：通过 audit_plugin_max_insert_stmt_length 限制 INSERT 语句长度
- 详情请参考文档：审计插件
- SQL 转换器控制：新增会话变量 sql_convertor_config 和 enable_sql_convertor_features
- 详情请参考文档：SQL 转换器缺陷修复
导入
- 修复 BE 事务清理失败问题
- 优化 Routine Load 任务报错准确性
- 禁止向 disable_load=true 节点分发元信息任务
- 修复 FE 重启后消费进度回退
- 修复 Group Commit 与 Schema Change 冲突导致的 Core Dump
- 解决 S3 Load 使用 HTTPS 协议报错
主键模型
- 修复竞争导致的主键重复问题
存储
- 解决 CCR 与磁盘均衡竞争
- 修复默认分区 Key 未持久化问题
- CCR 支持 Rollup 表
- 修复 cooldown_ttl=0 边界问题
- 解决数据 GC 与 Publish 竞争导致数据丢失
- 修复 Delete Job 分区剪枝失效
存算分离
- 修复 Schema Change 阻塞 Compaction
- 解决 storage_vault_prefix 为空时对象回收失败
- 修复 Tablet Cache 导致的查询性能问题
- 消除残留 Tablet Cache 引起的性能抖动
Lakehouse
- 解决 FE 内存泄漏
- 避免 FE 死锁
- JDBC Catalog 支持组合条件下推
- 修复阿里云 OSS Paimon 表 Deletion Vector 读取
- 支持含逗号的 Hive 表分区值
- 修正 MaxCompute Timestamp 列类型解析
- Trino Catalog 支持显示 information_schema 系统表
- 修复 LZO 压缩格式读取失败
- 兼容旧版 ORC 文件
- 修正 ORC 复杂类型解析错误
异步物化视图
- 修复同时指定 start time 与立即触发模式时的少刷新问题
查询优化器
- 修复 Lambda 表达式改写错误
- 解决 Group By 常量键规划失败
- 修正常量折叠逻辑
- 补全系统表信息
- 修复 NULL Literal 创建 View 的列类型错误
查询执行
- 解决 JSON 导入非法值导致 BE Core
- 修复 Intersect 输入 NULL 常量结果错误
- 修正 Variant 类型谓词错误执行
- 修复 get_json_string JSON Path 非法时的结果错误
- 对齐 MySQL 函数行为（JSON_REPLACE/INSERT/SET/ARRAY）
- 解决 array_map 空参数 Core
- 修复 Variant 转 JSONB 异常 Core
- 修复 explode_json_array_json_outer 函数缺失
- 对齐 percentile 与 percentile_array 结果
- 优化 UTF8 编码函数行为（url_encode/strright/append_trail_char_if_absent）
其他
- 修复高并发下审计日志丢失
- 解决动态分区建表导致元数据回放失败
- 避免 Global UDF 重启丢失
- 对齐 MySQL View 元数据返回格式

Enterprise Core 3.0.5

发布日期：2025 年 5 月 30 日

新特性

Lakehouse
- FE Metrics 新增 Catalog/Database/Table 数量监控指标
- MaxCompute Catalog 支持 Timestamp 类型
查询执行
- 新增 URL 处理函数：top_level_domain、first_significant_subdomain、cut_to_first_significant_subdomain
- 新增 year_of_week 函数，兼容 Trino 语法实现
- percentile_array 函数支持 Float 和 Double 数据类型
存算分离
- 支持重命名计算组（Rename Compute Group）

改进

存储
- 优化主键表（MOW）高频导入场景的查询性能
- 优化 Key Range 查询的 Profile 信息展示
- Stream Load 支持 JSON 压缩文件导入
- 优化多个导入场景的错误提示信息
- 新增 Routine Load 多项监控指标
- 优化 Routine Load 调度算法，避免单任务异常影响整体调度
- 新增 Routine Load 系统表
- 优化 Compaction 任务生成速度以提升性能
存算分离
- 修复多个 File Cache 稳定性及性能问题
- 优化 Storage Vault 创建校验逻辑
Lakehouse
- 优化 Trino Connector Catalog 的 BE 端 Scanner 关闭逻辑，加速内存释放
- ClickHouse JDBC Catalog 自动兼容新旧版本驱动
异步物化视图
- 优化透明改写（Transparent Rewrite）的规划性能
- 优化 tvf mv_infos 性能
- 基于外部表的物化视图构建时取消 Catalog 元数据刷新，减少内存占用
查询优化器
- 优化 Key 列与分区列的统计信息收集性能
- 查询结果别名与用户输入保持严格一致
- 优化聚合算子中公共子表达式抽取后的列裁剪逻辑
- 增强函数绑定失败及子查询不支持的报错信息
半结构化数据管理
- json_object 函数支持复杂类型参数
- 支持将 UInt128 写入 IPv6 类型
- 支持 VARIANT 类型中 ARRAY 字段的倒排索引
权限
- 提升 Ranger 鉴权性能
其他
- 优化 JVM Metrics 接口性能

Bug 修复

存储
- 修复若干极端场景下的数据正确性问题
- 修复已完成事务未及时清理的问题
- 部分列更新时 JSONB 类型默认值改用 {}
- 修复存算分离主键模型 Compaction 未释放 Delete Bitmap 锁导致导入卡顿的问题
- 修复 ARM 架构下 Stream Load 数据丢失问题
- 修复 Insert Into Select 遇到数据质量错误未返回错误 URL 的问题
- 修复 Routine Load 多表导入时数据质量错误未返回错误 URL 的问题
- 修复 Schema Change 期间 Insert Into Values 导入结果异常问题
- 修复 Tablet Commit 信息上报导致的 Core Dump 问题
- 修复 S3 Load 导入不支持 Azure 中国区域名的问题
- 修复 K8s 环境下 FE 报 "get image failed" 错误
- 优化动态分区调度的 CPU 消耗
- 修复重命名物化视图（MV）导致列异常的问题
- 修复 Schema Change 失败后未释放内存和 File Cache 的问题
- 修复含空分区表的 Base Compaction 失败问题
- 修复复杂类型变更导致的数据正确性问题
- 修复 Cold Compaction 导致 Core Dump 的问题
- 修复存在 Delete 操作时 Cumulative Point 未提升的问题
- 修复大数据量 Full Compaction 内存不足问题
存算分离
- 修复 K8s 环境下 File Cache 清除失败问题
- 修复高频导入时读写锁导致的 FE CPU 飙升问题
Lakehouse
- 修复并发写入 Hive/Iceberg 表可能引发的 BE Core Dump
- 修复 AWS S3 存储的 Hive/Iceberg 表写入失败问题
- 修复 Iceberg Position Deletion 读取结果错误
- 修复腾讯云 COS 无法创建 Iceberg 表的问题
- 修复 Kerberos 认证 HDFS 访问 Paimon 数据失败问题
- 修复 Hudi Jni Scanner 内存泄漏问题
- 修复 MaxCompute Catalog 多分区列表读取错误
- 修复 JDBC Catalog 表行数查询空指针问题
- 修复 OceanBase Oracle 模式连接测试失败
- 修复 JDBC Catalog 并发场景下列类型长度错误
- 修复 JDBC Catalog BE 端 Classloader 泄漏
- 修复 PostgreSQL JDBC Catalog 连接线程泄漏
- 修复 EXPORT 作业卡在 EXPORTING 状态
- 禁止 OUTFILE 自动重试以防止重复文件导出
其他
- 修复 FE WebUI 执行 TVF 查询空指针问题
- 修复 Hadoop Libhdfs Thread Local 空指针异常
- 修复 FE 访问 Hadoop Filesystem 报 "Filesystem already closed"
- 修复 Catalog Comment 未持久化问题
- 修复 Parquet 复杂类型读取报错
异步物化视图
- 修复极端场景下物化视图构建任务卡顿问题
- 修复嵌套物化视图透明改写失效问题
查询优化器
- 修复函数常量折叠计算结果错误
- 修复嵌套窗口函数使用 ORDER BY 子句意外报错
查询执行
- 修复 Pipeline 任务调度导致的卡死/性能问题
- 修复 FE 连接失败时的内存越界问题
- 修复 Lambda 函数与数组函数共用导致的内存越界
- 修复 String 与 JSONB 类型转换空值导致 BE Core
- 规范 parse_url 未定义行为
- 修复 array_overlap 函数空值结果异常
- 修复非 ASCII 字符大小写转换错误
- 修复 percentile 函数部分场景 BE Core
- 修复多个内存越界问题
- 修复 SET 算子结果错误
- 降低 Arrow Flight 默认线程池大小以避免句柄耗尽
- 修复窗口函数内存越界导致 BE Core
半结构化数据管理
- 修复 Transfer-Encoding: chunked 的 Stream Load JSON 导入异常
- 增强 JSONB 格式合法性校验
- 修复 STRUCT 类型字段过多导致的 Crash
- 支持复杂类型 VARCHAR 长度扩展
- 修复 array_avg 函数在特定参数下的 Crash
- 修复 VARIANT 类型 ColumnObject::pop_back Crash
- 禁用 VARIANT 类型的索引构建操作
- 禁用 VARIANT 类型倒排索引 V1 格式
- 修复 VARIANT 多层 CAST 结果错误
- 优化 VARIANT 多子列倒排索引元数据查询性能
- 优化存算分离模式下 VARIANT Schema 内存消耗
- 修复 PreparedStatement ID 溢出问题
- 修复行存与 Delete 操作结合问题
倒排索引
- 修复 ARRAY 类型倒排索引 Null Bitmap 错误
- 修复 Date/Datetimev1 类型 Bloomfilter 索引比较错误
- 修复 UTF-8 四字节字符截断问题
- 修复新增列后立即创建倒排索引导致丢失的问题
- 修复 ARRAY 倒排索引空数据处理异常
- 修复倒排索引 FE 元数据升级兼容性
- 修复 match_phrase_prefix 缓存错误
- 修复 Compaction 后倒排索引 File Cache 未清理
权限
- DELETE 操作不再检查 Select_Priv 权限
- 禁止非 root 用户修改 root 权限
- 修复 LDAP 偶发 Partial Result Exception
其他
- 修复 JDK17 环境 JAVA_OPTS 识别异常
- 修复 InterruptException 导致 BDB 元数据写入失败
- 优化多语句请求的 SQL Hash 生成
- 用户属性变量优先级高于 Session 变量

Enterprise Core 2.1.x

Enterprise Core 2.1.11

发布日期：2025 年 8 月 18 日

行为变更

time_series_max_tablet_version_num 控制时序 compaction 策略表的最大版本数目。
修复冷热分层时 hdfs root_path 没有生效的问题。
在新优化器（Nereids）中，当查询时的表达式的深度或宽度超过阈值限制时，无论是否开始查询回退到老优化器，都不会回退。
统一了开始 unicode 名字与否的名字检查规则，现在非 unicode 名字规则是 unicode 名字规则的严格子集。

新功能

查询执行引擎
- 引入系统表 routine_load_job 查看 routine load job 信息。
查询优化器
- 支持了 MySQL 的 GROUP BY 上卷语法 GROUP BY ... WITH ROLLUP。

改进提升

查询优化器
- 优化了在聚合模型表和主键模型 mor 表上收集统计信息的性能。
异步物化视图
- 优化了透明改写的规划性能。
- 优化了刷新的性能。

Bug 修复

导入
- 修复 routineload alter 属性之后 show 展示结果不符合预期的问题。
湖仓一体
- 修复某些情况读取 iceberg equality delete 数据错误的问题。
- 修复 iceberg hadoop catalog 在 kerberos 环境下报错的问题。
- 修复 Kerberos 环境下 Iceberg 表写入事务提交失败的问题。
- 修复 Iceberg 表写入事务提交错误的问题。
- 修复某些情况下访问 kerberos 环境的 Hudi 表数据报错的问题。
- SQL Server Catalog 支持识别 IDENTITY 列信息。
- 修复某些情况下 Jdbc Catalog 表无法获取行数信息的问题。
- 优化 orc zlib 在 x86 环境下的解压性能并修复潜在问题。
- 在 Profile 中增加 Parquet/ORC 条件过滤和延迟物化相关的指标。
- 优化 ORC Footer 的读取性能。
- 修复 Table Valued Function 无法读压缩格式的 json 文件的问题。
- 修复某些情况下并发刷新 Catalog 导致元数据不一致的问题。
索引
- 修复了倒排索引在处理包含 CAST 操作的 IN 谓词时出现的查询错误，避免返回错误的查询结果。
- 修复了倒排索引在执行异常情况下的内存泄漏问题。
半结构化数据类型
- 修复了一些 json 函数在 null 值情况下结果错误的问题。
- 修复了一些 json 函数相关的 bug。
查询优化器
- 修复解析字符串为日期失败时，查询无法继续执行的问题。
- 修复了个别场景下常量折叠结果错误的问题。
- 修复个别数组函数在遇到 null literal 作为输入时，无法正常规划的问题。
- 修复在极端场景下，开启 local shuffle 可能导致结果错误的问题。
- 修复了 replace view 可能导致 desc view 时看不到列信息的问题。
- 修复了 prepare command 在非 master FE 节点上有可能无法正确执行的问题。
异步物化视图
- 修复当基表列的类型变更，可能导致透明改写后查询失败的问题。
- 修复了个别场景下，透明改写分区补偿错误的问题。
查询执行引擎
- 修复 TopN 计算时如果遇到 variant 列类型，可能会 core 的问题。
- 修复函数 bitmap_from_base64 在输入错误数据时会 Core 的问题。
- 修复了 bitmap_union 函数在超大数据量时，一些结果错误的问题。
- 修复了 multi_distinct_group_concat 在窗口函数中使用时计算错误的问题。
- 修复了 array_map 函数，在极端值时可能 core 的问题。
- 修复了错误的时区处理的问题。
Others
- 修复多语句在主 FE 和非主 FE 行为不一致的问题。
- 修复 prepared statment 在非主 FE 报错的问题。
- 修复 roolup 操作时可能导致 CCR 中断的问题。

Enterprise Core 2.1.10

发布日期：2025 年 5 月 20 日

行为变更

DELETE 不再错误的需要目标表的 SELECT_PRIV 权限。
Insert Overwrite 不再限制对同一个表并发只能为 1。
Merge on write unique 表禁止使用时序 compaction。
禁止在 VARIANT 类型上 build index。

新功能

查询执行引擎
- 支持了更多的 GEO 类型的计算函数ST_CONTAINS , ST_INTERSECTS, ST_TOUCHES，GeometryFromText，ST_Intersects, ST_Disjoint, ST_Touches。
- 支持 years_of_week 函数。
湖仓一体
- Hive Catalog 支持 Catalog 级别的分区缓存开关控制。

改进提升

湖仓一体
- Paimon 依赖版本升级到 1.0.1
- Iceberg 依赖版本升级到 1.6.1
- 将 Parquet Footer 的内存开销纳入 Memory Tracker 管控，以避免可能的 OOM 问题。
- 优化 JDBC Catalog 的谓词下推逻辑，支持 AND/OR 等连接谓词的下推。
- 预编译版本默认携带 Jindofs 扩展包以支持阿里云 OSS-HDFS 访问。
半结构化管理
- ANY 函数支持 JSON 类型。
- JSON_REPLACE，JSON_INSERT，JSON_SET，JSON_ARRAY 函数支持 JSON 数据类型和复杂数据类型。
查询优化器
- 当 in 表达式的 options 多于 Config.max_distribution_pruner_recursion_depth 时，不执行分桶裁剪，以提升规划速度。
存储管理
- 减少日志和改进部分日志。
其他
- 避免 thrift rpc END_OF_FILE 异常。

Bug 修复

湖仓一体
- 修复某些情况下，在 Hive 侧新建表，Doris 侧无法立即查看到的问题。
- 修复某些 Text 格式 Hive 表访问报错 "Storage schema reading not supported" 的问题。
- 修复某些情况下，写入 Hive/Iceberg 表时，元数据提交并发问题。
- 修复某些情况下，写入存储在 oss-hdfs 上的 Hive 表失败的问题。
- 修复当 Hive 分区键值有逗号的情况下，访问失败的问题。
- 修复某些情况下，Paimon 表 Split 分配不均匀的问题。
- 修复读取存储在 OSS 上的 Paimon 表时，无法正确处理 Delete 文件的问题。
- 修复 MaxCompute Catalog 中，读取高精度 Timestamp 列时无法访问的问题。
- 修复某些情况下，删除 Catalog 可能导致部分资源泄露的问题。
- 修复某些情况下，读取 LZO 压缩格式的数据失败的问题。
- 修复某些情况下，ORC 延迟物化功能导致复杂类型读取错误的问题。
- 修复某些情况下，读取 pyorc-0.3 版本产生的 ORC 文件报错的问题。
- 修复某些情况下，EXPORT 操作导致元数据死锁的问题。
索引
- 修复多次添加、删除和重命名列操作后构建倒排索引的错误。
- 在 index compaction 中索引对应的列唯一 ID 的校验，避免潜在的数据异常和系统错误。
半结构化数据类型
- 修复某些情况下，VARIANT 类型转 JSON 类型返回 NULL 错误的结果。
- 修复某些情况下，JSONB CAST 导致 crash。
- 禁止在 VARIANT 类型上 build index。
- 修复 named_struct 函数 decimal 类型精度正确性。
查询优化器
- 修复常量折叠中的一些问题。
- 公共表达式提取在 lambda 表达式上可能工作异常。
- 修复消除 group by key 中的常量可能不能正常工作的问题。
- 修复在极端场景下，由于统计信息的推导错误，规划无法正常执行的问题。
- 修复部分依赖 BE 中元数据的 information_schema 表，不能获取完整数据的问题。
查询执行引擎
- 修复了找不到 explode_json_array_json_outer 函数的问题。
- 修复了 substring_index 不支持动态参数的问题。
- 修复了很多 st_contains 函数计算结果不对的问题。
- 修复了 array_range 函数可能导致的 core 的问题。
- 修复了 date_diff 函数计算结果错误的问题。
- 修复了一系列字符串函数在非 ASCII 编码下的乱码或者结果错误的问题。
存储管理
- 修复某些情况下，动态分区表（Dynamic Partition Table）回放元数据失败的问题。
- 修复 ARM 下 streamload 可能因为操作序列丢数据的问题。
- 修复 full compaction 报错以及可能导致 mow 数据重复的问题。
- 修复没有持久化分区 Storage Policy 的问题。
- 修复导入之后文件极小概率不存在的问题。
- 修复 CCR 和磁盘均衡并发可能导致的文件找不见问题。
- 修复备份恢复大快照时可能出现的 connection reset 问题。
- 修复 FE Follower 丢失本地备份快照的问题。

Enterprise Core 2.1.9

发布日期：2025 年 3 月 26 日

行为变更

DELETE 不再错误的需要目标表的 SELECT_PRIV 权限。
Insert Overwrite 不再限制对同一个表并发只能为 1。
Merge on write unique 表禁止使用时序 compaction。
禁止在 VARIANT 类型上 build index。

改进提升

倒排索引
- VARIANT 类型中的 ARRAY 支持倒排索引。
- Profile 中展示每个过滤条件的倒排索引性能指标。
查询优化器
- 支持在聚合查询中使用 SELECT`` *，如果下层 relation 仅输出聚合 key 列。
存储管理
- CCR 优化回收 binlog 效率、小文件传输效率，并增强了混沌环境下的健壮性。
- 改进了导入的错误提示，使错误提示更加具体。

Bug 修复

湖仓一体
- 修复 BE 端无法正确配置 krb5.conf 路径的问题。
- 禁止 SELECT ``OUTFILE 语句重试以避免重复导出数据。
- 修复无法通过 JAVA API 访问 Paimon 表的问题。
- 修复无法写入存储位置为 s3a:// 的 Hive 表的问题。
- 修复 Catalog 的 Comment 字段没有被持久化的问题。
- 修复某些情况下，JDBC BE 端类加载泄漏的问题。
- 修复 JDBC Catalog 无法使用高版本 ClickHouse JDBC Driver 的问题。
- 修复某些情况下，读取 Iceberg Position Delete 导致 BE 宕机的问题。
- 修复多分区列情况下读取 MaxCompute 表数据错误的问题。
- 修复某些情况下读取 Parquet 复杂列类型错误的问题。
倒排索引
- 修复 ARRAY 类型倒排索引空值处理错误的问题。
- 修复对刚刚添加的列执行 BUILD INDEX 异常的问题。
- 修复特殊字符 UTF8 编码索引被截断导致结果错误的问题。
半结构化数据类型
- 修复 array_agg 函数在特殊情况下 crash 的问题。
- 修复 Stream Load 导入 JSON 类型时，chunk 参数设置错误导致 crash 的问题。
查询优化器
- 修复时间函数内嵌套 current_date 等关键字函数无法的进行常量折叠的问题。
- 修复非确定性函数相关的结果错误问题。
- 修复当原表有 on update 列属性时，CREATE TABLE LIKE 无法执行的问题。
- 修复直查聚合模型表的物化视图可能产生非预期规划报错的问题。
- 修复 PrepareStatement 因为内部 ID 溢出导致异常的问题。
查询执行引擎
- 修复了查询系统表时，可能的查询卡住或者空指针的问题。
- LEAD/LAG 函数支持了 DOUBLE 类型。#47940
- 修复了 case when 条件超过 256 个时，查询报错的问题。
- 修复了 str_to_date 函数在空格的时候，结果错误的问题。
- 修复了 split_part 函数在常量折叠时遇到 || ，结果错误的问题。
- 修复了 log 函数结果错误的问题。#47228
- 修复了 array / map 函数在 lambda 表达式中使用时导致的 core 的问题。
存储管理
- 修复了导入聚合表时，可能的内存写脏问题。
- 修复内存紧张时 MoW 导入偶发 coredump 问题。
- 修复 MoW 在 BE 重启和 Schema Change 时可能出现重复 key 的问题。
- 修复 Group Commit 和全局打开列更新以及 memtable 前移时的问题。
- 权限管理
- 使用 LDAP 时不再会抛出 PartialResultException 异常。

Enterprise Core 2.1.8

发布日期：2025 年 1 月 24 日

行为变更

添加环境变量 SKIP_CHECK_ULIMI T 以跳过 BE 进程内关于 ulimit 值校验检查，仅适用于 Docker 快速启动场景中应用
添加 enable_cooldown_replica_affinity session 变量控制冷热分层下查询选用副本亲和性
FE 添加配置 restore_job_compressed_serialization 和 backup_job_compressed_serialization 用于解决 db tablet 数量非常大情况下备份和恢复操作时 FE OOM 的问题，默认关闭，打开之后无法降级

新功能

查询执行引擎：Arrowflight 协议支持通过负载均衡设备访问 BE。
其他：当前 Lambda 表达式支持捕获外部的列。

改进提升

湖仓一体
- Hudi 版本更新至 0.15，并且优化了 Hudi 表的查询规划性能。
- 优化了 MaxCompute 分区表的读取性能。
- 支持会话变量 enable_text_validate_utf8，可以忽略 CSV 格式中的 UTF8 编码检测。
- 优化在高过滤率情况下，Parquet 文件延迟物化的性能。
异步物化视图
- 现在支持手动刷新异步物化视图中不存在的分区。
- 优化了透明改写规划的性能。
查询优化器
- 提升了 Runtime Filter 的自适应能力。
- 增加了在 MAX / MIN 聚合函数列上的过滤条件生成原始列过滤条件的能力。
- 增加了在连接谓词上抽取单侧过滤条件的能力。
- 优化了谓词推导在集合算子上的能力，可以更好的生成过滤谓词。
- 优化了统计信息收集和使用的异常处理能力，避免在收集异常时产生非预期的执行计划。
查询执行引擎
- Resource Group 支持在当前 Group 不可用的时候，降级到别的 Group。
- 优化带 limit 的查询执行使其能够更快的结束，避免多余的数据扫描。
存储管理
- CCR 支持了更加全面的操作，比如 Rename Table，Rename Column，Modify Comment，Drop View，Drop Rollup 等。
- 提升了 Broker Load 导入进度的准确性和多个压缩文件导入时的性能。
- 改进了 Routine Load 超时策略、线程池使用以防止 Routine Load 超时失败和影响查询。
其他
- Docker 快速启动镜像支持不设置环境参数直接启动，添加环境变量 SKIP_CHECK_ULIMIT 以跳过 start_be.sh 脚本以及 BE 进程内关于 swap、max_map_count、ulimit 相关校验检查，仅适用于 Docker 快速启动场景中应用。
- 新增 LDAP 配置型 ldap_group_filter 用于自定义 Group 过滤。
- 优化了使用 Ranger 时的性能。
- 修复审计日志中，scan bytes 统计不准的问题。
- 在 COLUMNS 系统表中能够正确显示列的默认值。
- 在 VIEWS 系统表中能够正确显示视图的定义。
- 当前，admin 用户不能被删除。

BUG 修复

湖仓一体
- Hive
  - 修复无法查询 Spark 创建的 Hive 视图的问题。
  - 修复无法正确读取某些 Hive Transaction 表的问题。
  - 修复 Hive 表分区存在特殊字符时，无法进行正确分区裁剪的问题。
- Iceberg
  - 修复在 Kerberos 认证环境下，无法创建 Iceberg 表的问题。
  - 修复某些情况下，Iceberg 表存在 dangling delete 情况下，count(*) 查询不准确的问题。
  - 修复某些情况下，Iceberg 表列名不匹配导致查询错误的问题
  - 修复某些情况下，当 Iceberg 表分区被修改后，无法读取的问题
- Paimon
  - 修复 Paimon Catalog 无法访问阿里云 OSS-HDFS 的问题
- Hudi
  - 修复某些情况下，Hudi 表分区裁剪失效的问题
- JDBC
  - 修复某些情况下，开始表名大小写不敏感功能后，使用 JDBC Catalog 无法获取表的问题
- MaxCompute
  - 修复某些情况下，MaxCompute 表分区裁剪失效的问题。
- 其他
  - 修复某些情况下，Export 任务导致 FE 内存泄露的问题。
  - 修复某些情况下，无法使用 HTTPS 协议访问 S3 对象存储的问题。
  - 修复某些情况下，Kerberos 认证票据无法自动刷新的问题。
  - 修复某些情况下，读取 Hadoop Block 压缩格式文件出错的问题。
  - 查询 ORC 格式的数据时，不再下推 CHAR 类型的谓词，以避免可能的结果错误。
异步物化视图
- 修复了当物化视图定义中存在 CTE 时，无法刷新的问题。
- 修复了当基表增加列后，异步物化视图不能命中透明改写的问题。
- 修复了当查询中在不同位置包含相同的过滤谓词时，透明改写失败的问题。
- 修复了当过滤谓词或连接谓词中使用列的别名时，无法透明改写的问题。
索引
- 修复倒排索引 Compaction 异常处理的问题。
- 修复倒排索引构建因为等锁超时失败的问题。
- 修复异常情况下倒排索引写入 Crash 的问题。
- 修复 Match 函数特殊参数时空指针的问题。
- 修复 VARIANT 倒排索引相关的问题，禁用 VARIANT 使用索引 v1 格式。
- 修复 NGram Bloomfilter Index 设置 gram_size = 65535 时 Crash 的问题。
- 修复 Bloomfilter Index 计算 DATE 和 DATETIME 不对的问题。
- 修复 Drop Coloumn 没有自动 Drop Bloomfilter Index 的问题。
- 减少 Bloomfilter Index 写入时的内存占用。
半结构化数据类型
- 优化内存占用，降低 VARIANT 数据类型的内存消耗。
- 优化 VARIANT Schema Copy 性能。
- 自动推断 Tablet Key 时不将 VARIANT 作为 Key。
- 修复 VARIANT 从 NOT NULL 改成 NULL 的问题。
- 修复 Lambda 函数类型推断错误的问题。
- 修复 ipv6_cidr_to_range 函数边界条件 Coredump。
查询优化器
- 修复了潜在的表读锁互斥导致的死锁问题，并优化了锁的使用逻辑。
- 修复了 SQL Cache 功能错误的使用常量折叠导致在使用包含时间格式的函数时结果不正确的问题。
- 修复了比较表达式优化，在边缘情况下可能优化错误，导致结果不正确的问题。
- 修复高并发点查审计日志不正确的问题。
- 修复高并发点查遇到异常后持续报错的问题。
- 修复部分字段 Prepared Statement 不正确的问题。
查询执行引擎
- 修复了正则表达式和 LIKE 函数在特殊字符时结果不对的问题。
- 修复 SQL Cache 在切换 DB 的时候结果可能不对的问题。
- 修复 cut_ipv6 函数结果不对的问题。
- 修复数值类型到 bool 类型 cast 的问题。
- 修复了一系列 Arrow Flight 相关的问题。
- 修复了当 hashjoin 的 hash 表超过 4G 时，部分情况结果错误的问题。
- 修复了 convert_to 函数在中文字符时溢出的问题。
存储管理
- 修复高并发 DDL 可能导致 FE 启动失败的问题。
- 修复自增列可能出现重复值的问题。
- 修复扩容时 Routine Load 不能使用新扩容 BE 的问题。
权限管理
- 修复使用 Ranger 作为鉴权插件时，频繁访问 Ranger 服务的问题
其他
- 修复 BE 端开启 enable_jvm_monitor=true 后可能导致的内存泄漏问题

Enterprise Core 2.1.7

发布日期：2024 年 11 月 12 日

行为变更

以下全局变量会被强制设置到下列默认值
- enable_nereids_dml: true
- enable_nereids_dml_with_pipeline: true
- enable_nereids_planner: true
- enable_fallback_to_original_planner: true
- enable_pipeline_x_engine: true
审计日志增加了新的列。更多信息，请参考管理指南 (opens in a new tab)

新功能

异步物化视图
- 异步物化视图增加了一个属性 use_for_rewrite 用于控制是否参与透明改写
查询执行引擎：
- 在 Profile 中输出变更的 session variable 列表；
- 增加了 trim_in、ltrim_in 和 rtrim_in 函数的支持；
- 增加了一些 URL 函数，包括对 top_level_domain、first_significant_subdomain、cut_to_first_significant_subdomain 支持；
- 增加了 bit_set 函数；增加了 count_substrings 函数；
- 增加 translate 和 url_encode 函数；
- 增加 normal_cdf, to_iso8601, from_iso8601_date 函数；
- 增加 trim_in、ltrim_in、rtrim_in 函数
存储管理：
- 增加了 information_schema.table_options 和 information_schema.table_properties 系统表，支持查询建表时设置的一些属性。更多信息，请参考系统表： table_options (opens in a new tab)、table_properties (opens in a new tab)
- 支持 bitmap_empty 作为默认值；
- 增加了一个新的 Session 变量 require_sequence_in_insert 来控制向 Unique Key 表进行 insert into select 写入时，是否必须提供 Sequence 列
其他：允许在 BE WebUI 页面生成火焰图

改进提升

湖仓一体：
- 支持写入数据到 Hive Text 格式表。更多信息，请参考使用 Hive 构建数据湖 (opens in a new tab)文档
- 使用 MaxCompute Open Storage API 访问 MaxCompute 数据。更多信息，请参考 MaxCompute (opens in a new tab) 文档
- 支持 Paimon DLF Catalog。更多信息，请参考 Paimon Catalog (opens in a new tab) 文档
- 新增语法 table$partitions 语法支持直接查询 Hive 分区信息。更多信息，请参考通过 Hive 分析数据湖 (opens in a new tab)文档
- 支持 brotli 压缩格式的 Parquet 文件读取
- 支持读取 Parquet 文件中的 DECIMAL 256 类型
- 支持读取 OpenCsvSerde 格式的 Hive 表
异步物化视图
- 细化了异步物化视图中构建时锁持有的粒度
查询优化器
- 优化了极端情况下统计信息收集和使用的准确性，以提升规划稳定性
- 现在可以在更多情况下生成 Runtime Filter，以提升查询性能
- 提升数值，日期和字符串函数的常量折叠能力，以提升查询性能
- 优化了列裁剪的算法，以提升查询性能
查询执行引擎
- 支持并行的 Prepare 降低短查询的耗时
- 修正了 Profile 中一些 Counter 的名字，保持跟审计日志一致
- 增加了新的 Local Shuffle 规则，使得部分查询更快
存储管理
- Show Partitions 命令支持显示 Commit Version
- 建表时检查不合理的 Partition EXPR
- 优化 Routine Load EOF 时的调度逻辑
- Routine Load 感知 Schema 变化
- 优化 Routine Load Task 超时逻辑
其他
- 支持通过 BE 配置关闭 BRPC 的内置服务端口
- 修复审计日志缺失字段以及重复记录的问题

Bug 修复

湖仓一体
- 修复了 INSERT OVERWRITE 的行为跟 Hive 不一致的问题
- 清理临时创建的文件夹，解决 HDFS 上空文件夹太多的问题
- 修复某些情况下，使用 JDBC Catalog 导致 FE 内存泄露的问题
- 修复某些情况下，使用 JDBC Catalog 导致 BE 内存泄露的问题
- 修复某些情况下，读取 Snappy 压缩格式错误的问题
- 修复某些情况下，FE 端 FileSystem 可能泄露的问题
- 修复某些情况下，通过 EXPLAIN VERBOSE 查看外表执行计划可能导致空指针的问题
- 修复无法读取 Paimon parquet 格式表的问题
- 修复 JDBC Oracle Catalog 兼容性改动引入的性能问题
- 禁止下推隐式转换后的谓词条件已解决 JDBC Catalog 某些情况下查询结果不正确的问题
- 修复 External Catalog 中表名大小写访问异常的一些问题
异步物化视图
- 修复用户指定的 Start Time 不生效的问题
- 修复嵌套物化视图不刷新的问题
- 修复删除重建基表后，物化视图可能不刷新的问题
- 修复分区补偿改写可能导致结果错误的问题
- 当 sql_select_limit 设置时，改写结果可能错误的问题
半结构化管理
- 修复了索引文件句柄泄露的问题
- 修复了特殊情况下倒排索引 count() 不准确的问题
- 修复了未开启 Light Schema Change 时 Variant 异常的问题
- 修复了 Variant 返回数组时内存泄漏的问题
查询优化器
- 修正了外表查询时，可能存在过滤条件 nullable 计算错误，导致执行异常的问题
- 修复范围比较表达式优化可能发生错误的问题
查询执行引擎
- match_regexp 函数不能正确处理空字符串的问题
- 解决在高并发场景下，Scanner 线程池卡死的问题
- 修复了 data_floor 函数结果错误的问题
- 修复了部分场景下，Cancel 消息不正确的问题
- 修复 Arrow Flight 打印太多的 Warn 日志的问题
- 解决部分场景下 Runtime Filter 发送失败的问题
- 修复了一些系统表查询的时候不能正常结束或者卡住的问题
- 修复了窗口函数结果不正确的问题
- 修复 ENCRYPT 和 DECRYPT 函数导致 BE Core 的问题
- 修复 CONV 函数结果错误的问题
存储管理
- Memtable 前移在多副本情况下，有机器宕机时导入失败的问题
- 导入过程中，Memtable 在 Flush 阶段时，统计的内存不准确
- 修复 Memtable 前移多副本容错的问题
- 修复 Memtable 前移 bvar 统计不准的问题
- 修复 s3 Load 进度汇报不准的问题
权限管理
- 修复了 SHOW COLUMNS, SHOW SYNC, SHOW DATA FROM DB.TABLE 相关的权限问题
其他
- 修复 2.0 版本的审计日志插件在 2.1 版本无法使用的问题

Enterprise Core 2.1.7-rc01

发布日期：2024 年 9 月 13 日

新功能

存储管理：增加了 information_schema.table_options 和 table_properties 系统表，支持查询建表时设置的一些属性；支持 bitmap_empty 作为默认值。

改进提升

执行引擎：支持并行的 prepare 降低短查询的耗时。
存储管理：Show Partitions 命令支持显示 commit version；建表时检查不合理的 partition expr。

Bug 修复

湖仓一体：修复了 insert overwrite 的行为跟 hive 不一致的问题；在建立 DLF 的外表时，增加了一些检查，防止查询时出错；清理临时创建的文件夹，解决 HDFS 上空文件夹太多的问题。
异步物化视图：修复用户指定的 start time 不生效的问题；解决嵌套物化视图不刷新的问题。
执行引擎：修复 match_regexp 函数不能正确处理空字符串的问题；解决在高并发场景下，scanner 线程池卡死的问题。
存储管理：修复 Memtable 前移在多副本情况下，有机器宕机时导入失败的问题；修复导入过程中，memtable 在 flush 阶段时，统计的内存不准确。
权限管理：修复了 show columns, show sync, show data from db.table 相关的权限问题。

Enterprise Core 2.1.6

发布日期：2024 年 9 月 13 日

行为变更

移除 create repository 命令中的 delete_if_exists 选项。
新增会话变量 enable_prepared_stmt_audit_log，用于控制 JDBC 预编译语句是否记录审计日志，默认不记录。
采用文件描述符限制和内存限制来管理 Segment Cache。
当 sys_log_mode 配置项设置为 BRIEF 时，在日志中增加文件位置信息，以提供更详细的上下文。
将会话变量 max_allowed_packet 的默认值调整为 16MB，提高数据传输限制。
在单次请求中，若包含多个 SQL 语句，各语句间必须使用分号进行分隔，以增强语句的清晰度和执行效率。
现在支持 SQL 语句以分号开始，提供更灵活的语句书写方式。
在执行如 show create table 等语句时，类型格式与 MySQL 保持一致，提升与 MySQL 的兼容性。
当新优化器规划查询超时后，不再回退到旧优化器，以避免潜在的性能下降问题。

新功能

湖仓一体：实现 Iceberg 表的写回功能；增强 SQL 拦截规则，支持对外表的拦截处理；新增系统表file_cache_statistics，用于查看 BE 节点的数据缓存性能指标。
异步物化视图：支持在 Insert 中进行透明改写；支持对查询中存在 VARIANT 类型时的透明改写。
半结构化数据管理：支持 ARRAY MAP 类型到 JSON 类型的 CAST 转换功能；引入json_keys函数，用于提取 JSON 中的键名；支持在导入 JSON 时指定json path$``；ARRAY / MAP / STRUCT 类型支持replace_if_not_null；允许调整 ARRAY / MAP / STRUCT 类型的列顺序；新增multi_match函数，支持在多个字段中匹配关键词，并利用倒排索引加速查询。
查询优化器：完善 MySQL 协议返回列的信息，包括原始数据库名、表名、列名和别名；增强聚合函数group_concat，支持同时使用order by和distinct进行复杂数据聚合；改进了 SQL 缓存机制，支持通过注释区分不同的查询以复用缓存结果；增强分区裁剪功能，支持在过滤条件中使用date_trunc和date函数；允许在表别名前使用数据库名作为限定名前缀；支持 Hint 格式注释。
执行引擎：Group concat函数现支持distinct和order by选项。
其他：新增系统表table_properties，便于用户查看和管理表的各项属性；新增 FE 中死锁和慢锁检测功能。

改进提升

湖仓一体：革新外表元数据缓存机制；新增会话变量keep_carriage_return，默认关闭。读取 Hive Text 格式表时，默认将\r\n与\n均视为换行符；优化 Parquet / ORC 文件读写内存统计；Paimon 表支持 IN/ NOT IN 谓词下推；升级优化器，支持 Hudi 表的 Time Travel 语法；Kerberos 认证流程优化，提升安全认证效率与稳定性；支持 Rename column 操作后读取 Hive 表；提升外表分区列读取性能；优化外表查询规划，优化数据分片合并策略，有效避免小分片对查询性能的影响；SHOW CREATE DATABASE / TABLE 新增 Location 等属性展示；MaxCompute Catalog 扩展支持复杂类型；优化文件缓存加载策略，通过异步加载方式避免 BE 启动时间过长的问题；升级文件缓存淘汰策略，有效管理长时间占用锁的资源。
异步物化视图：支持小时、周及季度级别的分区上卷构建；基于 Hive 外表的物化视图，在刷新前自动更新元数据缓存，以保证每次刷新可以获取最新数据；通过批量获取元数据，优化存算分离模式下的透明改写规划性能；通过禁止重复枚举，进一步提升透明改写的规划性能；优化基于 Hive 外表分区刷新物化视图的透明改写性能。
半结构化数据管理：优化 TOPN 查询内存分配，显著提升查询性能；优化倒排索引字符串处理性能；优化倒排索引在 MOW 表中的性能；建表时支持指定行存 page_size，以控制压缩效果。
查询优化器：调整 Mark Join 行数估计算法，提高基数估算准确性；优化 Semi / Anti Join 代价估计算法，能够正确选择最佳 Join 顺序；调整部分列无统计信息情况下的过滤估计算法，使估算更精准；改进 Set Operation 算子 Instance 计算逻辑，防止在极端情况下并行度不足的问题；优化 Bucket Shuffle 使用策略，数据打散不充分时也能获得更好的性能；窗口函数数据提前过滤，支持单投影中存在多窗口函数的情况；过滤条件含 NullLiteral 时，智能折叠为 False，转换为 EmptySet，减少不必要的数据扫描量；扩大谓词推导适用范围，在特定模式的查询下能够大幅减少数据扫描量；在分区裁剪中支持部分短路计算逻辑，以提升分区裁剪性能。在特定场景下，性能提升超过 100%；在用户变量中，支持计算任意的标量函数；当查询中存在别名冲突时，报错信息能够保持与 MySQL 一致。
执行引擎：实现 AggState 从 2.1 到 3.x 版本的兼容，并解决了 coredump 问题；重构无 Join 操作时的 Local Shuffle 策略选择机制；将内部表查询的 scanner 调整为异步模式，以防止查询内部表时出现卡顿；优化 Join 算子在构建 Hash 表时的 Block Merge 流程；缩短 MultiCast 持有锁的时间；优化 gRPC 的 keepAliveTime 设置并增加了链接监测机制，降低了因 RPC 错误导致的查询失败率。
存储管理：备份恢复 / 跨集群同步中 Restore 功能现已支持删除多余的 Tablet 和分区选项，在创建 Repository 时，支持检查存储连通性，Binlog 支持 Drop 表操作，使 CCR 能够支持 Drop 表的增量同步；Compaction 改进高优 Compaction 任务不受并发控制限制的问题，根据数据特性自动调整 Compaction 的内存消耗，修复顺序数据优化策略可能引发的聚合表或 MOR UNIQUE 表数据准确性问题，优化补副本期间 Compaction 选择 rowset 的策略，以避免触发 -235 错误；Merge-on-Write 解决了列更新和 Compaction 并发时列更新慢的问题，修复一次导入大量数据时，Segcompaction 可能导致 MOW 数据不正确的问题，解决 BE 重启后，可能导致列更新数据丢失的问题。
数据导入：改进了导入发生 -238 错误时的错误信息提示；实现在 Restore 分区时，其他分区可以同时进行导入；优化了 Group Commit FE 选择 BE 的策略；对于一些常见的 Stream Load 错误信息，避免了程序栈的打印，简化了错误处理；改进下线的 BE 可能影响导入出错的问题。
权限管理：优化了开启 Ranger 鉴权插件后的访问性能；优化了 Refresh Catalog / Database / Table 操作的权限策略，用户仅需 SHOW 权限即可执行此操作。

Bug 修复

湖仓一体：修复切换 Catalog 时可能出现的数据库找不到问题；解决了读取 S3 上不存在的数据时出现的异常报错；修正导出操作时，指定异常路径可能导致导出位置异常的问题；修复 Paimon 表时间列时区问题；临时关闭 Parquet PageIndex 功能以避免部分错误行为；修复外表查询时，错误选取黑名单中 Backend 节点的问题；解决读取 Parquet Struct 列类型中缺失子列导致查询错误的问题；修复 JDBC Catalog 的谓词下推问题；修正 Parquet 格式读取时，历史格式导致查询结果错误的问题；增强了 Oracle JDBC Catalog 对 OJDBC6 驱动的兼容性。
异步物化视图：修复无法在 Follower FE 上使用 show create materialized view 命令的问题；统一异步物化视图在元数据中的对象类型，使其在数据工具中正常显示；修复嵌套异步物化视图总是进行全量刷新的问题；修正 Cancel 任务在重启 FE 后状态可能显示为 running 的问题；修复错误使用上下文，导致刷新物化视图任务可能非预期失败的问题；修复基于外表创建异步物化视图时，VARCHAR 类型因长度不合理导致写入失败的问题。
半结构化数据管理：删除老优化器上 PreparedStatement 的支持；修复 JSON 转义字符处理的问题；修复 JSON 字段重复处理的问题；修复部分 ARRAY MAP 函数的问题；修复倒排索引查询和 LIKE 查询复杂组合的问题。
查询优化器：修复分区过滤条件中存在 or 时，可能导致分区裁剪错误的问题；修复存在复杂表达式时，可能导致的分区裁剪错误的问题；修复 AGG_STATE 类型中的子类型，Nullable 可能规划不正确导致执行报错的问题；修复 Set Operation 算子 Nullable 可能规划不正确，导致执行报错的问题；修复 Intersect 算子执行优先级不正确的问题；修复当查询中存在最大合法日期字面量时，可能出现 NPE 的问题；修复偶现的规划报错，导致的执行时报错 Slot 不合法的问题；修复重复引用 CTE 中的列，可能导致结果缺少部分列数据的问题；修复在查询中存在 CASE WHEN 时，偶现的规划报错问题；修复不能将 IP 类型隐式转换为 STRING 类型的问题。
执行引擎：修复多个场景下，Pipeline 执行引擎被卡顿，导致查询不结束的问题；修复了 NULL 和非 NULL 列在差集计算时导致的 Coredump 问题；修复了 width_bucket 函数结果错误的问题；修复了当单行数据很大且返回结果集也很大时（超过 2GB）查询报错的问题；修复了 stddev 在 DecimalV2 类型下结果错误的问题；修复了 MULTI_MATCH_ANY 函数导致的 Coredump 问题；修复了 INSERT OVERWRITE AUTO PARTITION 导致事务回滚的问题；修复了 convert_tz 函数结果错误的问题。
权限管理：修复创建物化视图时，错误地要求拥有 ALTER TABLE 的权限的问题；修复 show routine load 时，Database 显式为空的问题；修复 create table like 错误的要求拥有对原表的创建权限的问题；修复赋权操作没有检查对象是否存在的问题。
其它：修复并发导入 Auto Partition 表可能报 Tablet 不存在的问题；修复可能的 Load Stream 泄露问题；修复 INSERT INTO SELECT 没有数据时开启事务的问题；使用 Memtable 前移时忽略单副本导入的配置；修复后台导入 stream load record 遇见 Database 删除时异常中止的问题；修复 Strict Mode 模式下，出现数据错误时错误信息提示不准确的问题；修复 Stream Load 遇见错误数据不返回 Error URL 的问题。

Enterprise Core 2.1.5

发布日期：2024 年 7 月 25 日

行为变更

JDBC Catalog 的默认连接池大小从 10 调整为 30。
创建 JDBC Catalog 时，参数connection_pool_max_size的默认值改为 30，以避免高并发场景下连接池耗尽的问题。
将系统的保留内存的最小值，即low water mark调整为min (6.4G, MemTotal * 5%)，以更好地防止 BE 出现 OOM 问题。
修改了单请求多个语句的处理逻辑，当客户端未设置CLIENT_MULTI_STATEMENTS标志位时，将仅返回最后一个语句的结果，而非所有语句结果。
不再允许直接更改异步物化视图的数据。
增加会话变量use_max_length_of_varchar_in_ctas，用于控制 CTAS 时 VARCHAR 和 CHAR 类型长度的生成行为。默认值是 true。当设置为 false 时，使用推导出的 VARCHAR 长度，而不是使用最大长度。
统计信息收集，默认开启了通过文件大小预估 Hive 表行数的功能。
默认开启异步物化视图透明改写机制。
透明改写利用分区物化视图，如果分物物化视图部分分区失效，默认行为是将所有基础表与物化视图联合，以保证查询数据的正确性。

新功能

湖仓一体：会话变量read_csv_empty_line_as_null用于控制在读取 CSV 格式文件时，是否忽略空行。默认情况下忽略空行，当设置为 true 时，空行将被读取为所有列均为 Null 的行；新增兼容 Presto 的复杂类型输出格式。通过设置set serde_dialect="presto"，可以控制复杂类型的输出格式与 Presto 一致，用于平滑迁移 Presto 业务。
多表物化视图：支持在构建物化视图中使用非确定性函数；支持原子替换异步物化视图定义；支持通过show create materialized view查看异步物化视图创建语句；支持对多维聚合查询的透明改写；支持对非聚合物化视图的聚合查询进行透明改写；支持使用 Key 列，对查询中的 DISTINCT 聚合做透明改写；支持对物化视图进行分区，通过使用date_trunc对分区进行汇总；支持分区表值函数（TVF）。
半结构化数据分析：使用 VARIANT 类型的表支持部分列更新；支持默认开启 PreparedStatement；VARIANT 类型支持导出为 CSV 格式；支持explode_json_object函数，用于将 JSON Object 行转列；ES Catalog 将 ES 的 NESTED 或者 OBJECT 类型映射成 Doris JSON 类型；默认情况下，对于具有指定分词器的倒排索引，默认开启support_phrase以提升match_phrase系列查询性能。
查询优化器：支持explain DELETE FROM语句；支持常量表达式参数的 Hint 形式。
内存管理：增加了 HTTP API 以清除缓存。
权限管理：支持对表值函数（TVF）中的资源进行鉴权。

改进提升

湖仓一体：将 Paimon 升级至 0.8.1 版本；修复在部分情况下，查询 Paimon 表时导致org.apache.commons.lang.StringUtils的问题；支持腾讯云 LakeFS；优化了外部表查询时获取文件列表的超时时间；可通过会话变量fetch_splits_max_wait_time_ms进行设置；改进了 SQLServer JDBC Catalog 的默认连接逻辑；默认情况下，不干预连接加密设置。仅当force_sqlserver_jdbc_encrypt_false设置为true时，才会强制在 JDBC URL 中添加encrypt=false以减少认证错误，从而提供更灵活的控制加密行为的能力；Hive 表的 show create table 语句增加序列化/反序列化；FE 端 Hive 表列表默认缓存时间由 1 天改为 4 小时；数据导出（Export/Outfile）支持指定 Parquet 和 ORC 的压缩格式；当使用 CTAS+TVF 创建表时，TVF 中的分区列将被自动映射为 Varchar（65533）而非 String，以便该分区列能够作为内表的分区列使用；优化 Hive 写入操作元数据的访问次数；ES Catalog 支持将 NESTED/OBJECT 类型映射到 Doris 的 JSON 类型；优化使用低版本 OBJECT 驱动连接 Oracle 时的报错信息；当 Hudi 表 Incremental Read 返回空集时，Doris 同样返回空集而非报错；修复部分情况下内外表关联查询可能导致 FE 超时的问题；修复了在从旧版本升级到新版本时，如果开启了 Hive Metastore Even Listener 情况下，可能出现 FE 元数据回放错误的问题。
多表物化视图：创建异步物化视图时，支持自动选择 Key 列；异步物化视图分区刷新支持定义中使用date_trunc函数；嵌套物化视图中，当下层命中聚合上卷改写后，上层现在依然可以继续进行透明改写；当 Schema Change 不影响异步物化视图数据正确性时，异步物化视图保持可用状态；提升了透明改写的规划速度；计算异步物化视图可用性时，不再考虑当前的刷新状态。
半结构化数据管理：通过采样优化 DESC 查看 VARIANT 子列的性能；行存page_size默认从 4K 调到 16K 压缩率提升 30%，而且支持表级别可配置；JSON 类型支持 Key 为空的特殊 JSON 数据。
倒排索引：减少倒排索引 Exists 调用避免对象存储访问延迟；优化倒排索引查询流程额外开销；在物化视图中不创建倒排索引。
查询优化器：当比较表达式两侧都是 Literal 时，String Literal 会尝试向另一侧的类型转换；重构了 VARIANT 类型的子路径下推功能，现在可以更好地支持复杂的下推场景；优化了物化视图代价计算的逻辑，能够更准确的选择代价更低的物化视图；提升了 SQL 中使用用户变量时的 SQL 缓存规划速度；优化了 NOT NULL 表达式的估行逻辑，当查询中存在 NOT NULL 时可以获得更好的性能；优化了 LIKE 表达式的 NULL 拒绝推导逻辑；优化查询指定分区失败时的报错信息，可以更清楚看到是哪个表导致的问题。
查询引擎：将某些场景下 BITMAP_UNION 算子的性能提升了 3 倍；提升 Arrow Flight 在 ARM 环境下的读取性能；优化了explode、explode_map、explode_json函数的执行性能。
数据导入：支持为INSERT INTO ... FROM TABLE VALUE FUNCTION语句设置max_filter_ratio参数。

Bug 修复

湖仓一体：修复部分情况下查询 Parquet 格式导致 BE 宕机的问题；修复查询 Parquet 格式，BE 端打印大量日志的问题；修复部分情况下 FE 端重复创建大量 FileSystem 对象、写入 Hive 后的事务信息未清理、Hive 表写入操作导致线程泄露、无法正确获取 Hive Text 格式行列分隔符、读取 lz4 压缩块时的并发、Iceberg 表 count(*) 返回错误、创建基于 MinIO 的 Paimon Catalog 导致 FE 元数据回放错误、使用 Ranger 创建 Catalog 客户端卡死的问题。
多表物化视图：修复当基表增加新的分区时，可能导致的分区聚合上卷改写后结果错误的问题；修复关联的基表分区删除后，物化视图分区状态没有被置为不同步的问题；修复异步物化视图构建偶现的死锁问题；修复异步物化视图单次刷新大量分区时偶现的，报错 nereids cost too much time 问题；修复创建异步物化视图时，如果最终的 Select List 中存在 Null Literal，则无法创建的问题；修复单表物化视图，如果构建了聚合的物化视图，虽然改写成功，但是 CBO 没有选择的问题；修复 Join 输入都是聚合的情况下，构建分区物化视图，分区推导失败的问题。
半结构化数据管理：修复 VARIANT 在并发/异常数据等特殊情况下的问题；修复 VARIANT 用在不支持的 SQL 中 Coredump 的问题；修复 1.x 版本升级到 2.x 或者更高版本时因为 MAP 数据类型 Coredump 的问题；修复 ES Catalog 对 Array 的支持。
倒排索引：修复倒排索引 v2 DROP INDEX 元数据没有删除的问题；修复字符串长度超过“ignore above”时查询准确性问题；修复索引大小统计的问题。
查询优化器：修复部分因为保留关键字而导致导入无法执行的问题；修复了在创建表时 CHAR(255) 类型错误的记录为 CHAR(1) 的问题；修复了在相关子查询中的连接表达式为复杂表达式时返回错误结果的问题；修复了 DECIMAL 类型分桶裁剪有可能错误的问题；修复了部分场景下开启 Pipeline Local Shuffle 后，聚合算子计算结果错误的问题；修复当聚合算子中存在相等的表达式时，可能出现的规划报错问题；修复当聚合算子中存在 Lambda 表达式时，可能出现的规划报错问题；修复了由窗口函数生成的字面量在优化为字面量时类型错误导致无法执行的问题；修复了聚合函数 foreach combinator 错误输出 Null 属性问题；修复了 acos 函数在参数为超越范围值的字面量时不能规划的问题；修复当查询指定的同步物化视图时，显示指定查询分区导致规划报错的问题；修复了在规划过程中偶尔出现 NPE 的问题。
查询引擎：修复 DELETE WHERE 语句中，在 DECIMAL 数据类型作为条件报错的问题；修复查询执行结束，但是 BE 内存不释放的问题；修复在千级别 QPS 场景下，Audit Log 占用 FE 内存太多的问题；修复 sleep 函数在输入非法值时 BE Core 的问题；修复执行过程中 sync filter size meet error、使用时区时结果不对的问题；修复 cast string 到 int 时结果不对的问题；修复 Arrow Flight 协议在开启 Pipelinex 时查询报错的问题；修复 cast string to date/datetime 报错的问题；修复使用 <=> 做大表关联查询时 BE Core 的问题。
存储管理：修复列更新写入时遇到 DELETE SIGN 数据不可见问题；优化 Schema Change 期间 FE 的内存占用；修复 BE 重启时事务没有 Abort 导致的 BE 下线卡住问题；修复 NOT-NULL 到 NULL 类型变更的偶发报错问题；优化 BE 宕机时的副本修复调度；单个 BE 创建 Tablet 时支持 round-robin 选择磁盘；修复 Publish 慢导致的查询 -230 错误；优化 Partition Balance 的速度；使用 FD 数目和内存控制 Segment Cache 避免 FD 不足；修复 Clone 和 Alter 并发可能导致的副本丢失问题；修复不能调整列顺序问题；禁止自增列的部分 Schema Change 操作；修复 Delete 操作报错不准确；BE 侧 Trash 过期时间调整为一天；优化 Compaction 内存占用和调度；检查潜在的过大 Backup 导致 FE 重启的问题；恢复动态分区删除策略以及交叉分区的行为到 2.1.3；修复 DELETE 谓词重部分 DECIMAL 报错问题。
数据导入：修复导入时错误处理竞争导致的数据不可见问题；Stream Load 导入支持 hhl_from_base64；修复潜在的单表非常多 Tablet 导入失败时可能导致 FE OOM 的问题；修复 FE 主从切换时自增列可能重复的问题；修复 INSERT INTO SELECT 自增列报错问题；降低数据下刷线程数，优化内存占用；优化 Routine Load 任务自动恢复和错误信息；增加 Routine Load 默认攒批大小；修复 Routine Load 在 Kafka EOF 过期的任务停止问题；修复一流多表 Coredump；修复 Group Commit 内存估计不准导致的提前反压问题；优化 Group Commit BE 侧线程占用；修复数据没有分区时没有错误 URL 的问题；修复导入时潜在的内存误操作问题。
主键模型：降低主键表 Compaction 的内存占用；修复主键副本 Clone 失败时可能的重复数据问题。
内存管理：修复 Jemalloc Cache 统计不准的问题；修复在 K8s / CGroup 中不能正确获取内存大小的问题。
权限管理：修复 Table Valued Function 引用 Resource 时没有鉴权的问题；修复 Show Role 语句中没有 Workload Group 权限的问题；修复创建 Row Policy 时，同时执行两条语句，导致 FE 重启失败的问题；修复部分情况下，老版本升级后，因为 Row Policy 导致 FE 元数据回放失败的问题。
其他：修复计算节点参与内部表创建的问题；修复 enable_strong_read_consistency = true 时从延迟问题。

Enterprise Core 2.1.4

发布日期：2024 年 6 月 26 日

查询优化器支持 FE 火焰图工具、SELECT DISTINCT 与聚合函数同时使用、无 GROUP BY 的单表查询重写及高并发点查询功能。
湖仓一体支持 Paimon 的原生读取器来处理 Deletion Vector、在表值函数（TVF）中使用 Resource 及通过 Ranger 插件实现数据脱敏。
异步物化视图构建支持分区上卷、触发式更新、指定 store_row_column 及 Storage Medium，透明改写支持单表异步物化视图及 AGG_STATE 类型的聚合上卷。
其他功能支持，包括新增 replace_empty 函数、支持 show storage policy using 语句及 BE 侧的 JVM 指标。
进行了多项功能优化，包括优化 Segment Cache 所消耗内存的估算准确度、支持为中文列名创建倒排索引等。
对查询优化器、查询执行、物化试图、半结构化数据分析等多方面进行了问题修复。

Enterprise Core 2.1.3

发布日期：2024 年 5 月 17 日

支持 INSERT INTO Hive Catalog 中的 hive 表。
添加视图显示语句以查询视图。
工作负载组支持绑定到特定的 BE 主机。
Broker Load 支持压缩的 JSON 格式。
截断函数可以使用列作为比例参数。
支持 mv 嵌套物化视图重写。
添加 BypassWorkloadGroup 以传递查询队列。
添加添加新函数 uuid_to_int、int_to_uuid 和 strcmp，支持 hll 函数 hll_from_base64、hll_to_base64。
支持 Variant 类型的聚合模型。

Enterprise Core 2.1.2

发布日期：2024 年 4 月 18 日

增加 processlist 系统表功能，用户可以通过查询系统表获得活跃的链接信息。
增加新的表函数 LOCAL 以访问部分共享存储上的文件。
将 EXPORT 命令中 data_consistence 属性的默认值调整为 Partition，这可以使得并发导入的同时做 EXPORT 操作更容易成功。
兼容部分 MySQL Connector（如 MySQL.Data for .NET）将 SELECT @``@autocommit 的返回值类型变更为 BIGINT。
修复正常 Workload Group 从 2.0 或者更早版本升级到 2.1 时没有默认创建的问题。
在 Profile 中增加已命中的物化视图信息，能够方便地定位物化视图是否命中。
增加 DNS Cache，解决 K8s 环境下域名解析较慢，从而影响查询的问题。
增加异步刷新 Catalog 中表的行数信息，避免查询抖动。

Enterprise Core 2.1.1

发布日期：2024 年 4 月 8 日

改变 Float 类型字段返回值序列化的方式，提升大数据量下 Float 返回的性能。
修复了从 2.0.x 滚动升级至 2.1.x 的过程中，部分 BE 节点升级出现 Core 的问题及使用 JDBC Catalog 会出现 Query 报错的问题。
支持 IP 透传的协议，以方便在 FE 之前启用代理的同时还能获取客户端准确的 IP 地址，实现白名单权限控制。
增加系统表 backend_active_tasks，以实时监测每个 BE 上活跃任务以及消耗的资源信息。
CCR 支持倒排索引。
Arrow 序列化方式增加对 Variant 类型的支持。
修复包括在 Restore 过程中 BE 有时候会 Core 在内的 20 项 bug。

Enterprise Core 2.1.0

发布日期：2024 年 3 月 18 日

复杂 SQL 查询性能的进一步提升，在 TPC-DS 1TB 测试数据集上获得超过 100% 的性能提升，查询性能居于业界领先地位。
数据湖分析场景性能改进、相对于 Trino 和 Spark 分别有 4-6 倍的性能提升，并引入了多 SQL 方言兼容、便于用户可以从原有系统无缝切换至 Apache Doris。在面向数据科学以及其他形式的大规模数据读取场景，引入了基于 Arrow Flight 的高速读取接口，数据传输效率提升 100 倍。
在半结构化数据分析场景，引入了全新的 Variant 和 IP 数据类型，完善了一系列分析函数，面向复杂半结构化数据的存储和分析处理更加得心应手。
引入基于多表的异步物化视图以提升查询性能，支持透明改写加速、自动刷新、外表到内表的物化视图以及物化视图直查，基于这一能力物化视图也可用于数据仓库分层建模、作业调度和数据加工。
在数据存储方面，引入了自增列、自动分区、MemTable 前移以及服务端攒批的能力，提高大规模数据实时写入的效率。
在负载管理方面，进一步完善了 Workload Group 资源组的隔离能力，并增加了运行时查看 SQL 资源用量的能力，进一步提升了多负载场景下的稳定性。

Enterprise Core 2.0.x

Enterprise Core 2.0.14

发布日期：2024 年 8 月 8 日

增加获取最近一个查询 Profile 的 REST 接口 curl http://user:password@127.0.0.1:8030/api/profile/text。
优化 MOW 表带有 Sequence 列的主键点查性能。
优化倒排索引在查询条件很多时的性能。
创建带分词的倒排索引时，自动开启 support_phrase 选项加速 match_phrase 系列短语查询。
支持简化的 SQL Hint，例如 SELECT /*+ query_timeout(3000) */ * FROM t 。
读对象存储遇到 429 错误时自动重试提升稳定性。
LEFT SEMI / ANTI JOIN 在匹配到符合的数据行时，终止后续的匹配执行提升性能。
避免非法数据返回 MySQL 结果时出发 coredump。
输出类型名字时统一使用小写，保持跟 MySQL 兼容对 BI 工具更加友好。

Enterprise Core 2.0.13

发布日期：2024 年 7 月 23 日

仅在客户端设置 CLIENT_MULTI_STATEMENTS 时，将输入的 SQL 视为多个语句处理，以增强与 MySQL 的兼容性。
新增 BE 配置 allow_zero_date，允许使用全零的日期。设置为false时0000-00-00被解析成NULL，设置为true时则被解析成0000-01-01，默认值为false，跟之前的行为保持一致。
LogicalWindow 和 LogicalPartitionTopN 允许多字段谓词下推，以提升性能。
ES Catalog 将 ES nested或者object类型映射成 Doris JSON类型。
LIMIT 查询现在会更早地停止读取数据，以减少资源消耗并提升性能。
支持具有空键的特殊 JSON 数据。
routine load 的稳定性和易用性提升，包括负载均衡，自动恢复，异常处理，更友好的错误信息等。
对 BE 的硬盘选择策略和速度进行了优化。
改进了 JDBC Catalog 的稳定性和可用性，包括加密，线程池连接数等配置，更友好的错误信息等。

Enterprise Core 2.0.12

发布日期：2024 年 7 月 1 日

不再将建表的默认注释设置为表的类型，而是改成默认为空，比如 COMMENT 'OLAP' 变成 COMMENT ''，这样对于依赖注释的 BI 软件更加友好。
将 autocommit 变量的类型从 BOOLEAN 改成 BIGINT，以免有些 mysql 客户端（比如.NET MySQL.Data）报错
删除 disable_nested_complex_type 参数，默认允许创建嵌套的 ARRAY MAP STRUCT 类型
HMS catalog 支持 SHOW CREATE DATABASE 命令
在 query profile 中增加更多倒排索引的指标
跨集群数据复制（CCR）支持倒排索引

Enterprise Core 2.0.11

发布日期：2024 年 6 月 7 日

为 JSON 和 TIME 添加 Trino JDBC catalog 类型映射
在无法转移到（非）主节点时，FE 退出以防止未知状态和过多日志
在删除统计表时写入审计日志
如果表只进行了部分分析，忽略最小/最大列统计以避免低效的查询计划
支持集合操作减法，例如set1 - set2
使用 concat(col, pattern_str) 改进 LIKE 和 REGEXP 子句的性能，例如：col1 LIKE concat('%', col2, '%')
添加查询选项以支持短路查询，保证升级兼容性
由于倒排索引已经成熟稳定，可以替换老的 BITMAP INDEX，因此后续新建 BITMAP INDEX 会自动切换成 INVERTED INDEX，而已经创建的 BITMAP INDEX 保持不变。整个切换过程对用户无感知，写入和查询没有变化，此外用户可以修改 FE 配置 enable_create_bitmap_index_as_inverted_index = false 来关闭该自动切换

Enterprise Core 2.0.10

发布日期：2024 年 5 月 20 日

增加了read_only和super_read_only 变量以保持和 MySQL 兼容
仅在 IO_ERROR 的错误才把数据目录加入 broken list，防止 fd 超限等错误导致误加入
基于外表 CTAS 创建新表时，把 varchar 类型转成 string 类型
支持把 Paimon 的 Row 类型映射成 Doris 的 Struct 类型
在创建 tablet 选择数据盘时，允许存在少量的倾斜
对set replica drop命令记录 editlog，以防止在 follower 节点执行命令后，其状态显示不正确
schema change 内存自适应避免内存超限
倒排索引中 unicode 分词器可以配置不使用停用词

Enterprise Core 2.0.9

发布日期：2024 年 4 月 24 日

物化视图的 key 和 value 列都允许出现谓词
物化视图支持 bitmap_union(bitmap_from_array())
增加一个 fe 配置强制集群中所有表的 replicate allocation
新优化器支持日期字面量指定时区
MATCH_PHRASE 全文检索支持 slop 参数指定搜索词之间的距离
first_value/last_value 函数增加第二个参数指定忽略 NULL 值
lead/lag function 的 offset 参数可以为 0
调整物化视图匹配的顺序优先利用索引和预聚合加速查询

Enterprise Core 2.0.8

发布日期：2024 年 4 月 12 日

新优化器支持 TopN 优化中使用倒排索引
限制统计信息 STRING 长度为 1024 以控制 BE 内存消耗
修复未创建 JDBC Client 时意外关闭的情况
接受所有 Iceberg Database，不再做额外的名字检查
异步更新外表行数统计，避免同步更新带来的 Cache miss 和 Plan 不稳定
简化 Hive 外表的 isSplitable 方法，避免过多的 Hadoop metric

Enterprise Core 2.0.7

发布日期：2024 年 3 月 26 日

round 函数行为及时间精度转换行为跟 MySQL 保持一致
支持通过 Nginx, HAProxy 等代理连接的 IP 透传
通过在 information_schema 中增加 DEFAULT_ENCRYPTION 列、增加 processlist 表，提升 BI 工具的兼容性
创建 JDBC Catalog 时默认自动检测连通性
增强自动恢复提升 kafka routine load 的稳定性
倒排索引中文分词对英文默认做小写转换
repeat 函数的重复次数超过限制时报错
自动跳过 Hive 外表中的隐藏文件和目录
在某些极端情况下减少 file meta cache 避免 OOM
减少 broker load 的 jvm 内存占用
加速带排序的 INSERT INTO SELECT 比如 INSERT INTO t1 SELECT * FROM t2 ORDER BY k

Enterprise Core 2.0.6

发布日期：2024 年 3 月 14 日

自动选择物化视图时支持匹配带别名的函数
增加安全下线一个 tablet 副本的命令
外表统计信息增加行数统计缓存
统计信息收集支持 rollup
使用 protobuf 稳定序列化减少 tablet schema 缓存内存占用
提升 show column stats 的性能
统计信息收集和优化器支持 iceberg 和 paimon 的行数估计
jdbc catalog 支持读取 SQL Server 的 timestamp 类型

Enterprise Core 2.0.5

发布日期：2024 年 2 月 28 日

增加 SHOW TABLETS BELONG 语法用于获取 tablet 属于哪个 table。
InferPredicates 支持 IN，例如：a = b & a in [1, 2] -> b in [1, 2]。
利用过滤条件中的 is null 谓词，将 outer join 转换为 anti join。
支持对物化视图收集统计信息，并对统计信息收集任务优化，停止 auto analyze 后尽快停止统计收集。
SHOW PROCESSLIST 支持输出连接对应的 fe。
export 导出 csv 文件支持通过 with_bom 参数控制是否带有 Windows BOM。
Query plan 优化，包含在无统计信息时的优化和基于 rollup 的统计信息的优化。
修复 MySQL catalog 中 to_date 函数下推的问题。
优化 JDBC 客户端连接关闭的逻辑，在异常时正常取消查询。
优化 routine load 的内存占用和错误信息。

Enterprise Core 2.0.4

发布日期：2024 年 1 月 26 日

新优化器支持 datev1, datetimev1 和 decimalv2 数据类型以及 ODBC 外表，自动统计信息收集的可观测性和性能优化。
倒排索引支持 lower_case 和 ignore_above 选项以及 match_regexp 和 match_phrase_prefix 查询加速。
数据湖支持 paimon native reader 以及读取 lzo 压缩的 parquet 文件。
审计日志支持 insert into。
更加合理、精确的 precision 和 scale 的推导，满足金融场景的计算需求。
drop policy 支持 user 和 role。
改进数据冷却策略以及数据均衡、迁移等存储管控部分，节省本地硬盘存储空间。
ASCII 字符串 substr 优化及使用 date 函数时分区裁剪优化。

Enterprise Core 2.0.3

发布日期：2023 年 12 月 8 日

支持自动统计信息收集，通过收集统计信息有助于优化器了解数据分布特性，选择更优的计划以大幅提升查询效率。从 2.0.3 版本开始正式支持，默认为全天开启状态。
数据湖支持 JAVA UDF、JDBC、Hudi MOR 更多系统支持复杂数据类型。
CCR 跨集群复制支持限速、truncate table 等增强。
增加 SHA、JSON 更多内置函数。
倒排索引、case when、谓词下推等 20 多项性能提升。
分布式副本管理改进，包括跳过删除分区，colocate group，持续写时均衡失败，冷热分层表不能均衡等。
复杂数据类型、倒排索引、物化视图、导入和 compaction、数据湖兼容性、SQL 规划等稳定性提升。

Enterprise Core 2.0.2

发布日期：2023 年 10 月 8 日

易用性提升，包括优化优先级网络匹配逻辑、行级别支持角色授权等。
新优化器 Nereids 统计数据收集改进，包括运行分析任务时取消文件缓存、支持基本的 jdbc 外部表统计信息收集等。
倒排索引查询性能优化及增强，包括增加 bkd 索引提升新能、优化多词连接查询等。
数据湖 multi-catalog 更友好支持多类型数据源，包括 jdbc、hdfs、hive、mysql、maxcompute 等。
数组函数优化，array_union 支持多参数。

Enterprise Core 2.0.1

发布日期：2023 年 9 月 16 日

完善了 array 和 map 复杂数据类型的功能和稳定性，包括内表复杂类型嵌套、外表嵌套 orc/parquet 等。
倒排索引查询性能提升，包括分词、数值处理、谓词下推等。
查询性能提升，包括 bitmap, like, scan, 聚合函数等。
跨集群复制 CCR 功能和稳定性完善。
查询优化器统计信息收集更加快速和准确，提升自动查询优化效果。
数据湖 multi-catalog 功能和性能增强，包括 iceberg 性能优化、复杂数据类型等。

Enterprise Core 1.2.x

Enterprise Core 1.2.8

发布日期：2023 年 9 月 5 日

修复若干 decimal 相关的问题。
修复 show tables 无法显示拥有 select 权限的表。
修复副本调度相关的问题。
修复若干查询规划问题。
修复某些情况下，BE 进程文件句柄泄漏的问题。
修复某些情况下，建表超时的问题。
修复读取 ORC 格式文件错误的问题。
修复 Broker 关闭 FileSystem 导致读取错误的问题。
优化 Auto Bucket 的副本大小计算逻辑。
修复某些情况下，Spark Load 空指针异常问题。

常见导入问题 Enterprise Manager