统一

单一系统可支持各种分析负载

单一系统可支持各种分析负载

融合统一

大数据分析领域拥有大量针对特定场景的工具和技术,企业通常需要部署大量的产品来满足不同分析场景的需求。而这个带来了组件过多、运维成本高、数据链路长、数据重复存储等一系列问题。

SelectDB 作为现代化统一的数据仓库,单一系统支持多种数据源,支持多种数据类型,支持多种数据分析场景。All-In-One 的分析平台,更加易于使用和管理,让企业精力从管理复杂的数据基础设施转为关注上层的数据应用。

现代化统一的数据仓库

核心特性

湖仓统一
湖仓统一

不仅支持内部表,还支持通过 Multi-Catalog 集成外部数据湖和数据库

  • 丰富的数据湖类型:HDFS、对象存储等湖存储,Hive、Iceberg、Hudi 等表格式,HMS、Glue、DLF 等元数据目录
  • 多种集成方式:元数据目录映射,数据库、数据表映射,表值函数(TVF)直接访问
  • 查询、导入与导出:内外表联邦查询,外表数据导入内表,内表数据导入外表
多模统一
多模统一

不仅支持结构化数据,还支持半结构化和文本数据

  • Array、Map、JSON 等复合数据类型
  • 任意数据容器 Variant 类型,支持 JSON 数据的自动类型推断和列式存储
  • 支持存储文本,支持文本上的 NGram BloomFilter 和 倒排索引,提升文本匹配性能
离线统一
离线统一

不仅支持实时报表查询与交互式即席分析,还支持库内增量数据处理(即将推出)

  • 库内 ELT: 从依靠外部 Spark 或 Flink 做 ETL,支持库内 ELT
  • 增量数据读取:数据存储支持增量数据读取
  • 增量数据处理:比Spark更实时,比 Flink 更易用

查看其他特性