AI 和分析统一数据库 Cloudberry Database 1.5.0 发布


近日,Cloudberry Database v1.5.0 正式发布,本次新版本新增了若干功能,同时包含了若干产品性能/稳定性优化,修复了若干 bug。

快速下载试用:Cloudberry Database 1.5.0

新功能​

分类 功能
查询处理 支持并行创建 AO/AOCO 表和并行刷新物化视图
支持自动使用物化视图进行查询优化
支持部署单计算节点的集群
支持使用命令行“一键”部署集群
存储 支持增量物化视图
支持在 AO 表上使用唯一索引
安全 支持登录错误输入密码次数检查

 

各个新功能的详细说明如下:

查询处理​

  • 支持并行创建 AO/AOCO 表和并行刷新物化视图。

    支持使用 CREATE TABLE AS 语句并行创建 Append-Optimized (AO) 表和 Append-Optimized Column Oriented (AOCO) 表,同时支持并行刷新基于该表的物化视图,从而加速建表和物化视图刷新。

  • 支持自动使用物化视图进行查询优化,即在查询规划阶段自动使用物化视图来计算部分或全部查询 (AQUMV)。这一功能使用场景:

    • 大数据量的聚合查询:对于需要从数百万条记录中进行聚合的查询,AQUMV 能显著减少查询时间。
    • 频繁更新的大表:在数据频繁更新的环境中,使用 IMV 可以确保查询结果的实时性和准确性。

集群管理​

  • 支持以单计算节点部署集群。

    在 v1.5.0 以前,用户部署一套 Cloudberry Database 集群时,至少需要部署一个 Coordinator 节点和一个 Segment 节点,还需要指定繁多的配置信息和启动参数,这一过程相对复杂耗时。

    从 v1.5.0 开始,用户可以像部署 PostgreSQL 一样部署单计算节点的 Cloudberry Database 集群,集群仅包含一个 Coordinator 节点,无需指定繁多的配置参数,也无需预分配多个节点的计算资源。

    用户只需使用脚本工具 gpdemo 即可快速部署一套单节点的 Cloudberry Database 集群。

  • 支持使用命令行工具“一键”部署集群。

    在 v1.5.0 以前,如果用户想在单节点上部署带有 Segment 的小型集群用于演示,需要花费时间编写配置文件和参数。自 v1.5.0 起,用户只需要通过内置的 gpdemo 脚本,使用一条命令就能快速部署指定 Segment 数的 Cloudberry Database 集群。即:

    gpdemo

存储​

  • 支持增量物化视图。

    增量物化视图是物化视图的一种特殊形式。当数据在基础表中发生变化时(例如插入、更新、删除操作),增量物化视图不需要重新计算整个视图中的所有数据。相反,它只更新那些自上次刷新以来发生变化的部分。这样可以节省大量的计算资源和时间,显著提高性能,尤其是在处理大型数据集时。

    自 v1.5.0 起,如果查询时有中间结果集需要加速,或者在读多写少的场景下,用户可以使用增量物化视图来加速查询。

  • 在 AO 表上使用唯一索引。

    自 v1.5.0 起,你可以在 Cloudberry Database 的 Append-Optimized (AO) 或 Append-Optimized Column Store (AOCS) 表上添加唯一索引。有了唯一索引,Cloudberry Database 会在将数据插入到 AO 表时,强制检查唯一性约束,从而保证数据的唯一性,同时能够与优化器一起优化特定的查询,从而提高数据库的查询性能。但这也带来的一定的开销用于维护唯一索引,尤其是在插入数据时。

安全​

  • 支持创建和绑定数据库的用户密码策略配置。

    Profile,即密码策略配置,用于控制数据库中用户的密码安全策略。Profile 定义了用户管理和重复使用密码的规则。通过配置 Profile,数据库管理员可以使用 SQL 语句强制添加一些约束,例如在一定次数的登录失败后锁定账户,或者控制密码重复使用次数。

    自 v1.5.0 起,Cloudberry Database 支持通过 SQL 语句创建 Profile,并将 Profile 绑定到一个或多个用户中,从而控制数据库用户的密码安全策略。

变更说明​

SQL 语法变更说明​

CREATE MATERIALIZED VIEW 新支持 INCREMENTAL 选项。你可以使用 SQL 命令 CREATE INCREMENTAL MATERIALIZED VIEW 来创建增量物化视图。完整的语法支持如下:

CREATE [INCREMENTAL] MATERIALIZED VIEW [ IF NOT EXISTS ] table_name
[ (column_name [, ...] ) ]
[ USING method ]
[ WITH ( storage_parameter [= value] [, ... ] ) ]
[ TABLESPACE tablespace_name ]
AS query
[ WITH [ NO ] DATA ]

功能变更说明​

参数变更说明​

Bug 修复​

  • 修复了 AOCO 表内存越界的问题。该 Bug 导致的报错如下所示:

    SET default_table_access_method=ao_column;
    CREATE temp TABLE nocolumns();
    
    SELECT EXISTS(SELECT * FROM nocolumns);
    
    WARNING:  detected write past chunk end in ExecutorState 0x8f79b78  (seg0 slice1 127.0.1.1:7002 pid=16215)
    
  • 修复了使用 EXPLAIN 查看查询计划时,输出结果中的 operatorMem 对齐问题,修复前显示如下:

    SET gp_resqueue_print_operator_memory_limits=ON;
    EXPLAIN(COSTS OFF) SELECT COUNT(*) FROM test_hj_spill;
    
                                    QUERY PLAN
    ----------------------------------------------------------------------------
    Finalize AggregateoperatorMem: 100 kB
    
          ->  Gather Motion 3:1  (slice1; segments: 3)operatorMem: 100 kB
    
                    ->  Partial AggregateoperatorMem: 100 kB
    
                              ->  Seq Scan on test_hj_spilloperatorMem: 100 kB
    
  • 修复了在特定条件下导致快照功能内存异常的问题,这个问题可能会在某些情况下使事务处理过程中发生 core dump。

  • 改进了并行扫描操作时,并行哈希连接中内部表格大小的估算精度。

  • 并行扫描时新增对 Semi HashJoin 类型的支持。

  • 改进了 NOT IN 语句的处理逻辑,现在它可以正确地处理包含 NULL 值的情况。例如,在执行像 SELECT c1 FROM t1_lasj WHERE c1 NOT IN (SELECT c1n FROM t2_lasj_has_null WHERE c1n IS NULL OR c1n IS NULL); 这样的查询时,将得到正确的结果。

  • 修复了在 macOS 上编译运行遇到的问题。

  • 修复了 CREATE EXTENSION 时,用户的 search_path 发生变更的问题。


相關推薦

2024-07-09

Greenplum 数仓衍生项目、开源替代数据库 Cloudberry Database 1.5.4 近期发布。Cloudberry Database 1.5.4 是一个小版本更新,包含了一些提升改进、 bug 修复和文档更新。下面是主要变更: 提升改进 添加 cbdb_relation_size 函

2023-11-18

方便用户根据自己的场景需求快速安装部署,进行 PoC、数据库学习,体验数据分析、数据仓库等场景。 欢迎前往社区版下载页面 piestore.openpie.com 下载,无需注册,输入手机号码即可快速登录。 免费下载、低成本:PieCloudDB

2024-06-29

、清理垃圾数据,更新数据和执行自动化操作等场景,为数据库管理员和开发人员提供了进一步的便捷。 本功能目前仅限企业版 新增数据加载功能 PieCloudDB 云原生平台新增数据加载功能。数据加载支持从不同的数据库抽

2023-10-21

增长的需求。 Alluxio Enterprise AI 平台可综合优化企业 AI 和分析基础设施的性能、数据可访问性、可扩展性和成本效益,助力生成式 AI、计算机视觉、自然语言处理、大语言模型和高性能数据分析等下一代数据密集型应用的发展。

2022-04-13

对步骤 CHEEVOS:禁止在 Hardcore 模式下手动设置帧延迟 DATABASE:Wii 的串行扫描现在包括 WBFS INPUT/MAPPING:在清除输入端口绑定时修复偏移和崩溃 INPUT/MAPPING:修复使用配置覆盖时保存“Analog to Digital Type”的问题 LOCALIZATION:

2024-05-21

DBeaver 是一个免费开源的通用数据库工具,适用于开发人员和数据库管理员。DBeaver 24.0.5 现已发布,更新内容如下: SQL Editor: 改进了语句分隔符的智能模式 设置“Blank line is statement delimiter”的默认选项已更改为“Alw

2022-09-08

无法删除 library panels 的问题。#54600 Metrics:修复grafana_database_conn_*metrics,并添加新的go_sql_stats_*metrics 作为最终替换。#54405 TestData DB:修复数据类型字段设置为随机时不显示节点图的问题。#54298 弃用 grafana_database_conn_*metrics

2023-01-14

大更新] 框架主体业务与代码生成器 完成 oracle postgres 多数据库类型支持(中间件不支持) [重大更新] 使用 spring 事件发布机制 重构登录日志与操作日志 支持多事件监听无入侵扩展 例如: 可以增加一个监听者将日志上传至ES

2023-10-14

务 (S3) 对象存储、Hadoop 分布式文件系统 (HDFS) 和其他关系数据库中的数据集。它利用 PostgreSQL 的外来数据封装器 API 来并行访问远程数据源,提供抽象数据模型来管理远程数据的安全性和统计数据,以优化查询。 增强文本搜索

2023-04-02

行一些相关操作的需求。而通过事件触发器可以捕获当前数据库下的ddl操作以及ddl操作的目标对象,当目标对象发生执行指定操作的事件后,触发用户自定义的存储过程,处理业务期望的后续任务。目前已支持捕获的DDL事件包括

2023-03-17

//opengemini.org openGemini 简介 openGemini 是由华为云数据库创新实验室自行设计、研发并面向全球开源的一款云原生分布式时序数据库。主要面向物联网和运维监控等场景,提供海量时序数据库处理和分析的开源解决方案,

2023-02-23

致未定义过滤 ( #23293 ) 如果直接从尚未加载/api/database的位置进入,则数据选择器无法在 FullApp 嵌入中工作 ( #21511 ) 更多详情可查看:https://github.com/metabase/metabase/releases/tag/v0.45.3   

2023-10-22

幅提升灾害防治、自然资源管理、农业估产等遥感应用的分析效率。”

2022-09-14

DuckDB 是一个高性能的分析数据库系统。它被设计为快速,可靠和易于使用。DuckDB 提供了丰富的 SQL 方言,支持远远超过基本 SQL。DuckDB 支持任意的和嵌套的相关子查询、复杂类型等。 注意:这个版本再次引入了一个向后不兼容