Apache Hop 2.0.0 正式 GA


Apache Hop 2.0.0 已正式发布。

Apache Hop(Hop 是 Hop Orchestration Platform 的缩写)是一个灵活、元数据驱动的数据编排、工程和集成平台。该项目起源于二十多年前的 ETL 平台 Kettle,经过几年的重构,于 2020 年 9 月进入 ASF 孵化器。

Kettle 是一款知名的开源 ETL 工具,抽取数据高效稳定,在执行 ETL 工具、ETL 数据抽取转换等批任务时,使用频率较高,包括电信、金融、银行在内的各行业都使用 Kettle 作为数据处理工具。但是由于各种因素,Kettle 近几年的发展还是较为缓慢,为了改变现况,从 2020 年 2 月份开始,Kettle 社区在 Kettle 8.2 的基础上创建了一个分支,Hop 正是基于这个分支构建的新项目,2020 年 9 月份,Hop 正式进入 ASF,成为孵化项目。

Apache Hop 基于 Java 的可视化设计器、服务器和配置工具易于在众多平台上设置、部署和维护,其被设计用于任何场景:本地、云、裸操作系统、容器、物联网环境、大型数据集等,并支持在 Windows、Linux 和 OSX 平台上运行。特点包括:

  • 轻量级的 “一次设计,处处运行” 架构
  • 元数据驱动
  • 可视化开发环境
  • 集成丰富的插件
  • 内置生命周期管理

2.0 更新亮点

升级到 Java 11

发布公告写道,在 2.0 中,Hop 可以在 Java 11 上可靠地运行。因为新版本升级了所有 Apache Hop 代码,目前支持在 Java 11 和 Java 8 上正常构建和运行。 官方称升级 Java 版本的工作进行了几个月,开发团队细致地修复和扩展了测试和代码问题。借此机会,他们还对代码进行了清理,同时对部分 API 进行了破坏兼容性的变更,开发者需要查看文档以了解如何才能将 Hop 插件升级到 2.0。

提供中文版本

Apache Hop 2.0 提供了中文版本,这项工作由中国开发者@Shl Xue贡献。

引入新的转换插件

Apache AVRO 文件输出

Apache Avro 文件输出将写入转换为 Avro 二进制或 JSON 格式的二进制文件或字段。

Apache Doris 批量加载程序

Apache Doris 是现代 MPP 分析数据库产品,可提供亚秒级查询和高效的实时数据分析。凭借其分布式架构,支持高达 10PB 级别的数据集,并且易于操作。Apache Doris Bulk Loader 转换支持以高速和大容量将数据插入到 Apache Doris 中,使其成为比使用传统数据库插入语句更快的数据加载方式。

Drools 规则执行器

Drools Rule Executor 转换可根据规则集执行传入行的字段。这对于确定附加信息,或将行路由到另一个转换很有用。

升级 Apache Beam

Apache Beam是先进的统一编程模型,可用于在任何执行引擎上运行批量和流式数据处理作业。流行的执行引擎包括 Apache Spark、Apache Flink 或 Google Cloud Platform Dataflow。 Apache Beam 一直是 Apache Hop 的一个重要插件,并随 Apache Spark 3.1.3 和 Apache Flink 1.14.4 升级到 2.38.0。 详情查看发布公告。

相关文章

2022-11-30

源的用户名/密码,并为外部服务(例如 MySQL、PostgreSQL、Apache Cassandra、Consul、AWS 等)提供凭证。 Spring Vault 3.0 重要变化: 基于 Java 17 且支持 Java 19 Spring Vault 3.0 使用 Java 17 作为最低支持版本。如果开发者目前使用的是 Jav

2022-09-19

Apache Struts 小组宣布,Apache Struts 6.0.3 版现已作为“General Availability”版本提供。具体更新内容包括: 将 async 和速度插件添加到 bom #568 [WW-5191] 修复了 <s:textarea/> 标签中 maxLength 和 minLength 属性的位置 #572 [WW-5185] 重

2022-12-02

QL 支持。有关详细信息,请参阅GraphQL 支持。 引入了对 Apache Camel 路由的支持。有关详细信息,请参阅Apache Camel 支持。 Hazelcast Spring Integration Extensions 项目已作为spring-integration-hazelcast模块迁移。有关详细信息,请参阅 Hazelcast

2022-10-24

。 移除 GemFire 支持 由于 Spring Data 已停止支持 Apache Geode,因此 Spring Batch 中对 Apache Geode 的支持也被移除了。作为社区工作的存档,这些代码已被移动至 spring-batch-extensions 仓库。 最后,开发团队计划在 11 月初

2022-11-26

月之前仅接受错误修复。 目前 Spring Modulith  0.1 版本正式发布,此版本修复了一些 Bug ,顺便将依赖升级到 Spring Boot 3.0 。 到达 GA 版本意味着该工具已正式可用,取代了 Moduliths 项目,公告中称“结束了 Moduliths 项目与 S

2022-11-21

Rocky Linux 8.7 已正式 GA。Rocky Linux 是一个企业级 Linux 发行版,与 RHEL 完全兼容,由 CentOS 创始人 Gregory Kurtzer 创建和领导,支持 x86_64 和 AArch64 处理器架构。 新版下载地址:https://rockylinux.org/download/ 主要变化 NetworkManager 已 re

2022-11-23

Oracle Linux 8.7 上周正式发布了 GA 版本,支持 64 位英特尔、AMD (x86_64),以及 64 位 Arm (aarch64) 架构平台。与所有的 Oracle Linux 版本一样,此版本与相应 RHEL 版本 100% 应用二进制兼容。 对于 64 位英特尔和 AMD 架构,Oracle Linux 提供了

2022-11-11

NET MAUI 6 正式发布大约半年后,微软今天在 .NET Conf 2022 大会举办期间宣布 .NET MAUI 7 已正式 GA——与 .NET 7 一起推出,可在 Visual Studio 17.4 中使用。未来,.NET MAUI 将继续保持与 .NET 一致的发布节奏,即 .NET MAUI 7.0 与 .NET 7.0 一起发

2022-11-26

em for Linux (WSL) 已从“预览”阶段毕业,并随着 1.0 的发布正式升级为 "GA"。 WSL 在去年被上架到 Microsoft Store,以方便用户更容易进行安装和更新,最初只支持 Windows 11。现在微软表示,为了满足社区用户的需求,Microsoft Store

2022-11-23

Spring Authorization Server 1.0 现已正式发布,Spring Authorization Server 是 Spring Security 团队领导的社区驱动项目,致力于解决 Spring 社区的 OAuth 2.0 Authorization Server 支持问题。 公告称,自 2020 年 4 月 2 日首次提交以

2022-11-23

Spring Security 6.0 现已普遍可用。与此同时 Spring Security 5.8 也已全面上市,以简化到 6.0 的升级。 Spring Security 是一个能够为基于 Spring 的企业应用系统提供声明式的安全访问控制解决方案的安全框架。它提供了一组可以在 Spring 应

2022-11-18

Spring Framework 6.0.0 现已正式发布。 “这是 2023 年及以后新一代框架的开始,拥抱了 OpenJDK 和 Java 生态系统中当前和即将到来的创新。同时,我们将其精心设计为针对现代运行时环境的 Spring Framework 5.3.x 的直接升级。” 作为核心

2022-09-21

JDK 19 / Java 19 已正式发布。 新版本总共包含 7 个新的 JEP: 405: Record Patterns (Preview) 422: Linux/RISC-V Port 424: Foreign Function & Memory API (Preview) 425: Virtual Threads (Preview) 426: Vector API (Fourth Incubator) 42

2022-11-12

新内容包括: 查询性能 Neo4j 工程师的运行时优化使 K-Hop 查询变得更快。内部基准测试表明,对于 8-hop 查询,Neo4j 5 的性能与其前身相比提高了 1000 倍。 Cypher clauses CONTAINS 和 ENDS WITH 广泛用于按文本属性过滤结果。Neo4j 5 中基