Apache Hop 2.0.0 正式 GA


Apache Hop 2.0.0 已正式发布。

Apache Hop(Hop 是 Hop Orchestration Platform 的缩写)是一个灵活、元数据驱动的数据编排、工程和集成平台。该项目起源于二十多年前的 ETL 平台 Kettle,经过几年的重构,于 2020 年 9 月进入 ASF 孵化器。

Kettle 是一款知名的开源 ETL 工具,抽取数据高效稳定,在执行 ETL 工具、ETL 数据抽取转换等批任务时,使用频率较高,包括电信、金融、银行在内的各行业都使用 Kettle 作为数据处理工具。但是由于各种因素,Kettle 近几年的发展还是较为缓慢,为了改变现况,从 2020 年 2 月份开始,Kettle 社区在 Kettle 8.2 的基础上创建了一个分支,Hop 正是基于这个分支构建的新项目,2020 年 9 月份,Hop 正式进入 ASF,成为孵化项目。

Apache Hop 基于 Java 的可视化设计器、服务器和配置工具易于在众多平台上设置、部署和维护,其被设计用于任何场景:本地、云、裸操作系统、容器、物联网环境、大型数据集等,并支持在 Windows、Linux 和 OSX 平台上运行。特点包括:

  • 轻量级的 “一次设计,处处运行” 架构
  • 元数据驱动
  • 可视化开发环境
  • 集成丰富的插件
  • 内置生命周期管理

2.0 更新亮点

升级到 Java 11

发布公告写道,在 2.0 中,Hop 可以在 Java 11 上可靠地运行。因为新版本升级了所有 Apache Hop 代码,目前支持在 Java 11 和 Java 8 上正常构建和运行。 官方称升级 Java 版本的工作进行了几个月,开发团队细致地修复和扩展了测试和代码问题。借此机会,他们还对代码进行了清理,同时对部分 API 进行了破坏兼容性的变更,开发者需要查看文档以了解如何才能将 Hop 插件升级到 2.0。

提供中文版本

Apache Hop 2.0 提供了中文版本,这项工作由中国开发者@Shl Xue贡献。

引入新的转换插件

Apache AVRO 文件输出

Apache Avro 文件输出将写入转换为 Avro 二进制或 JSON 格式的二进制文件或字段。

Apache Doris 批量加载程序

Apache Doris 是现代 MPP 分析数据库产品,可提供亚秒级查询和高效的实时数据分析。凭借其分布式架构,支持高达 10PB 级别的数据集,并且易于操作。Apache Doris Bulk Loader 转换支持以高速和大容量将数据插入到 Apache Doris 中,使其成为比使用传统数据库插入语句更快的数据加载方式。

Drools 规则执行器

Drools Rule Executor 转换可根据规则集执行传入行的字段。这对于确定附加信息,或将行路由到另一个转换很有用。

升级 Apache Beam

Apache Beam是先进的统一编程模型,可用于在任何执行引擎上运行批量和流式数据处理作业。流行的执行引擎包括 Apache Spark、Apache Flink 或 Google Cloud Platform Dataflow。 Apache Beam 一直是 Apache Hop 的一个重要插件,并随 Apache Spark 3.1.3 和 Apache Flink 1.14.4 升级到 2.38.0。 详情查看发布公告。

相關推薦

2022-11-30

源的用户名/密码,并为外部服务(例如 MySQL、PostgreSQL、Apache Cassandra、Consul、AWS 等)提供凭证。 Spring Vault 3.0 重要变化: 基于 Java 17 且支持 Java 19 Spring Vault 3.0 使用 Java 17 作为最低支持版本。如果开发者目前使用的是 Jav

2023-11-20

pring Data MongoDB4.2 GA-Javadoc-Documentation-Changelog Spring Data for Apache Cassandra4.2 GA-Javadoc-Documentation-Changelog Spring Data Neo4j7.2 GA-Javadoc-Documentation-Changelog Spring Data LDAP3.2 GA-Javadoc-Documentation-Changelog Spring Data REST4.2 GA-Javadoc-Documentation-Changelo

2023-04-15

一个开源的 MongoDB 替代品,建立在 PostgreSQL 之上,并在 Apache 2.0 许可下发布。 FerretDB 希望将 MongoDB 数据库的工作负载带回其开源的本源,使 PostgreSQL 和其他数据库后端能够运行 MongoDB 工作负载,保留 MongoDB 现有生态所提供的

2023-09-07

Apache Struts 小组宣布,Apache Struts 6.3.0 现已作为“General Availability”版本提供。具体更新内容包括: Bug WW-5330 - 提交文本区域包含超过 4000 个字符的表单时出现问题。 WW-5331 - 通过 tag 访问请求属性被破坏 Improvement WW-5233

2022-09-19

Apache Struts 小组宣布,Apache Struts 6.0.3 版现已作为“General Availability”版本提供。具体更新内容包括: 将 async 和速度插件添加到 bom #568 [WW-5191] 修复了 <s:textarea/> 标签中 maxLength 和 minLength 属性的位置 #572 [WW-5185] 重

2024-03-09

服务、极速弹性、极具成本效益的下一代 Kafka。100%兼容Apache Kafka,无分区数据复制。在无副作用的前提下解决了 Kafka 弹性、运维上的诸多痛点并且带来了数量级的成本降低。   AutoMQ 1.0.0 GA 版本现已在 Github 仓库 (https://g

2022-12-02

QL 支持。有关详细信息,请参阅GraphQL 支持。 引入了对 Apache Camel 路由的支持。有关详细信息,请参阅Apache Camel 支持。 Hazelcast Spring Integration Extensions 项目已作为spring-integration-hazelcast模块迁移。有关详细信息,请参阅 Hazelcast

2023-01-11

个版本 v1.5 发布,已经过了 3 个月,我们很高兴地宣布 Apache APISIX Ingress v1.6 正式发布! 在该版本中,共有 29 位贡献者 参与代码提交,其中 17 位是新晋贡献者 ,感谢大家的支持和参与! 本次发布的 Apache APISIX Ingress v1.6 版本

2023-04-12

驱动的游戏 还可以设置 4MLinux LAMP 服务器(Linux 6.1.10、Apache 2.4.56、MariaDB 10.6.12、PHP 5.6.40、PHP 7.4.33 和 PHP 8.1.17。) Perl 5.36.0、Python 2.7.18、Python 3.10.8 和 Ruby 3.1.3 可用 新的主要版本还有一些新功能: Krita(光栅图形编辑

2023-09-06

,我们很高兴的宣布,2023 年 9 月 4 日 我们正式发布了 Apache Doris 2.0.1 和 Apache Doris 1.2.7 这两个版本,这两个版本由上百名位贡献者共同努力完成的,提供了更多有用的新特性,同时修复了若干已知的问题,进一步提升了系统的

2023-03-24

图表: 此外,Oracle 还特别感谢了开发者 Rick Hillegas 和 Apache Derby 团队,“感谢他们多年来在每个 JDK 版本的抢先体验测试周期中提供的可靠且定期的反馈”。

2022-10-24

。 移除 GemFire 支持 由于 Spring Data 已停止支持 Apache Geode,因此 Spring Batch 中对 Apache Geode 的支持也被移除了。作为社区工作的存档,这些代码已被移动至 spring-batch-extensions 仓库。 最后,开发团队计划在 11 月初

2023-11-16

NET 8 已正式 GA。 微软称 .NET 8 提供了数以千计的性能、稳定性和安全性改进,以及平台和工具增强功能,有助于提高开发者的工作效率和创新速度。 比如 .NET 8 为 Android 和 WASM 引入了全新的 AOT 模式、改进 System.Text.Json,以及

2022-11-26

月之前仅接受错误修复。 目前 Spring Modulith  0.1 版本正式发布,此版本修复了一些 Bug ,顺便将依赖升级到 Spring Boot 3.0 。 到达 GA 版本意味着该工具已正式可用,取代了 Moduliths 项目,公告中称“结束了 Moduliths 项目与 S