开源查询引擎 Trino(Presto)10 岁了


十年前,Dain Sundstrom、Martin Traverso、David Phillips 和 Eric Hwang 在 Facebook 共同创建了最初的 Presto,这是一种大规模并行处理 SQL 引擎,旨在解决 Facebook 大型数据集的快速分析和查询问题。

在此之前,Facebook 的数据分析师依靠的还是 Apache Hive 在其数 PB 的数据仓库中运行 SQL 分析。对 Facebook 所拥有的这种规模数据来说,Apache Hive 还是太慢了。2012 年 Presto 正式诞生,很好地填补了这一空白,并于当年晚些时候在 Facebook 部署。

到 2013 年 11 月,Facebook 将 Presto 正式开源。开源后,Presto 已被 Netflix、LinkedIn 和 Teradata 等公司采用。

2017 年,此前采用了 Presto 的 Teradata 分拆出一家名为 Starburst Data 的公司,为 Presto 提供商业支持。

2018 年,这些创作者与 Facebook 分道扬镳,原始代码也被划为两个分支,留在 Facebook 下的被称为 PrestoDB,另一个由原创作者继续维护的则被称为 PrestoSQL。

2019 年 9 月,Facebook 将 PrestoDB 捐赠给了 Linux 基金会,成立了 Presto 基金会。但无论是 Presto 的创作者,还是顶级贡献者和提交者,都没有被邀请加入这个基金会。

2020 年,Presto 所有四位原始创作者都加入了此前提到的 Starburst 公司。同年 12 月,由于 Facebook 已经获得了 "Presto" 这个名字的商标,PrestoSQL 被重新命名为 Trino,从那时起,整个社区在新名字下蓬勃发展。

也就是说,虽然如今是 Starburst 在主导项目发展与 Trino 社区的维护,但 Starburst 公司的历史还没有 Trino 项目的创立时间久。

展望未来 Dain Sundstrom 表示,他对 Trino 和它的未来感到兴奋,因为他们仍在为 Trino 添加新的功能和特性,用例能够覆盖更多工作负载和数据类型。Trino 能够适用的范围也会越来越广 —— 例如,增加处理地理空间数据的功能意味着地图公司、手机供应商和食品配送公司可以从分析客户数据中获得附加值。

在官方博客中,Starburst 表示:

我们为在帮助 Trino 成为今天这样一个成熟的项目中所扮演的角色而感到自豪,包括我们自己做出的创新以及与我们的生态合作伙伴合作创造的创新。

 


相關推薦

2023-03-10

百家企业落地应用,2021年度入选中国科协“科创中国”开源创新榜单。项目经 Apache 基金会孵化,已于2022年12月顺利毕业。 社区资源 官方网站:https://kyuubi.apache.org/ 代码仓库:https://github.com/apache/kyuubi 邮件列表:https://kyuubi.ap

2023-10-20

【源创会预告】1024 程序员节(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> Apache Superset 3.0.1 现已发布。Apache Superset 是一款现代化的开源数据工具,用于数据探索和数据可视化。它提供了简单易用的无代码可视化构建器

2023-04-28

想查看列的实际类型,可以通过DESCRIBE ALL语句查看。) 查询information_schema库中的表时,默认不再返回 External Catalog 中的元信息。(该改动避免了因 External Catalog 的连接问题导致的information_schema库不可查的问题,从而解决部分 BI

2022-10-10

在开源大数据技术飞速发展的十数年,我们见证了多元化技术的兴起和变迁。如何从海量数据中,通过数据处理和可视化的手段,对开源大数据技术的过去、现在和未来,做出深刻洞察?如何为开发者在开源大数据技术领域的学

2023-02-03

间件项目,是由微众银行大数据平台团队在2019年7月进行开源,并于2021年8月正式捐献给全球顶级开源社区 Apache 软件基金会(ASF),成为 ASF 孵化项目,在2022年12月03日通过孵化毕业投票。 Apache Linkis 在上层应用程序和底层引擎

2023-07-05

线与离线的业务负载、高吞吐的交互式分析与高并发的点查询;通过一套架构实现湖和仓的统一、在数据湖和多种异构存储之上提供无缝且极速的分析服务;也可通过对日志/文本等半结构化乃至非结构化的多模数据进行统一管

2024-10-18

于云原生存算分离的架构,用户可以通过多计算集群实现查询负载间的物理隔离以及读写负载隔离,并借助对象存储或 HDFS 等低成本的共享存储系统来大幅降低存储成本。 3.0 版本是 Apache Doris 在湖仓一体演化路线上的重要里程

2023-07-20

的 Decimal 类型数据,用于兼容之前的逻辑。 问题修复 查询 修复了部分查询计划的问题; 支持会话变量 sql_select_limit 和 have_query_cache, 用于与老版本的 MySQL 客户端兼容; 优化 Cold Run 查询性能; 修复 Expr Context 类内存

2023-08-11

关功能,让存算分离更好地支持实时分析场景;性能上,查询和导入性能也基本与存算一体架构持平。 极速数据湖分析性能进一步提升,比 Trino/Presto 快3-6倍, 并实现常用 Trino 语法的完全兼容;增加 Apache Iceberg 的读写支持、

2024-07-26

据分析等方面进行了全面更新及改进,同时在倒排索引、查询优化器、查询引擎、存储管理等 10 余方向上完成了若干问题修复,欢迎大家下载使用。 官网下载:https://doris.apache.org/ GitHub 下载:https://github.com/apache/doris/releases/tag

2022-06-10

Apache Superset 1.5.1 现已发布。Apache Superset 是一款现代化的开源数据工具,用于数据探索和数据可视化。它提供了简单易用的无代码可视化构建器和声称是最先进的 SQL 编辑器,用户可以使用这些工具快速地构建数据仪表盘。 具体

2023-09-26

DBeaver 是一个免费开源的通用数据库工具,适用于开发人员和数据库管理员。DBeaver 23.2.1 现已发布,更新内容如下: SQL Editor: 改进了带有连接的表的别名建议 SQL 控制台现在可以保存为脚本 增强型智能补全已启用(可

2023-02-02

阳康后继续开源,本次发布建议更新 I6B7AN 修复注解@InheritMapper 解析映射目标为Object的BUG public static interfaceCommonMapper<T> extends BaseMapper{ @InheritMapper public List<T> implementByChild(T t); } @SqlResource("user") public static interfaceMyTestU

2022-07-06

,GreenPlum 物联网时序数据库:Machbase,TD-Engine,IotDB SQL 查询引擎:Drill,Presto,Druid 内存数据库:ignite,CouchBase 阅读文档 源码和例子 在线体验 多库使用 性能测试