Feathr 0.8 发布,领英开源的企业级高性能特征存储


Feathr 是领英为简化机器学习 (ML) 功能管理和提高开发者生产力而构建的特征存储,并已在生产环境中使用多年,该项目于今年 4 月正式开源。

突出的特点

  • UI:添加数据源详细页面
  • 添加 aerospike sink
  • 支持在 Local Spark 环境中运行 Feature Join Job

改进

  • 对 github PR/Issue 模板的更新
  • 添加关于 maven 发布自动化的文档
  • 在 README 中添加 OSS 徽章
  • 修复破损的文档链接
  • 为 macOS 添加必要的 _scproxy
  • 转移到 LFAI 后的清理工作
  • 更新 ARM 模板中的 docker 版本,以使用最新发布的镜像
  • 添加了更漂亮的文档
  • 删除 sbt 中对 aerospike JAR 的引用
  • 扩展 RBAC,支持项目 ID 作为输入
  • 修复了 docker image 在 demo 应用中无法更新的问题
  • 锁定 Python 的依赖版本
  • 应用 'aggregation_features' 参数合并数据帧
  • 修复 rbac 注册表中的数据源详细页面
  • 修复锚点中的 multi-keyed 功能
  • 修复 #LATEST 的路径
  • 修复 Spark 执行器上的特征值适配器和 UDF 适配器
  • 增强 SQL 注册表错误信息

更多详情可查看:https://github.com/feathr-ai/feathr/releases/tag/v0.8.0


相關推薦

2022-04-20

领英(LinkedIn)近日宣布开源 Feathr,这是领英为简化机器学习 (ML) 功能管理和提高开发者生产力而构建的特征存储。 特征存储是一个用于管理机器学习特征的数据管理系统,包括特征工程代码和特征数据。它是一个中央存储

2022-11-23

Feathr 是领英为简化机器学习 (ML) 功能管理和提高开发者生产力而构建的特征存储,并已在生产环境中使用多年,该项目于今年 4 月正式开源。 重要变化: 将派生功能的执行引擎改为 Spark SQL,所以对于没有运行最新样本 notebook

2023-03-09

Feathr 是领英(LinkedIn)为简化机器学习 (ML) 功能管理和提高开发者生产力而构建的特征存储,并已在生产环境中使用多年,该项目于 2022 年 4 月正式开源。 Feathr 1.0 近日正式发布,具有以下新功能: 新功能 Feathr 沙盒:Feathr

2023-06-15

LT 还提供了灵活的分布式训练部署以满足不同的需求。 开源地址:https://github.com/alibaba/graphlearn-for-pytorch 文档地址:https://graphlearn-torch.readthedocs.io/en/latest/index.html 背景介绍 图神经网络作为一种图数据上表示学习的方法已

2023-01-10

市公司,中科院、红 + 字会等。相比 WordPress,高安全、高性能、本地化是我们的切入点。(已获得 Gitee 评为:最有价值的开源项目)。 v5.0.8 主要修复多站点切换时,可能正常换成数据读取不正确的问题。 JPress v5.0.8  更新内

2023-07-06

能、扩展性及可用性上均得到了大幅提升,已基本达到了企业级数据库的部署和应用的要求。同时,本迭代也初步补齐了 MatrixOne 核心架构上的最后一块拼图 Proxy,该模块将应用提交的各种 SQL 请求及负载类型与相应 CN 组关联,

2022-11-09

GB 的小数据(例如 64kb)读取。 目前 DirectStorage 1.1 已发布 ,这个版本正式带来了 GPU 解压缩功能,在解压游戏资源方面加速了好几倍。 新东西: GPU 解压缩和 Gdeflate 压缩格式现已可用。 添加了 EnqueueSetEvent ,以使

2022-08-10

Markdown 和 Emacs Org 模式(更多内容即将加入)。 Logseq 0.8 发布,更新内容如下: 功能 新增设置选项 :feature/enable-search-remove-accents,以获得更好的搜索体验 将宏提取为块;为慢速查询增加一个刷新按钮(这些查询不会自动重

2022-04-20

。 事件起因于微软旗下全球最大的职业社交网络平台领英(LinkedIn)和小型数据分析公司 HiQ 之间的诉讼。一直以来,HiQ 都依赖于爬取 LinkedIn 用户在网络上可公开访问的信息来实现商业模式。但随着越来越多的企业开始爬

2023-09-19

开发者使用,适用于开发 ERP、OA、CRM、EAM、WMS、MES、PM 等企业级信息化系统,是企业数字化转型的必备工具 更新日志 v2.0.7 (2023-09-17) Features 【基础平台】:功能列表删除数据时刷新列表数据 【基础平台】:树形功能更多

2023-10-14

VMware Greenplum 7 现已正式发布。Greenplum 是一个统一分析和人工智能 (AI) 平台,旨在帮助企业充分利用其数据资源。VMware Greenplum 核心是以开源 PostgreSQL 项目为基础,其独特之处在于将商业智能(BI)和人工智能(AI)功能无缝集成

2023-12-03

Light Chaser v0.0.8 已经发布,大屏数据可视化设计器 此版本更新内容包括: 新增分组图层设置面板 新增图层列表支持右键菜单 优化蓝图性能, 优化图层列表操作体验 优化画布组件拖拽体验,支持shift固定方向拖拽 优化

2022-11-30

软件还可以在 macOS 和 Windows 上使用。 OpenRGB 0.8 近日正式发布,这是该项目有史以来最大的一次更新。新版本增加了大量新设备的支持,还对其用户界面进行了改进、能够自动生成 udev 规则、进行了错误修复,并进行了大量的其

2023-03-17

续版本迭代,现已发布 v1.0.0 版本,在高性能、高安全、企业级特性、可扩展性、功能、应用开发等六个方面已全面具备生产环境可使用的完整能力。 高性能 openGemini 针对物联网、运维监控等领域海量数据管理和分析诉求