领英发布 Feathr 1.0,简化机器学习


Feathr 是领英(LinkedIn)为简化机器学习 (ML) 功能管理和提高开发者生产力而构建的特征存储,并已在生产环境中使用多年,该项目于 2022 年 4 月正式开源。

Feathr 1.0 近日正式发布,具有以下新功能:

新功能

  • Feathr 沙盒:Feathr 沙盒是一个预先配置好的环境,可以用来学习如何使用 Feathr、带有实验性功能,并在本地建立概念验证的应用程序,而不需要在云端设置复杂的基础设施。
  • Online Transform:Online Transform(在线转换)是一项功能,可以实现实时的特征转换,作为特征检索过程的一部分。
    • 特征化源只在推理时可用
    • 使用离线转换可能是对存储和计算资源的一种浪费
    • 用户希望将特征化工作从上游的在线系统中分离出来
    • 用户希望为在线和离线消费定义一次转换
  • 使用 Azure Cosmos DB 作为在线存储
  • Feathr Notebook 示例现在提供了 5 个带有 Jupyter notebooks 的入门教程,帮助用户入门,这些 notebooks 涵盖了 ML 工作中常用的各种用例。
  • Web UI 在以下方面得到了增强
    • 支持注册功能
    • 支持删除功能
    • 支持显示版本
    • 在顶部菜单中添加了行文,以便快速访问,你可以在 Feathr 实时演示网站上尝试这些新变化(https://feathr-registry-sql.azurewebsites.net/)
  • 使用 SparkSQL 作为 DataSource,代码样本可以在以下链接找到(链接)。
  • 数据源路径中支持时间模式
  • 特征名称冲突检查和自动修正
  • Feathr MLOps V2 与 Terraform Deployment 的整合

更多详情可查看:https://github.com/feathr-ai/feathr/releases/tag/v1.0.0


相關推薦

2022-04-20

领英(LinkedIn)近日宣布开源 Feathr,这是领英为简化机器学习 (ML) 功能管理和提高开发者生产力而构建的特征存储。 特征存储是一个用于管理机器学习特征的数据管理系统,包括特征工程代码和特征数据。它是一个中央存储

2022-09-27

Feathr 是领英为简化机器学习 (ML) 功能管理和提高开发者生产力而构建的特征存储,并已在生产环境中使用多年,该项目于今年 4 月正式开源。 突出的特点 UI:添加数据源详细页面 添加 aerospike sink 支持在 Local Spark 环境中

2022-11-23

Feathr 是领英为简化机器学习 (ML) 功能管理和提高开发者生产力而构建的特征存储,并已在生产环境中使用多年,该项目于今年 4 月正式开源。 重要变化: 将派生功能的执行引擎改为 Spark SQL,所以对于没有运行最新样本 notebook

2022-07-21

开源量子编程框架 Cirq 的第一个完整版本 :Cirq 1.0 正式发布。 Cirq 是一个 Python 框架,用于编写、操作和优化量子电路。它专为近期的量子计算机设计,这些计算机具有几百个量子比特和几千个量子门,而 Cirq 1.0 版本支持这些

2023-04-04

Kubeflow v1.7 可以利用开发者的 Python 知识来构建无缝的工作流程,而不需要 Kubernetes CLI 命令,也不需要为每次迭代构建容器镜像。通过多个组件中的新 UI,开发人员可以将配置参数与日志联系起来,这使他们能够快速分析结果。

2023-12-01

微软近日正式发布 ML.NET 3.0,带来了许多新功能和改进。 ML.NET 是一个开源、跨平台的机器学习框架,专为 .NET 开发者设计,可以将自定义的机器学习模型集成到 .NET 应用程序中。 在这个版本中,深度学习方案得到了大幅

2022-08-25

推理图的一种新的、更简单的方法,在 2.0 中作为 Beta 版发布。 更多详情可查看:https://github.com/ray-project/ray/releases/tag/ray-2.0.0  

2023-02-12

于加速 ML 工作负载的工具包(Ray AIR)组成。 Ray 2.2 正式发布,该版本增强了可观察性、提高了数据密集型人工智能应用的性能、提高了稳定性,并为 RLlib 提供了更好的用户体验。 改善整个 Ray 生态的可观察性 Ray Jobs API 现在

2023-04-27

Apache Flink 社区很荣幸地宣布 Apache Flink ML 2.2.0 版本正式发布!本次发布的版本重点添加了 Flink ML 中的特征工程算法。现在 Flink ML 包含了 33 个开箱可用的特征工程算法,可以支持很多常见的特征工程任务。 随着这些算法的添

2023-04-05

Slint 1.0 已发布,标志着项目已顺利从开发阶段“毕业”,可正式用于生产环境。 1.0 文档:https://slint-ui.com/releases/1.0.0/docs/slint/ Slint(最初称为"SixtyFPS")是一个 Rust 编写的综合性 UI 工具包,用于为桌面和嵌入式设备构建原生用

2022-08-11

父 Juergen Schmidhuber 创办的人工智能公司 NNAISENSE 宣布正式发布其 EvoTorch 开源进化算法库。根据介绍,这是同类中的首个开源平台,为工业界提供了一个进化算法包 (evolutionary algorithm,EA);当与机器学习专业知识相结合时,可以在

2023-03-26

开源监控项目 frostmourne 最新发布版本 1.0-RELEASE,带来了很多核心功能,欢迎使用 更新内容 ### Feature * 【1.0】发布0.9-RELEASE, 开始1.0-SNAPSHOT开发 [2022-09-19] * 【1.0】数据名增加名称模糊查询 [2022-09-25] * 【1.0】prometheus增加/api/v1/que

2023-03-04

OpenSearch 2.6 已正式发布。此版本新增了按照 OpenTelemetry 标准构建的数据模式 (data schema),为分析和可观察性用例的未来功能进行了铺垫。此外还升级了索引管理、改进了安全分析工作负载的威胁检测,并为可视化工具、机器学习

2023-11-18

,并认为其可能改变 Linux 应用程序的游戏规则。“通过简化内核优化,将使 Linux 对更广泛的用户和应用程序来说更易用、更高效。特别是,我看到自动调整系统几乎可以提升所有服务器、云计算和数据中心应用的性能。”