微软近日正式发布 ML.NET 3.0,带来了许多新功能和改进。
ML.NET 是一个开源、跨平台的机器学习框架,专为 .NET 开发者设计,可以将自定义的机器学习模型集成到 .NET 应用程序中。
在这个版本中,深度学习方案得到了大幅扩展——引入了目标检测 (Object Detection)、命名实体识别 (Named Entity Recognition) 和问答 (Question Answering) 等新功能。这些功能得以实现,得益于与 TorchSharp 和 ONNX 模型的集成和互操作性。同时,该版本还将集成的 LightGBM 升级到了最新版本。
数据处理方面也有很大的改进,DataFrame 引入了一系列增强和错误修复,使得数据的加载、检查、转换和可视化等步骤更加强大。
在 ML.NET 3.0 中,开发者可以利用这些先进的功能来处理深度学习、自然语言处理等机器学习任务。例如,可以使用 ML.NET 的目标检测 API 来定位和分类图像中的实体,还可以使用 ML.NET 的命名实体识别和问答训练器来处理自然语言处理任务。
此外,ML.NET 3.0 还引入了 Intel oneDAL 的训练加速功能,可以加快训练过程。Intel oneDAL 是一个用于数据分析的库,通过提供高度优化的算法构建块,加速数据分析和机器学习过程。它通过利用 64 位架构中的 SIMD 扩展,支持 Intel 和 AMD 的 CPU。
自动机器学习 (AutoML) 也是 ML.NET 3.0 的一个重要功能。AutoML 可以自动化应用机器学习到数据的过程,简化了模型构建的流程。ML.NET 3.0 的 AutoML 针对多个新功能进行了增强,包括支持判断句子相似性、问答和目标检测等任务。
详情查看 Release Notes。