OpenCV 4.9.0 发布,Intel 开源的计算机视觉库


OpenCV 是 Intel 开源计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 4.9.0 版本的主要更新内容如下:

  • Core Module

    • #23965 添加cv::broadcast
  • DNN module patches:
    • Experimental transformers 支持
    • #24476 ONNX Attention layer 支持
    • #24037 ONNX Einsum layer 支持
    • #23987 INT8 models 的 OpenVINO 后端
    • #24092 ONNX Gather Elements layer
    • #24378 ONNX InstanceNorm layer
    • #23897 #24694 #24509 新的 fastGEMM 实现及其之上的多个层
    • #23654 ARM 上的 Winograd fp16 优化
    • 对 Yolo 系列模型支持的测试和多项修复
    • CUDA 后端中的新层支持和错误修复:GEMM、Gelu、Add
    • #24462 CANN 后端:错误修复,支持 HardSwish、LayerNormalization 和 InstanceNormalization
    • #24552 LayerNormalization:支持 OpenVINO、OpenCL 和 CUDA 后端
  • G-API 模块:

    • TBD
  • Objdetect 模块:

    • #24364 QR code encoder version estimation 中的错误修复
    • #24479 修复了 ArUco 中的 contour filtering
    • #24598 Android 的 QR 码检测示例
    • 针对 Aruco makers、Charuco boards 和 QR 码的多个本地错误修复和文档更新。
  • Video:

    • #24201 Google Summer of Code:为基于视觉转换器的 VitTrack 添加了新的对象跟踪 API TrackerVit
  • Calibration module:

    • 多项修复和改进 chess board calibration rig detector。
    • #23025 如果 calibration system 约束不足,calibrateCamera 会抛出异常。
    • #24482 修复了 USAC 的 findEssentialMat 中的错误
    • #24527 修复了cv::cornerSubPix中的 out-of-image access
    • #23607 修复了 ap3p 中的崩溃
    • #24035 修复 stereoRectify image boundaries
    • #24211 修复了 Essential_solver.cpp 中的“use after free”问题
  • Python 绑定:

    • 为遗漏的类型和手动包装的类型添加了类型存根生成。
    • #24026 添加了 Numpy 数组的只读标志处理。
    • #24028 修复了模块内的异常处理和绑定。
    • #23958 改进了 Numpy 数组类型处理中的错误消息。
    • #24468 修复了 Python 中的构造函数文档。
  • Android:

    • 通过 Maven Central 发布的新 Android Archive Package (AAR)
    • 新的 Android 示例:QR 码检测器、视频 IO 示例。DNN 和人脸检测器示例更新。
    • 切换到 Gradle 7.6.3,现代 Android 工具。
  • 平台支持:

    • #23021 在 CMake 中将 CUDA 作为 first class 语言进行实验性支持
  • 其他:

    • TBD
    • OpenCV Summer of Code:HAN Liutong 跨多个拉取请求的半自动重构使 CPU 优化代码与可变向量长度的 SIMD (RISC-V RVV) 兼容

更多详情可查看 ChangeLog。


相關推薦

2022-06-08

OpenCV 是 Intel 开源计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 4.6 版本的主要更新内容如下: OpenCV 项目基础设施为 CI 和发布目的迁移到 GitHub Actions 工作流 增加了对 GCC 12、Clang 15 的支持 增

2023-06-30

OpenCV 是 Intel 开源计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 4.8 版本的主要更新内容如下: DNN module patches: #23161、#23409 TFLite 模型支持,包括 int8 量化模型。 #23604 启用 DNN 模

2023-06-28

如,其 MosaicML Composer 开源的深度学习库,提供 20 种用于计算机视觉和自然语言处理的方法,包括模型、数据集等。 延伸阅读 Databricks 开源 LLM,训练只需三个小时、30 美元

2023-06-09

眼睛疲劳,并可能减轻疲惫感。 Intel One Mono 于 4 月底发布了最初的“v1.0”版本,而最新版本是 Intel One Mono v1.2 ,解决了在 Visual Studio Code 上使用时发现的兼容问题。 目前 Intel One Mono 可在 Intel GitHub 仓库下载,除了源

2022-10-02

用例、架构和网络中,精度与 16 位精度相当。变压器、计算机视觉和 GAN 网络的结果都表明,FP8 训练精度与 16 位精度相似,同时提供了显著的加速。 下图为语言模型 AI 训练测试: 下图为语言模型 AI 推理测试: 在 AI 行业

2023-05-18

量加法等)定义通用接口,使得用户可以在不同的平台和计算机架构上重用相同的代码。最初的BLAS标准包含40个Fortran语言函数,用于执行常见的线性代数运算。 随着时间的推移,标准还进行了更新和扩充,增加了更多的函数和

2023-08-23

Intel One Mono 是英特尔面向开发者打造的开源等宽字体,集清晰度、易读性和开发者视力保护于一体。 Intel One Mono 字体涵盖了 200 多种使用拉丁文字的语言,提供四种粗细 —— Light、Regular、Medium 和 Bold,并带有默认的斜体。

2022-09-21

源项目 —— CV-CUDA。CV-CUDA 是一个用于构建加速的端到端计算机视觉和图像处理管道的开源库,可以更快、更高效地大规模处理图像。 如今大多数互联网流量来自于视频,也有越来越多的视频被 AI 特效和计算机视觉工具所增

2022-12-10

Blender 是一个免费和开源的 3D 计算机图形软件工具集,用于创建动画电影、视觉效果、艺术、3D 打印模型、交互式 3D 应用、VR 和计算机游戏。随着 Blender 3.4 的发布,Blender 开发人员开始讨论提高 Blender 对 CPU 的要求,以便这款开

2024-03-04

其 NPU 加速库 (intel-npu-acceleration-library) 在 Apache-2.0 协议下开源。这是一个 Python 库,旨在利用英特尔神经处理单元 (NPU) 的强大功能在兼容硬件上执行高速计算,从而提高应用程序的效率。 该库目前正处于积极开发状态。为了显

2023-02-21

nbsp;文档门户网站。 早在去年 8 月,梦工厂动画公司就发布声明宣布,计划于 2022 年晚些时候在 Apache 2.0 许可下开源发布 MoonRay。MoonRay 是梦工厂动画内部开发的的 MCRT 渲染器,可以用来制作故事动画,现已被应用于 How

2023-12-01

bsp; 1.ACPI ACPI(Advanced Configuration and Power Interface)是一种计算机硬件和操作系统之间交换能源相关信息的接口规范。它定义了计算机硬件的能源相关信息,如电源供应器状态、设备功耗、设备功率因数等。ACPI 是操作系统控制计

2022-08-10

OpenBLAS 0.3.21 现已发布,OpenBLAS 是一个优化的 BLAS 库,基于 GotoBLAS2 1.13 BSD 版本。 BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩

2023-03-30

Cycles 灯光采样等内容。 Blender 是一个免费和开源的 3D 计算机图形软件工具集,用于创建动画电影、视觉效果、艺术、3D 打印模型、交互式 3D 应用、VR 和计算机游戏。 内置的毛发资产 3.5 版本内置了大量毛发类型,Essentials