OpenCV 4.9.0 发布,Intel 开源的计算机视觉库


OpenCV 是 Intel 开源计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 4.9.0 版本的主要更新内容如下:

  • Core Module

    • #23965 添加cv::broadcast
  • DNN module patches:
    • Experimental transformers 支持
    • #24476 ONNX Attention layer 支持
    • #24037 ONNX Einsum layer 支持
    • #23987 INT8 models 的 OpenVINO 后端
    • #24092 ONNX Gather Elements layer
    • #24378 ONNX InstanceNorm layer
    • #23897 #24694 #24509 新的 fastGEMM 实现及其之上的多个层
    • #23654 ARM 上的 Winograd fp16 优化
    • 对 Yolo 系列模型支持的测试和多项修复
    • CUDA 后端中的新层支持和错误修复:GEMM、Gelu、Add
    • #24462 CANN 后端:错误修复,支持 HardSwish、LayerNormalization 和 InstanceNormalization
    • #24552 LayerNormalization:支持 OpenVINO、OpenCL 和 CUDA 后端
  • G-API 模块:

    • TBD
  • Objdetect 模块:

    • #24364 QR code encoder version estimation 中的错误修复
    • #24479 修复了 ArUco 中的 contour filtering
    • #24598 Android 的 QR 码检测示例
    • 针对 Aruco makers、Charuco boards 和 QR 码的多个本地错误修复和文档更新。
  • Video:

    • #24201 Google Summer of Code:为基于视觉转换器的 VitTrack 添加了新的对象跟踪 API TrackerVit
  • Calibration module:

    • 多项修复和改进 chess board calibration rig detector。
    • #23025 如果 calibration system 约束不足,calibrateCamera 会抛出异常。
    • #24482 修复了 USAC 的 findEssentialMat 中的错误
    • #24527 修复了cv::cornerSubPix中的 out-of-image access
    • #23607 修复了 ap3p 中的崩溃
    • #24035 修复 stereoRectify image boundaries
    • #24211 修复了 Essential_solver.cpp 中的“use after free”问题
  • Python 绑定:

    • 为遗漏的类型和手动包装的类型添加了类型存根生成。
    • #24026 添加了 Numpy 数组的只读标志处理。
    • #24028 修复了模块内的异常处理和绑定。
    • #23958 改进了 Numpy 数组类型处理中的错误消息。
    • #24468 修复了 Python 中的构造函数文档。
  • Android:

    • 通过 Maven Central 发布的新 Android Archive Package (AAR)
    • 新的 Android 示例:QR 码检测器、视频 IO 示例。DNN 和人脸检测器示例更新。
    • 切换到 Gradle 7.6.3,现代 Android 工具。
  • 平台支持:

    • #23021 在 CMake 中将 CUDA 作为 first class 语言进行实验性支持
  • 其他:

    • TBD
    • OpenCV Summer of Code:HAN Liutong 跨多个拉取请求的半自动重构使 CPU 优化代码与可变向量长度的 SIMD (RISC-V RVV) 兼容

更多详情可查看 ChangeLog。


相關推薦

2022-06-08

OpenCV 是 Intel 开源计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 4.6 版本的主要更新内容如下: OpenCV 项目基础设施为 CI 和发布目的迁移到 GitHub Actions 工作流 增加了对 GCC 12、Clang 15 的支持 增

2023-06-30

OpenCV 是 Intel 开源计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 4.8 版本的主要更新内容如下: DNN module patches: #23161、#23409 TFLite 模型支持,包括 int8 量化模型。 #23604 启用 DNN 模

2024-09-24

日,摩尔线程宣布其自研统一系统架构MUSA已完成与开源计算机视觉库OpenCV的适配,并正式发布OpenCV-MUSA开源项目。 该项目旨在为开发者和研究人员提供更加高效与便捷的工具,使其在开发基于全功能GPU的各类计算机视觉应用时

2024-06-04

者:于仕琪,郑锋,廖琪梅,田蕾 单位:南方科技大学计算机科学与工程系 摘要:随着人工智能的兴起,学生对编程的热情逐渐从C/C++向Python迁移,对于计算机硬件体系结构的理解也呈现逐年下降的趋势。当前许多人工智能从

2023-06-28

如,其 MosaicML Composer 开源的深度学习库,提供 20 种用于计算机视觉和自然语言处理的方法,包括模型、数据集等。 延伸阅读 Databricks 开源 LLM,训练只需三个小时、30 美元

2023-06-09

眼睛疲劳,并可能减轻疲惫感。 Intel One Mono 于 4 月底发布了最初的“v1.0”版本,而最新版本是 Intel One Mono v1.2 ,解决了在 Visual Studio Code 上使用时发现的兼容问题。 目前 Intel One Mono 可在 Intel GitHub 仓库下载,除了源

2022-10-02

用例、架构和网络中,精度与 16 位精度相当。变压器、计算机视觉和 GAN 网络的结果都表明,FP8 训练精度与 16 位精度相似,同时提供了显著的加速。 下图为语言模型 AI 训练测试: 下图为语言模型 AI 推理测试: 在 AI 行业

2023-05-18

量加法等)定义通用接口,使得用户可以在不同的平台和计算机架构上重用相同的代码。最初的BLAS标准包含40个Fortran语言函数,用于执行常见的线性代数运算。 随着时间的推移,标准还进行了更新和扩充,增加了更多的函数和

2023-08-23

Intel One Mono 是英特尔面向开发者打造的开源等宽字体,集清晰度、易读性和开发者视力保护于一体。 Intel One Mono 字体涵盖了 200 多种使用拉丁文字的语言,提供四种粗细 —— Light、Regular、Medium 和 Bold,并带有默认的斜体。

2022-09-21

源项目 —— CV-CUDA。CV-CUDA 是一个用于构建加速的端到端计算机视觉和图像处理管道的开源库,可以更快、更高效地大规模处理图像。 如今大多数互联网流量来自于视频,也有越来越多的视频被 AI 特效和计算机视觉工具所增

2022-12-10

Blender 是一个免费和开源的 3D 计算机图形软件工具集,用于创建动画电影、视觉效果、艺术、3D 打印模型、交互式 3D 应用、VR 和计算机游戏。随着 Blender 3.4 的发布,Blender 开发人员开始讨论提高 Blender 对 CPU 的要求,以便这款开

2024-03-04

其 NPU 加速库 (intel-npu-acceleration-library) 在 Apache-2.0 协议下开源。这是一个 Python 库,旨在利用英特尔神经处理单元 (NPU) 的强大功能在兼容硬件上执行高速计算,从而提高应用程序的效率。 该库目前正处于积极开发状态。为了显

2024-08-16

现代计算的诞生,我们一直在追求制造出能够理解人类的计算机,而如今我们正在进入一个新时代,就像摩尔定律推动了信息革命一样,深度神经网络的扩展定律也将推动智能革命。”张磊表示,展望未来,deepin将加速构建AI与

2024-07-13

Facebook 开源了其内部用于计算机视觉 (CV) 和 增强现实 (AR) 应用程序的框架 Ocean,用于执行各种任务,包括计算机视觉、几何、媒体处理、网络和渲染。 Ocean 主要使用 C++ 编写,且不依赖于特定平台: Ocean 是一个独立于平