OpenCV 4.8 发布,Intel 开源的计算机视觉库


OpenCV 是 Intel 开源计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 4.8 版本的主要更新内容如下:

  • DNN module patches

    • #23161、#23409 TFLite 模型支持,包括 int8 量化模型。
    • #23604 启用 DNN 模块构建,无需 Protobuf 依赖。
    • Improved layers => supported more models:
      • ONNX:#23047 Layer normalization、#23219 GELU 和 #23655 QLinearSoftmax。
      • CANN 后端修复:
        • #23319 支持 ONNX Split、Slice、Clip (Relu6) 和带有 auto_pad 的 Conv。
        • #23401 支持 ONNX Sub、PRelu、ConvTranspose。
      • #23613 减少重构以实现 robustness 和潜在的后续改进。
      • 修复了 nary element wise 层中关于 broadcast 的问题:
        • #23557 CPU 修复。
        • #23528 和 #23560 修复 CUDA 后端。
      • 通过改进卷积,进一步提高 DNN 在 ARM 和 X86 上的速度,覆盖 1D 和 3D 情况,支持 convolution+element-wise op fusion。
      • 在 ARMv8 平台上添加了完整的 FP16 计算分支,比 FP32 快 1.5 倍(FP16 Winograd 仍在等待中)。
      • #22957 现代 OpenVINO 支持。
  • G-API module:

    • TBD
  • Objdetect module:

    • #23020 FaceDetectorYN 升级以获得更好的性能、准确性和 facial landmarks 支持。
    • #23264 基于 ArUco 码的新 QR 代码检测算法。
    • #23666 条形码检测器和解码器从 Contrib 移至主存储库。
    • #23758 为所有图形码(如条形码和 QR 码)引入了通用 API。
    • #23153 添加了 4.6.0 之前版本 ChAruco boards 支持的 flag。
    • QR 码检测和解码管道中的多个错误修复和改进。
    • 基于 ArUco 的管道中的多个错误修复和改进。
  • Calibration module:

    • #23078 USAC 框架改进。
    • #23025 修复了相机校准管道中的 stddev 估计。
    • #23305 修复了 icvGetRectangles 中不正确的像素网格生成问题,提高了 getOptimalNewCameraMatrix、stereoRectify 和其他一些校准函数的准确性。
    • 在模式生成器、交互式校准工具和校准样本中支持 Charuco board。
  • Image processing module:

    • #23210、#23388 线段检测器中的各种修复。
    • #23634 修复了调整大小时 INTER_NEAREST_EXACT 的 even 输入尺寸。
    • #21959 优化IntelligentScissorsMB::buildMap 中的 local cost 计算。
    • #22798 修复 distransform 使其适用于大图像。
  • Features2d module:

    • #23124 SIFT 精度改进。
  • 核心模块:

    • #13879 添加了 REDUCE_SUM2 选项到cv::reduce.
    • #22947 引入cv::hasNonZerofunction。
    • #23443 将 IPP 二进制文件更新至版本 20230330。
    • 改进了 RISC-V RVV 矢量扩展支持。
      • #23383 支持 LLVM 16 和 GCC 13 中可用的 RVV v0.11 intrinsics
      • #23246 支持使用 T-Head RISC-V 工具链进行构建(RVV 0.7.1 和 1.0)
    • 多个 OpenCL 供应商和版本处理改进。
  • Multimedia:

    • #23596 通过 libavif 添加了 AVIF 支持。
    • #23237 Orbbec Femto Mega cameras 支持。
    • #23692 修复了 FFmpeg 后端某些视频的 FPS 计算。
    • #23300 为 DShow 后端添加了对 VideoCapture CAP_PROP_AUTO_WB 和 CV_CAP_PROP_WHITE_BALANCE_BLUE_U 的支持。
    • #23460、#23469 修复 OBS 虚拟相机捕获。
    • #23433 CV_32S 编码支持 tiff。
    • #3486、#3453 cudacodec 模块(opencv_contrib)中更严格的解码器检查和动态分辨率支持。
    • #3485 在 cudacodec 模块(opencv_conrib)中添加了基本的 VideoCapture 属性支持。
  • Python Bindings:

    • #20370 Python typing stubs。
    • #23350 修复 registerNewType 中的引用计数错误。
    • #23399、#23436、#23138 修复了 ChAruco 和 diamond boards detector bindings。
    • #23371 添加了绑定以允许 GpuMat 和 Stream 对象从其他库中初始化的内存进行初始化
    • #23691 np.float16 支持。
    • RotatedRect、CV_MAKETYPE、CV_8UC(n) 的 Python 绑定。
  • JavaScript bindings:

    • #23344 在opencv.js中添加了禁用内联wasm的可能性
    • Aruco、Charuco、QR 码和条形码的扩展 JS 绑定。
  • Platforms:

    • #21736 Android:不需要已弃用的工具。
    • #23768 iOS:修复了 CMake 3.25.1+ 的框架构建问题。
  • Other:

    • wechat_qrcode 模块(opencv_contrib)中的几个关键问题修复

详情可查看更新说明。 


相關推薦

2022-06-08

OpenCV 是 Intel 开源计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 4.6 版本的主要更新内容如下: OpenCV 项目基础设施为 CI 和发布目的迁移到 GitHub Actions 工作流 增加了对 GCC 12、Clang 15 的支持 增

2023-12-30

OpenCV 是 Intel 开源计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 4.9.0 版本的主要更新内容如下: Core Module: #23965 添加cv::broadcast DNN module patches: Experimental transformers 支持 #24476 

2024-09-24

日,摩尔线程宣布其自研统一系统架构MUSA已完成与开源计算机视觉库OpenCV的适配,并正式发布OpenCV-MUSA开源项目。 该项目旨在为开发者和研究人员提供更加高效与便捷的工具,使其在开发基于全功能GPU的各类计算机视觉应用时

2024-06-04

者:于仕琪,郑锋,廖琪梅,田蕾 单位:南方科技大学计算机科学与工程系 摘要:随着人工智能的兴起,学生对编程的热情逐渐从C/C++向Python迁移,对于计算机硬件体系结构的理解也呈现逐年下降的趋势。当前许多人工智能从

2023-06-28

如,其 MosaicML Composer 开源的深度学习库,提供 20 种用于计算机视觉和自然语言处理的方法,包括模型、数据集等。 延伸阅读 Databricks 开源 LLM,训练只需三个小时、30 美元

2023-06-09

眼睛疲劳,并可能减轻疲惫感。 Intel One Mono 于 4 月底发布了最初的“v1.0”版本,而最新版本是 Intel One Mono v1.2 ,解决了在 Visual Studio Code 上使用时发现的兼容问题。 目前 Intel One Mono 可在 Intel GitHub 仓库下载,除了源

2022-10-11

本,参与版本贡献的开发者数量新增 63%,是 openEuler 已经发布的发行版中,开发者数量最多的一次。openEuler 22.09 的顺利发布离不开社区近 400 家企业的积极贡献,特别感谢华为、麒麟软件、统信软件、润和软件、中科院软件所、

2022-10-02

用例、架构和网络中,精度与 16 位精度相当。变压器、计算机视觉和 GAN 网络的结果都表明,FP8 训练精度与 16 位精度相似,同时提供了显著的加速。 下图为语言模型 AI 训练测试: 下图为语言模型 AI 推理测试: 在 AI 行业

2023-05-18

量加法等)定义通用接口,使得用户可以在不同的平台和计算机架构上重用相同的代码。最初的BLAS标准包含40个Fortran语言函数,用于执行常见的线性代数运算。 随着时间的推移,标准还进行了更新和扩充,增加了更多的函数和

2023-08-23

Intel One Mono 是英特尔面向开发者打造的开源等宽字体,集清晰度、易读性和开发者视力保护于一体。 Intel One Mono 字体涵盖了 200 多种使用拉丁文字的语言,提供四种粗细 —— Light、Regular、Medium 和 Bold,并带有默认的斜体。

2022-09-21

源项目 —— CV-CUDA。CV-CUDA 是一个用于构建加速的端到端计算机视觉和图像处理管道的开源库,可以更快、更高效地大规模处理图像。 如今大多数互联网流量来自于视频,也有越来越多的视频被 AI 特效和计算机视觉工具所增

2023-09-20

  帮助文档: https://gitee.com/yhuse/SunnyUI/wikis/pages Gitee: https://gitee.com/yhuse/SunnyUI GitHub: https://github.com/yhuse/SunnyUI Nuget: https://www.nuget.org/packages/SunnyUI/ Blog: https://www.cnblogs.com/yhuse SunnyUI.Net 是基于.Net F

2022-12-10

Blender 是一个免费和开源的 3D 计算机图形软件工具集,用于创建动画电影、视觉效果、艺术、3D 打印模型、交互式 3D 应用、VR 和计算机游戏。随着 Blender 3.4 的发布,Blender 开发人员开始讨论提高 Blender 对 CPU 的要求,以便这款开

2024-03-04

其 NPU 加速库 (intel-npu-acceleration-library) 在 Apache-2.0 协议下开源。这是一个 Python 库,旨在利用英特尔神经处理单元 (NPU) 的强大功能在兼容硬件上执行高速计算,从而提高应用程序的效率。 该库目前正处于积极开发状态。为了显