PaddleOCR 3.0 发布


百度飞桨团队宣布推出 PaddleOCR 3.0,全面适配飞桨框架3.0正式版,进一步提升文字识别精度,支持多文字类型识别和手写体识别,满足大模型应用对复杂文档高精度解析的旺盛需求,结合文心大模型4.5 Turbo显著提升关键信息抽取精度,并新增对昆仑芯、昇腾等国产硬件的支持。

具体更新亮点如下:

  • 发布全场景文字识别模型PP-OCRv5: 单模型支持五种文字类型和复杂手写体识别;整体识别精度相比上一代提升13个百分点。
  • 发布通用文档解析方案PP-StructureV3: 支持多场景、多版式 PDF 高精度解析,在公开评测集中领先众多开源和闭源方案。
  • 发布智能文档理解方案PP-ChatOCRv4: 原生支持文心大模型4.5 Turbo,精度相比上一代提升15个百分点。
  • 重构部署能力,统一推理接口: PaddleOCR 3.0 融合了飞桨 PaddleX3.0 工具的底层能力,全面升级推理、部署模块,优化 2.x 版本的设计,统一并优化了 Python API 和命令行接口(CLI)。部署能力现覆盖高性能推理、服务化部署及端侧部署三大场景。
  • 适配飞桨框架 3.0,优化训练流程: 新版本已兼容飞桨 3.0 的 CINN 编译器等最新特性,静态图模型存储文件名由 xxx.pdmodel 改为 xxx.json
  • 统一模型名称: 对PaddleOCR3.0支持的模型命名体系进行了更新,采用更规范、统一的命名规则,为后续迭代与维护奠定基础。

更新说明:https://github.com/PaddlePaddle/PaddleOCR/releases/tag/v3.0.0


相關推薦

2024-07-09

OpsPilot 2.2.0 版本发布公告 🎉 各位亲爱的用户,我们很高兴地宣布OpsPilot最新2.2.0版本的发布!此次更新带来了许多令人兴奋的新功能和优化,让我们一同来看看吧! 🛠 基础服务更新 新增 SaltStack Server:强力管理配置,提

2025-04-18

1.7.5 将 ffmpeg 更新至 2025-03-31 更新 yt-dlp 至 2025-03-26 PaddleOCR 的改进(速度和修复) 添加独立 PaddleOCR(无需 Python) 使 Whisper 文件列表可滚动 + 自动滚动当前项目 对“spell check”稍作改进 对字典做了一些补充 对 CSV&nbs

2023-11-26

今年年初,GIMP 开发团队表示会在 2023 年发布 GIMP 3.0,或者至少发布 RC 版本,但不幸的是这个计划没有实现。 相关阅读: GIMP 3.0 计划今年发布首个 RC GIMP 3.0 计划今年推出,GTK+3 移植已基本完成 GIMP 最新开发版已完成 GTK3 移

2023-08-28

GIMP 最新开发版 (GIMP 2.99) 已完成 GTK3 移植,并计划于年底发布 RC 版本 (GIMP 3.0 RC)。Ubuntu 团队原本计划让 10 月发布的 Ubuntu 23.10 将预装的 GIMP 升级到 GIMP 3.0 最新快照,这样也可以为 Ubuntu 24.04 LTS 搭载 GIMP 3.0 提供一个测试周期。

2023-07-01

总部提供。 ▲ GIMP 核心开发者 虽然 GIMP 3.0 的发布计划仍存在很多变数,但开发团队透露应该会在今年发布 GIMP 3.0 首个 RC——进入候选版本阶段。 目前他们正在开发 GIMP 2.99.16 版本,如果一切顺利,这个版本发布后就

2022-06-12

化实现性能的提升,减少人工优化的步骤。 PoCL 3.0 发布了,该版本支持最小的 OpenCL 3.0 功能集,提供了最初的 OpenCL 3.0 支持意味着 POCL 可通过 LLVM 在 CPU 或其他后端执行,例如针对 AMD HSA、NVIDIA GPU 和其他加速器。 除了解

2022-11-21

GIMP 2.99.14 发布了,这是朝着 GIMP 3.0 迈进的最新开发版本。 GIMP 即 GNU Image Manipulation Program(GNU 图像处理程序)的首字母组成,是一个自由开源的位图图像编辑器,用于图像照片润饰及编辑、自由绘图、调整大小、裁剪、照片

2023-01-20

,这个教育套件包括 100 多个活动。 目前 GCompris 3.0 发布了,GCompris 3.0 在 GCompris 2.0 推出一年多后推出,引入了八项新活动,包括用于练习使用鼠标左右单击的“鼠标单击训练”,以及用于学习的“创建分数”和“查找分数

2023-12-01

微软近日正式发布 ML.NET 3.0,带来了许多新功能和改进。 ML.NET 是一个开源、跨平台的机器学习框架,专为 .NET 开发者设计,可以将自定义的机器学习模型集成到 .NET 应用程序中。 在这个版本中,深度学习方案得到了大幅

2025-04-18

表示,全新图像生成基础模型「Seedream 3.0」技术报告正式发布。 Seedream 3.0 是一个原生高分辨率、支持中英双语的图像生成基础模型,亮点如下: 原生 2K 直出,适配多比例场景:无需后处理可直接输出 2K 分辨率图像,从手

2024-04-18

goview列表页/设计页与admin-ui项目间授权相关优化 goview发布后的页面与项目间的授权支持   适配支持以下数据库: PostgreSql、金仓Kingbase(Postgres模式) Oracle 12c+ 达梦DM8 SqlServer 2017+ 升级 Spring boot 至 v

2024-10-16

go-oam v1.3.0 已经发布,运维资产管理系统 此版本更新内容包括: 1.完善权限控制功能,权限控制到按钮级别,右侧导航菜单根据权限动态展示 2.优化和修复bug 3.增加主机连通性测试 4.增加linux启动脚本 完整的更新日志: https:/

2022-11-23

(IoT)和机器学习(ML)的理想选择。 近日 HSE 3.0 正式发布,更新内容如下: 变化 游标性能现在与游标过滤器的长度无关。这意味着 HSE 应用程序可以使用任意游标过滤器对键进行迭代,并实现相同的吞吐量,这对许多客

2022-08-02

Wasmer 3.0 发布了首个 Alpha 版本。 Wasmer 是支持 WASI 和 Emscripten 的通用 WebAssembly 运行时,提供基于 WebAssembly 的超轻量级容器,专注于支持在任何平台上运行 WASM 代码:从桌面端到云端、以及 IoT 设备,并且能嵌入在任何编程