OpenBLAS 0.3.21 发布,支持龙芯 2K1000 处理器


OpenBLAS 0.3.21 现已发布,OpenBLAS 是一个优化的 BLAS 库,基于 GotoBLAS2 1.13 BSD 版本。

BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。该程序集最初发布于 1979 年,并 用于建立更大的数值程序包(如 LAPACK)。在高性能计算领域,BLAS 被广泛使用。例如,LINPACK 的运算成绩则很大程度上取决于 BLAS 中子程序 DGEMM 的表现。为提高性能,各軟硬件厂商则针对其产品对 BLAS 接口实现进行高度优化。

一些更新亮点如下:

  • 现在支持使用 Intel IFX、Fujitsu FCC 和 Cray C/Fortran 编译器构建 OpenBLAS。
  • 初步支持兆芯/Centaur KH40000 处理器。
  • OpenBLAS 的 CMake 构建系统现在支持对单个 Intel 和 AMD x86_64 目标进行交叉编译。现在有暴露的 CMake 目标,从 Intel Prescott 到 Sapphire Rapids,然后在 AMD 方面从 Barcelona 到 Zen。
  • 各种 IBM POWER 修复,包括许多 Power10 修复。OpenBLAS POWER 构建现在还可以默认编译 BFLOAT16 内核。
  • OpenBLAS RISC-V CPU 自动检测逻辑已修复。
  • 添加了 Arm Neoverse-N2 的 SBGEMM 内核。
  • 支持运行 Microsoft Windows 的 64 位 Arm 系统。
  • 在 Linux 上对 Apple M1 CPU 的初始支持。
  • 初步支持 Phytium FT2000 处理器。
  • 对 Arm Cortex A510 / A710 / X1 / X2 处理器的初步支持。
  • 修复 OpenBLAS 在不同条件下在各种 x86_64 CPU 目标上的编译。
  • 初步支持龙芯 2K1000 处理器

更多详情可查看:https://github.com/xianyi/OpenBLAS/releases/tag/v0.3.21 

 


相關推薦

2022-05-08

龙芯中科宣布,2022年4月底,龙芯2K1000处理器完成了改版芯片(代号龙芯2K1000LA)的功能和性能测试,正在开展用户试用。龙芯2K1000LA在实现与原有版本2K1000引脚和接口兼容的基础上,处理器核更新为基于龙芯自主指令系统架构Loo

2023-05-18

作者:王军辉 前言 数学计算库是使能处理器在数值计算领域的基础软件库,是工程计算、科学计算、AI计算的基石。大部分物理、工程问题都能转化成线性方程组求解问题,而高效的数学计算库是发挥硬件算力的基石。 以BL

2023-11-30

023 龙芯产品发布暨用户大会上,龙芯 3A6000 国产桌面通用处理器正式发布。 此处引用一下央视新闻的报道原文: 龙芯3A6000采用我国自主设计的指令系统和架构,无需依赖任何国外授权技术,是我国自主研发、自主可控

2023-08-02

龙芯中科宣布,基于龙架构的新一代四核处理器龙芯3A6000流片成功,代表了我国自主桌面CPU设计领域的最新里程碑成果。 根据中国电子技术标准化研究院赛西实验室测试结果,龙芯3A6000四核处理器在2.5GHz运行频率下,SPEC CPU 20

2023-07-05

日,龙芯开发者提交了多个补丁为即将发布的龙芯 3A6000 处理器提供支持。 这些补丁的功能包括: 初步启用 ClangBuiltLinux 支持克隆时间命名空间 (time namespace) 支持向量扩展 (vector extensions)——128 位 LSX (Loongson SIMD eXtension)

2023-11-08

三季度业绩说明会上,龙芯中科宣布 3A6000 国产桌面处理器初步定于11 月 28 日发布。 via https://rsc.sseinfo.com/roadshowIndex.do?id=16536 龙芯 3A6000 是基于龙架构的新一代四核处理器,于今年 8 月流片成功。综合相关测试结果,

2022-03-22

,伴随着支持 LoongArch 的 FFmpeg 5.0 版本发布,龙芯5000桌面处理器平台能更好地释放潜能,为龙芯电脑终端带来更佳的音视频体验,具体到使用体验以及技术支持上将有以下重要提升: 支持 4K 高码率 FFmpeg 5.0版本中集成了对H264、H

2023-12-01

芯产品发布暨用户大会上,华硕宣布推出支持龙芯 3A6000 处理器的消费级主板 ——XC-LS3A6M 主板。 华硕电脑开放平台中国区总经理俞元麟在大会现场展示了龙芯 3A6000 的测试成绩,在多核定点 / 浮点成绩上强于英特尔 i3-10100 处

2022-10-11

持。 ▲ 龙芯2K0500开发板 龙芯2K0500是一款基于64位LA264处理器核设计的高集成度处理器芯片,主要面向工控互联网应用、打印终端、BMC等应用场景,可实现ACPI、DVFS/DPM动态电源功耗管理等低功耗技术,支持多种电源级别和唤醒

2023-02-11

中科发布公告称,公司撤诉对上海芯联芯提起的关于3A5000处理器不侵犯MIPS指令系统的计算机软件著作权的诉讼案(案件1);同时,上海芯联芯针对公司LoongArch和3A5000处理器的诉讼案(案件2)已判决,北京知识产权法院判决驳回

2023-05-25

发布的新中间件项目:Qt 6.2, CMake 3.24, Bazel, 5.1, OpenSSL 3.0, OpenBLAS, 0.3.21, Python 3.11 Unity Player 在 Windows on Arm 上已经正式 GA。使用该游戏引擎的开发者可轻松地将 Windows on Arm 设备作为 target Arm64 即将推出其他解决方案,例如 GNU GCC、

2023-06-16

计的 CPU 都基于自主设计的 LoongArc h架构。 龙芯于 2019 年发布的 3A4000 每 GHz 性能首次接近 AMD Zen1,3A5000 主要是因为更换成了 LoongArch 架构,使 IPC 进一步提高了 10%。

2023-08-27

-gamma。 在本次更新中,我们成功实现了对RISC-V和MIPS两种处理器架构的支持,并将其添加到了自动化构建任务流中,这意味着洛书的每一次更新将会及时地同步到相应二进制文件当中。目前,洛书的PC版本支持处理器架构已经增

2023-05-08

对内核的贡献,大部分都是添加对 LoongArch CPU 架构的基本支持、内存优化,以及实现更多内核功能。 内存优化有利于对 memset / memcpy / memmoove 的处理,还有优化的校验和和 CRC32/CRC32C 计算。 此外,LoongArch 回溯 (back-traces) 现在也