Pandas 2.0 发布，Python 数据分析库

2023-04-04 發表於开源资讯

Pandas 是一个 Python 数据分析库，它提供了快速、灵活和富有表现力的数据结构，旨在使处理 "关系型" 或 "标签型" 数据的工作变得简单和直观。

此版本包括一些新功能、错误修复和性能改进，建议现有用户在升级到 Pandas 2 之前先升级到 Pandas 1.5.3，并确保他们的代码不会产生 FutureWarning 或 DeprecationWarning 消息。

增强

使用 pip extras 安装可选的依赖项
Index 现在可以容纳 numpy 数字 dtypes
参数 dtype_backend，用于返回 pyarrow-backed 或 numpy-backed 可空的 dtypes。
写入时复制的改进

错误修复

DataFrameGroupBy.cumsum() 和 DataFrameGroupBy.cumprod()溢出，而不是有损地转换为浮点数。

向后不兼容的 API 更改

使用不支持 resolutions（即 “ns” 以外的任何内容）的 datetime64 或 timedelta64 dtype 构建
值计数将结果名称设置为 count
禁止 astype 转换为不受支持的 datetime64/timedelta64 dtypes
UTC 和固定偏移的时区默认为标准库中的 tzinfo 对象
空的 DataFrames/Series 现在将默认有一个 RangeIndex
DataFrame to LaTeX 有一个新的渲染引擎
Datetimes 现在以一致的格式解析

弃用

弃用了将带有系统本地时区的日期时间字符串解析为 tzlocal 的做法，可通过 tz 关键字或明确调用 tz_localize 来代替（GH50791）。
弃用了 to_datetime() 和 read_csv() 中的参数 infer_datetime_format，因为它的严格版本现在是默认的（GH48621）。
弃用了 to_datetime() 在解析字符串时使用 unit 的行为，在未来的版本中，这些字符串将被解析为日期，而不是浮点数。要保留原来的行为，请在调用 to_datetime() 之前将字符串转换为数字类型
弃用 pandas.io.sql.execute()
Index.is_boolean()已被弃用，请使用 pandas.api.types.is_bool_dtype() 来代替
Index.is_integer() 已被弃用，使用 pandas.api.types.is_integer_dtype() 来代替
……

更多详情可查看：https://github.com/pandas-dev/pandas/releases/tag/v2.0.0

相關推薦

微软推出 AI 代码审查工具，可将准确率提升至 >80%

2022-04-13

来提高未来的性能；该工具旨在使用多模式输入为 Python Pandas API 合成代码。Pandas 是数据科学中广泛使用的 API，具有数百个用于 manipulating dataframes 或具有行和列的表的函数。微软方面称，其经验表明，随着这些大型语言模型演

InfoWorld 公布 2023 年最佳开源软件

2023-10-26

越精确，但运行速度越慢，所需的内存也越大。 Polars Pandas 能做到的 Polars 不一定能做到，但它能做到的事情都能以极快的速度完成--比 Pandas 快 10 倍，使用的内存只有 Pandas 的一半。来自 PySpark 的开发人员会觉得 Polars API 比 Pan

Hikyuu 2.0.0 发布，高性能量化交易研究框架

2024-04-04

接查看系统绩效新增 concat_to_df 将多个指标数据合并为 pandas DataFrame，方便其他使用 pandas 的工具包进一步处理所有系统部件及指标支持参数变更时的动态检查其他优化与调整 python 中增强系统部件快速创建方法直接

Pyodide 0.23.0 发布，基于 WebAssembly 的 Python 发行版

2023-04-04

暴露给 Python。该项目还使许多 Python 科学包，包括 NumPy、Pandas、Matplotlib、SciPy 和 Scikit-learn，就可以在浏览器中运行。近日 Pyodide 发布了 0.23.0，这是一个重要更新版本，更新内容包括将 CPython 升级到 3.11，以及其他功能增强和

Claude Code 自动化安全审查功能将“漏洞”误报为“安全”

2025-09-10

指出，这类工具并非完美。Claude Code 在处理使用 Python 数据分析库 pandas 的远程代码执行漏洞时未能准确识别，甚至将其误报为“安全”。此外，自动化安全审查可能带来新的风险，包括在执行代码检测过程中可能触发系统

Conan 2.0 发布，开源 C/C++ 包管理器

2023-02-27

Conan 是一个去中心化、开源的 C/C++ 包管理器。适用于所有平台，包括 Linux、macOS、Windows、Solaris、FreeBSD、Docker、WSL 等。它可以为任何配置和平台创建、上传和下载二进制文件，甚至交叉编译，节省大量的开发和持续集成时间。

PyCharm 2022.3 正式发布

2022-12-04

c（设置同步）解决方案、管理 Conda 软件包的新方法针对 pandas DataFrames 的增强用户体验。用户体验新的 Settings Sync（设置同步）解决方案新的 Settings Sync（设置同步）插件现在可用于 PyCharm。新解决方案能够同步来自平台、

phpy：PHP 与 Python 互调用库，为 PHP 引入 Python 生态

2023-12-06

transformers、TensorFlow 等 AI 库，以及 Numpy、Pandas、Scikit 等科学计算库，还可以使用 PyQt、wxPython 等图形界面库。 GitHub 地址：https://github.com/swoole/phpy Gitee 地址：https://gitee.com/swoole/phpy 不建议

Ray 2.0 发布，OpenAI 背后的机器学习技术

2022-08-25

推理图的一种新的、更简单的方法，在 2.0 中作为 Beta 版发布。更多详情可查看：https://github.com/ray-project/ray/releases/tag/ray-2.0.0

英特尔开源其 Python NPU 加速库

2024-03-04

el-npu-acceleration-library) 在 Apache-2.0 协议下开源。这是一个 Python 库，旨在利用英特尔神经处理单元 (NPU) 的强大功能在兼容硬件上执行高速计算，从而提高应用程序的效率。该库目前正处于积极开发状态。为了显着提高库的性能

NumPy 2.0.0 发布，2006 年以来的首个主要版本

2024-06-20

NumPy 2.0.0 现已发布，这是自 2006 年以来的第一个主要版本，是自上一个功能版本发布以来经过 11 个月开发的成果。该版本包含了来自 212 位贡献者提交的 1078 个 PR，引入了大量的新功能以及对 Python 和 C API 的更改。此主要版本

SQLAlchemy 1.4.50 发布，Python ORM 框架

2023-10-31

SQLAlchemy 1.4.50 现已发布。 SQLAlchemy 是一个 Python 的 SQL 工具包以及数据库对象映射 (ORM) 框架。它包含整套企业级持久化模式，专门用于高效和高性能的数据库访问。版本 1.4.50 是 1.4 系列的最新版本，旨在跟上从 2.0 系列

EdgeDB 2.0 发布，内置 UI 和访问控制

2022-08-20

构下的属性以及 elements 上的链接，因此能够支持复杂的数据分析查询语句（CUBE 和 ROLLUP 默默路过……）。当然，GROUP 的真正实力还是在于能与其它的 EdgeQL 语句强强联手： db> with ... groups := ( ... group Movie ... using ... starts_with_v

PyTorch 2.0 早期版本来了，稳定版明年 3 月发布

2022-12-04

用于体验的早期版本，并表示稳定版将于 2023 年 3 月上旬发布。团队介绍道，PyTorch 2.0 是他们向 PyTorch 下一代 2 系列迈出的第一步。在过去的几年里，从 PyTorch 1.0 到最新的 1.13，他们对 PyTorch 进行了创新和迭代，并将它迁移

熱門推薦