Pandas 2.0 发布,Python 数据分析库


Pandas 是一个 Python 数据分析库,它提供了快速、灵活和富有表现力的数据结构,旨在使处理 "关系型" 或 "标签型" 数据的工作变得简单和直观。

此版本包括一些新功能、错误修复和性能改进,建议现有用户在升级到 Pandas 2 之前先升级到 Pandas 1.5.3,并确保他们的代码不会产生 FutureWarning 或 DeprecationWarning 消息。

增强

  • 使用 pip extras 安装可选的依赖项
  • Index 现在可以容纳 numpy 数字 dtypes
  • 参数 dtype_backend,用于返回 pyarrow-backed 或 numpy-backed 可空的 dtypes。
  • 写入时复制的改进

错误修复

  • DataFrameGroupBy.cumsum()DataFrameGroupBy.cumprod()溢出,而不是有损地转换为浮点数。

向后不兼容的 API 更改

  • 使用不支持 resolutions(即 “ns” 以外的任何内容) 的 datetime64 或 timedelta64 dtype 构建
  • 值计数将结果名称设置为 count
  • 禁止 astype 转换为不受支持的 datetime64/timedelta64 dtypes
  • UTC 和固定偏移的时区默认为标准库中的 tzinfo 对象
  • 空的 DataFrames/Series 现在将默认有一个 RangeIndex
  • DataFrame to LaTeX 有一个新的渲染引擎
  • Datetimes 现在以一致的格式解析

弃用

  • 弃用了将带有系统本地时区的日期时间字符串解析为 tzlocal 的做法,可通过 tz 关键字或明确调用 tz_localize 来代替(GH50791)。
  • 弃用了 to_datetime()read_csv() 中的参数 infer_datetime_format,因为它的严格版本现在是默认的(GH48621)。
  • 弃用了 to_datetime() 在解析字符串时使用 unit 的行为,在未来的版本中,这些字符串将被解析为日期,而不是浮点数。要保留原来的行为,请在调用 to_datetime() 之前将字符串转换为数字类型
  • 弃用 pandas.io.sql.execute()
  • Index.is_boolean()已被弃用,请使用 pandas.api.types.is_bool_dtype() 来代替
  • Index.is_integer() 已被弃用,使用 pandas.api.types.is_integer_dtype() 来代替
  • ……

更多详情可查看:https://github.com/pandas-dev/pandas/releases/tag/v2.0.0


相關推薦

2022-04-13

来提高未来的性能;该工具旨在使用多模式输入为 Python Pandas API 合成代码。Pandas 是数据科学中广泛使用的 API,具有数百个用于 manipulating dataframes 或具有行和列的表的函数。 微软方面称,其经验表明,随着这些大型语言模型演

2023-10-26

越精确,但运行速度越慢,所需的内存也越大。 Polars Pandas 能做到的 Polars 不一定能做到,但它能做到的事情都能以极快的速度完成--比 Pandas 快 10 倍,使用的内存只有 Pandas 的一半。来自 PySpark 的开发人员会觉得 Polars API 比 Pan

2024-04-04

接查看系统绩效 新增 concat_to_df 将多个指标数据合并为 pandas DataFrame,方便其他使用 pandas 的工具包进一步处理 所有系统部件及指标支持参数变更时的动态检查 其他优化与调整 python 中增强系统部件快速创建方法直接

2023-04-04

暴露给 Python。该项目还使许多 Python 科学包,包括 NumPy、Pandas、Matplotlib、SciPy 和 Scikit-learn,就可以在浏览器中运行。 近日 Pyodide 发布了 0.23.0,这是一个重要更新版本,更新内容包括将 CPython 升级到 3.11,以及其他功能增强和

2023-02-27

Conan 是一个去中心化、开源的 C/C++ 包管理器。适用于所有平台,包括 Linux、macOS、Windows、Solaris、FreeBSD、Docker、WSL 等。它可以为任何配置和平台创建、上传和下载二进制文件, 甚至交叉编译,节省大量的开发和持续集成时间。

2022-12-04

c(设置同步)解决方案、管理 Conda 软件包的新方法针对 pandas DataFrames 的增强用户体验。 用户体验 新的 Settings Sync(设置同步)解决方案 新的 Settings Sync(设置同步)插件现在可用于 PyCharm。 新解决方案能够同步来自平台、

2023-12-06

transformers、TensorFlow 等 AI 库,以及 Numpy、Pandas、Scikit 等科学计算库,还可以使用 PyQt、wxPython 等图形界面库。 GitHub 地址:https://github.com/swoole/phpy Gitee 地址:https://gitee.com/swoole/phpy   不建议

2022-08-25

推理图的一种新的、更简单的方法,在 2.0 中作为 Beta 版发布。 更多详情可查看:https://github.com/ray-project/ray/releases/tag/ray-2.0.0  

2024-03-04

el-npu-acceleration-library) 在 Apache-2.0 协议下开源。这是一个 Python 库,旨在利用英特尔神经处理单元 (NPU) 的强大功能在兼容硬件上执行高速计算,从而提高应用程序的效率。 该库目前正处于积极开发状态。为了显着提高库的性能

2024-06-20

NumPy 2.0.0 现已发布,这是自 2006 年以来的第一个主要版本,是自上一个功能版本发布以来经过 11 个月开发的成果。该版本包含了来自 212 位贡献者提交的 1078 个 PR,引入了大量的新功能以及对 Python 和 C API 的更改。 此主要版本

2022-08-20

构下的属性以及 elements 上的链接,因此能够支持复杂的数据分析查询语句(CUBE 和 ROLLUP 默默路过……)。当然,GROUP 的真正实力还是在于能与其它的 EdgeQL 语句强强联手: db> with ... groups := ( ... group Movie ... using ... starts_with_v

2022-12-04

用于体验的早期版本,并表示稳定版将于 2023 年 3 月上旬发布。 团队介绍道,PyTorch 2.0 是他们向 PyTorch 下一代 2 系列迈出的第一步。在过去的几年里,从 PyTorch 1.0 到最新的 1.13,他们对 PyTorch 进行了创新和迭代,并将它迁移

2023-10-31

SQLAlchemy 1.4.50 现已发布。 SQLAlchemy 是一个 Python 的 SQL 工具包以及数据库对象映射 (ORM) 框架。它包含整套企业级持久化模式,专门用于高效和高性能的数据库访问。 版本 1.4.50 是 1.4 系列的最新版本,旨在跟上从 2.0 系列

2023-01-11

SQLAlchemy 2.0 发布了第 2 个 RC 版本。 下载地址:https://www.sqlalchemy.org/download.html SQLAlchemy 是一个 Python 的 SQL 工具包以及数据库对象映射 (ORM) 框架。它包含整套企业级持久化模式,专门用于高效和高性能的数据库访问。 发布公