Pandas 是一个 Python 数据分析库,它提供了快速、灵活和富有表现力的数据结构,旨在使处理 "关系型" 或 "标签型" 数据的工作变得简单和直观。
此版本包括一些新功能、错误修复和性能改进,建议现有用户在升级到 Pandas 2 之前先升级到 Pandas 1.5.3,并确保他们的代码不会产生 FutureWarning 或 DeprecationWarning 消息。
增强
- 使用 pip extras 安装可选的依赖项
Index
现在可以容纳 numpy 数字 dtypes- 参数
dtype_backend
,用于返回 pyarrow-backed 或 numpy-backed 可空的 dtypes。 - 写入时复制的改进
错误修复
DataFrameGroupBy.cumsum()
和DataFrameGroupBy.cumprod()
溢出,而不是有损地转换为浮点数。
向后不兼容的 API 更改
- 使用不支持 resolutions(即 “ns” 以外的任何内容) 的 datetime64 或 timedelta64 dtype 构建
- 值计数将结果名称设置为
count
- 禁止 astype 转换为不受支持的 datetime64/timedelta64 dtypes
- UTC 和固定偏移的时区默认为标准库中的 tzinfo 对象
- 空的 DataFrames/Series 现在将默认有一个
RangeIndex
- DataFrame to LaTeX 有一个新的渲染引擎
- Datetimes 现在以一致的格式解析
弃用
- 弃用了将带有系统本地时区的日期时间字符串解析为
tzlocal
的做法,可通过tz
关键字或明确调用tz_localize
来代替(GH50791)。 - 弃用了
to_datetime()
和read_csv()
中的参数infer_datetime_format
,因为它的严格版本现在是默认的(GH48621)。 - 弃用了
to_datetime()
在解析字符串时使用unit
的行为,在未来的版本中,这些字符串将被解析为日期,而不是浮点数。要保留原来的行为,请在调用to_datetime()
之前将字符串转换为数字类型 - 弃用
pandas.io.sql.execute()
Index.is_boolean()
已被弃用,请使用pandas.api.types.is_bool_dtype()
来代替Index.is_integer()
已被弃用,使用pandas.api.types.is_integer_dtype()
来代替- ……
更多详情可查看:https://github.com/pandas-dev/pandas/releases/tag/v2.0.0