Pandas 6.数据运算

数据初始准备就绪后,就需要对数据进行运算,就像做菜步骤中的炒菜环节!

Pandas数据运算

数据初始准备就绪后,就需要对数据进行运算,就像做菜步骤中的炒菜环节!

原始表格

原始数据

算数运算

  • 数据相加 +
  • 数据相减 -
  • 数据相乘 *
  • 数据相除 /

案例:

1
df['2018年'] + df['2019年']

结果如下
原始数据

比较运算

  • 大于 >
  • 小于 <
  • 不相同 !=
  • 相同 ==

案例:

1
df['2018年'] == df['2019年']

结果如下
原始数据

汇总运算

描述 语法
非空值计数 df.count()
求和 df.sum()
平均值 df.mean()
最大值 df.max()
最小值 df.mix()
中位数 df.median()
求众数 df.mode()
方差 df.var()
标准差 df.std()
求分位数 df.quantile()

注意

所有汇总运算默认都是以列为单位,单可以用 **df.运算方法(axis=1)** 参数改为行为单位进行运算例如 df.count(axis=1),并且可以指定行或者列df['指定'].count()

相关性运算

行量两者之间的关系之,比如衡量啤酒与尿布的关系值

1
2
3
4
df['2018年'].corr(df['2019年'])  #取 2008 年与 2019 年的关系值

# 结果
# >>> 0.9972860147857155

取整体关系值

1
df.corr()

运行结果
原始数据