Pandas 1.基础之数据结构

python 数据分析必须掌握的 Pandas 基础

Series 一维数据对象

创建 Series

  • 列表形式创建
  • 指定索引创建
  • 传入一个字典
1
2
3
4
5
6
7
8
9
10
11
12
13
import pandas as pd

print('\n用列表创建')
s1 = pd.Series(['a', 'b', 'c', 'd'])
print(s1)

print('\n用指定索引创建')
s2 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
print(s2)

print('\n传入一个字典')
s3 = pd.Series({'a': 1, 'b': 2, 'c': 3})
print(s3)

获取索引

直接用 index 方法就可以获取其索引

1
2
3
4
# 获取索引
print(s1.index) # 列表形式插入的数据
print(s2.index) # 指定索引插入的数据
print(s3.index) # 字典形式插入的数据

获取值

直接用 values 方法就可以获取其值

1
2
3
4
# 获取索引
print(s1.values) # 列表形式插入的数据
print(s2.values) # 指定索引插入的数据
print(s3.values) # 字典形式插入的数据

DataFrame 表格数据结构

series 是一组数据 + 索引。 DataFrame 是一组数据 + 一对索引,该模式与 Excel 的数据储存非常相似,我们主要也用 DataFrame 进行操作

创建 DataFrame

列表形式创建

1
2
print('\n传入列表')  # 只传入一个列表时,会显示成一列,且都是从0开始
df1 = pd.DataFrame(['a', 'b', 'c'])

嵌套列表或元组

1
2
print('\n传入嵌套列表或元组')
df2 = pd.DataFrame([['a', 'A'], ['b', 'B'], ['c', 'C']])

指定行、索引

1
2
3
4
5
6
print('\n指定行、索引')
df3 = pd.DataFrame(
[['a', 'A'], ['b', 'B'], ['c', 'C']],
columns=['小写', '大写'], # 指定列
index=['一', '二', '三'], # 指定行(索引)
)

传入字典

1
2
3
print('\n传入字典')
data = {'小写':['a','b','c'],'大写':['A','B','C']}
df4 = pd.DataFrame(data)

传入字典,设置索引

1
2
3
print('\n传入字典,设置索引')
data = {'小写':['a','b','c'],'大写':['A','B','C']}
df5 = pd.DataFrame(data,index=['一', '二', '三'])

获取

获取列索引

  • columns 获取索引
1
print(df4.columns)

获取行索引

  • index 获取索引
1
print(df4.index)

获取 DataFrome 的值

该板块 会单独写一篇文章来讲解