pandas数据结构Series, DataFrame的索引方式总结

2024-01-02 21:29:08
pandas数据结构Series, DataFrame的索引方式总结
1, 转换为Numpy。

pandas的目的在于方便进行列操作,如果想遍历循环,就利用values值转换为numpy。

import pandas as pd
df = pd.DataFrame({'a':[10,20,30],'b':['c',30,40]})
print(df.values)
print(df['a'].values)
'''
[[10 'c']
 [20 30]
 [30 40]]
 
[10 20 30]
'''
2,索引
一,DataFrame普通索引三种:

1,df[列名或者列名list]

2,df.loc[[行名], [列名]]

3,df.iloc[[行号],[列号]]

二,serires普通索引有三种:

1,se[行名] ,其中之后的版本中,只有se[[行名]]这一种。

2,se.loc[[行名]]

3,se.iloc[[行号]]

import pandas as pd
df = pd.DataFrame({'a':[10,20,30],'b':['c',30,40]})
print(df['a'])
print(df[['a', 'b']])
print(df.loc[1, 'a'])
print(df.loc[[1,2], ['a']])
print(df.iloc[1, [0,1]])
二, 布尔索引两种:

1,data[[行布尔]], 用于挑选行的。

2, data.loc[[行布尔],[列布尔]]

import pandas as pd
df = pd.DataFrame({'a':[10,20,30],'b':['c',30,40]})
df.index = ['a', 'b', 'c']
print(df[df.a == 10])
print(df.loc[df.a==10, [True, False]])
print(df.loc[df.a==10, df.columns!='b']) #出去b之外的所有列。 
'''
    a  b
a  10  c

    a
a  10
'''

文章来源:https://blog.csdn.net/Akun_2217/article/details/135342707
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。