Python:pandas处理DataFrame

Python:pandas处理DataFrame,第1张

概述DataFrame1.读入数据df=pd.read_excel('info.xlsx')type(df)#输出<class'pandas.core.frame.DataFrame'>2.获取前5行df.head(5)#输出 姓名 年龄 性别 籍贯0 张三 31 男 上海1 李四 24 男 北京2 赵五 47 女 深圳3 刘六 21 男 广州4 谭七 19 女 香港3.获 DataFrame1.读入数据
df = pd.read_excel('info.xlsx')type(df)# 输出<class 'pandas.core.frame.DataFrame'>
2.获取前5行
df.head(5)# 输出	姓名	年龄	性别	籍贯0	张三	31	男	上海1	李四	24	男	北京2	赵五	47	女	深圳3	刘六	21	男	广州4	谭七	19	女	香港
3.获取第3-4行
df[2:4]# 输出	姓名	年龄	性别	籍贯2	赵五	47	女	深圳3	刘六	21	男	广州
4.获取特定的列
df[['姓名', '籍贯']].head(2)# 输出	姓名	籍贯0	张三	上海1	李四	北京
5.使用整数下标选择行和列
df.iloc[0:3, 0:3]# 输出	姓名	年龄	性别0	张三	31	男1	李四	24	男2	赵五	47	女

注:通过iloc属性实现

6.使用整数和标签的混合来选择行和列
df.loc[df.index[0:3], ['姓名', '性别']]# 输出	姓名	性别0	张三	男1	李四	男2	赵五	女

注:通过loc属性实现

7.重置索引为姓名
df = df.set_index('姓名')# 输出	年龄	性别	籍贯姓名			张三	31	男	上海李四	24	男	北京赵五	47	女	深圳刘六	21	男	广州谭七	19	女	香港
8.更改列名
df.columns = 'a','b','c'输出:	a	b	c姓名			张三	31	男	上海李四	24	男	北京赵五	47	女	深圳刘六	21	男	广州谭七	19	女	香港
9.对数据进行计算
df['a'] = df['a']+2020# 输出	a	b	c姓名			张三	2052	男	上海李四	2045	男	北京赵五	2068	女	深圳刘六	2042	男	广州谭七	2040	女	香港

参考:https://mp.weixin.qq.com/s/b-rHS18WQoPJ78NbKaSaXQ

总结

以上是内存溢出为你收集整理的Python:pandas处理DataFrame全部内容,希望文章能够帮你解决Python:pandas处理DataFrame所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/1185986.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存