我正在尝试完成一个简单的任务:根据其他列的条件在Pandas数据框中创建一个新列.我曾咨询过其他职位(例如this very popular one,但也有其他采用不同方法的职位),但均未成功.
我现在遇到的问题是在新列中仅返回函数中定义的最后一个值
例如:
我有以下专栏:
x123
我想这样添加新的标签列:
x size1 Small2 Medium3 Large
这是最近尝试的代码:
import pandas as pdimport numpy as npdf = pd.read_csv('blah.csv')def size (row): if row['rQ7'] == 1: return 'Small' if row['rQ7'] == 2: return 'Medium' if row['rQ7'] == 3: return 'Large' return -99 '''I have also trIEd breaking this into else: return -99 but it doesn't work. '''df['size'] = df.apply (lambda row: size (row),axis=1)
现在,虽然我没有收到任何错误,但是当我将函数应用于数据框时,它仅返回最后一个值,即-99:
x size1 -992 -993 -99
我尝试过的其他函数也是如此,当我尝试使用df.loc []时,Python不会将任何值复制到新列中,尽管没有错误.
我感到困惑和茫然:对我来说,根据我尝试过的其他示例,似乎代码应该可以工作.
任何帮助是极大的赞赏.
最佳答案您可以使用numpy.select()
:df['col']=np.select([df.x.eq(1),df.x.eq(2),df.x.eq(3)],['small','medium','large'],\ 'something')
您可以将“某物”替换为不满足条件时应显示的值.
print(df) x size0 1 small1 2 medium2 3 large
总结 以上是内存溢出为你收集整理的python-根据条件创建新的Pandas列,但不会生成值 全部内容,希望文章能够帮你解决python-根据条件创建新的Pandas列,但不会生成值 所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)