首先,要将“分类”列转换为其数字代码,可以使用以下命令更轻松地做到这一点
dataframe['c'].cat.pres。
此外,可以使用来自动选择数据框中具有特定dtype的所有列
select_dtypes。这样,您可以将以上 *** 作应用于多个自动选择的列。
首先制作一个示例数据框:
In [75]: df = pd.Dataframe({'col1':[1,2,3,4,5], 'col2':list('abcab'), 'col3':list('ababb')})In [76]: df['col2'] = df['col2'].astype('category')In [77]: df['col3'] = df['col3'].astype('category')In [78]: df.dtypesOut[78]:col1 int64col2 categorycol3 categorydtype: object
然后,通过使用
select_dtypes选择列,然后将其应用于
.cat.pres这些列中的每一个,您可以获得以下结果:
In [80]: cat_columns = df.select_dtypes(['category']).columnsIn [81]: cat_columnsOut[81]: Index([u'col2', u'col3'], dtype='object')In [83]: df[cat_columns] = df[cat_columns].apply(lambda x: x.cat.pres)In [84]: dfOut[84]: col1 col2 col30 1 0 01 2 1 12 3 2 03 4 0 14 5 1 1
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)