最佳答案
我有一个包含这种类型数据(太多列)的数据框:
col1 int64
col2 int64
col3 category
col4 category
col5 category
柱子看起来像这样:
Name: col3, dtype: category
Categories (8, object): [B, C, E, G, H, N, S, W]
我想把每列中的所有值都转换成如下的整数:
[1, 2, 3, 4, 5, 6, 7, 8]
我在一篇专栏文章中解决了这个问题:
dataframe['c'] = pandas.Categorical.from_array(dataframe.col3).codes
现在我有两个列在我的数据框架-旧的 col3
和新的 c
,并需要删除旧的列。
这是个坏习惯。它工作,但在我的数据框中有太多的列,我不想手动这样做。
我怎样才能做得更聪明呢?