最佳答案
假设我有一个国家的数据框架,它是这样的:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
我知道有一个 pd.get _ Dummies 函数可以将这些国家转换为“ one-hot 编码”。但是,我希望将它们转换为索引,这样我将得到 cc_index = [1,2,1,3]
代替。
我假设有一种比使用 get _ Dummies 和 numpy where 子句更快的方法,如下所示:
[np.where(x) for x in df.cc.get_dummies().values]
This is somewhat easier to do in R using 'factors' so I'm hoping pandas has something similar.