我想把一个由一系列元素组成的“熊猫”列分解成尽可能多的列,只要有唯一的元素即 one-hot-encode
(值 1
表示一个给定的元素存在于一行中,如果没有,值 0
表示给定的元素)。
例如,取数据帧 Df
Col1 Col2 Col3
C 33 [Apple, Orange, Banana]
A 2.5 [Apple, Grape]
B 42 [Banana]
我想将其转换为:
Df
Col1 Col2 Apple Orange Banana Grape
C 33 1 1 1 0
A 2.5 1 0 0 1
B 42 0 0 1 0
我如何使用熊猫/学习来实现这一点?