如何在熊猫身上做到这一点:
我在单个文本列上有一个函数extract_text_features
,返回多个输出列。具体来说,该函数返回6个值。
函数可以工作,但是似乎没有任何合适的返回类型(pandas DataFrame/ numpy数组/ Python列表),从而可以正确地分配输出df.ix[: ,10:16] = df.textcol.map(extract_text_features)
所以我认为我需要回到用df.iterrows()
迭代,就像根据这?
df.iterrows()
进行迭代至少要慢20倍,因此我放弃并将该函数分解为6个不同的.map(lambda ...)
调用
更新2:这个问题是在v0.11.0前后提出的,在可用性df.apply
得到改进或df.assign()
为v0.16新增之前。因此,很多问题和答案都不太相关。