将熊猫 DataFrame 中带逗号的数字字符串转换为 float

我有一个 DataFrame,它将数字作为字符串包含,并用逗号表示数千个标记。我需要把它们转换成花车。

a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']]
df=pandas.DataFrame(a)

我想我需要使用 locale.atof 确实

df[0].apply(locale.atof)

正如预期的那样,我得到了一系列的花车。

但是当我将它应用到 DataFrame 时,会得到一个错误。

df.apply(locale.atof)

TypeError: (“无法将序列转换为”,u‘发生在索引0’处)

还有

df[0:1].apply(locale.atof)

给出了另一个错误:

ValueError: (‘ void Literal for float () : 1,200’,u‘ came at index 0’)

那么,如何将字符串的 DataFrame转换为浮点数的 DataFrame 呢?

158761 次浏览

如果你是 从 CSV 那里读取信息,那么你可以使用 :

df.read_csv('foo.tsv', sep='\t', thousands=',')

此方法可能比将操作作为单独的步骤执行更有效。


首先你需要 设定地点:

In [ 9]: import locale


In [10]: from locale import atof


In [11]: locale.setlocale(locale.LC_NUMERIC, '')
Out[11]: 'en_GB.UTF-8'


In [12]: df.applymap(atof)
Out[12]:
0        1
0  1200  4200.00
1  7000    -0.03
2     5     0.00

你可以使用 熊猫系列 Str.place方法:

df.iloc[:,:].str.replace(',', '').astype(float)

此方法可以删除或替换字符串中的逗号。

您可以像下面这样一次转换一列:

df['colname'] = df['colname'].str.replace(',', '').astype(float)