如何替换一个Pandas数据框架的字符串列中的文本?

我有一个列在我的数据框架像这样:

range
"(2,30)"
"(50,290)"
"(400,1000)"
...

我想用-破折号替换,逗号。我目前正在使用这种方法,但没有任何改变。

org_info_exc['range'].replace(',', '-', inplace=True)

有人能帮忙吗?

508521 次浏览

使用向量化的str方法replace:

df['range'] = df['range'].str.replace(',','-')


df
range
0    (2-30)
1  (50-290)

编辑:所以如果我们看看你尝试了什么,为什么它没有工作:

df['range'].replace(',','-',inplace=True)

文档中我们看到这样的描述:

str或regex: str: string完全匹配to_replace将被替换 与价值< / p >

因此,因为str值不匹配,不会发生替换,与以下比较:

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)


df['range']


0    (2,30)
1         -
Name: range, dtype: object

在这里,我们在第二行得到了完全匹配,然后进行替换。

对于从谷歌搜索到这里的任何人,如何在所有列上进行字符串替换(例如,如果一个人有多个列,如OP的'range'列): Pandas在dataframe对象上有一个内置的replace方法

df.replace(',', '-', regex=True)

来源:文档

将列名中的所有逗号替换为下划线

data.columns= data.columns.str.replace(' ','_',regex=True)

此外,对于那些想要替换列中多个字符的人,你可以使用正则表达式:

import re
chars_to_remove = ['.', '-', '(', ')', '']
regular_expression = '[' + re.escape (''. join (chars_to_remove)) + ']'


df['string_col'].str.replace(regular_expression, '', regex=True)

如果你只需要替换一个特定列中的字符,不知怎么的regex=True和in place=True都失败了,我认为这种方式是可行的:

data["column_name"] = data["column_name"].apply(lambda x: x.replace("characters_need_to_replace", "new_characters"))

lambda更像是在这种情况下工作于for循环的函数。 这里的X表示当前列中的每一项

你唯一需要做的就是改变“;column_name”,“;characters_need_to_replace”;和“;new_characters"。

如果你想从一个字符串中删除两个或多个元素,例如字符'$'和',':

Column_Name
===========
$100,000
$1,100,000

... 然后使用:

data.Column_Name.str.replace("[$,]", "", regex=True)

=比;[ 100000, 1100000 ]

几乎类似于Nancy K的回答,这对我来说很管用:

data["column_name"] = data["column_name"].apply(lambda x: x.str.replace("characters_need_to_replace", "new_characters"))