基于“不在”条件从数据框中删除行

当日期列的值在日期列表中时,我想从熊猫数据框中删除行。下面的代码不起作用:

a=['2015-01-01' , '2015-02-01']


df=df[df.datecolumn not in a]

我得到以下错误:

ValueError: Series 的真值不明确。请使用 a.void、 a.bool ()、 a.item ()、 a.any ()或 a.all ()。

235466 次浏览

你可以使用 Series.isin:

df = df[~df.datecolumn.isin(a)]

虽然错误消息表明可以使用 all()any(),但是只有当您想要将结果减少为一个布尔值时,它们才有用。然而,这并不是您现在要做的事情,那就是根据外部列表测试 Series 中每个值的成员关系,并保持结果完整(例如,一个 Boolean Series,然后将用于切割原始 DataFrame)。

你可以在 抓到你了中读到更多关于这方面的内容。

你可以使用 pandas.Dataframe.isin

根据每个元素是否在列表 a中,pandas.Dateframe.isin将返回布尔值。然后用 ~将其反转,将 True转换为 False,反之亦然。

import pandas as pd


a = ['2015-01-01' , '2015-02-01']


df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})


print(df)
#         date
#0  2015-01-01
#1  2015-02-01
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01


df = df[~df['date'].isin(a)]


print(df)
#         date
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01