最佳答案
在熊猫中有没有一种方法可以检查一个数据框列是否有重复的值,而不需要删除行?我有一个函数可以删除重复的行,但是,我只希望在特定列中有重复的行时才运行它。
目前,我将列中的唯一值的数量与行的数量进行比较: 如果唯一值少于行,那么就会有重复值,代码就会运行。
if len(df['Student'].unique()) < len(df.index):
# Code to remove duplicates based on Date column runs
有没有一种更简单或更有效的方法来检查重复的值是否存在于一个特定的列,使用熊猫?
我使用的一些示例数据(只显示了两列)。如果找到了重复的行,那么另一个函数将标识保留哪一行(带有最早日期的行) :
Student Date
0 Joe December 2017
1 James January 2018
2 Bob April 2018
3 Joe December 2017
4 Jack February 2018
5 Jack March 2018