最佳答案
我试图在我的数据框中计算每种类型的行的重复数量。例如,假设我有一个熊猫的数据框如下:
df = pd.DataFrame({'one': pd.Series([1., 1, 1]),
'two': pd.Series([1., 2., 1])})
我得到一个像这样的 df:
one two
0 1 1
1 1 2
2 1 1
我想第一步是找到所有不同的唯一行,我通过:
df.drop_duplicates()
这给了我下面的 df:
one two
0 1 1
1 1 2
现在我想从上面的 df ([11]和[12])中获取每一行,并计算每一行在初始 df 中的次数。我的结果是这样的:
Row Count
[1 1] 2
[1 2] 1
我应该怎样做最后一步?
编辑:
这里有一个更大的例子来说明这一点:
df = pd.DataFrame({'one': pd.Series([True, True, True, False]),
'two': pd.Series([True, False, False, True]),
'three': pd.Series([True, False, False, False])})
给了我:
one three two
0 True True True
1 True False False
2 True False False
3 False False True
我想要一个结果告诉我:
Row Count
[True True True] 1
[True False False] 2
[False False True] 1