数据帧排序后更新索引

以下列数据框架为例:

x = np.tile(np.arange(3),3)
y = np.repeat(np.arange(3),3)
df = pd.DataFrame({"x": x, "y": y})
   x  y
0  0  0
1  1  0
2  2  0
3  0  1
4  1  1
5  2  1
6  0  2
7  1  2
8  2  2

我需要先按 x排序,然后再按 y排序:

df2 = df.sort(["x", "y"])
   x  y
0  0  0
3  0  1
6  0  2
1  1  0
4  1  1
7  1  2
2  2  0
5  2  1
8  2  2

我怎样才能改变索引,使它再次上升,也就是说,我怎样才能得到这个:

   x  y
0  0  0
1  0  1
2  0  2
3  1  0
4  1  1
5  1  2
6  2  0
7  2  1
8  2  2

我尝试了以下方法。不幸的是,它根本没有改变索引:

df2.reindex(np.arange(len(df2.index)))
200861 次浏览

您可以使用 reset_index对索引进行 重置,以返回一个默认的索引0,1,2,... ,n-1(并使用 drop=True来表明您想删除现有的索引,而不是将其作为一个附加列添加到您的数据帧中) :

In [19]: df2 = df2.reset_index(drop=True)


In [20]: df2
Out[20]:
x  y
0  0  0
1  0  1
2  0  2
3  1  0
4  1  1
5  1  2
6  2  0
7  2  1
8  2  2

您可以使用 set_index设置新的索引:

df2.set_index(np.arange(len(df2.index)))

产出:

   x  y
0  0  0
1  0  1
2  0  2
3  1  0
4  1  1
5  1  2
6  2  0
7  2  1
8  2  2

不推荐使用 df.sort(),请使用 df.sort_values(...): https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sort_values.html

然后按照 joris 的回答做 df.reset_index(drop=True)

因为熊猫1.0.0 df.sort_values有一个新的参数 ignore_index,它完全符合你的需要:

In [1]: df2 = df.sort_values(by=['x','y'],ignore_index=True)


In [2]: df2
Out[2]:
x  y
0  0  0
1  0  1
2  0  2
3  1  0
4  1  1
5  1  2
6  2  0
7  2  1
8  2  2

下面的工作!

  1. 如果要更改现有数据框本身,可以直接使用

     df.sort_values(by=['col1'], inplace=True)
    df.reset_index(drop=True, inplace=True)
    
    
    df
    >>     col1  col2  col3 col4
    0    A     2     0    a
    1    A     1     1    B
    2    B     9     9    c
    5    C     4     3    F
    4    D     7     2    e
    3  NaN     8     4    D
    
  2. 否则,如果您不想改变现有的数据框架,而是想将排序后的数据框架分别存储到另一个变量中,您可以使用:

    df_sorted = df.sort_values(by=['col1']).reset_index(drop=True)
    
    
    df_sorted
    >>     col1  col2  col3 col4
    0    A     2     0    a
    1    A     1     1    B
    2    B     9     9    c
    3    C     4     3    F
    4    D     7     2    e
    5  NaN     8     4    D
    
    
    df
    >>       col1  col2  col3 col4
    0    A     2     0    a
    1    A     1     1    B
    2    B     9     9    c
    3  NaN     8     4    D
    4    D     7     2    e
    5    C     4     3    F