如何将熊猫数据框的索引转换为列

这似乎相当明显,但我似乎无法弄清楚如何将数据帧的索引转换为列?

例如:

df=
gi       ptt_loc
0  384444683      593
1  384444684      594
2  384444686      596

为了,

df=
index1    gi       ptt_loc
0  0     384444683      593
1  1     384444684      594
2  2     384444686      596
1092963 次浏览

或者:

df['index1'] = df.index

或者,.reset_index

df = df.reset_index(level=0)

因此,如果您有一个具有3个索引级别的多索引框架,例如:

>>> df
val
tick       tag obs
2016-02-26 C   2    0.0139
2016-02-27 A   2    0.5577
2016-02-28 C   6    0.0303

如果你想将索引中的第1(tick)和第3(obs)级转换为列,你可以这样做:

>>> df.reset_index(level=['tick', 'obs'])
tick  obs     val
tag
C   2016-02-26    2  0.0139
A   2016-02-27    2  0.5577
C   2016-02-28    6  0.0303

对于MultiIndex,您可以使用以下命令提取其子索引

df['si_name'] = R.index.get_level_values('si_name')

其中si_name是子索引的名称。

为了提供更清晰的信息,让我们看一下索引中有两个级别的DataFrame(MultiIndex)。

index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'],
['North', 'South']],
names=['State', 'Direction'])


df = pd.DataFrame(index=index,
data=np.random.randint(0, 10, (6,4)),
columns=list('abcd'))

在此处输入图片描述

使用默认参数调用的reset_index方法将所有索引级别转换为列,并使用简单的RangeIndex作为新索引。

df.reset_index()

在此处输入图片描述

使用level参数来控制将哪些索引级别转换为列。如果可能,请使用级别名称,这更明确。如果没有级别名称,您可以通过其整数位置引用每个级别,从外部从0开始。您可以在此处使用标量值或要重置的所有索引的列表。

df.reset_index(level='State') # same as df.reset_index(level=0)

在此处输入图片描述

在极少数情况下,您希望保留索引并将索引转换为列,您可以执行以下操作:

# for a single level
df.assign(State=df.index.get_level_values('State'))


# for all levels
df.assign(**df.index.to_frame())

如果您想使用reset_index方法并保留现有索引,您应该使用:

df.reset_index().set_index('index', drop=False)

或者在原地改变它:

df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)

例如:

print(df)
gi  ptt_loc
0  384444683      593
4  384444684      594
9  384444686      596


print(df.reset_index())
index         gi  ptt_loc
0      0  384444683      593
1      4  384444684      594
2      9  384444686      596


print(df.reset_index().set_index('index', drop=False))
index         gi  ptt_loc
index
0          0  384444683      593
4          4  384444684      594
9          9  384444686      596

如果你想摆脱索引标签,你可以这样做:

df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
index         gi  ptt_loc
0      0  384444683      593
4      4  384444684      594
9      9  384444686      596

rename_axis+reset_index

您可以首先将索引重命名为所需的标签,然后提升为系列:

df = df.rename_axis('index1').reset_index()


print(df)


index1         gi  ptt_loc
0       0  384444683      593
1       1  384444684      594
2       2  384444686      596

这也适用于MultiIndex数据帧:

print(df)
#                        val
# tick       tag obs
# 2016-02-26 C   2    0.0139
# 2016-02-27 A   2    0.5577
# 2016-02-28 C   6    0.0303


df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()


print(df)


index1 index2  index3     val
0  2016-02-26      C       2  0.0139
1  2016-02-27      A       2  0.5577
2  2016-02-28      C       6  0.0303
df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1


new     gi     ptt
0    0      232    342
1    1      66     56
2    2      34     662
3    3      43     123

这应该做的伎俩(如果不是多级索引)-

df.reset_index().rename({'index':'index1'}, axis = 'columns')

代码结果

当然,如果您不想将其分配给rename函数参数中的新变量,您可以始终设置inplace=true

pandas1.5.0的最新版本中,您可以使用带有新参数names的函数reset_index来指定要为索引列提供的名称列表。这是一个具有一个索引列的可重现示例:

import pandas as pd


df = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})


gi  ptt
0  232  342
1   66   56
2   34  662
3   43  123


df.reset_index(names=['new'])

输出:

   new   gi  ptt
0    0  232  342
1    1   66   56
2    2   34  662
3    3   43  123

这也可以很容易地应用于MultiIndex。只需创建您想要的名称列表。

我通常是这样做的:

df = df.assign(index1=df.index)