如何避免熊猫在保存的csv中创建索引

在对文件进行一些编辑后,我正在尝试将csv保存到文件夹中。

每次我使用pd.to_csv('C:/Path of file.csv')时,csv文件都有一个单独的索引列。我想避免将索引打印到csv。

我试过:

pd.read_csv('C:/Path to file to edit.csv', index_col = False)

并保存文件…

pd.to_csv('C:/Path to save edited file.csv', index_col = False)

但是,我仍然得到了不需要的索引列。保存文件时如何避免这种情况?

677060 次浏览

使用index=False

df.to_csv('your.csv', index=False)

有两种方法可以处理我们不希望索引存储在csv文件中的情况。

  1. 正如其他人所说,您可以使用index=False同时保存您的
    csv文件的数据帧。

    df.to_csv('file_name.csv',index=False)

  2. 或者你可以保存你的数据帧,因为它是一个索引,当你读取你只是删除列未命名0包含你以前的索引。

    df.to_csv(' file_name.csv ')
    df_new = pd.read_csv('file_name.csv').drop(['unnamed 0'],axis=1)

如果您想将此列保留为索引,则另一种解决方案。

pd.read_csv('filename.csv', index_col='Unnamed: 0')

如果你想要一个好的格式,下一个语句是最好的:

dataframe_prediction.to_csv('filename.csv', sep=',', encoding='utf-8', index=False)

在这种情况下,您有一个带有','的csv文件,在列和utf-8格式之间分开。 另外,数字索引不会出现。

正如其他人所说,如果您不想首先保存索引列,您可以使用df.to_csv('processed.csv', index=False)

但是,由于您通常使用的数据本身具有某种索引,例如“时间戳”列,因此我会保留索引并使用它加载数据。

因此,要保存索引数据,首先设置它们的索引,然后保存DataFrame:

df.set_index('timestamp')
df.to_csv('processed.csv')

之后,您可以使用索引读取数据:

pd.read_csv('processed.csv', index_col='timestamp')

或者读取数据,然后设置索引:

pd.read_csv('filename.csv')
pd.set_index('column_name')

如果您不想要索引,请使用以下方式读取文件:

import pandas as pd
df = pd.read_csv('file.csv', index_col=0)

保存它使用

df.to_csv('file.csv', index=False)