最佳答案
我正在浏览“ Python 用于数据分析”一书,在“示例: 2012年联邦选举委员会数据库”部分读取数据到 DataFrame 时遇到了麻烦。问题在于,数据的其中一列总是被设置为索引列,即使 index _ coll 参数被设置为 Nothing。
下面是到数据的链接: http://www.fec.gov/disclosurep/PDownload.do。
下面是加载代码(为了节省检查时间,我设置 nrows = 10) :
import pandas as pd
fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None)
为了简短起见,我排除了数据列的输出,但下面是我的输出(请不要使用 Index 值) :
In [20]: fec
Out[20]:
<class 'pandas.core.frame.DataFrame'>
Index: 10 entries, C00410118 to C00410118
Data columns:
...
dtypes: float64(4), int64(3), object(11)
下面是本书的输出(同样不包括数据列) :
In [13]: fec = read_csv('P00000001-ALL.csv')
In [14]: fec
Out[14]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1001731 entries, 0 to 1001730
...
dtypes: float64(1), int64(1), object(14)
我输出中的 Index 值实际上是文件中的第一列数据,然后将所有其余数据向左移动一个。有人知道如何防止这一列数据被列为索引吗?我希望索引只是 + 1增加整数。
我对蟒蛇和熊猫还是很陌生的,所以我为给你们带来的不便表示歉意。谢谢。