我从CSV文件中加载了一些机器学习数据。前两列是观察结果,其余列是特征。
目前,我做以下事情:
data = pandas.read_csv('mydata.csv')
它会给出如下内容:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
我想把这个数据帧切成两个数据帧:一个包含列a
和b
,另一个包含列c
, d
和e
。
不可能写出这样的东西
observations = data[:'c']
features = data['c':]
我不确定最好的方法是什么。我需要pd.Panel
吗?
data['a']
是允许的,但data[0]
是不允许的。另一方面,data['a':]
是不允许的,但data[0:]
是允许的。
这有什么实际的原因吗?如果列以Int为索引,这确实令人困惑,假设data[0] != data[0:1]