获取给定列的第一行值

小开

最佳答案

要选择ith行，使用iloc:

In [31]: df_test.iloc[0]
Out[31]:
ATime     1.2
X         2.0
Y        15.0
Z         2.0
Btime     1.2
C        12.0
D        25.0
E        12.0
Name: 0, dtype: float64

要选择Btime列中的第i个值，您可以使用:

In [30]: df_test['Btime'].iloc[0]
Out[30]: 1.2

`df_test['Btime'].iloc[0]`(推荐)和`df_test.iloc[0]['Btime']`之间有区别:

DataFrames将数据存储在基于列的块中(其中每个块有一个单独的 dtype)。如果先按列选择，则可以返回视图比返回副本快)，并且原始dtype被保留。相比之下, 如果先按行选择，如果DataFrame有不同的列 dtypes，然后Pandas 副本将数据转换为一个新的Series对象dtype。所以选择列比选择行快一些。因此,尽管 df_test.iloc[0]['Btime']工作，df_test['Btime'].iloc[0]有点更有效率。< / p > 当涉及到分配时，两者之间有很大的区别。 df_test['Btime'].iloc[0] = x影响df_test，但是df_test.iloc[0]['Btime'] 可能不会。请看下面的解释。因为细微的差别索引的顺序在行为上有很大的不同，最好使用单索引赋值:

df.iloc[0, df.columns.get_loc('Btime')] = x

`df.iloc[0, df.columns.get_loc('Btime')] = x`(推荐):

推荐方式为a赋新值 DataFrame是避免链式索引，而是使用方法所示安德鲁。< / >,< / p >

df.loc[df.index[n], 'Btime'] = x

或

df.iloc[n, df.columns.get_loc('Btime')] = x

后一种方法稍微快一些，因为df.loc必须将行和列标签转换为位置索引，所以如果你使用 df.iloc。< / p >

`df['Btime'].iloc[0] = x`可以工作，但不推荐:

虽然这是有效的，但它利用了dataframe 目前实现的方式。没有人保证熊猫将来一定要这样工作。特别地，它利用了(当前)df['Btime']总是返回a的事实视图(不是副本)，因此df['Btime'].iloc[n] = x可以用来分配一个新值在df的Btime列的第n个位置

由于Pandas没有明确保证索引器什么时候返回视图而什么时候返回副本，使用链式索引的赋值通常总是引发SettingWithCopyWarning，即使在这种情况下赋值成功修改了df:

In [22]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1])
In [24]: df['bar'] = 100
In [25]: df['bar'].iloc[0] = 99
/home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame


See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
self._setitem_with_indexer(indexer, value)


In [26]: df
Out[26]:
foo  bar
0   A   99  <-- assignment succeeded
2   B  100
1   C  100

`df.iloc[0]['Btime'] = x`不工作:

相比之下，df.iloc[0]['bar'] = 123的赋值则无效，因为df.iloc[0]返回的是一个副本:

In [66]: df.iloc[0]['bar'] = 123
/home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame


See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy


In [67]: df
Out[67]:
foo  bar
0   A   99  <-- assignment failed
2   B  100
1   C  100

警告:我之前建议df_test.ix[i, 'Btime']。但这并不能保证给你ith值，因为ix在尝试通过位置进行索引之前，会尝试通过标签进行索引。因此，如果DataFrame有一个整数索引，该索引不是按从0开始的顺序排序的，那么使用ix[i]将返回标签 i行，而不是ith行。例如,

In [1]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1])


In [2]: df
Out[2]:
foo
0   A
2   B
1   C


In [4]: df.ix[1, 'foo']
Out[4]: 'C'

小开

注意，来自@unutbu的答案将是正确的，直到你想将值设置为新的值，然后如果你的数据框架是一个视图，它将不起作用。

In [4]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1])
In [5]: df['bar'] = 100
In [6]: df['bar'].iloc[0] = 99
/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas-0.16.0_19_g8d2818e-py2.7-macosx-10.9-x86_64.egg/pandas/core/indexing.py:118: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame


See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
self._setitem_with_indexer(indexer, value)

另一种同时使用setting和getting的方法是:

In [7]: df.loc[df.index[0], 'foo']
Out[7]: 'A'
In [8]: df.loc[df.index[0], 'bar'] = 99
In [9]: df
Out[9]:
foo  bar
0   A   99
2   B  100
1   C  100

小开

df.iloc[0].head(1) -仅来自整个第一行的第一个数据集。
df.iloc[0] -整列的第一行。

小开

一般来说，如果你想从pandas dataframe的J列中提取第一个N行，最好的方法是:

data = dataframe[0:N][:,J]

小开

另一种方法是:

first_value = df['Btime'].values[0]

这种方式似乎比使用.iloc更快:

In [1]: %timeit -n 1000 df['Btime'].values[20]
5.82 µs ± 142 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [2]: %timeit -n 1000 df['Btime'].iloc[20]
29.2 µs ± 1.28 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

小开

获取第一行并保存索引的另一种方法:

x = df.first('d') # Returns the first day. '3d' gives first three days.

小开

例如，要从“test”列和第一行中获取值，它的工作方式如下

df[['test']].values[0][0]

因为只有df[['test']].values[0]返回一个数组

小开

要访问单个值，可以使用方法iat，它是快得多而不是iloc:

df['Btime'].iat[0]

你也可以使用方法take:

df['Btime'].take(0)

小开

.iat和.at是获取和设置单个值的方法，比.iloc和.loc快得多。Mykola Zotko在他们的回答中指出了这一点，但他们没有充分使用.iat。

当我们可以使用.iat或.at时，我们应该只需要索引到数据帧一次。

这并不好:

df['Btime'].iat[0]

这并不理想，因为'Btime'列首先被选为一个系列，然后.iat被用于索引到该系列。

以下两种选择是最好的:

使用零索引位置:

df.iat[0, 4]  # get the value in the zeroth row, and 4th column

 df.at[0, 'Btime']  # get the value where the index label is 0 and the column name is "Btime".

这两个方法都返回值1.2。

小开

根据熊猫文档， at是访问标量值的最快方法，例如OP中的用例(已经由本页的亚历克斯建议)。

根据Alex的回答，因为数据帧不一定有范围索引，所以索引df.index(因为数据帧索引是建立在numpy数组上的，你可以像数组一样索引它们)或在列上调用get_loc()来获得列的整数位置可能更完整。

df.at[df.index[0], 'Btime']
df.iat[0, df.columns.get_loc('Btime')]

一个常见的问题是，如果你使用一个布尔掩码来获得一个值，但最终得到了一个带索引的值(实际上是一个Series);例如:

0    1.2
Name: Btime, dtype: float64

你可以使用squeeze()来获取标量值，即。

df.loc[df['Btime']<1.3, 'Btime'].squeeze()

获取给定列的第一行值

df_test['Btime'].iloc[0](推荐)和df_test.iloc[0]['Btime']之间有区别:

df.iloc[0, df.columns.get_loc('Btime')] = x(推荐):

df['Btime'].iloc[0] = x可以工作，但不推荐:

df.iloc[0]['Btime'] = x不工作:

`df_test['Btime'].iloc[0]`(推荐)和`df_test.iloc[0]['Btime']`之间有区别:

`df.iloc[0, df.columns.get_loc('Btime')] = x`(推荐):

`df['Btime'].iloc[0] = x`可以工作，但不推荐:

`df.iloc[0]['Btime'] = x`不工作: