最佳答案
我有这个密码:
l = [('Alice', 1),('Jim',2),('Sandra',3)]
df = sqlContext.createDataFrame(l, ['name', 'age'])
df.withColumn('age2', df.age + 2).toPandas()
效果很好,做了该做的事。假设我只想显示前 n 行,然后调用 toPandas()
返回熊猫数据帧。我该怎么做?我不能调用 take(n)
,因为它不返回数据帧,因此我不能将它传递给 toPandas()
。
那么换句话说,我怎样才能从一个数据帧中获取最上面的 n 行,并在结果数据帧上调用 toPandas()
呢?我不觉得这很难,但是我想不出来。
我用的是 Spark 1.6.0。