最佳答案
我使用 randomSplit
函数获取少量的数据帧,以便在开发中使用,最后只获取该函数返回的第一个 df。
val df_subset = data.randomSplit(Array(0.00000001, 0.01), seed = 12345)(0)
如果我使用 df.take(1000)
,那么我最终得到的是一个行数组——而不是一个数据框架,所以这对我来说不起作用。
有没有更好、更简单的方法来获取 df 的前1000行并将其存储为另一个 df?