我有一个数据框,列为 String。 我想在 PySpark 中将列类型更改为 Double 类型。
我是这样做的:
toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType())
changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show']))
只是想知道,这是正确的方式做到这一点,因为在跑步 通过 Logit模型,我得到了一些错误,所以我想知道, 这就是麻烦的原因吗。