最佳答案
我想覆盖特定的分区,而不是所有的火花。我尝试以下命令:
df.write.orc('maprfs:///hdfs-base-path','overwrite',partitionBy='col4')
其中 df 是数据帧,具有要覆盖的增量数据。
Hdfs-base-path 包含主数据。
当我尝试上面的命令时,它会删除所有分区,并在 hdfs 路径处插入 df 中的分区。
我的要求是只覆盖 df 中指定 hdfs 路径处的分区。有人能帮帮我吗?