Her dakika için bir veri seti üreten bir kıvılcım akışı uygulamam var. İşlenen verilerin sonuçlarını kaydetmem / üzerine yazmam gerekiyor.
Veri kümesinin üzerine yazmaya çalıştığımda org.apache.hadoop.mapred.FileAlreadyExistsException yürütmeyi durduruyor.
Spark özelliğini ayarladım set("spark.files.overwrite","true")
, ancak şans yok.
Kıvılcım dosyalarının üzerine nasıl yazılır veya önceden silinir?
set("spark.files.overwrite","true")
sadece eklenen dosyalar için çalışırspark.addFile()