MapReduce'u uyguladığınız birçok gerçek yaşam durumunda, son algoritmalar birkaç MapReduce adımı olur.
ör. Map1, Reduce1, Map2, Reduce2 vb.
Böylece, bir sonraki harita için girdi olarak gerekli olan son azaltmanın çıktısına sahip olursunuz.
Ara veriler, ardışık düzen başarıyla tamamlandıktan sonra (genel olarak) saklamak istemediğiniz bir şeydir. Ayrıca bu ara veriler genel olarak bazı veri yapıları olduğundan (bir 'harita' veya 'küme' gibi) bu anahtar / değer çiftlerini yazmak ve okumak için çok fazla çaba harcamak istemezsiniz.
Hadoop'ta bunu yapmanın önerilen yolu nedir?
Bu ara verilerin nasıl doğru şekilde işleneceğini gösteren (daha sonra temizleme dahil) (basit) bir örnek var mı?