tl; dr: Pek çok açıdan önemli ölçüde farklılar ve Redshift'in Hadoop'un yerini alacağını düşünemiyorum.
-Fonksiyon
Redshift üzerinde SQL dışında bir şey çalıştıramazsınız. Belki de en önemlisi, Redshift üzerinde herhangi bir özel işlev çalıştıramazsınız. Hadoop'ta birçok dili kullanarak (Java, Python, Ruby .. adını verirsiniz). Örneğin, Hadoop'taki NLP kolaydır, Redshift'de az ya da çok imkansızdır. Yani Hadoop'ta yapabileceğiniz birçok şey var ama Redshift'te değil. Bu muhtemelen en önemli farktır.
-Performans Profili
Redshift üzerinde sorgu yürütme çoğu durumda Hadoop'tan çok daha verimlidir. Ancak, bu verimlilik veriler Redshift'e yüklendiğinde yapılan indekslemeden gelir ( indexing
burada çok gevşek terimini kullanıyorum ). Bu nedenle, verilerinizi bir kez yükleyip birden çok sorgu yürütmeniz harika olur, ancak örneğin yalnızca bir sorgu yürütmek istiyorsanız, genel olarak performansınızı kaybedebilirsiniz.
-Maliyeti Profil
Hangi çözümün maliyetle kazandığı, duruma (performans gibi) bağlıdır, ancak Hadoop'tan (daha spesifik olarak Amazon'un Elastik Harita Azaltması) daha ucuz hale getirmek için muhtemelen çok fazla sorguya ihtiyacınız vardır. Örneğin, OLAP yapıyorsanız, Redshift'in daha ucuz olması muhtemeldir. Günlük toplu ETL yaparsanız, Hadoop'un daha ucuza çıkması daha olasıdır.
Söyledikten sonra, Hive to Redshift'te yapılan ETL bölümümüzün yerini aldık ve oldukça harika bir deneyim oldu; çoğunlukla kalkınma kolaylığı için. Redshift'in Sorgu Motoru, PostgreSQL tabanlıdır ve Hive'ınkine kıyasla çok olgunlaşmıştır. ACID özellikleri bununla ilgili akıl yürütmeyi kolaylaştırır ve daha hızlı yanıt süresi daha fazla test yapılmasına izin verir. Sahip olmak harika bir araç, ancak Hadoop'un yerini almayacak.
DÜZENLEME : Kurulum karmaşıklığına gelince, AWS'nin EMR'sini kullanırsanız Hadoop ile daha kolay olduğunu söyleyebilirim. Aletleri o kadar olgun ki, Hadoop işinizi çalıştırmanız gülünç derecede kolay. Redshift'in operasyonunu çevreleyen araç ve mekanizmalar henüz bu kadar olgun değil. Örneğin, Redshift damlama yüklemesini kaldıramaz ve bu nedenle bunu toplu yüke dönüştüren bir şey bulmanız gerekir, bu da ETL'nize biraz karmaşıklık katabilir.