SQL devam etmenize ve birçok farklı ilişki işlemi gerçekleştirmenize ve her zaman birden fazla farklı kullanım için hazır olmasını sağlar. Esasen gidilecek bir gerçek veya yer kaynağı. Kesinlikle başın üstünde var. Bununla birlikte, bazı analizler çok karmaşık olabilir ve küçük bir veri setini bile çok hızlı bir şekilde büyük bir veri setine dönüştürebilen önemli miktarda set tabanlı işlem gerektirir. Terabaytları 5 dakikadan daha az bir sürede işleyen ve sonunda tahmini bir model için milyarlarca kayıt alan 2000'den fazla sorguya sahip veri süreçlerim oldu ve python ve numpy, ilişkisel bir veri deposu olarak veri kümesinin bir kısmını 10x sürede puanladı ve bir sunum katmanına sunun.
Ek bir nokta, bunu bulutta yapıyorsa, belleğini ölçeklendirebilecek dinamik bir örneğiniz olduğundan emin olun. SQL ile her şey diske ve zamanında yapmak için yeterli hesaplama ile ilgilidir.
Sinerjide çalışabilmeleri için birçok yol görüyorum. Birçok veri bilimi işi, Pandaların yapmak için tasarlandığı şeydir. Bazı veri bilimi işleri RDB'lerin yapmak için tasarlandığı şeydir. Her ikisini de dengede kullanın.
Her şey doğru işi yapmak için doğru araçla ilgilidir.