Bir Ubuntu sunucusunda çalışan bir PostgreSQL veritabanında ikili veri dosyalarını depolamak gerekiyor. Başlangıçta her biri yaklaşık 250kb boyutunda birkaç düzine dosya olacaktır. Ancak, dosya sayısı zamanla artacaktır. Zaman zaman diğer aşağı akım analizleri için dosyalardan veri ayıklamak gerekebilir.
İkili verileri BLOB veya referans olarak depolamak için asırlık soru ile ilgili biraz araştırma yaptım. Her ikisinin de artıları ve eksileri var. PostgreSQL ile ilgili bilmem gereken belirli sorunlar var mı? Dosyalardan veriyi PostgreSQL fonksiyonu veya harici bir Python programı ile çıkarmak istersem bir yöntem veya diğeri tercih edilebilir mi?
Veri dosyalarını doğrudan veritabanında saklayacak olsaydım, onları diğer tüm alanları içeren tabloda değil, "ana" tabloya başvuran yabancı anahtarla ayrı bir tabloda saklamak daha mı iyi olurdu?
Burada soru ve cevapları okudum ; Buradaki bir açıklama, ikili dosyaları Linux'ta referans olarak (dosya sisteminde) depolamanın daha iyi olduğunu göstermektedir. Buradaki sorularım özellikle PostgreSQL ve çeşitli analizler için dosyalardan veri çıkarma ile ilgili.
Güncelleme: Benzer soru .