Tek bir dizinde yaklaşık 10 milyon sonuç potansiyel olarak kaydetmek için herhangi bir sorun olur mu?
Evet. Muhtemelen daha fazla neden var ama bunlar başımın üstünden gönderebilirim:
tune2fs
dir_index
bir performans isabeti görmeden önce bir dizinde kabaca 100 bin dosya depolamanızı sağlayan varsayılan olarak açık olma (Ubuntu'da) olarak adlandırılan bir seçeneğe sahiptir . Bu, düşündüğünüz 10m dosyalarına bile yakın değil.
ext
dosya sistemlerinde sabit maksimum sayıda düğüm bulunur. Her dosya ve dizin 1 inode kullanır. df -i
Bölümlerinizin ve düğümlerinizin ücretsiz bir görünümü için kullanın . Düğümleriniz bittiğinde yeni dosya veya klasör oluşturamazsınız.
joker karakterler gibi rm
ve ls
kullanırken komutlar komutu genişletir ve "argüman listesi çok uzun" olur. find
Dosyaları silmek veya listelemek için kullanmanız gerekir. Ve find
yavaş olma eğilimindedir.
Yoksa bunları klasörlere ayırmanız önerilir mi?
Evet. Kesinlikle. Temel olarak 1 dizinde 10m dosyaları bile saklayamazsınız.
Veritabanını kullanırdım. Bir web sitesi için önbellek istiyorsanız " solr " ("dağıtılmış indeksleme, çoğaltma ve yük dengeli sorgulama sağlayan") bir göz atın .