Gerçek veri setlerinden küçük parçacıklar kullanan daha küçük birim testlerim var. Programımı birçok nedenden ötürü tam veri kümelerine karşı test etmek istiyorum. Tek sorun, tek bir gerçek veri kümesinin yaklaşık ~ 5GB olmasıdır. Git depolarının depolayabileceği şeyler için sabit sayılar bulamadım ama bu çok fazla gözüküyor.
Bu Programcılar yazısına göre, projeyi depoda test etmek için gereken tüm verilerimi saklamalıyım.
Ekibimin benimsediği çözüm, projenin test verilerimizi tutan ağa bağlı bir dosya sistemine giden yolu içeren bir dosyaya sahip olmasıdır. Dosya Git yoksayılır.
Bunun iki nedenden dolayı kusurlu bir çözüm olduğunu hissediyorum. NAS çalışmadığında, yavaşsa veya tam test yapamayacağımızdan daha düşük olduğunda. İkinci neden, birisi bir havuzu ilk kez klonladığında, birim testleri başarısız olur, bu nedenle belirli bir ada sahip şeylerin nasıl bağlanacağını ve test yolu dosyasını oluşturmak için kullanılan sözdizimini bulmaları gerekir.
Benim sorum iki kat. Revizyon kontrolünde saklanacak veri miktarı ne kadar?
Büyük miktarda test verisini işlemenin daha iyi bir yolu nedir?