Test verilerinin büyük veri kümelerini üretme aracı [kapalı]


25

Etkili bir veritabanı tasarımı oluşturmaya çalışırken çoğu zaman en iyi eylem yolu, iki örnek veritabanı oluşturmak, bunları veriyle doldurmak ve hangisinin daha iyi performans gösterdiğini görmek için bunlara karşı bazı sorgular çalıştırmaktır.

Oldukça hızlı bir şekilde büyük (~ 10.000 kayıt) test verisi kümesini üretecek (ideal olarak veritabanına ideal) bir araç var mı? En azından MySQL ile çalışan bir şey arıyorum.

Yanıtlar:


12

En iyi araç (bulabilirseniz) DataFactory'dir. (Ne yazık ki baskı dışında). Ondan kesinlikle keyifli (ve oldukça özgün görünümlü) veri setleri oluşturdum.

Generatedata.com ... kabul edilebilir, ancak çok iyi ölçeklenemiyor.

DataGenerator , göz kulak olmanız gereken bir şey.

Ederken DTM Veri Jeneratör aksak ve DataFactory için kötü bir yerine, onun var ve satılmakta olan ve ben hafif kabul edilebilir verileri oluşturmak için kullandım.



4

Genellikle girdi olarak bilinen bazı verileri kullanarak, kendi oluşturmak - bu eğer çok rastgele, her zaman iyi bir test değil; Son ürünüme benzer şekilde dağıtılacak verilere ihtiyacım var.

Ayarlamam gereken daha büyük veritabanlarının tümü doğada bilimseldir - bu nedenle genellikle girdi olarak başka bir araştırma yapabilir, ölçeklendirebilir ve titreme ekleyebilirim. (örneğin, milisaniye hassasiyetli 5 dakikalık bir kadansta olan veriyi almak ve bunu milisaniye hassasiyetli 10 saniyelik kadansa çevirmek fakat zamana göre +/- 100 ms'lik bir titremeye çevirmek)

...

Ancak, başka bir alternatif olarak, kendiniz yazmak istemiyorsanız, bazı kıyaslama araçlarına bakmaktır - şeyleri bir eğitim setine dayanarak tekrar tekrar tekrar edebildikleri için, lotları eklemek için bunları kullanabilirsiniz. Kayıtların listesi (ve yalnızca ne kadar hızlı yaptığının raporlarını yok sayın) ... ve ardından aynı aracı, bir kez doldurulduktan sonra veritabanının ne kadar hızlı performans gösterdiğini sınamak için kullanabilirsiniz.


3

MySQL kullanıyorum. Kendisinden sonra da temizlenir.

İşte kullanmaya başladığımda okuduğum makale .




1

En uygun maliyetli yol muhtemelen açık kaynak kodlu veya ticari veri üreteci kullanmaktır. Eskiden yapardım.

Şimdi, altın yıllarımda, test verilerinin her birinin başka bir betik dili öğrenmek için zorunlu olduğunu düşünüyorum.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.