Sahte Veri Oluşturmak için Araçlar? [kapalı]


104

Test veritabanlarına yükleme amacıyla örnek veriler oluşturmak için iyi ve ücretsiz bir aracın önerilerini arıyorum. Benzer şekilde, herhangi bir RDBMS için " lorem ipsum " metni üreten bir şey . Aradığım özellikler şunları içerir:

  • Mevcut bir tablo tanımı için veri üretme esnekliği.
  • Küçük ve büyük veri kümeleri (> 1 milyon satır veya daha fazla) oluşturma yeteneği.
  • SQL komut dosyası biçiminde ( INSERTifadeleri) veya toplu içe aktarmaya uygun düz bir dosya biçiminde (genellikle daha hızlıdır) oluşturun.
  • Kolay komut dosyası oluşturma için bir komut satırı arayüzü.
  • Genişletilebilir, açık kaynak kodlu, dinamik bir dilde yazılmış (bunlar hoş şeylerdir, güçlü gereksinimler değildir).

Not: StackOverflow'da yinelenen bir soru aradım, ancak bir tane bulamadım. Eğer varsa, ona bir işaretçi bulduğum için minnettar olacağım.


Harika yanıtlar için herkese teşekkürler! Windows değil, birincil geliştirme ortamım olarak Mac OS X'i kullanmama ilişkin gereksinimlerimi değiştirmeliyim (komut satırı arayüzünün arzu edildiğini ve Windows'un pratik olarak dışlandığını söylememe rağmen ). Windows'a özgü öneriler şüphesiz bu sorunun diğer okuyucuları için faydalı olacaktır, bu yüzden teşekkürler.


İşte benim sonucum:

  • Veri Oluştur:
    • PHP web uygulaması arayüzü, komut satırı değil
    • 200 kayıt oluşturmakla sınırlıdır (veya 5.000 kayıt oluşturma lisansı için 20 ABD doları ödeyin)
  • RedGate SQL Veri Oluşturucu
    • ücretsiz değil, fiyat 295 $
    • Windows, .NET, SQL Server gerektirir
  • Visual Studio 2008 Veritabanı Sürümü
    • Windows gerektirir
    • maliyetli MSDN veya ISV aboneliği gerektirir
  • Banner Datadect
    • ücretsiz değil, fiyat 595 $
    • Windows gerektirir (?)
    • MySQL desteği yok (?)
    • GUI, komut satırı veya komut dosyası değil
  • Ruby Faker mücevher
    • toplu veri yüklemesi için ActiveRecord'u kullanmak çok yavaş
  • Süper Smack
    • temelde yerleşik bir rastgele veri oluşturucuya sahip bir yük testi aracı
    • yine de kullanımı oldukça basit
    • genel olarak iyi bir ikinci araç
  • Databene Benerator
    • ihtiyaçlarım için en iyi çözüm
    • DbUnit ile uyumlu XML betikleri
    • açık kaynak (GPL) Java kodu
    • komut satırı kullanımı
    • birçok veritabanına doğrudan JDBC aracılığıyla erişin

Bu, doğası gereği benzer ve kendi ışığında ilginç: en.wikipedia.org/wiki/Fuzz_testing
grieve

GenerateData php uygulamasıdır. İstediğiniz miktarda veri kaydı oluşturmak için kodu kırabilirsiniz. V2.x. için 3.x'in lisansı değiştirip değiştirmediğini bilmiyorum.
Han Zheng

Yanıtlar:


41

Gereksinimlerinize yakın görünen bir test verisi üreticisi olan databene benerator'a bir göz atın .

  • mevcut bir tablo tanımı için veri oluşturabilir (hatta üretim verilerini anonimleştirebilir)
  • daha büyük veri seti oluşturabilir (sınırsız boyut)
  • çeşitli girdi (CSV, Düz Dosyalar, DBUnit) ve çıktı formatlarını (CSV, Düz Dosyalar, DBUnit, XML, Excel, Komut Dosyaları) destekler
  • komut satırında veya bir maven eklentisi aracılığıyla kullanılabilir
  • açık kaynak ve özelleştirilebilir

Denerdim.

BTW, bir listesi benzer ürünlere Databene benerator web sitesinde mevcuttur.


kimse onun kullanımı ile başarılı oldu? Denedim, ancak benerator-wizard geçersiz pom.xml dosyası oluşturuyor ("Veritabanını doldur" seçeneği için). Ayrıca maven ile demolardan birine (hsqldb) gitmek de hatalara neden olur. Bana göre alet iyi durumda değil, dolayısıyla onunla zaman kaybetmeye değmez.
Peter Butkovic


6

Http: //www.mockaroo.com'u deneyin

Bu, şirketimin kendi uygulamalarımızı test etmeye yardımcı olmak için yaptığı bir araçtır. Herkesin kullanması için ücretsiz hale getirdik. Temelde, etrafına sarılmış bir web uygulaması olan Forgery yakut cevheri. CSV, txt veya SQL formatlarında veri üretebilirsiniz. Bu yardımcı olur umarım.


Bahşiş için teşekkürler, kontrol edeceğim!
Bill Karwin

5

Ücretsiz bir araç aradığınızı söylediğinizi biliyorum, ancak bu, 295 $ harcamanın size kazanılan zamanda hızlı bir şekilde geri ödeme yapacağını önerdiğim bir durum. RedGate aracı SQL Data Generator'ı geçen yıl kullanıyorum ve kısa olmak gerekirse harika bir araç. Sütunlar arasında bağımlılıkları ayarlamaya izin verir, telefon numaraları, url'ler, isimler vb. Gibi iş nesneleri için gerçekçi veriler üretir. Dürüstçe bu aracın kendi masrafını defalarca ödediğini söyleyebilirim.


Evet, yüzlerce geliştirme süresinden tasarruf etmek için 295 $ harcamaktan çekinmiyorum. Kurşun için teşekkürler!
Bill Karwin

2

MySQL'e özgü bir şey arıyorsanız veya kullanmak istiyorsanız, Super Smack'e bir göz atabilirsiniz. . Şu anda Tony Bourke tarafından sürdürülmektedir.

Super Smack, veritabanı tablolarınıza eklemek için rastgele veriler oluşturmanıza olanak tanır. Özelleştirilebilir, paketlenmiş word.dat dosyasını veya seçtiğiniz herhangi bir test verilerini kullanmanıza izin verir.

Bununla ilgili güzel şeylerden biri, komut satırının oldukça özelleştirilebilir olmasıdır. Kitapta kullanımı için bazı oldukça iyi örnekler vardır Yüksek Performanslı MySQL ayrıca edilir burada excerpted .

Bunun aradığınız şeyin çizgisinde olup olmadığından emin değilim, ama sadece bir düşünce.


Umut verici görünüyor! PostgreSQL'in yanı sıra MySQL'i de desteklediğini söylüyor. Bağlantı için teşekkürler.
Bill Karwin

2

Mevcut sahte veri oluşturuculardan birine sahip bir Ruby betiği size iyi gelecektir.

http://faker.rubyforge.org/ böyle bir cevherdir. Maalesef bu, tüm gereksinimlerinizi karşılamıyor.

İşte başka bir: http://random-data.rubyforge.org/

Ve Faker'ı kullanmak için bir eğitim: http://www.rubyandhow.com/how-to-generate-fake-names-addresses-in-ruby/


RE: Mevcut bir tablo tanımı için veri üretme esnekliği. Faker mücevherini mevcut ORM'lerden biriyle birleştirin. ActiveRecord muhtemelen en kolayıdır.


ActiveRecord arabirimi aracılığıyla her seferinde bir satır olmak üzere 1 milyondan fazla satırlık toplu yükleme yapmayı denediniz mi? Tamamlanma süresi konusunda iyimser değilim.
Bill Karwin

Ayrıca, bugün Faker mücevherini bazı Hıyar Özelliği adımlarında ve SLO W'sinde kullandım. Yani şimdiye kadarki skorum: ActiveRecord -1; Faker -1 Pek iyi yapmıyorum. :)
brendanjerwin

2

Normalde çok maliyetlidir, ancak küçük bir ISV iseniz, Visual Studio 2008 Veritabanı Sürümünü çok ucuza alabilirsiniz, güçlendirici ve bizspark'a bakın promosyonlarına bakın. Test verilerini oluşturmaktan çok daha fazla işlevsellik sağlar (SCC ile Entegrasyon, Birim Testi, DB Yeniden Düzenleme, vb.)

Red-Grate araçlarının öğrenilmesinin bu kadar kolay olması hoşuma gittiğinden, yine de SQL Data Generator'a bakardım.


Evet, RedGate'in aracıyla aynı fiyattan sipariş üzerine daha az maliyetli, ancak ek olarak bir ISV olarak nitelendirilmelisiniz ve bu, başka şeyler satın almak anlamına gelir. Yine de bağlantı için teşekkürler, hiç şüphesiz birisi için faydalı olacaktır. +1
Bill Karwin

2

Listede gerçekten eksik olmaması gereken bir araç, veritabanlarını doğrudan dolduran veya ekleme komut dosyaları oluşturan, önceden yüklenmiş geniş bir jeneratör koleksiyonuna sahip (ve birden fazla veritabanını destekleyen ...

http://www.datanamic.com/datagenerator/index.html


Önerin için teşekkürler. Sadece Windows platformu için olduğu ve 799 dolara mal olduğu unutulmamalıdır.
Bill Karwin

1

Gerçek lorem ipsum metnini aramadığınızı biliyorum; ancak başka birinin gerçek bir lorem ipsum üreteci araması ve bu konuyu bulması durumunda: lipsum.com harika bir iş çıkarır .


Bağlantı için teşekkürler, ama evet aradığım bu değildi.
Bill Karwin

Dummy Lipsum adında Firefox için bir eklenti de var, bu kullanışlı! Üzgünüm Bill'e yardım edemem :(
alex

1

Ücretsiz değil, ancak Visual Studio 2008 Veritabanı Sürümü iyi bir alternatiftir ve çok daha fazla işlevsellik sağlar (SCC ile Entegrasyon, Birim Testi, DB Yeniden Düzenleme, vb ...)


Yalnızca yıllık 5469 ABD doları olan bir MSDN aboneliği aracılığıyla kullanılabilir gibi görünüyor. Bu kadar para karşılığında, bazı üniversite öğrencilerini test verilerini oluşturmaları ve
yazmaları için tutabilirim

1

Datatect adlı bir araç kullanıyorum :

  1. Düz dosyalara veya ODBC uyumlu herhangi bir veritabanına veri üretir.
  2. VBScript ile genişletilebilir.
  3. Referans olarak farkında; yabancı anahtarları üst tablodaki değerlerle doldurur.
  4. Veriler bağlama duyarlıdır; şehir, eyalet ve verilen posta kodları için telefon numaraları, cinsiyetle birlikte adlar ve unvanlar.
  5. Özel, karmaşık veri türleri oluşturabilir.
  6. 2 milyardan fazla özel ad, işletme adı, sokak adresi, şehir, eyalet ve posta kodu oluşturun.

Bu aracı, bir SQLServer veritabanına 40.000.000 satır veri ve bir Oracle veritabanına 8.000.000 satır veri oluşturmak için kullandım.

Banner Systems'a hiçbir şekilde bağlı değilim, sadece memnun bir müşteri.


Bu umut verici bir seçenek gibi görünüyor. Bağlantı için teşekkürler. +1 Ancak, birincil platformum olarak Windows üzerinde geliştirme yapmıyorum, üzgünüm bunu sorumda belirtmedim.
Bill Karwin


1

OS X için Veri Oluşturucu var (7 ABD Doları). İndirme test amaçlı ücretsizdir. Yazılımı ve özelliklerini değerlendirmek için kullanabilirsiniz.

OS X Lion veya ardışık gerektirir. Çok sayıda farklı alan türü oluşturabilir ve özel bir dışa aktarma moduna ek olarak bazı ön ayarlara (TSV, CSV, Html tablosu, içinde tablo bulunan web sayfası) sahiptir.

http://www.tensionsoftware.com/osx/datacreator/

App Store'da:

https://itunes.apple.com/us/app/data-creator/id491686136?mt=12


1

DbSchema'yı kullanabilirsiniz, www.dbschema.com bir veritabanı yönetim aracıdır ve veritabanınızı doldurmak için bir Random Data Generator'a sahiptir.


0

Sorunuzun doğrudan cevabı değil, ancak bu belirli tür veriler için yardımcı olabilir:

Sahte Ad Oluşturucu yararlı olabilir - http://www.fakenamegenerator.com/ , kullanıcı hesapları veya bunun gibi şeyler dışında her şey için değil. AFAIK Toplu sipariş için destek sağlarlar.


Evet bir baktım ama aradığım esnekliği sunmuyor. Bağlantı için yine de teşekkürler.
Bill Karwin

0

+1 for Benerator: Sunulan diğer araçlardan (dbmonster dahil) 3 veya 4 tanesini denedim, ancak Benerator'ün çok hızlı olduğunu, gerçekçi veriler sağladığını ve esnek olduğunu gördüm. Forumda bir paylaşımda bulunduğumda aracın yaratıcısından çok hızlı ve yararlı geri bildirimler aldım.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.