Herkese açık veriler için barındırma seçenekleri


12

Böylece tekrarlanabilir araştırma fikrini desteklemeye karar verdiniz ve verilerinizin insanların görmesi ve kullanması için çevrimiçi olarak kullanılabilir olmasını istiyorsunuz. Soru şu, nerede barındırıyorsunuz?

İlk eğim elbette bir üniversite sunucusundaki özel web alanıdır, ancak bunlar aslında o kadar kalıcı değildir - ayrılırsam, dizin kaybolmadan önce çok kısa bir süre açık kalır. Gelecekte insanların kullanması ve birlikte çalışması için verileri kullanılabilir tutmak için neredeyse doğru ayar yoktur.

GitHub veya SourceForge gibi bir şey kullanıyor musunuz? Yoksa başka bir hizmet mi?

Söz konusu veriler, çok dar ilgi gösteren bazı simülasyonların çıktısıdır - bu yüzden mutlaka InfoChimps veya halka açık veri havuzlarından biri gibi bir yer olduğunu düşünmüyorum. Bu daha az "Bu kodla bir şeyler öğrenebilirsiniz!" ve daha fazlası "Bu makalede Şekil 3'ü çoğaltabilirsiniz".



1
Kesinlikle alakalı - neden bir kopya olduğunu düşünmediğimi gösteren bazı ayrıntılar eklemek.
Fomite

@EpiGrad: Aklınızda ne tür bir tarih var? Araştırma projenizle ilgili bir kaynak kodu ise, arXiv ön baskınıza ekleyebilirsiniz .
Piotr Migdal

@PiotrMigdal İdeal olarak, verilerin birkaç yıl boyunca, normal kağıt alıntı yayılımı vb. İçin yeterince uzun süre takılabilmesini istiyorum. Sadece alanım kullansaydı bir arXiv ön baskısına
eklerdim

@EpiGrad O zaman aramak için belki de iyi bir yer Açık Bilim'in bir yönü olarak Açık Verilerdir - michaelnielsen.org/blog/open-science .
Piotr Migdal

Yanıtlar:


4

Basit bir seçenek github .

Veri ve veri analiz kodunu paylaşmak için biraz kullanıyorum . Sitede kod ve veri paylaşan diğer birkaç iyi örnek bu soruda listelenmiştir .

Github'un Faydaları

  • Git'i tanıdıktan sonra yüklemek kolaydır ve neden sürüm kontrolü ihtiyaçlarınız için git'i kullanmıyorsunuz?
  • Basit tek dosyalar için gist kullanabilirsiniz
  • Başkalarının tek veya birden fazla dosyayı arşiv olarak indirmesi kolaydır
  • İyi miktarda ücretsiz depolama alanına sahiptir
  • kaynak kodu internette gezilebilir
  • ve dahası...

Elbette, github veri için mükemmel değildir. Daha kalıcı bir kurumsal depo veya daha ciddi arşivleme için başka bir özel araç kullanmanın yararlarını görebiliyorum.


1
Aslında bu benim gittiğim çözüm. Kurumsal bir depodaki sorunun bir kısmı, içinde bulunduğum kurumun akış halinde olması ve verilerin büyük veri ambarlarından biri için gerçekten yeterince önemli olmamasıdır.
Fomite

4

Başka bir seçenek , hizmet ve açık kaynak yazılım olarak kullanılabilen Dataverse gibi görünüyor . Yine de denemedim.


2

Akademe olanlar için bir olasılık, genellikle kampüs kütüphaneleri tarafından barındırılan bir kampüs dijital havuzunun kullanılmasıdır (bana yayınlara eşlik eden veri kümeleri için mantıklı bir konum).

Popüler (ücretsiz) bir dijital veri havuzu, benim görüşüme göre veri kümelerini barındırabilen DSpace . Ancak bu, kurumunuzdaki bir kişinin barındırması gereken bir hizmettir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.