«reproducible-research» etiketlenmiş sorular

Yayınlanan sonuçların başka bir yerde çoğaltılabilmesi için tam deneysel açıklamayı, toplanan verilerin tamamını ve tüm veri analizi komut dosyalarını halka açık hale getirme araştırma uygulaması.

2
“Vahşi doğada” p-hackleme hakkında ne biliyoruz?
İfade s (ayrıca: -hacking "veri tarama" , "balık" "gözetleme" ya da) yapay olarak istatistiksel olarak anlamlı hale sonuçlarında olduğu istatistiksel uygulama hataları çeşitli ifade eder. Aşağıdakiler dahil ancak bunlarla sınırlı olmamak üzere, “daha ​​önemli” bir sonuç elde etmenin birçok yolu vardır: sadece bir kalıbın bulunduğu verilerin "ilginç" bir alt kümesini …

15
R kullanarak tekrarlanabilir araştırmaların önemli örneklerini tamamlayın
Soru: R kullanarak çevrimiçi olarak serbestçe ulaşılabilen iyi bir çoğaltılabilir araştırma örneği var mı? İdeal Örnek: Özellikle, ideal örnekler şunları sağlar: Ham veriler (ve ideal olarak verileri açıklayan meta veriler), Veri alma, işleme, analiz ve çıktı oluşturma dahil tüm R kodlarını, Nihai çıktıyı nihai belgeye bağlamak için yemin ederim ya …

8
Mevcut bir değişken (ler) ile tanımlanmış bir korelasyon ile rastgele bir değişken oluşturun
Bir simülasyon çalışması için, mevcut bir değişkenine önceden tanımlanmış (popülasyon) bir korelasyon gösteren rastgele değişkenler oluşturmalıyım .YYY RPaketlere baktım copulave CDVinebelirli bir bağımlılık yapısına sahip rastgele çok değişkenli dağılımlar üretebiliyorum. Bununla birlikte, ortaya çıkan değişkenlerden birini mevcut bir değişkene sabitlemek mümkün değildir. Herhangi bir fikir ve mevcut fonksiyonlara bağlantılar takdir …

3
'Tekrarlanabilir araştırmayı' nasıl tanımlarız?
Bu şimdi birkaç soruda ortaya çıktı ve bir şey hakkında merak ediyorum. Bir bütün olarak alan, orijinal verilerin ve söz konusu kodun kullanılabilirliğine odaklanarak "tekrarlanabilirliğe" doğru yöneldi mi? Her zaman, yeniden üretilebilirliğin özünün zorunlu olduğunu söylemem gerektiği gibi, Çalıştır'ı tıklayıp aynı sonuçları elde etme kabiliyetine sahip olduğum öğretildi. Veri ve …

8
İnsanların verilere daha iyi bakmalarını nasıl sağlarım?
İşyerimde çok çeşitli disiplinlerden çalışanlar var, bu yüzden birçok farklı biçimde veri üretiyoruz. Sonuç olarak, her takım veri depolamak için kendi sistemini geliştirmiştir. Bazıları Access veya SQL veritabanlarını kullanır; bazı takımlar (korkularıma göre) neredeyse tamamen Excel çalışma sayfalarına güveniyorlar. Genellikle, veri formatları projeden projeye değişir. Bazı durumlarda 'sistem' olarak adlandırmak …

5
P-değeri esasen işe yaramaz ve kullanımı tehlikeli midir?
Bu yazıda NY Times'dan "Sürekli Olarak Güncellenme Oranı" dikkatimi çekti. Kısacası, bunu belirtir [Bayesian istatistikleri], eksik balıkçı John Aldridge'i bulmak için 2013 yılında kullanılan Sahil Güvenlik gibi aramalar da dahil olmak üzere karmaşık sorunlara yaklaşmakta özellikle yararlı olduğunu kanıtlıyor (şu ana kadar olmasa da, Malezya Havayolları Uçuş 370 avında). ......, …

6
Araştırmanın daha uzun vadeli tekrarlanabilirliğini nasıl artırabilirim (özellikle R ve Sweave kullanarak)
Bağlam: Tekrarlanabilir araştırma konusundaki daha önceki bir soruya cevaben Jake yazdı JASA arşivimizi oluştururken keşfettiğimiz bir sorun, CRAN paketlerinin sürümlerinin ve varsayılanlarının değişmesiydi. Dolayısıyla, bu arşivde kullandığımız paketlerin sürümlerini de ekliyoruz. Skeç tabanlı sistem muhtemelen millet paketlerini değiştirdikçe bozulur (Ekstra paketin içine ilave paketlerin nasıl ekleneceğinden emin değilsiniz). Sonunda, R'nin …

3
Veri analizinde en iyi uygulama hakkında bilgi edinmek için kim github'u takip edecek?
Uzmanların veri analizi kodunu incelemek yardımcı olacaktır. Son zamanlarda github perusing ve orada veri analizi kodunu paylaşan birkaç kişi var. Bu, birkaç R Paketini (elbette doğrudan CRAN'dan temin edilebilir) içerir, ancak özellikle R kullanarak birkaç tekrarlanabilir araştırma örneği de içerir ( github'daki bu R listesine bakınız ). Veri analizinde en …

2
Sentetik veri setleri oluşturmak için bazı standart uygulamalar nelerdir?
Bağlam olarak: Çok büyük bir veri kümesiyle çalışırken, bazen yordayıcılar ve yanıt değişkeni arasındaki ilişkiyi veya "yordayıcılar arasındaki ilişkileri" bildiğimiz "sentetik bir veri kümesi oluşturabilir miyiz? Yıllar boyunca, ya geçici bir şekilde hazırlanmış gibi görünen bir kerelik sentetik veri setleriyle ya da araştırmacının önerdiği modelleme yöntemi için özellikle uygun görünen …

4
Gözden geçiren kişi olarak, dergi olmasa bile, talep eden verileri ve kodun kullanılmasını haklı kılabilir miyim?
Bilim, yeniden üretilebilir olması gerektiğinden, tanım gereği, veri ve kodun veri ve kod paylaşımı için Yale Roundtable tarafından tartışıldığı gibi, yeniden üretilebilirliğin temel bir bileşeni olduğu konusunda artan bir farkındalık vardır . Veri ve kod paylaşımı gerektirmeyen bir dergi için bir makaleyi gözden geçirirken, veri ve kodun kullanılabilir olmasını isteyebilir …

1
Duygu analizi için paragraf vektörlerini kullanma konusunda bildirilen son teknoloji performans çoğaltılmış mı?
Le ve Mikolov'un " Cümle ve Belgelerin Dağıtılmış Temsilleri " başlıklı ICML 2014 belgesindeki sonuçlardan etkilendim . "Paragraf vektörleri" olarak adlandırdıkları teknik, word2vec modelinin bir uzantısına dayanarak, keyfi olarak uzun paragrafların / belgelerin denetimsiz temsillerini öğrenir. Bu makale, bu teknik kullanılarak duyarlılık analizinde en son teknolojiye sahip performansı göstermektedir. Bu …

1
Sweave ve Xtable ile renkli tablolar nasıl oluşturulur? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 2 yıl önce kapalı . Bir rapor oluşturmak için Sweave ve xtable kullanıyorum . Masaya biraz renk katmak istiyorum. Ama xtable ile renkli tablolar oluşturmak …

1
Araştırmada yüksek doğrulama doğruluğu ancak düşük test doğruluğu varsa ne olur?
Makine öğrenimi araştırmalarında doğrulama hakkında özel bir sorum var. Bildiğimiz gibi, makine öğrenme rejimi araştırmacılardan modellerini eğitim verileri üzerinde eğitmelerini, doğrulama seti ile aday modeller arasından seçim yapmalarını ve test setinde doğruluğunu bildirmelerini ister. Çok titiz bir çalışmada, test seti sadece bir kez kullanılabilir. Bununla birlikte, asla araştırma senaryosu olamaz, …

3
Herkese açık veriler için barındırma seçenekleri
Böylece tekrarlanabilir araştırma fikrini desteklemeye karar verdiniz ve verilerinizin insanların görmesi ve kullanması için çevrimiçi olarak kullanılabilir olmasını istiyorsunuz. Soru şu, nerede barındırıyorsunuz? İlk eğim elbette bir üniversite sunucusundaki özel web alanıdır, ancak bunlar aslında o kadar kalıcı değildir - ayrılırsam, dizin kaybolmadan önce çok kısa bir süre açık kalır. …

4
Güncel tartışmanın istatistiksel anlamlılığa etkileri
Geçtiğimiz birkaç yıl içinde, çeşitli araştırmacılar "araştırmacı serbestlik derecesi" olarak adlandırılan zararlı bir bilimsel hipotez testi problemi ortaya attılar; Bunlar belirsiz seçimler, örneğin, bu durumda boş sonuçlarını psikolojide bu tartışma yol açtı, vb (kağıt yayınlamak değil, bir şey gösterileri yukarı kadar sayısız model özelliklerine çalışan, sapan değer olarak kategorize edilir, …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.