Sonuç olarak , istatistikler hakkında ne kadar çok şey öğrenirsem, o alanda yayınlanmış makalelere o kadar az güvenirim; Araştırmacıların istatistiklerini yeterince iyi yapmadıklarına inanıyorum.
Ben bir meslektenim, tabiri caizse. Biyoloji eğitimi aldım ancak istatistik ya da matematik alanında örgün bir eğitimim yok. R'den zevk alıyorum ve araştırma yaparken uyguladığım yöntemlerin bazı teorik temellerini okumak (ve anlamak…) için çaba sarfediyorum. Bugün analiz yapan insanların çoğunluğu aslında resmi olarak eğitimli değilse, beni şaşırtmaz. Bazıları tanınmış dergiler ve istatistikçiler tarafından kabul edilen yaklaşık 20 orijinal makale yayınladım. Analizlerim genel olarak hayatta kalma analizi, doğrusal regresyon, lojistik regresyon, karışık modeller içerir. Bir daha önce hiç bir gözden geçiren model varsayımları, uygunluk veya değerlendirme hakkında bir soru sormadı.
Bu nedenle, model varsayımları, uyum ve değerlendirme konusunda hiçbir zaman çok fazla sıkıntı yaşamadım. Bir hipotez ile başlıyorum, regresyonu yürütüyorum ve sonra sonuçları sunuyorum. Bazı durumlarda, bunları değerlendirmek için çaba sarf ettim ama her zaman " bütün varsayımları yerine getirmedi, ama sonuçlara güveniyorum (" konu bilgisi ") ve akla yatkın, bu yüzden sorun değil " ve Bir istatistikçiye danışırken her zaman aynı fikirde görünüyorlardı.
Şimdi, kendi analizlerini yapan diğer istatistikçiler ve istatistikçi olmayan kişilerle (kimyagerler, doktorlar ve biyologlar) konuştum; İnsanların bütün bu varsayımlar ve resmi değerlendirmelerden pek fazla rahatsız etmediği görülüyor. Fakat burada CV'de, artıklar, model uyumu, değerlendirme yolları, özdeğerler, vektörler ve liste devam ediyor. Bana bu şekilde koyalım, lme4 büyük özdeğerler hakkında uyardığında, kullanıcılarının çoğunun bunu ele almakla ilgilendiğinden şüpheliyim ...
Ekstra çabaya değer mi? Yayınlanan tüm sonuçların çoğunluğunun bu varsayımlara saygı göstermemesi ve belki de onları değerlendirmemiş olması muhtemel değil mi? Veritabanları her geçen gün daha da büyüdüğü için bu büyük olasılıkla büyüyen bir konudur ve veriler ne kadar büyük, varsayımlar ve değerlendirmeler o kadar az önemlidir.
Kesinlikle yanılıyor olabilirim, ama bunu böyle algıladım.
Güncelleme: StasK'dan ödünç alınan alıntı (aşağıda): http://www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15509