Bazı ilginç ve iyi yazılmış uygulamalı istatistik makaleleri nelerdir?


28

Okumak için eğlenceli ve bilgilendirici olacak istatistik uygulamalarını tanımlayan iyi makaleler nelerdir ? Sadece açık olmak gerekirse, gerçekten yeni istatistiksel yöntemleri (örneğin, en az açılı regresyonlu bir kağıt) tanımlayan kağıtları değil, gerçek dünyadaki sorunların nasıl çözüleceğini açıklayan kağıtları aramıyorum.

Örneğin, aradığım şeye uyacak bir makale, ikinci Çapraz Onaylanmış Dergi Kulübü’nün iklim raporu . Makine öğrenim kağıtlarından ziyade daha fazla istatistik-makale makalesi arıyorum, ancak sanırım biraz bulanık bir ayrım (Netflix Ödül belgelerini biraz sınır çizgisi olarak ve duygu analizi üzerine bir makaleyi bir şey olarak sınıflandırırdım) Ben değilim değil ) arıyor.

Soruyorum çünkü gördüğüm istatistik uygulamalarının çoğu ya ders kitaplarında gördüğünüz küçük parçacıklar ya da kendi çalışmalarımla ilgili şeyler, bu yüzden biraz dallanmak istiyorum.


4
Listelemek istediğiniz genel çıkarlarınız var mı? Bu, önerileri yönlendirmeye yardımcı olabilir. İstatistik uygulamaları, oldukça geniş bir alan dizisinde oldukça yaygınlaştı.
kardinal

1
@ cardinal, hayır, belirli bir ilgi alanı yok - amaç, tipik olarak okuduğum şeylerden çıkmaktı, bu yüzden herhangi bir cevabı sınırlandırmamaya çalışıyorum. (Bu soruyu biraz daha geniş bir duruma getirir, ancak sanırım insanların kişisel "en iyi" listelerini
arıyorum

1
Klasik bir zorunluluktur-okuması gereken, özellikle tanıtılan tüm olasılık modelleri, şapkadan çıkartılmak yerine, sorun hakkında "fiziksel" sebeplerle motive edildiklerinden dolayıdır: F. Mosteller, DL Wallace (1963): Yazarlık sorununda çıkarım : Tartışmalı Federalist gazetelerin yazarlarına uygulanan karşılaştırmalı ayrımcılık yöntemleri üzerine bir çalışma , J. Am. Stat. Doç. 58 (302), sayfa 275-309. Ayrıca bu bağlantıda .
pglpm

Yanıtlar:


12

Hangi makalenin ilginizi çekebileceğini görmek benim için biraz zor, bu yüzden psiko literatürden aşağıdakileri deneyip önereyim:

Borsboom, D. (2006). Psikometristlerin saldırısı . Psikometrika , 71 , 425-440.

sahneyi giydirmek için (Neden psikolojik araştırmalarda sıkça bulunan temel hipotezleri daha iyi yansıtan istatistiksel modelleri kullanmamız gerekiyor?), ve

Borsboom, D. (2008). Teşhis sistemlerine psikometrik bakış açıları . Klinik Psikoloji Dergisi , 64 , 1089-1108.

Tanısal tıbbın uygulamalı bir perspektifi için (DSM-IV'te kullanıldığı şekliyle evet / hayır değerlendirmesinden DSM-V'ye yönelik “boyutsal” yaklaşıma geçiş). Sevdiğim biyomedikal araştırmalardaki gizli değişken modellerin daha geniş bir incelemesi:

Rabe-Hesketh, S. ve Skrondal, A. (2008). Tıbbi araştırmalar için klasik gizli değişken modelleri . Tıbbi Araştırmalarda İstatistiksel Yöntemler , 17 (1) , 5-32.


@ chl (+1) bu Borsboom gazeteleri harikaydı, ölçme konusundaki düşüncemi genişletti
richiemorrisroe

+1, Borsboom'u da seviyorum. Saldırı makalesiyle ilgilenenler için "Geçerlilik Kavramı", rhowell.ba.ttu.edu/borsboomValidity2004.pdf . Her ne kadar biraz daha ayrıntılı olsa da, Saldırı makalesi kadar kolay değil.
Andy W,

10

İşte Kraliyet İstatistik Kurumu Dergisinin son 40 yılındaki C: Uygulamalı İstatistik dergisinin , Bilgi Ağı arama sonuçlarına göz atarken dikkatimi çeken açık bir uygulaması olan beş makalesi :


9

Daha geniş bir düzeyde, Leo Breiman tarafından 2001'de ["İstatistiksel Modelleme: İki Kültür"] [1] adlı makaleyi (515 alıntı) önerirdim. Son zamanlarda günlük kulübü tarafından kapsandığını biliyorum ve gerçekten ilginç buldum. Ben soyut yapıyorum.

Özet. Verilerden çıkarımlara ulaşmak için istatistiksel modelleme kullanımında iki kültür vardır. Veriler, belirli bir stokastik veri modeli tarafından üretildiğini varsayar. Diğer algoritmik modelleri kullanır ve veri mekanizmasını bilinmeyen olarak değerlendirir. İstatistik topluluğu, neredeyse yalnızca veri modellerinin kullanılmasına adanmıştır. Bu taahhüt, alakasız teoriye, sorgulanabilir sonuçlara yol açmıştır ve istatistikçilerin çok çeşitli ilginç güncel problemler üzerinde çalışmasını engellemiştir. Hem teorik hem de pratikte algoritmik modelleme, istatistiklerin dışındaki alanlarda hızla gelişmiştir. Hem büyük karmaşık veri kümelerinde hem de küçük veri kümelerindeki veri modellemesine daha doğru ve bilgilendirici bir alternatif olarak kullanılabilir. Eğer bir alan olarak hedefimiz sorunları çözmek için veri kullanmaksa,

[1]: https://doi.org/10.1214/ss/1009213726 (açık erişim)


8

Genetik epidemiyoloji perspektifinden şimdi, genom çapında dernek çalışmaları ile ilgili aşağıdaki yazı dizilerini tavsiye ederim :

  1. Cordell, HJ ve Clayton, DG (2005). Genetik ilişkilendirme çalışmaları . Lancet 366, 1121-1131.
  2. Cantor, RM, Lange, K. ve Sinsheimer, JS (2010). GWAS sonuçlarının önceliklendirilmesi: Uygulanması için istatistiksel yöntemlerin ve önerilerin gözden geçirilmesi . Amerikan İnsan Genetiği Dergisi 86, 6-22.
  3. Ioannidis, JPA, Thomas, G., Daly, MJ (2009). Genom çapında ilişkilendirme sinyallerinin doğrulanması, artırılması ve rafine edilmesi . Nature Reviews Genetik 10, 318-329.
  4. Balding, DJ (2006). Nüfus birliği çalışmaları için istatistiksel yöntemler üzerine bir öğretici . Nature Reviews Genetik 7, 781-791.
  5. Green, AE ve diğ. (2008). Bilişsel sinirbilimde genetik veri kullanımı: artan ağrılardan gerçek içgörülere . Doğa İncelemeleri Neuroscience 9, 710-720.
  6. McCarthy, MI ve ark. (2008). Karmaşık özellikler için genom çapında ilişkilendirme çalışmaları: fikir birliği, belirsizlik ve zorluklar . Nature Reviews Genetik 9, 356-369.
  7. Psikiyatrik GWAS Konsorsiyum Koordinasyon Komitesi (2009). Genomewide Association Çalışmaları: Psikiyatrik Bozuklukların Tarihçesi, Gerekçesi ve Beklentileri . Amerikan Psikiyatri Dergisi 166 (5), 540-556.
  8. Sebastiani, P. ve ark. (2009). Genom çapında ilişkilendirme çalışmaları ve karmaşık özelliklerin genetik diseksiyonu . Amerikan Hematoloji Dergisi 84 (8), 504-15.
  9. Wellcome Trust Vaka Kontrol Konsorsiyumu (2007). Yedi yaygın hastalığın 14.000 vakasının ve 3.000 paylaşılan kontrolün genom çapında ilişki çalışması . Nature 447, 661-678.
  10. Wellcome Trust Vaka Kontrol Konsorsiyumu (2010). Sekiz ortak hastalıkta 16.000 vakada ve 3.000 paylaşılan kontrol olgusunda CNV'lerin genom çapında ilişki çalışması . Nature 464, 713-720.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.