İstatistiklerdeki teknik olmayan ama derin makaleler için öneriler


24

Bu sorunun ilham kaynağı, Leo-Breiman'ın çok bilinen bir makalesi olan İstatistiksel Modelleme: İki Kültür (açık erişim). Yazar, klasik istatistik ve makine öğrenimindeki ana fikirlere değinen, verileri analiz etmek için iki farklı yaklaşım olarak gördüğü şeyi karşılaştırır. Bununla birlikte, makale geniş bir izleyici kitlesine açıktır - tartışmalı bir şekilde, doktora düzeyinde istatistik izlemiş olup olmadıklarına veya yalnızca tanıtım dersi aldıklarına bakılmaksızın, verilerle çalışan herkes için. Dahası, makale uyarıcıdır . Diğer bir deyişle, kolayca tartışma üretir (aynı sayıda yayınlanan yorumların bir dizisinde gösterildiği gibi).

Bu niteliklerle daha fazla makale keşfetmeyi merak ediyorum. Yani, makaleler:

  • İstatistik / veri analizinde temel kavramlara dokunun
  • Araştırma odaklı ve resmi istatistik eğitimindeki değişkenlik açısından geniş bir izleyici kitlesi tarafından anlaşılabilir.
  • İçgörü veya tartışma yoluyla olsun, tartışmayı teşvik edin

2
Şimdiye kadar cevaplar çok ilginçti! Bırak gelsinler. Tabii ki, meta.stats.stackexchange.com/questions/409/…
Richard Border

2
İstatistiklere göre Royal Road yok .
Aksakal

Yanıtlar:


15

Shmueli, Galit. "Açıklamak mı yoksa tahmin etmek mi?" İstatistiksel bilim (2010): 289-310.

Üç kurşun puanınla uyuştuğuna inanıyorum.

Tahmine dayalı modellemeye karşı açıklayıcı modelden (terimler kendi kendini açıklamalı olmalıdır) bahseder ve aralarındaki farkların çoğunlukla tanınmadığını not eder.

Modellemenin amacına bağlı olarak (açıklayıcı ve öngörücü), farklı model oluşturma stratejilerinin kullanılabileceği ve farklı modellerin "en iyi" model olarak seçilebileceği noktasını ortaya koymaktadır.

Oldukça kapsamlı bir makale ve keyifli bir okuma. Bir tartışma Rob J. Hyndman'ın blog yazısında özetlenmiştir . Validated Cross ile ilgili bir tartışma bu konu başlığında (çok fazla oy ile). Aynı konuyla ilgili bir başka (cevapsız) sorudur bu .


12

Lehmann, Erich L. "Fisher, Neyman-Pearson hipotezlerini test etme teorileri: Bir teori mi, iki mi?" Amerikan İstatistik Kurumu Dergisi 88.424 (1993): 1242-1249.

Birçok kişi tarafından bilinmemektedir, ancak mesleğin devleri hala aramızdayken, birbirleriyle iyi geçinemediler. Özellikle hipotez testinin temelleri üzerine, endüktif mi yoksa tümdengelimli mi olması gerektiği konusundaki tartışma, bir yandan Fisher ve bir yandan Neyman-Pearson arasında dolaşan oldukça ciddi hakaretler gördü. Ve sorun yaşamları boyunca hiçbir zaman çözülmedi.

Hepsi geçtikten çok sonra, Lehmann boşluğu kapatmaya çalışıyor ve bence yaklaşımların birbirini dışlamaktan ziyade tamamlayıcı olduğunu gösterdiği için iyi bir iş çıkarıyor. Bu, bugünlerde öğrencilerin öğrendiği şey. Hipotez testi hakkında birkaç temel şey bilmeniz gerekir, ancak makaleyi herhangi bir sorun olmadan takip edebilirsiniz.


1
Alıntı için teşekkürler. Bir keresinde yaklaşımlar F ve NP arasında olduğu iddia edilen çatışma hakkında bir soru sordum: stats.stackexchange.com/questions/112769 dikkat bir sürü rağmen ve ve ben hala mevcut cevapları herhangi biri tarafından ikna değilim alınan upvotes (ve vermedi herhangi birini kabul et). O konuya geri dönmeyi ve biraz okuma / ödül ya da bir şeyler koymayı planlıyorum ama asla zaman bulamıyorum; Lehmann'ın makalesine aşina iseniz, sizi orada bir cevap vermeye teşvik ediyorum.
amip diyor Reinstate Monica

@amoeba Lehmann'ın makalesini tekrar tekrar okudum, çok okunaklı, ancak konuyu sizin kadar ayrıntılı araştırdığımı sanmıyorum. Bu yüzden vaktiniz olduğunda, onun üzerinden geçmek ve onun bakış açısını görmek iyi bir fikir olacaktır. Behrens-Fisher probleminin tartışmasını özellikle açığa vuracaksınız.
JohnK

Paylaşım için teşekkürler. Belki duyduğum her şey tek taraflıdır, ama Sir Ron Fisher hakkında duyduğum her şey, en azından söyleyeceği şeyle başa çıkmak için hoş olmayan bir adamdı. Ayrıca tütün kullanımı ve akciğer kanseri arasındaki bağlantı hakkında da bazı şüpheli görüşleri vardı .
Phil

Makaleye "hafif" bir alternatif, Christensen, Ronald. "Fisher, Neyman, Pearson ve Bayes'i test etmek." Amerikan İstatistiği 59.2 (2005): 121-126. Keyifli buldum.
Richard Hardy

9

Wilk, MB ve Gnanadesikan, R. 1968. Verilerin analizi için olasılık çizme yöntemleri. Biometrika 55: 1-17. Erişiminiz varsa Jstor bağlantısı

Bu yazı, benim yazdığım sırada, neredeyse 50 yaşında ama yine de taze ve yenilikçi. Zengin bir ilginç ve önemli örnekler çeşitliliği kullanan yazarlar, QQ (kuantil-kuantil) ve PP (olasılık-olasılık) grafiklerini kullanarak dağılımları çizmek ve karşılaştırmak için çeşitli fikirleri birleştiriyor ve genişletiyor. Buradaki dağılımlar genel olarak analizlerinde ortaya çıkan herhangi bir veri kümesini veya sayıları (artıklar, kontrastlar vb.) Belirtir.

Bu parsellerin belirli sürümleri birkaç on yıl öncesine, en açık olan normal olasılık veya normal skor parsellerine dayanır. bu terimlerle kuantil kuantil parseller, yani normal (Gaussian) bir dağılımdan aynı büyüklükteki bir numuneden beklenen veya teorik kuantillere karşı gözlenen kuantillerin grafikleridir. Ancak yazarlar, mütevazı ancak güvenli bir şekilde, aynı fikirlerin kolayca ve pratikte modern bilgisayarla genişletilebileceğini, başka türden materyalleri incelemek ve sonuçları otomatik olarak çizmek için kullandıklarını göstermektedir.

Her ikisi de Bell Telephone Laboratories'deki yazarlar, en yeni bilgisayar tesislerinden yararlandılar ve birçok üniversite ve araştırma kurumu bile on yıl kadar yetti. Şimdi bile, bu makaledeki fikirler aldıklarından daha geniş bir uygulamayı hak ediyor. Normal QQ arsa dışında bu fikirlerin herhangi birini içeren nadir bir tanıtım metni veya ders. Histogramlar ve kutu çizimleri (her biri genellikle oldukça faydalıdır, ancak yine de her biri garip ve birkaç şekilde sınırlıdır), dağıtım grafikleri tanıtıldığında ana zımba olmaya devam eder.

Kişisel düzeyde, bu yazının ana fikirleri kariyerimin çoğunda aşina olsa da, birkaç yılda bir tekrar okumaktan zevk alıyorum. İyi bir sebep, yazarların ciddi örneklerle iyi etki yapması için basit ama güçlü fikirler üretme şeklindeki hazdır. Bir başka iyi sebep de, en ufak bir bomba izi olmadan, kesin olarak yazılmış olan kağıdın, ana fikirlerin uzantılarını ima ettiği yoludur. Bir kereden fazla, açıkça yan ipuçlarında ve daha fazla yorumda ele alınan temel fikirler üzerinde bükülmeleri yeniden keşfettim.

Bu, özellikle istatistiksel grafiklerle ilgilenenler için bir bildiri değil, aklıma gelen her türlü istatistiklerle ilgilenen herkesi içermelidir. Herkesin istatistiksel becerilerini ve içgörülerini geliştirmede pratik olarak faydalı olan dağılımlar hakkında düşünme yollarını teşvik eder.


2
Bu harika bir seçim. Bunu birkaç kez okudum - yazarın cevabında yazarların isimlerini görür görmez bunun hangi kağıt olduğunu anladım ve hemen tekrar okumak istedim. Sanırım burada bir yerde bir kopyası var ...
Glen_b -Reinstate Monica

6

Ioannidis, John PA "Neden En Yaygın Araştırma Bulguları Yanlış?" PLoS Tıp (2005)

Ioannidis, John PA "Daha Fazla Yayınlanmış Araştırma Nasıl Gerçekleştirilir?" PLoS Tıp (2014)

Araştırmada istatistikleri yanlış kullanma ve yorumlamanın tehlikelerinden kaçınmak isteyen her araştırmacı / istatistikçi / analist için okumalısınız. 2005 tarihli makale, Bilim Halk Kütüphanesi tarihinde en çok erişilen ve birçok tartışma ve tartışmayı teşvik etti.


6

Tukey JW (1960) kararlar vs Sonuçlar Technometrics 2 (4): 423-433

Bu makale, Tukey’in akşam yemeğinden sonraki konuşmasına dayanıyor ve “önemli tartışmaların gerçekleştiği” yorumu yapıldı.

Bu dokümanı mühendislik alanında doktora yaparken okudum ve veri analizinin uygulanabilirliklerini keşfetmesini takdir ediyorum.


Bağlantı çalışmıyor. Bu işleri
kjetil b halvorsen

5

Efron ve Morris, 1977, İstatistikte Stein'in Paradoksu .

Efron ve Morris 1970'lerde James-Stein tahmincisi hakkında Stein'in Empirical Bayes bağlamında "paradoksunu" çerçeveleyen bir dizi teknik makale yazdı. 1977 makalesi Scientific American’ta yayınlanan popüler bir kitaptır .

Bu bir olan büyük bir okuma.


3

Roy Model'e duyulan ilginin ekonomistler arasında olmasına rağmen (ancak ben hatalı olabilirim), 1951'den itibaren "Kazanç Dağılımı Üzerine Bazı Düşünceler" başlıklı özgün makalesi , kişisel seçim sorunuyla ilgili anlayışlı ve teknik olmayan bir tartışma. Bu makale, nobel ödüllü James Heckman tarafından geliştirilen seçme modelleri için ilham kaynağı oldu. Her ne kadar eski olsa da, üç kurşun noktanıza uyduğunu düşünüyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.