İstatistiksel araçların uygunsuz kullanımından kaynaklanan maliyetli sonuçlara örnekler


12

İstatistiksel araç kullanıcılarının çoğunun yardımcı kullanıcılar olduğundan şüpheleniyorum (istatistik konusunda çok az resmi eğitim almış veya hiç eğitim almamış kişiler). Araştırmacıların ve diğer profesyonellerin, sadece hakemli dergilerde, gri literatürde, web'de veya bir konferansta “daha ​​önce yapıldığını” gördükleri için istatistik yöntemlerini uygulamalarına çok cazip geliyor. Bununla birlikte, gerekli varsayımları ve istatistiksel aracın sınırlamalarını net bir şekilde anlamadan bunu yapmak hatalı sonuçlara yol açabilir - hatalar genellikle onaylanmamıştır!

Lisans öğrencilerinin (özellikle sosyal ve doğa bilimlerinde) ya istatistiksel tuzaklardan habersiz olduklarını ya da bu tuzakları önemsiz bulduklarını düşünüyorum (ikincisi çoğu zaman durumdur). İstatistiksel araçların uygunsuz kullanım örnekleri birçok giriş seviyesi ders kitabında, web'de veya StackExchange'te bulunsa da, zararlı sonuçları olan gerçek dünya örneklerini bulmakta zorlanıyorum (örneğin $, maliyet, etkilenen hayatlar ve kariyer kaybı) . Bu amaçla, istatistiksel yöntemlerin kötüye kullanımını vurgulayan gerçek dünyadan örnekler arıyorum:

  1. kullanılan istatistiksel yöntemler genellikle giriş istatistikleri derslerinde (yani çıkarımsal istatistikler, gerilemeler vb.)
  2. Sonuçta oldu masraflı sonuçlar (... kariyer vb paramparça, hayatlarını etkiledi, dolar kaybetti)
  3. veri kolayca kullanılabilir bir derste örnekler çalışma olarak kullanım için (amaç gerçek dünya etkileri olmuştur gerçek dünya örnekleri ile öğrencilerin çalışmalarını sahip olmaktır.)

İstatistiksel olmayan bir örnek, bir araştırma projesinde birimleri doğru bir şekilde tanımlamanın önemini tartışırken öğrencilere yetiştirmeyi sevdiğim bir örnek, 125 milyon dolarlık bir uydunun kaybına yol açan “metrik yanlışlık” dır! Bu genellikle öğrencilerden: -o faktörünü başlatır ve kalıcı bir izlenim yaratır (en azından kısa akademik yaşamları boyunca).


2
Edward Tufte'den istatistiksel olmayan bir başka örnek olan Powerpoint, Rocket Science'ı yapıyor . Her ne kadar genel olarak istatistiksel düşünceden mantıksal ilerleme ile bahsettiğiniz metrik yanlışlıktan biraz daha yakından ilişkili olsa da. Ayrıca bu kitabın İstatistiksel Önemi Kültüne aşina mısınız?
Andy W

@AndyW, "İstatistiksel Önem Kültü" ne aşina değilim. Sorumdaki 2 / ve 3 / öğelerinin bu kitapta ele alınıp alınmadığını biliyor musunuz?
MannyG

Ben 3 hakkında bilmiyorum, ama eğer bağlantılı kitap inceleme okursanız bu soru 2 cevap (veya kitabın kalan başlığını okuyun!) Gerçekten bütün kitap referans # 2 soru hakkında olması amaçlanmıştır anlamlılık testlerini yorumlamak.
Andy W

@AndyW bahsettiğim kitap bu.
Peter Flom - Monica'yı eski durumuna döndürün

@AndyW, bağladığınız inceleme, kitabın gerçek dünyadaki istatistiklerin yanlış kullanımı örneğinden birine atıfta bulunsa da, sonuçta ortaya çıkan maliyetin ele alınıp alınmadığı açık değildir. Sonuçta ortaya çıkan maliyetler kitapta ele alınıyorsa bağımsız analizlere mi yoksa yazarın öznel görüşüne mi dayanıyorlar?
MannyG

Yanıtlar:


8

Veri kullanılabilirliğinden emin değilim, ancak kötü istatistiklerin harika bir örneği, Harvard Hemşirelerinin menopozal kadınlarda hormon replasman tedavisinin (HRT) etkinliği üzerine çalışmasıdır.

Genel fikir nedir? Hemşireler Çalışması, HRT'nin menopoz sonrası kadınlar için faydalı olduğunu ileri sürdü. Kontrol grubunun tedavi grubundan çok farklı olduğu ve bu farklılıkların analizde dikkate alınmadığı için bu sonucun ortaya çıktığı ortaya çıkmaktadır. Sonraki randomize çalışmalarda HRT, kanser, kalp krizi, inme ve kan pıhtılarıyla ilişkilendirilmiştir. Hemşirelerin çalışması uygun düzeltmelerle bu modelleri de ortaya koymaktadır.

ABD'nin HRT ile ilgili ölümleri hakkında tahmin bulamıyorum, ancak büyüklüğü onbinlerce idi. Bir makale İngiltere'deki 1000 ölümü HRT'ye bağladı.

Bu New York Times Dergisi makalesi, çalışmada mevcut olan karışıklık yaratan meselelerin iyi bir istatistiksel arka planını sunmaktadır.

Amerikan Epidemiyoloji Dergisi'nin bu sayısında akademik bir tartışma var . Makaleler, gözlemsel Hemşireler çalışmasının sonuçlarını randomize çalışmalara dayanarak Kadın Sağlığı Girişimi ile karşılaştırmaktadır.

Ayrıca Biyometri konusunda da (aynı kişilerin birçoğu tarafından) tartışma var Freedman ve Petitti'nin özellikle [ prepub versiyonu ] yorumuna bakınız .


1
Aslında bu örneğin kullanımına karşı çıkarım. 2005'ten bu yana, özellikle Miguel Hernan tarafından daha fazla çalışma yapılmıştır, bkz. Rastgele Deneyler Gibi Analiz Edilen Gözlemsel Çalışmalar: Postmenopozal Hormon Tedavisi ve Koroner Kalp Hastalığına Uygulama , Epidemiyoloji (2008). Sonuç: "Özet olarak, bulgularımız WHI ve NHS ITT tahminleri arasındaki tutarsızlıkların menopozdan bu yana geçen süre dağılımı ve takip süresi ile büyük ölçüde açıklanabileceğini göstermektedir. Tedaviye başlamanın etkisi için artık kafa karıştırıcı NHS çok az rol oynuyor gibi görünüyor. "
Fomite

Söz konusu çalışmalar hakkında ne hissettiğine bakılmaksızın, aralarındaki farklar OP'nin önerdiği ortamda muhtemelen yararlı olandan daha karmaşık ve daha karmaşıktır.
Fomite

@EpiGrad, Bu kesinlikle benim alanım değil ve bu örnek hakkında benden daha fazlasını bildiğinizden eminim. Ancak, alıntı yaptığınız kağıdın diğer kağıtların yaptığı noktayı ifade ettiğini düşünüyorum. OSALRE belgesinde, WHI çalışmasının kriterlerini karşılamayan NHS çalışmasından kadınları atıyorlar. Atılan kadınların oranı, NHS tedavisi ve kontrol gruplarına göre değişmelidir (veya sonuçlar değişmez). Böylece, NHS çalışmasında bulunan seçim problemini geri almaktadırlar. [[Devamı]]
Charlie

1
Sevdiğim makale, en azından bana, doğrudan karıştırmaktan ziyade, "Aynı soruyu sorduğunuzdan emin olun" satırında daha fazla bir şey önermektedir. Beni yanlış anlamayın, NHS / WHI sorunu istatistiksel ve halk sağlığı uygulamaları sorusu olarak son derece ilginçtir . İlk anlaşmazlığın önerdiğinden biraz daha karmaşık ve bence bu OP'nin talebinin 1. Noktası için uygun değil. 3. nokta da dışarıda.
Fomite

2
@EpiGrad, Yeterince adil. Ancak, yaygın, önemli sonuçların olduğunu anlamak için biraz kazmaya ihtiyaç duymayan göze çarpan bir istatistiksel hataya sahip bir çalışma bulacağınızdan şüpheliyim. Belki diğer katılımcılar araştırmacılardaki iyimserliğimi öldüreceklerdir (heh).
Charlie

8

Harika bir tarihsel örnek, 1933'te Horace Secrist'in İşte Sıradanlık Zaferi'nin yayınlanmasıyla sağlanmıştır . O zaman Secrist, köklü bir istatistikçiydi, bir ders kitabının yazarı (c. 1919, hatırlıyorum), Amerikan İstatistik Derneği'nde iyi bağlanmıştı ve Northwestern Üniversitesi'nde bir istatistiksel araştırma grubunun başkanıydı. O ve personeli, kitapta çoğaltılmış ve özenle analiz edilen önceki on yıllık iş verilerini derleyerek geçirmişlerdi. Hırslı bir istatistikçi tarafından bir şef d'oeuvre olması gerekiyordu .

Harold Hotelling'in o yıl içinde JASA'da ortaya çıkan kitabı incelemesi, Secrist'in ortalamaya sadece yüzlerce regresyon örneğini belgelediğine dikkat çekti (bugün herhangi bir giriş istatistik dersinde temel bir konu, sorunun 1. maddesi). Secrist yayınlanan bir cevaba itiraz etti. Hotelling'in buna cevabı bir klasik:

Pahalı ve uzun süreli sayısal bir çalışma ile böyle bir matematiksel sonucu "kanıtlamak" ... filler sıra ve sütunlar halinde düzenlenmiş ve daha sonra birçok hayvan türü için aynısını yaparak çarpım tablosunu kanıtlamaya benzer. Performans, belki de eğlenceli olsa da ve belirli bir pedagojik değere sahip olsa da, zooloji veya matematiğe önemli bir katkı değildir.

[JASA - 29 # 186, Haziran 1934, s. 199.]

Secrist, bundan kısa bir süre sonra istatistik sahnesinden hızla kaybolmuş gibi görünüyor ("kariyer bozuldu", soruda # 2 noktası). Kitabı hala mevcut. (Birkaç yıl önce Kütüphaneler Arası Ödünç yoluyla çok az okunan güzel ve temiz bir kopya elde ettim.) Ondan istediğiniz sayıda örnek veri seti çıkarabilirsiniz (sorunun 3. noktası).

Steven Stigler bu hikayeyi bir kitapta ve bir makalede anlatıyor , 1933'te istatistik tarihi .


4

Bana göre, Wired'in 2008 borsa çöküşünü ele geçirmesi bilgilendirici bir örnek olabilir. Sonuçların doğru olup olmadığı konusunda yorum yapamayız , ancak temsili bir örnek olmayan veriler üzerinde korelasyon kullanma fikri, önerdiğiniz koşullara uygun olabilecek bir şey gibi görünüyor. Aynı zamanda günceldir ve onları da ilgilendirebilir.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.