Şüpheci (ama matematikten değil) okuyucu için çıkarım


14

İstatistiksel çıkarım ("oranları ve araçları karşılaştırma"), çevrimiçi istatistiklere giriş dersinin bir bölümünü izledim. Malzeme bana her zamanki gibi az mantıklı geldi (şimdiye kadar bu şeyleri onlarca kez görmüştüm, son otuz yılda yayılmış olmalı).

Şüpheci bir okuyucuyu ikna etme sorununu ciddiye alan "temel İstatistikler-101" (nokta tahmini, tahmin değerlendirmesi, istatistiksel çıkarım, hipotez testi, çalışma tasarımı) üzerine bir kitap arıyorum ...

Aşağıda, aradığım yazarın ciddiye alacağı ve inandırıcı bir şekilde nasıl ele alınacağını bileceği soru türüne bazı örnekler veriyorum.

Ama önce bu yazıda bu soruları sormadığımı vurgulamak için bir dakikanızı ayırın . Lütfen onlara cevap verme! Onlara örnek olarak ve "turnusol testi" ile (araştırmanın yazar türü için) veriyorum.

  1. Bir "oran" basitçe ise ortalama bir Boole değişkenin (yani yalnızca değerleri 0 ve 1 sürer bir) neden farklı prosedürler "oranlarda" ile ve "aracı" ile istatistiksel çıkarım yapmak için öğretilir?

  2. Normal dağılım o kadar sağlamsa, verilerin normal olarak dağıtılmadığı durumlarda bile normallik varsayımı iyi sonuçlar verirse ve t-dağılımı çok normal görünüyorsa, neden t-dağıtımını kullanmakla ilgili tüm yaygaralar normal?

  3. "Serbestlik derecesi" tam olarak nedir ve neden onlar için endişeleniyoruz?

  4. Sadece verilere benzer görünen dağılımları kullandığımızı düşünerek, bir parametrenin "gerçek" değerinden bahsetmek ne anlama gelir ?

  5. Nasıl "keşifsel veri analizi" iyi bir şey olurken, "veri gözetleme" kötü bir şeydir?

Söylediğim gibi, bu tür soruların ihmalinin ima ettiği tavırdan vazgeçiyorum. Bana bir şeyler öğreten birisinde görmek istediğim "epistemolojik duruş" değil. Okuyucunun şüpheciliğine ve rasyonalitesine saygı duyan ve bunlara nasıl hitap edeceğini bilen yazarlar arıyorum (formalizm ve tekniklerin sayfalarına ve sayfalarına girmeden).

Bunun uzun bir düzen olduğunu ve belki de özellikle istatistik söz konusu olduğunda farkındayım. Bu nedenle, birçok yazarın başarılı olmasını beklemiyorum. Ama şu anda sadece bir tane bulmaktan memnun olurum .

Matematikten kaçınmadığımı da ekleyeyim. Aksine, matematiği seviyorum. (Analiz [aka “ileri matematik”], doğrusal cebir, olasılık teorisi, hatta temel ölçü teorisi ile rahatım.)

Bununla birlikte, şu an ilgim "uygulamalı", "pratik", "günlük", "gerçek dünya" istatistiklerine (teorik inceliklerin aksine). (Ama ben de yemek kitabı istemiyorum!)

FWIW, Gelman ve Hill'in regresyon ve çok düzeyli / hiyerarşik modelleri kullanarak Veri analizinin ilk birkaç bölümünü okudum ve yazarların tonunu beğendim. Odaklanmaları pratiktir, ancak gerektiğinde teoriye girer. Ayrıca sık sık geri adım atıyorlar ve standart uygulamaları eleştirel olarak değerlendiriyorlar ve şüpheci bir okuyucunun ilgisini çekecek samimi görüşler sunuyorlar. Ne yazık ki, bu yazarlar bu yazıda sorduğum konuya adanmış bir kitap yazmadılar (yukarıda açıklandığı gibi "İstatistik 101" şeyler). Ayrıca bu yazarlardan birinin (Gelman) saygın Bayesci veri analizini birlikte yazdığının farkındayım , ama yine de, şu anda aradığım şey bu değil.

DÜZENLE:

Dikran Marsupial aşağıdaki itirazı artırıyor:

Soruları ihmal etmede mutlaka yanlış bir şey olduğunu düşünmüyorum, her sorunun ele alınmasının genellikle daha önemli olan temel kavramların açıklanmasından (özellikle istatistik 101 kitabında!)

Buna katılıyorum. Benim "temel istatistiklere ikinci bakış" aradığımı söylemek daha doğru olur. Aslında, bu benim motivasyonum olarak, çıkarım üzerine lisansüstü derslerde kullanılan ders kitaplarına baktım (diyelim) ve listelediklerim gibi soruları çok ihmal ettiklerini buldum . Bir şey varsa, bu tür soruları araştırmaya daha az eğilimli görünüyorlardı (böylece, bu ya da bunun yakınsama koşulları gibi konulara odaklanabilsinler ...).

Sorun şu ki, daha gelişmiş kitaplar radikal olarak farklı bir okuyucu kitlesine yöneliyor. Bu kitapta “dışarıdan gelen kuşkuculuğun” büyük ölçüde tükendiği görülüyor. IOW, lisansüstü düzeyde istatistik alan kişiler beni rahatsız eden sorulardan rahatsız olma noktasını geçmiş. Artýk bu ţeyler hakkýnda ţüpheci deđiller. (Şüphecilik kamburunu nasıl aştılar? Belki ilk başta bazıları asla çok eleştirel değildi, özellikle de istatistiklerini erkenden öğrendiysem - örneğin, kendim için özellikle kritik bir birinci sınıf öğrencisi olmadığımı biliyorum. Başkaları ders kitaplarının kısa olduğu yerleri dolduran öğretmenlere sahip olabilirler. Bazıları bu tür soruların cevaplarını kendileri için çözecek kadar zeki olabilirler. Kim bilir.)


2
Bu soruların çoğunun - cevap vermeyeceğimiz soruların - zaten CV'de iyi cevapları var. Bu soruların bazılarının oldukça önemsiz cevapları bile var. Ama herhangi bir konuyu sırasında insanlar ile gelip binlerce sorum var - asla kapakları tüm olası sorular, ne sadece bunu sadece belirli soruları beklediğini birini bulacaksınız açıklama bulmak için gidiyoruz sen sen izlerken ya okuma. Bir ya da ikisini şans eseri vurabilirsiniz, ama genel olarak bu imkansız bir standarttır. Neden sadece ortaya çıkan soruları sormuyorsunuz? Soruları cevaplayan bir sitede mi?
Glen_b

2
İnsanlar istatistik yaptıklarında (ve bazı kitaplar bunlardan bazılarına cevap verirken) benzer soruların ortaya çıktığını söyleyeceğim, ancak çoğu şüphecilikle ilgili gerçek sorular değil - çoğunlukla basit anlama soruları. örneğin "özgürlük derecesi nedir ve neden önemsiyoruz" hiç şüpheci değil, açıklama ve motivasyonun netliğini istiyor. İleri düzey istatistik kullanıcılarının bunun için endişelenmemesinin nedenleri, neden bu kadar değerli olduklarını zaten anlamalarıdır.
Glen_b

Yanıtlar:


6

Zaten bazı iyi önerileriniz var. İşte biraz daha. İlk olarak, ara sıra okuduğum ve kendinize sorduğunuz soruların bazen tartışıldığı iki blog. Blog oldukları için soru sorabilir ve çok iyi cevaplar alabilirsiniz! İşte geliyorlar:

http://andrewgelman.com/ (Andrew Gelman)

http://errorstatistics.com/ (Deborah Mayo)

Sanırım size yardımcı olacak birkaç kitap: Box, Hunter ve Hunter: Deney uzmanları için istatistikler.

Başlığın dediği gibi, bu, kendi deneylerini tasarlamak ve böylece analiz etmek isteyen insanlar için ("ilk", ama gerçekten, gerçekten ... ikinci) bir derstir. "Neden" kısmında çok yüksek.

Öyleyse: DR Cox: İstatistiksel Çıkarımın Prensipleri, "nasıl" değil "neden" hakkında bir başka çok iyi kitap.

Ayrıca, araçların ve oranların neden farklı muamele gördüğünü sorduğunuzdan, burada bunu yapmayan bir kitap var: http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = kitaplar & ie = UTF8 & qid = 1373395118 & sr = 1-1 & anahtar kelimeler = freedman + istatistikleri

Düşük matematik, yüksek prensipler.


8

Bireysel insanlar farklı şeyler hakkında şüpheci olma eğilimi gösterdiğinden ve bireyler yerine hedef kitle için kitaplar yazıldığından size uygun tek bir kitap olduğundan şüpheliyim. Bu, sadece bir kitaptan ziyade bir kişi tarafından öğretilmenin iyi şeylerinden biridir, bu da giderken soru sorabilirsiniz. Bu doğrusal bir metinde yapılması oldukça zor bir şeydir.

Soruları ihmal etmede mutlaka yanlış bir şey olduğunu düşünmüyorum, her sorunun ele alınmasının genellikle daha önemli olan temel kavramların açıklanmasından (özellikle istatistik 101 kitabında!)

En iyi yaklaşımın iyi bir kitap almak ve daha sonra başka bir yerde cevaplanmamış soruların cevabına bakmak olduğundan şüpheleniyorum. Önümde istatistik metinlerle dolu bir kitap rafım var, çünkü bunların hiçbiri tek başına izole değil çünkü ihtiyacım olan tek şey (Jaynes'in kitabı bile değil; o).

Mutlak bir başlangıç ​​için, Grant Foster'ın "İstatistikleri Anlamak" adlı kitabının başlamak için iyi bir yer olduğunu düşünüyorum, ancak bu durumda çok temel olduğundan şüpheleniyorum.


1
“Soruları ihmal etmede mutlaka yanlış bir şey olduğunu sanmıyorum ...” Bunun adil bir itiraz olduğunu düşünüyorum; Yazımı ele almak için bir EDIT ekledim.
kjo

7

XΘXΘΘXtXΘ


5
İstatistiksel prosedürlerin sorgulanabilir görünmesinin nedeninin büyük bir kısmını + 1'leri oldukça sezgisel olmaları ve istatistiklerin nasıl olduğu konusunda tarihsel bir takdir, muhtemelen şüpheci için iyi bir yaklaşımdır.
Dikran Marsupial

2
@DikranMarsupial: Aslında, Stigler'ın "İstatistiklerin tarihi" ni tam olarak istatistiklerle ilgili zorluklarımın en altına indirmek için okudum. Ve bazılarına yardımcı oldu. Ne yazık ki, Fisher - Neyman döneminin çoğunu, sapık tuhaflığın çoğunun (şüphelendiğim) ortaya çıkmasıyla ayrılıyor. Hald'ın kitabının yaklaşık 50 sayfasını denedim, ancak türevlerini takip etmenin imkansız olduğunu gördüm: önemli istatistiksel uzmanlığa sahip okuyuculara açıkça hitap ettiler ... Düşünmeye gelin, bence eğitimli laymana hitap eden ve "Neden istatistikler bu kadar tuhaf mı? " iyi satacak ... :)
kjo

4
IMHO istatistiğin sezgiselliği, Fisher vs Neyman döneminden önce gelir (sezgisellik kullanışlılık veya tersi anlamına gelmez). Ian Hacking'in kitapları denemeye değer olabilir, "Olasılığın Ortaya Çıkışı" nı sevdim. Bayesci istatistikleri kavramsal olarak anlamak için sıkça kullanılan istatistiklerden çok daha kolay, ancak uygulamada gerçekleştirilmesi çok daha zor olduğunu düşünüyorum. Bayesci ve sıklıkçı yaklaşımlar arasındaki farklılıkları anlamak, sıklıkçı yaklaşımı anlamada çok yardımcı oldu.
Dikran Marsupial

1
Teşekkürler, Hacking'e göz atacağım. Kitapları uzun zamandır gözümün önünde duruyor, ama onu olasılık teorisi felsefesi (kendi başına büyüleyici bulduğum bir konu) etrafında daha merkezli olduğunu düşünerek okumayı bıraktım. Bununla birlikte, istatistiklerle ilgili sorunlarımın en azından birkaçının olasılık yorumunu etkilediğini biliyorum, bu yüzden belki Hacking'i okumak itirazlarımın en azından bir kısmını halledecektir.
kjo

2
@kjo Hacking'in İstatistiksel Çıkarım Mantığını okudum ve çok 'felsefi' buldum - Neyman-Pearson üzerinde 'destek' olma olasılığını düşünüyordu, ancak basit örneklerle devam etti - sıkıntı parametrelerini tartışmadı, çok -parametre çıkarımı veya zor bir şey (unutmadıkça). Kesinlikle okumaya değer, ama başlamak için tavsiye etmem.
Scortchi - Eski durumuna getir Monica

6

Abelson (1995), İlkeli Argüman Olarak İstatistikler giriş niteliğindedir ve çoğu zaman öğrencileri şaşırtan bazı soruları ilginç bir şekilde ele almaktadır.

Ama belki de sadece teorik istatistiklerle ilgili bazı kitaplar okumalısınız (yakınsama, metrik uzaylar vb. İle ilgili her şeyi atlayın) ve daha sonra örnekleriniz gibi özel soruları cevaplamasalar bile, çoğu @Dikran'ın önerdiği gibi, onları kendiniz görün ve gerisini arayın.

Ben Cox & Hinkley, okuma başka bir iş parçacığı önerdi Teorik İstatistik veya Cox, İstatistiksel Çıkarım İlkeleri Casella & Berger, birlikte İstatistiksel Çıkarım bir var farklı bakış açılarının anlaşılması alır.


1
Ben ilginç buldum ama hiç OP tarafından beklenen düzeyde olduğunu sanmıyorum.
Gala

@Gael Muhtemelen haklısınız, özellikle de düzenleme açısından.
Scortchi - Eski durumuna getir Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.