Tahmin, istatistikçilerin kabiliyetini yargılamak için 'altın kriter' midir?


13

Geçen hafta Faraway'in R (1. baskı) ders kitabı doğrusal modellerini okuyordum . Faraway'in "İstatistiksel Strateji ve Model Belirsizliği" adlı bir bölümü vardı. O yapay bir çok karmaşık model kullanılarak bazı verileri oluşturduğunu (sayfa 158) açıklanan, sonra veriyi modellemek ve öğrencileri tahmin sonuçları karşılaştırmak için öğrencilerini istedi vs okuma sonuçları. Ne yazık ki, çoğu öğrenci test verilerini aşırı derecede uydurdu ve tahmin edilen değerleri tamamen işaretsiz verdi. Bu fenomeni açıklamak için bana çok etkileyici bir şey yazdı:

"Modellerin bu kadar farklı olmasının nedeni, öğrencilerin çeşitli yöntemleri farklı düzenlerde uygulamış olmalarıydı. Bazıları dönüşümden önce değişken seçimi, diğerleri ise tersini yaptı. Bazıları model değiştirildikten sonra bir yöntem tekrarladı, diğerleri yapmadı. Stratejileri aştım. Bu kullanılan öğrencilerin çeşitli ve açıkça yanlış bir şey bulamadı ne yaptığını ile. bir öğrenci hesaplamada bir hata yapmış özel hayatının değerlerini tahmin ama geri kalanında tabii ki yanlış bir şey yoktu. Bu ödev performans göstermemiştir sınavlarda bununla herhangi bir ilişki. "

Model tahmin doğruluğunun, en iyi model performansını seçmemiz için 'altın kriter' olduğu konusunda eğitildim. Yanılmıyorsam, bu aynı zamanda Kaggle yarışmalarında kullanılan popüler yöntemdir. Ancak burada Faraway, farklı bir şey gözlemledi, model tahmin performansının hiçbir şey yapamayacağınıilgili istatistikçinin yeteneği ile. Başka bir deyişle, öngörücü güç açısından en iyi modeli yapıp yapamayacağımız, gerçekten ne kadar deneyimli olduğumuzla belirlenmez. Bunun yerine büyük bir 'model belirsizliği' (kör şans?) İle belirlenir. Sorum şu: bu gerçek hayattaki veri analizinde de geçerli mi? Yoksa çok temel bir şeyle kafam karıştı mı? Bu doğruysa, o zaman gerçek veri analizinin anlamı çok büyüktür: verinin arkasındaki "gerçek modeli" bilmeden, deneyimli / deneyimsiz istatistikçilerin yaptığı çalışmalar arasında temel bir fark yoktur: her ikisi de mevcut eğitim verileri.


2
+1 güzel soru. Başka bir açı sunmak için, analistlerden birinin gerçek modu bildiğini varsayalım - o zaman onun tahminleri de kötü olabilir! Yani gerçek modeli bilerek bile bunu görürsünüz. Önemli olan, Haggerty ve Srivinasans 1991 Psychometrika'da "daha yüksek öngörücü doğruluğa sahip bir modelin" daha doğru "olduğu sonucuna varma pratiğinin geçerli bir çıkarım olmadığı" gözlemi olabilir.
Momo

1
Henüz kitaba bakmadım, ama "değişken seçimi" ve "dönüşüm" zaten uyarı çanları çalıyor. Otomatik model seçimi ve Regresyonda Bağımlı ve Bağımlı Arasındaki İlişkinin Doğası için bkz. Algoritmalar . İstatistik öğrencilerinin sınav performansını istatistikçilerin gerçek çalışma becerisiyle de karıştırmam.
Scortchi - Monica'yı eski durumuna döndürün

2
Faraway tarafından verilen bu bilgiler, istatistik alanı hakkında kapsamlı bir genel ilkenin temeli olarak kullanılmak üzere çok anekdot gibi görünüyor. Bu tür tekrarlanamayan örneklere dayalı tahmine dayalı modelleme hakkında bir model oluşturmak istemem. Aynı zamanda, isteyerek veya olmasa da kiraz toplanmış olmaları da mümkündür.
rolando2

3
Bu fıkra türünden türetilebilen mantıksal olarak geçerli bir sonuç, Faraway öğrencilerinin hiçbirinin tahmin testinde iyi performans göstermesi için gerekli becerileri (henüz) edinmemiş olmasıdır. Bu sonuç ile deneyimli istatistikçilerin nasıl performans gösterebileceği hakkındaki spekülasyonlarınız arasında herhangi bir bağlantı kurmak zordur.
whuber

@whuber: Ben öyle düşünmüyorum. 28 öğrencinin biraz küçük olduğuna katılıyorum, ancak bu gerçek gözlemin bazı ciddi sonuçları olduğunu düşünüyorum. Faraway gerçek modeli yaptıysa ve birkaç öğrencinin çalışmasına devam ederse, ciddi bir hata bulamadıysa da, tahminler olması gerekenden uzak. Daha sonra bu, 'model belirsizliği' hakkında bir şey söylüyor, en azından orijinal analistin ne kadar 'deneyimli' olursa olsun, farklılıkları karşılaştırmak için ayrı bir analistin yaptığı işe ihtiyaç duyuyor. Bunun benim için oldukça endişe verici olduğunu düşünüyorum.
Bombyx mori

Yanıtlar:


1

Bölümümdeki profesöre bunu sordum. Açıkçası bu konuda hiç şaşırmadığını söyledi. Şuna bakmak için şu yolu önerdi: Faraway'in yaptığı tek seferlik bir deneydi ve sonuçların final notlarıyla hiçbir ilişkisi olmadığı ortaya çıktı. Ancak Faraway 'denemesini' aynı grup öğrenci ile 100 kez tekrarlarsa, öğrencilerin güven aralığı gibi istatistiklerin daha iyi performans göstereceğini öğrendiğinden emindir. Onun görüşüne göre, deneyimin önemi var, sadece bir kerelik sosyal deney, model belirsizliğinden dolayı bunu gösteremedi.


Bu bahaneyi çok komik buluyorum. Bence istatistiklerin yerine "veri bilimi" getiriliyor (ya da yeniden markalanıyor). İnsanlar, üniversitelerde öğretilen istatistiklerin tahminde çok iyi olmadığını ve tahmin gücü olmayan modellerin işe yaramadığını fark etmeye başlıyor.
Flounderer

1
@Flounderer: Bunun gerçekten bir mazeret olmadığını düşünüyorum ve yazdıklarınız bu davaya gerçekten iyi bağlı olmayabilir. İlk olarak, gerçek hayatta çoğu zaman bir test seti ve bir eğitim seti vardır, Faraway'in durumundan farklı olarak sadece bir eğitim seti vardır. İkincisi, Faraway'in modeline bakarsanız, regresyon yöntemlerinin çok iyi çalışmaması için oldukça doğrusal değildir. Bu nedenle, tüm doğrusal modeller sadece vahşi tahminlerdir. Deneyin ahlakı, "üniversitelerde öğretildiği şekliyle istatistiklerin tahmininde çok iyi değil" yerine "tüm modeller yanlıştır" dır.
Bombyx mori

@Flounderer: Başka bir deyişle, ben (veya forumdaki herhangi bir kişinin) yirmi yıl önce bu garip eğitim setiyle karşı karşıya kalan Faraway öğrencisinin pozisyonunda olup olmadığına inanıyorum, sadece doğrusal modelleri kullanarak daha iyisini yapmamız pek mümkün değil. Bunun "üniversitelerde öğretildiği şekliyle istatistik" ile ilgili bir şey olduğunu düşünmüyorum.
Bombyx mori

1

Öğrencilerin modelleri neredeyse tümüyle uyguntu. N veri noktası ile, her zaman n-1 sırası mükemmel bir polinomu sığabilir. Böyle bir model gecikmiş ve hiçbir şey rastgele hataya bırakılmamıştır. Öğrencilerin benzer aşırı hata hataları yaptıkları anlaşılıyor, ancak muhtemelen farklı işlevlerle.

Aşırı sığdırma, sadece öğrenciler tarafından yapılması gereken bir hatadır. Bu da deneyim ve eğitimin modelleme için gerekli nitelikler olduğunu göstermektedir.


2
"Aşırı takma sadece öğrenciler tarafından yapılması gereken bir hatadır" dayanması oldukça yüksek bir standarttır. Modelleme zor. Belki de "Aşırı uydurma, modelcilerin deneyim ve eğitim yoluyla tanımayı ve bunlardan kaçınmayı öğrenen bir şeydir" gibi bir şey gerçeğe daha yakın olurdu?
Matthew Drury
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.