(Bu soru Felsefe SE için daha uygun gibi görünebilir. İstatistikçilerin Box ve Shmueli'nin ifadeleri hakkındaki yanlış düşüncelerimi netleştirebileceğini umuyorum, bu yüzden buraya gönderiyorum).
ARIMA şöhretinden George Box şöyle dedi:
"Tüm modeller yanlış, ancak bazıları faydalı."
Galit Shmueli "Açıklamak ya da Tahmin Etmek" adlı ünlü makalesinde şunları savunuyor (ve onunla aynı fikirde olan diğerlerine atıfta bulunuyor):
Açıklamak ve tahmin etmek aynı değildir ve bazı modellerde, öngörme konusunda zayıf bir iş yapsalar bile, iyi bir açıklama işi vardır.
Bunların ilkelere göre bir şekilde çelişkili olduğunu hissediyorum.
Bir model iyi tahmin etmiyorsa, faydalı mı?
Daha da önemlisi, eğer bir model iyi açıklıyorsa (ama iyi tahmin etmiyorsa), bir şekilde doğru (yani yanlış değil) olmalıdır. Peki bu Box'ın "tüm modeller yanlış" ile nasıl bir ağ?
Son olarak, eğer bir model iyi açıklıyor, ancak iyi tahmin etmiyorsa, nasıl bilimseldir? Çoğu bilimsel sınırlama ölçütü (doğrulama, falsificstionizm, vb ...) bilimsel bir ifadenin öngörücü güce sahip olması ya da konuşma dilinde olması gerektiği anlamına gelir: Bir teori ya da model yalnızca ampirik olarak test edilebilirse (ya da tahrif edilebilirse) doğrudur. gelecekteki sonuçları tahmin etmek zorundadır.
Sorularım:
- Box'un ifadesi ve Shmueli'nin fikirleri gerçekten çelişkili mi, yoksa bir şey mi kaçırıyorum, örneğin bir modelin tahmin gücü henüz mevcut değil mi?
- Box ve Shmueli'nin ifadeleri çelişkili değilse , bir modelin yanlış olması ve iyi tahmin etmemesi, ancak yine de açıklayıcı güce sahip olması ne anlama gelir? Başka bir deyişle: Eğer kişi hem doğruluğu hem de öngörme yeteneğini ortadan kaldırırsa, bir modelden geriye ne kalır?
Bir modelin açıklayıcı güce sahip olduğu, ancak öngörücü güce sahip olmadığı durumlarda hangi deneysel doğrulamalar mümkündür? Shmueli şu şeylerden bahseder: açıklama için AIC'yi ve tahmin için BIC'yi kullanın, vb ... ama bunun sorunu nasıl çözdüğünü göremiyorum. Öngörü modelleri ile, AIC veya BIC veya kullanabilir veya vs düzene koymayı, ... ama sonuçta dışarı örnek test ve performans üretiminde modelin kalitesini belirleyen şeydir. Ancak iyi açıklayan modeller için, herhangi bir kayıp fonksiyonunun bir modeli gerçekten nasıl değerlendirebileceğini görmüyorum. Bilim felsefesinde yetersiz belirleme kavramı vardırBurada verilen herhangi bir veri kümesi için, her zaman veriye uyacak şekilde bir miktar dağıtım (veya dağılım karışımı) ve kayıp fonksiyonu seçilebilir (ve dolayısıyla bunu açıkladığı iddia edilebilir). Ayrıca, eşik değeri modeli yeterli veri keyfidir açıklayan bir isteme birisi için altında olmalıdır (tür p-değerleri benzerlerinin neden olduğunu ve veya ?).
- Yukarıdakilere dayanarak, iyi açıklayan, ancak iyi tahmin etmeyen bir modeli nasıl objektif olarak doğrulayabiliriz, çünkü örnek dışı testler mümkün değildir?