Güven aralıklarının ve tahmin aralıklarının yorumlanması ile ilgili sitede birçok mükemmel tartışmayı okudum, ancak bir kavram hala biraz kafa karıştırıcı:
OLS çerçevesini düşünün ve uygun modelini aldık . Bize bir verildi ve yanıtını tahmin etmemiz istendi. değerini hesaplıyoruz ve bir bonus olarak, tahminimiz etrafında% 95 tahmin aralığı sağlıyoruz, a la Doğrusal bir modelde tahmin sınırları için bir formül elde etmek . Bu tahmin aralığına PI diyelim. x*X*T β
Şimdi, aşağıdakilerden hangisi (veya hiçbiri) PI'nin doğru yorumu değildir?
- İçin , özellikle, % 95 olasılık ile PI kaynaklanıyor olabilir. y ( x ∗ )
- Biz çok sayıda verilen ediyorsanız s, hesaplama Pl'lere bu prosedür gerçek yanıtları zamanlarının% 95'ini kapsayacaktır.
@ Gung'un Doğrusal regresyon tahmin aralığındaki ifadelerinden , birincisi doğru gibi görünüyor (çok iyi yorumlayabilmeme rağmen.) Yorum 1 bana mantıksız görünüyor (sıkça analizden Bayesian sonuçlar çıkardığımız için), ancak doğruysa eğer biz çünkü, öyle tahmin bir gerçekleşmesini rastgele değişken vs. tahmin bir parametre ?
(Düzenle) Bonus soru: Diyelim ki gerçek nedir, yani veri üreten süreç, o zaman sadece baktığımız için herhangi bir tahminle ilgili olasılıklar hakkında konuşabilir miyiz ?ϵ
Bu konuda son girişimim: (kavramsal olarak çok gevşek kullanarak) bir tahmin aralığını iki parçaya ayırabiliriz: (A) tahmin edilen ortalama yanıt etrafında bir güven aralığı ve (B) sadece kantil olan bir aralık koleksiyonu hata teriminin aralıkları. (B) gerçek öngörülen ortalamayı bilmeye bağlı olarak olasılıksal açıklamalar yapabiliriz, ancak bir bütün olarak, tahmin aralıklarını yalnızca öngörülen değerler etrafında sık CI'ler olarak ele alabiliriz. Bu biraz doğru mu?