@whuber size üç iyi cevaba işaret etti, ama belki de hala değerli bir şeyler yazabilirim. Anladığım kadarıyla, açık sorunuz:
Benim oturtulan model göz önüne y^i=m^xi+b^ (bildirim I 'şapkalar' ilave edildi) , ve benim artıklar normalde dağıtılmış varsayımıyla henüz gibi bir tahmin edebilirsiniz, gözlenmeyen yanıtı, y , n , e ağırlık bilinen bir belirleyici değeri ile x , n , e w , aralık içinde olacaktır ( y - σ e , y + σN(0,σ^2e)ynewxnew olasılıkla% 68?(y^−σe,y^+σe)
Sezgisel olarak, cevap 'evet' olmalı gibi görünüyor, ancak doğru cevap belki de olabilir . Parametreler (yani, & σ ) bilindiğinde ve hatasız olduğunda durum böyle olacaktır . Bu parametreleri tahmin ettiğinizden beri, belirsizliklerini dikkate almamız gerekir. m,b,σ
İlk önce artıklarınızın standart sapmasını düşünelim. Bu verilerinizden tahmin edildiği için, tahminde bazı hatalar olabilir. Sonuç olarak, tahmin aralığınızı oluşturmak için kullanmanız gereken dağılım normal değil olmalıdır . Bununla birlikte, t hızlı bir şekilde normale yaklaştığından, bunun pratikte bir sorun olma olasılığı daha düşüktür. tdf errort
Bu nedenle, sadece kullanabilir y yeni ± t ( 1 - α / 2 , df hata ) ler , yerine y yeni ± z ( 1 - α / 2 ) s , ve neşeli şekilde gitmek? Ne yazık ki hayır. Daha büyük sorun, tahminler nedeniyle belirsizlik bu konumdaki tepki koşullu ortalama senin tahmini hakkında belirsizlik olmasıdır m & b . Böylece,y^new±t(1−α/2, df error)sy^new±z(1−α/2)sm^b^Tahminlerinizde standart sapması sadece daha dahil etmek gerekiyor serror . Çünkü farklılıklar eklemek , tahminler tahmini varyans olacaktır:
Uyarı bu " X " sıfır belirli bir değer temsil eden subscripted gözlem ve " s 2 " nin buna uygun olarak abone olduğunu. Yani, tahmin aralığınız x boyunca yeni gözlemin yerine bağlı olarak belirlenir.
s2predictions(new)=s2error+Var(m^xnew+b^)
xs2xeksen. Tahminlerinizin standart sapması, aşağıdaki formüle göre daha uygun bir şekilde tahmin edilebilir:
gibi ilginç bir yan not, bu denklemden tahmin aralıklarla hakkında birkaç gerçekleri çıkarabiliriz. Birincisi, tahmin aralıkları biz (daha az belirsizlik var, çünkü bu öngörü modeli inşa ettiğinde biz daha fazla veri dar olacak
m&
b). İkincisi,modelinizi geliştirmek için kullandığınız
xdeğerlerininortalarında yapılırsa tahminler enkesindir, çünkü üçüncü terim için sayı
0olacaktır. Bunun nedeni, normal şartlar altında,
x'inortalama eğiminde tahmin edilen eğim konusunda bir belirsizlik olmamasıdır.
spredictions(new)=s2error(1+1N+(xnew−x¯)2∑(xi−x¯)2)−−−−−−−−−−−−−−−−−−−−−−−−√
m^b^x0x, sadece regresyon çizgisinin gerçek dikey konumu ile ilgili bazı belirsizlikler. Bu nedenle, tahmin modellerini oluşturmak için öğrenilecek bazı dersler şunlardır: daha fazla verinin, “önem” bulmakla değil, gelecekteki tahminlerin kesinliğini arttırmakla faydalı olması; ve veri toplama çabalarınızı gelecekte tahminlerde bulunmanız gereken aralığa odaklamanız gerekir (bu payı en aza indirmek için), ancak gözlemleri bu merkezden olabildiğince geniş bir şekilde yaymak (bu paydayı maksimize etmek için).
Bu şekilde doğru değeri hesapladıktan sonra , yukarıda belirtildiği gibi uygun dağılımıyla kullanabiliriz . t