Tahmin ve tahmin arasındaki fark nedir?

46

Örneğin, geçmiş kayıp verilerim var ve aşırı miktarları (Riske Maruz Değer veya Olası Maksimum Zarar) hesaplıyorum. Elde edilen sonuçlar zararı tahmin etmek veya tahmin etmek içindir? Bir insan çizgiyi nerede çizebilir? Kafam karıştı.

estimation predictor prediction-interval

— kavun
kaynak

4

Yakından ilgili olan istatistik.stackexchange.com/questions/16493 adresindeki güven aralıkları ve tahmin aralıkları arasındaki fark ile ilgili bir tartışmadır .

— whuber

64

“Tahmin” ve “tahmin” aslında teknik olmayan yazılarda birbirinin yerine kullanılır ve benzer şekilde işlev görür gibi görünür, ancak istatistiksel bir sorunun standart modelinde bunlar arasında keskin bir ayrım vardır. Bir tahmin bir süre kullanım veri, parametre tahmin etmek belirleyicisi veri kümesi bir parçası olmayan bir rastgele değeri ile tahmin verileri kullanır. İstatistiklerde "parametre" ve "rastgele değer" in ne anlama geldiğini bilmeyenler için aşağıdakiler ayrıntılı bir açıklama sunar.

Bu standart modelde, verilerinin , dağılımının sadece belirli bir dağılımlar dizisi içerisinde yer aldığı "doğanın durumları" olarak bilinen rastgele bir değişkenin (muhtemelen çok değişkenli) bir gözlemini oluşturduğu varsayılmaktadır . Bir tahminci ( , ortalama gibi bir doğa durumunun bazı özelliklerine her bir özelliğine atanan matematiksel bir prosedürdür . Dolayısıyla bir tahmin, doğanın gerçek durumu hakkındaki bir tahmindir. Bir tahminin ne kadar iyi olduğunu söyleyebiliriz ile . $\mathbf{x}$ $X$ $t$ $\mathbf{x}$ $t(\mathbf{x})$ $\theta$ $\mu(\theta)$ $t(\mathbf{x})$ $\mu(\theta)$

Bir tahmincisi , dağılımı doğanın gerçek durumuyla ilgili olan bir başka rastgele değişken bağımsız gözlemiyle ilgilidir . Bir tahmin, başka bir rastgele değer hakkında bir tahmindir. Belirli bir tahminin ne kadar iyi olduğunu ancak tarafından gerçekleştirilen değerle karşılaştırarak söyleyebiliriz . Umarız ortalama olarak anlaşmanın iyi olacağını umarız (tüm olası sonuçların ortalamasının ortalaması ve aynı anda tüm olası değerleri üzerinden ). $p(\mathbf{x})$ $Z$ $p(\mathbf{x})$ $Z$ $\mathbf{x}$ $Z$

Sıradan en küçük kareler standart örneği verir. Veriler , bağımlı değişkenin değerlerini bağımsız değişkenin değerleriyle ilişkilendiren çiftlerden oluşur . Doğanın durumu, üç parametre , ve : her bir , ortalama ve standart sapma ile normal bir dağılımdan bağımsız bir çizim gibi olduğunu söyler . , ve , sabit ve değişmez olduğuna inanılan parametrelerdir (sayılar). İlgi odaklanır $(x_i,y_i)$ $y_i$ $x_i$ $\alpha$ $\beta$ $\sigma$ $y_i$ $\alpha + \beta x_i$ $\sigma$ $\alpha$ $\beta$ $\sigma$ $\alpha$ (kesişme) ve (eğim). En Küçük Kareler yazılı tahmin anlamında iyi olduğunu yakın olma eğilimindedir ve eğilimi yakın , hiçbir maddenin gerçek (ama bilinmeyen) değerleri neyi ve olabilir . $\beta$ $(\hat{\alpha}, \hat{\beta})$ $\hat{\alpha}$ $\alpha$ $\hat{\beta}$ $\beta$ $\alpha$ $\beta$

OLS tahmini , bağımsız değişkenin bazı değerleriyle ilişkili bağımlı değişkenin yeni bir değerinin izlenmesinden oluşur . veri setindeki arasında olabilir veya olmayabilir ; bu önemsiz. Sezgisel olarak iyi bir tahmin, bu yeni değerin yakın olması muhtemeldir . Daha iyi tahminler , yeni değerin ne kadar yakın olabileceğini söylüyor ( tahmin aralıkları olarak adlandırılır ). ve 'nın belirsiz olduğu gerçeğini açıklarlar (çünkü matematiksel olarak rasgele değerlere bağımlıdırlar) $Z = Y(x)$ $x$ $x$ $x_i$ $\hat{\alpha} + \hat{\beta}x$ $\hat{\alpha}$ $\hat{\beta}$ $(y_i)$ ), bu kesin olarak bilinmediği (ve bu nedenle tahmin edilmesi gerekir), ayrıca in standart sapma ve ortalama ( normal sapma ile normal bir dağılıma sahip olduğu varsayımı şapka bulunmadığına dikkat edin!). $\sigma$ $Y(x)$ $\sigma$ $\alpha + \beta x$

Özellikle, bu tahminin iki ayrı belirsizlik kaynağına sahip olduğuna dikkat edin : belirsizlik tahmini eğim, kesilme ve artık standart sapmada ( ) belirsizlik ; Ek olarak, sadece değerinin ne olacağı konusunda belirsizlik vardır . Bu ek belirsizlik - çünkü rastgeledir - tahminleri karakterize eder. Bir tahmin bir tahmin gibi görünebilir (sonuçta, tahminler :-) ve hatta aynı matematiksel formüle sahip olabilir ( bazen $(x_i,y_i)$ $\sigma$ $Y(x)$ $Y(x)$ $\hat{\alpha} + \hat{\beta}x$ $\alpha+\beta x$ $p(\mathbf{x})$ $t(\mathbf{x})$ ) fakat tahminden daha fazla belirsizlikle gelecek.

İşte, o zaman, OLS örneğinde, açıkça ayrım bkz: Bir tahmin , (sabit fakat bilinmeyen numaralar vardır) parametreleri de tahmin ederken tahmin rastgele miktar değerinde tahmin. Potansiyel karışıklığın kaynağı, tahminin genellikle tahmini parametreler üzerine kurduğu ve hatta bir tahminci ile aynı formüle sahip olabileceği yönündedir.

Uygulamada, tahmin edicileri öngördürücülerden iki şekilde ayırt edebilirsiniz:

Amaç : Bir tahminci, doğanın gerçek durumunun bir özelliğini bilmeye çalışırken, bir tahmin rastgele bir değişkenin sonucunu tahmin etmeye çalışır; ve
belirsizlik : Bir tahmin edici, söz konusu rasgele değişkenin sonucundaki belirsizlik nedeniyle, tahmin ediciden ilgili belirleyiciden daha büyük belirsizliğe sahiptir. Bu nedenle, iyi belgelenmiş ve tanımlanmış öngörücüler genellikle belirsizlik grupları ile birlikte gelir - tahmin aralıkları - tahmin aralıkları belirsizlik gruplarından daha geniştir, güven aralıkları olarak bilinir. Tahmin aralıklarının karakteristik bir özelliği de, veri kümesi büyüdükçe (varsayımsal olarak) küçülmeleridir; Bir tahminin kesinliğinin yeterli miktarda veri ile keyfi bir şekilde iyi olabileceği sezgisine karşılık gelen sıfıra düşer.

Bunu potansiyel yatırım kaybını değerlendirmek için uygularken, öncelikle amacı göz önünde bulundurun: belirli bir süre boyunca bu yatırımda (veya bu belirli yatırım sepetinde) gerçekte ne kadar kaybedebileceğinizi bilmek ister misiniz , yoksa gerçekten ne olduğunu tahmin ediyor musunuz? beklenen zarar (belki de büyük bir yatırım evreninde)? İlki bir tahmindir, ikincisi bir tahmindir. O zaman belirsizliği düşünün. Veri toplamak ve analizler yapmak için neredeyse sınırsız kaynaklarınız olsaydı cevabınız nasıl değişecekti? Çok kesinleşirse, büyük olasılıkla yatırımın beklenen getirisini tahmin ediyor olursunuz, oysa cevaptan oldukça emin değilseniz, bir tahminde bulunuyorsunuz.

Bu nedenle, hangi hayvanla uğraştığınızdan hala emin değilseniz, tahmininiz / tahmininizle ilgili olarak şu soruyu sorun : ne kadar yanlış olması ve neden? Her iki kriter (1) ve (2) ile neye sahip olduğunuzu bileceksiniz.

— whuber
kaynak

Çok ilginç cevap! Bize biraz referans verebilir misiniz?

— user1420303 21:15

2

@ user1420303 İşte iki tane. (1) Kiefer, İstatistiksel Çıkarımlara Giriş (1987), s. 30. ( "A tahmini sorun karar bir tahmin olduğu biridir olmayan bazı özelliği değil rastgele değişkenin bir özelliği, ..."). (2) Hahn ve Meeker, Istatistiksel Aralıkları (1991) . Örnekler ve yorumlar için bölüm 2.3'e bakınız.

F

$F$

— whuber

+1. Cevabınıza rastladım çünkü karışık modellerde BLUE ve BLUP arasındaki terminolojik farkı anlamaya çalışıyorum ve hala anladığımdan emin değilim. Karma modeli halinde , rastgele kesişir , biz tahmin ve . Sonra yapabilirsiniz tahmin . Bu farkı anlıyorum. Peki ya ? Bir BLU P ile , yani bir "kestirici" ile hesaplanırlar ; ama o görünüyor herhangi belirsizlik kaybolur, bu nedenle bu dememeliyim edilir tahmin

y = α + β x + u_{i} + ϵ

$y=\alpha+\beta x + u_i + \epsilon$

u_{i} \sim N (0, σ_{u}^{2})

$u_i \sim \mathcal N(0, \sigma^2_u)$

α, β, σ,

$\alpha, \beta, \sigma,$

σ_{u}

$\sigma_u$

y

$y$

u_{i}

$u_i$

n \to \infty

$n \to \infty$

u_{i}

$u_i$ ?

— Amip, Reinstate Monica’nın

2

@amoeba Bu durumu bir hiyerarşik model olarak anlamak faydalı olabilir: hiyerarşinin bir düzeyinde rastgeledir (bu yüzden onunla ilgili ifadeler öngörücüler olur ), daha sonraki bir düzeyde gerçekleşir ve müteakip tahmin gerçekleşmeye bağlıdır. ( tahminciler hakkında açıklama yapmak ).

u_{i}

$u_i$

— whuber

2

@whuber Belirttiğiniz en önemli nokta, tahmin edicilerin bir SLR modelindeki parametreler gibi stokastik / rasgele olmayan bir doğaya her zaman bir miktarı yaklaştırmayı amaçlamasıdır; tahmin edicilerin her zaman bir SLR modelinde yanıt değişkeni (hata terimi dahil) gibi stokastik / rasgele yapıya sahip bir miktara yaklaşmayı hedefler. Rao'nun ilk eserlerinde bu nokta vurgulanmıştır.

— Henry,

8

Tahmin her zaman bilinmeyen bir parametredir, oysa tahmin rastgele değişken içindir.

— Arif
kaynak

5

Rasgele bir değişkenin parametresini tahmin ederken rastgele bir değişkenin gerçekleşmesini tahmin edersiniz (örneğin beklenen değeri).

— Richard Hardy,

@ KovboyTrader, talebiniz hakkında yorum yapmak için çekirdek yoğunluğu tahmini hakkında yeterince bilgim yok.

— Richard Hardy,

2

Modellerde fark yoktur. Gerçekleştirilen eylemde (hafif) bir fark var. Tahmin, olasılık modelinizin verileri kullanarak (AI terminolojisinde "öğrenme") kalibrasyonu anlamına gelir. Tahmin, gelecekteki bir gözlemin “tahmini” dir. Bu “tahmin etme” nin geçmiş verilere dayandığını varsayarsak - bu bir tahmin durumu olabilir; gibi tahmini bir sonraki kişinin yüksekliğinin bir kullanarak bir araya üzeresiniz tahminini popülasyonda ortalama yüksekliğinin. Ancak, bu tahminin her zaman bir tahmin örneği olmadığını unutmayın. Bir araya gelmek üzere olduğunuz kişinin cinsiyeti, klasik anlamda nüfusun bir parametresi değildir; Cinsiyeti tahmin etmek, biraz tahmin gerektirebilir, ama biraz daha gerekecek ...

Riske maruz değer örneğinde, tahmin ve tahmin, tahmin edilen zararınızdan bu yana çakışır , zararın tahmini beklentisidir.

— JohnRos
kaynak

2

Tahmin ve tahmin arasında doğru bir ayrım yaparak iyi başlıyorsunuz, ancak daha sonra cevabın son üçte ikisi bir kez daha tahminle birlikte tahminde bulunmuyor gibi görünüyor. Cinsiyet örneğinin tanıtılması daha da kafa karıştırıcıdır, çünkü başlangıçtaki ayrımla ilgili değildir (aslında saçmadır, çünkü bunun temeli, tahmin ve tahmin aşaması arasındaki istatistiksel modelin bir kaymasıdır).

— whuber

0

Öngörü, bağımsız değişkenin bazı gözlemlenmemiş değerlerine koşullu bağımlı değişken için bir değer tahmin etmek için örnek regresyon işlevinin kullanılmasıdır.

Tahmin, bilinmeyen bir parametrenin veya popülasyonun miktarının hesaplanması işlemi veya tekniğidir.

— user82419
kaynak

3

Kısalık övgüye değer ancak burada karışıklığa yol açabilir. Tahmin, regresyon uygulamalarıyla sınırlı değildir: tahmin kadar tamamen geneldir. Ne olursa olsun, tam olarak ne demek "bağımsız değişkenin bazı gözlemlenmemiş değerlerine şartlandırılmış"? Bu sadece öngörünün veri gerektirdiğini söylemenin bir yolu mu? Eğer öyleyse, peki ya, böyle bir gereksinimi sağlamadığınız tahminler? Açıklamanız bu gibi bir ders kitabı egzersiz gibi ses yapar "kimin SD olan bir normal dağılım ortalama ne ve üst çeyrek ise ?" Tahmin verilere ihtiyaç duyuyor mu, gerektirmiyor mu?

1

$1$

2

$2$

— whuber

0

Genellikle "tahmin", parametreler için ayrılmıştır ve "tahmin", değerler içindir. Bununla birlikte, bazen ayrım bulanıklaşır, örneğin “yarının değerini tahmin etmek” yerine “yarının değerini tahmin etmek” gibi bir şey görmüş olabilirsiniz.

Riske maruz değer (VaR) ilginç bir durumdur. VaR bir parametre değildir, ancak "VaR'ı tahmin et" demiyoruz. "VaR tahmini" diyoruz. Neden?

Bu VaR'ın nedeni, dağıtımı biliyorsanız EĞER rastgele bir miktar değildir ve VaR'ı hesaplamak için dağıtımı bilmeniz gerekir . Yani eğer parametrik VaR yaklaşımını kullanıyorsanız, o zaman önce dağılım parametrelerini tahmin eder, sonra VaR'yi hesaplarsınız. Eğer parametrik olmayan modellerle yapılan kullanıyorsanız, o zaman doğrudan tahmin parametreleri tahmin ediyorum nasıl benzer VaR'yi. Bu bakımdan kuantile benzer.

Öte yandan, zarar tutarı rastgele bir değerdir. Öngörünün kayıplara istenir eğer Dolayısıyla, sen olurdu tahmin tahmin bunları değil. Yine, bazen "tahmin" kaybını söylüyoruz. Daha önce yazdığım gibi, çizgi bulanık.

— Aksakal
kaynak

VaR'nin bir parametre olmadığını söylüyorsunuz, ama bunun gerçekten böyle olup olmadığını merak ediyorum. VaR, bağımlı değişkenin dağılımının (koşullu ya da koşulsuz) niceliğidir. Bu yüzden bana dağılımın bir parametresi gibi görünüyor, ya da en azından özü değiştirmemiş gibi görünen diğer bazı temel parametrelerin bir fonksiyonu. Rasgele bir değişkenin gerçekleşmesi gibi görünmüyor.

— Richard Hardy,

Ayrıca, tahminin değerler için olduğunu söylediğinizde, rastgele değişkenlerin (aynı zamanda değerler olan) gerçekleşmesi kadar, parametrelerin değerleri için de geçerlidir. Bu nedenle, değerleri rasgele değişkenlerin gerçekleştirilmesiyle değiştirmeyi öneriyorum; o zaman hedeflediğiniz ikiliği elde edersiniz.

— Richard Hardy,

-3

Aşağıda tanımları daha açıklayıcı buluyorum:

Tahmin, bir sonucun hesaplanan tahminidir. Bu sonuç bir tahmin olabilir, ancak mutlaka değil. Mesela, dün akşam saat 5: 00'de Golden Gate Köprüsü'ndeki araba sayısının, Marin'e doğru giden üç şeridin kapasitesini aldığını, her bir aracın 30 feet uzayı aldığını ve köprünün 9000 feet uzunluğunda olduğunu varsayarak 900 olduğunu tahmin edebiliyorum. 9000/30 x 3 = 900).

Ekstrapolasyon, tahmin edilen değerin bilinenlerden bir örüntü izlediğini varsayarak, bilinen bir değer aralığı dışındaki bir değişkenin değerini tahmin eder. En basit ve en popüler ekstrapolasyon şekli, bilinen verilere dayanan doğrusal bir eğilim tahmin etmektir. Doğrusal ekstrapolasyona alternatifler arasında polinom ve konik ekstrapolasyon bulunur. Tahmin gibi, tahminde öngörme için de kullanılabilir, ancak öngörme ile sınırlı değildir.

Tahmin sadece gelecekle ilgili bir şeyler söylüyor. Tahminler genellikle bu sonuçlara giden yolu değil sonuçlara odaklanır. Örneğin, 2050 yılına kadar tüm araçların 2011'de düşük benimsemekten 2050'lerin tam benimsemesine nasıl geçtiğimizi açıklamaksızın elektrikli motorlarla çalıştırılacağını tahmin edebiliyordum.

Tahmin, bir tahmin veya tahminde bulunma sürecidir. Tahmin ve tahmin terimleri genellikle birbirinin yerine kullanılır, ancak bazen tahminler, bu tahminlerdeki öngörülerden ayırt edilir ve genellikle bir sonuca giden yolların açıklamalarını sunar. Örneğin, bir elektrikli araç kabul tahmini, 2025'ten önce az sayıda otomobilin elektrikli olduğu, 2030'da hızlı bir şekilde benimseyen bir çarpma noktasının meydana geldiği ve otomobillerin çoğunluğunun elektrikli olduğu bir S-biçimli bir modelin ardından tam elektrikli araçların benimsenmesine giden yolu içerebilir. 2040.

Tahmin, ekstrapolasyon, tahmin ve tahmin, karşılıklı olarak ayrıntılı ve toplu olarak ayrıntılı değildir. Karmaşık problemler için iyi ve uzun vadeli tahminler, genellikle makul sonuçlar elde etmek için dış değerleme dışındaki teknikleri kullanmaya ihtiyaç duyar. Tahminler ve tahminler, herhangi bir hesaplanmış tahmin olmadan da gerçekleşebilir.

bağlantıları tanımları görmek1 tanımları2

— sso
kaynak

2

Tahmin, mutlaka gelecekle ilgili olmak zorunda değildir.

— miura

Tamamen oku: Tahmin, gelecekle ilgili bir şeyler söylüyor. Tahminler, genellikle bu sonuçlara giden yola değil sonuçlara odaklanır.

— sso

Evet, ancak sonuçların gelecekte olması gerekmez. Örneğin, geçmiş bilinmeyen sonuçları da tahmin edebilirsiniz.

— miura

1

Bu, "tahmin" ve "tahmin" kelimelerinin teknik olmayan, istatistiksel olmayan bir anlamda nasıl kullanıldığının makul bir ifadesidir. @Miura'nın öne sürdüğü gibi, buradaki diğer cevaplardan, bu konuşma duyumlarının geleneksel istatistiksel olanlardan farklı olduğu açıktır. Özgün soruyu istatistiksel olmayan bir şekilde yorumlamak lehinde geçerli bir tartışma görüyorum. Bununla birlikte, bu yorumlama "tahmin" in bilinmeyen sonuçları

— whuber

Bunu, geçmiş ega minimum varyans Kalman filtresine uygularsanız ve gürültülü ölçümlerden ilgilenilen verileri kurtarmak için minimum varyans düzgünlüğü kullanılabilir. Yukarıda belirtilen teknikler, bir adım ilerideki tahmincilere dayanır ... bu yüzden, hala bir adım ilerideki tahmin (gelecek) :)

— sso