Üstel modelin tahmini


10

Üstel model, aşağıdaki denklemle açıklanan bir modeldir:

yi^=β0eβ1x1i++βkxki

Bu modeli tahmin etmek için kullanılan en yaygın yaklaşım, her iki tarafın logaritmalarını hesaplayarak kolayca yapılabilen doğrusallaştırmadır. Diğer yaklaşımlar nelerdir? Özellikle bazı gözlemlerde başa ilgileniyorum .yi=0

31.01.2011 Güncellemesi
Bu modelin sıfır üretemediğinin farkındayım. Modellediğim şeyi ve bu modeli neden seçtiğimi biraz ayrıntılandıracağım. Diyelim ki bir müşteri bir mağazada ne kadar para harcadığını tahmin etmek istiyoruz. Tabii ki birçok müşteri sadece bakıyor ve hiçbir şey satın almıyorlar, bu yüzden 0 var. Doğrusal modeli kullanmak istemedim çünkü çok fazla negatif değer üretiyor, bu da mantıklı değil. Diğer neden ise bu modelin gerçekten iyi, doğrusaldan çok daha iyi çalışmasıdır. Bu parametreleri tahmin etmek için genetik algoritma kullandım, bu yüzden 'bilimsel' bir yaklaşım değildi. Şimdi daha bilimsel yöntemler kullanarak problemle nasıl başa çıkılacağını bilmek istiyorum. Ayrıca, değişkenlerin çoğunun, hatta hepsinin ikili değişkenler olduğu varsayılabilir.


1
verilerinizde sıfır varsa, üstel regresyon uygun olmayabilir, çünkü belirttiğiniz model sıfır değerlerin gözlemlenmesine izin veremez.
mpiktas

Yanıtlar:


11

Burada birkaç sorun var.

(1) Modelin açıkça olasılıklı olması gerekir . Neredeyse her durumda olacak hiçbir lhs tüm verileriniz için rhs maçları hangi parametrelerin set: artıklar olacaktır. Bu artıklar hakkında varsayımlar yapmanız gerekiyor. Ortalama olarak sıfır olmalarını mı bekliyorsunuz? Simetrik olarak dağıtılacak mı? Yaklaşık olarak normal dağıtılacak mı?

Aşağıda belirtilen model ile aynı fikirde olan ancak büyük ölçüde farklı kalıntı davranışlara izin veren iki model bulunmaktadır (ve bu nedenle genellikle farklı parametre tahminleriyle sonuçlanacaktır). Bu modelleri nin ortak dağılımı hakkındaki varsayımları değiştirerek değiştirebilirsiniz :ϵi

B: y i = β 0 exp ( β 1 x 1 i + + β k x k i ) + ϵ i .

A: yi=β0exp(β1x1i++βkxki+ϵi)
B: yi=β0exp(β1x1i++βkxki)+ϵi.

(Bunların verileri için modeller olduğunu ; genellikle tahmini veri değeri diye bir şey yoktur .)^ y iyiyi^

(2) y değerleri için sıfır değerlerinin ele alınması ihtiyacı , belirtilen model (A) 'nın hem yanlış hem de yetersiz olduğunu ima eder , çünkü rastgele hatanın değeri ne olursa olsun sıfır değeri üretemez. (B) 'nin üzerindeki ikinci model, y'lerin sıfır (hatta negatif) değerlerine izin verir. Ancak, sadece böyle bir temelde bir model seçilmemelidir. 1'i tekrarlamak için: hataları makul bir şekilde modellemek önemlidir.

(3) Doğrusallaştırma modeli değiştirir . Tipik olarak, (A) gibi, ancak (B) gibi olmayan modellerle sonuçlanır. Bu değişikliğin parametre tahminlerini önemli ölçüde etkilemeyeceğini bilmek için verilerini analiz eden kişiler ve neler olduğunu bilmeyen kişiler tarafından kullanılır. (Farkı söylemek birçok kez zordur.)

(4) Sıfır değerinin olasılığını ele almanın yaygın bir yolu , (ya da karekök gibi bir miktar yeniden ifadesinin) kesinlikle pozitif olarak eşit sıfır şansına sahip olmasını önermektir . Matematiksel olarak, bir nokta kütlesini (bir "delta fonksiyonu") başka bir dağılımla karıştırıyoruz. Bu modeller şöyle görünür:y

f(yi)F(θ);θj=βj0+βj1x1i++βjkxki

burada , vektöründe örtük parametrelerden biridir , , parametrelendirilmiş bazı dağıtım ailesidir tarafından ve yeniden ekspresyonuna olan (: giderebilirsiniz yanıtını bakın genelleştirilmiş lineer modelin 'bağlantı' fonksiyonu) 'in. (Tabi ki, daha sonra, = zaman ). Örnekler sıfır şişirilmiş Poisson ve Negatif Binom modelleri .PrFθ[f(Y)=0]=θj+1>0θFθ1,,θjfyPrFθ[f(Y)t](1θj+1)Fθ(t)t0

(5) Bir model oluşturma ve uydurma konuları birbiriyle ilişkilidir ancak farklıdır . Basit bir örnek olarak, sıradan bir regresyon modeli bile en az kareler (Maksimum Olabilirlik ve neredeyse aynı standart hatalarla aynı parametre tahminlerini veren) birçok yönden sığabilir, iteratif en küçük kareler yeniden ağırlıklandırmalı , çeşitli diğer formları " sağlam azından kareler " vb uydurma seçimi genellikle rahatlık çıkar dayanmaktadır ( örn , yazılımın kullanılabilirliği), aşinalık, alışkanlık veya kongre, fakat en azından bazı düşünce olmalıdır hata terimlerinin varsayılan dağılımı için neyin uygun olduğuna,ϵ iY=β0+β1X+ϵϵisorun için kayıp fonksiyonu makul olabilir ve ek bilgilerden yararlanma olasılığı ( parametreler için önceki dağıtım gibi ) olabilir.


10

Bu, günlük bağlantısı işlevine sahip genelleştirilmiş doğrusal bir modeldir (GLM) .

Sıfıra sıfır olmayan yoğunluk üzerinde herhangi bir olasılık dağılımı bazı gözlemlerde başa ; en yaygın olanı Poisson dağılımı, Poisson regresyonu , yani log-lineer modelleme. Başka bir seçenek negatif bir binom dağılımı olacaktır .y i = 0[0,)yi=0

Sayım verileriniz yoksa veya tamsayı olmayan değerler , için tam bir dağılım belirtmeden genelleştirilmiş doğrusal modeller çerçevesini kullanmaya devam edebilirsiniz, bunun yerine sadece yarı olasılıkla ortalama ve varyans arasındaki ilişkiyi belirtmek . P ( y i | x )yiP(yi|x)


Utanç Üniversitede bu konuda öğretildim: / Görünüşe göre bu durumda yardımcı olacak, ama ayrıntılara inmek için biraz zamana ihtiyacım var. Teşekkürler!
Tomek Tarczynski

değerinin rasyonel olduğunda her zaman tamsayı değerlere yeniden ölçeklendirilebileceğini unutmayın , örneğin, pound / dolar yerine peni / ölçün. Yine de en yakın pound / dolara yuvarlamak isteyebilirsiniz, çünkü malların fiyatının pence / cents bölümünün dağılımı muhtemelen çok düzensiz olacaktır (yani çoğunlukla 99). yi
James

3

Her zaman doğrusal olmayan en küçük kareleri kullanabilirsiniz . O zaman modeliniz:

yi=β0exp(β1x1i+...+βkxki)+εi

Bu durumda içindeki sıfırlar doğrusal olmayan eğilimden sapmalar olarak ele alınacaktır.yi


Parametrelerin başlangıç ​​değerleri ne olacak? Onları seçmenin iyi yolu nedir? Bir güncellemede belirttiğim gibi, sürekli değişken olmadığı varsayılabilir.
Tomek Tarczynski

@Tomek, bence onları seçmenin iyi bir yolu yok. Genellikle verilere bağlıdır. Kesişim için ortalama, diğer katsayı için sıfır öneririm.
mpiktas
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.