Toplamsal Hata mı, Çarpımsal Hata mı?


13

İstatistiklerde nispeten yeniyim ve bunu daha iyi anlamaya yardımcı olacağım.

Benim alanımda formun yaygın olarak kullanılan bir modeli var:

Pt=Po(Vt)α

İnsanlar modeli verilere uyduğunda genellikle doğrusallaştırır ve aşağıdakilere uyarlar

log(Pt)=log(Po)+αlog(Vt)+ϵ

Bu tamam mı? Sinyaldeki gürültü nedeniyle gerçek modelin olması gerektiği bir yerde okudum

Pt=Po(Vt)α+ϵ

ve bu yukarıdaki gibi doğrusallaştırılamaz. Bu doğru mu? Eğer öyleyse, okuyabileceğim ve hakkında daha fazla bilgi edinebileceğim ve muhtemelen bir raporda alıntı yapabileceğim bir referans bilen var mı?


Denklemlerinizi biçimlendirdim. Lütfen içeriğin hala istediğiniz gibi olup olmadığını kontrol edin (özellikle aboneliklerle ilgili).
Andy

Sorunuzu "ölçüm hatası" ile işaretlediniz ve 3. denklemdeki + e, yanıtta P * (V ^ alfa) * gibi çarpımsal stokastik / rasgele varyasyona ek olarak ek ölçüm hatası nedeniyle görünmektedir. exp (e). Bu doğru mu? Ölçüm hatası modelleri (diğer bir deyişle, "değişkenlerde hata" modelleri) genellikle iki tür işlem gerektirir; bu durumda, durumunuzda "gürültü" nedeniyle ek hatanın karakterize edilmesi için ayrı doğrulama verileri gerekebilir; bu durumda, denklemi doğrusallaştırmak gerekir.
N Brouwer

Yanıtlar:


14

Hangi modelin uygun olduğu, ortalama etrafındaki varyasyonun gözlemlere nasıl geldiğine bağlıdır. Çarpıcı veya katkı maddesi olarak ya da başka bir şekilde gelebilir.

Bu varyasyonun, bazıları çoğul olarak girebilen, bazıları da katkı olarak ve bazıları da gerçekten karakterize edilemeyen yollardan giren birkaç kaynak bile olabilir.

Bazen hangisinin uygun olduğunu belirlemek için açık bir teori vardır. Bazen ortalama ile ilgili ana varyasyon kaynaklarını düşünmek uygun bir seçim ortaya çıkaracaktır. Çoğu zaman insanların hangi yöntemi kullanacakları konusunda net bir fikirleri yoktur veya süreci uygun bir şekilde tanımlamak için farklı türlerin birkaç varyasyon kaynağı gerekli olabilir.

Doğrusal regresyonun kullanıldığı log-lineer model ile:

log(Pt)=log(Po)+αlog(Vt)+ϵ

OLS regresyon modeli sabit log ölçeği varyansı varsayar ve eğer durum buysa, orijinal veriler ortalama arttıkça ortalama hakkında artan bir dağılım gösterecektir.

Öte yandan, bu tür bir model:

Pt=Po(Vt)α+ϵ

genellikle doğrusal olmayan en küçük kareler tarafından takılır ve tekrar, eğer sabit varyans (NLS için varsayılan) takılırsa, ortalamaya yayılma sabit olmalıdır.

resim açıklamasını buraya girin

[Son görüntüde yayılımın artan ortalama ile azaldığı görsel izleniminiz olabilir; bu aslında artan eğimin neden olduğu bir yanılsamadır - yayılmayı dikeyden ziyade eğriye dik olarak değerlendiririz, böylece çarpık bir izlenim alırız.]

Orijinal veya günlük ölçeğinde neredeyse sürekli yayılımınız varsa, bu iki modelden hangisinin sığacağını önerebilir, bunun katkı veya çarpım olduğunu kanıtlaması nedeniyle değil, yaymanın yanı sıra anlamına gelmek.

Tabii ki, sabit olmayan varyansa sahip olan ilave hata olasılığı da olabilir.

Bununla birlikte, hala ortalama ve varyans arasında (ortalamanın kare kökü ile orantılı olarak yayılan bir Poisson veya yarı-Poisson GLM gibi) farklı ilişkilere sahip bu tür fonksiyonel ilişkilerin kurulabileceği başka modeller de vardır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.