Zaman içinde daha ayrıntılı açıklayıcı değişkenleri dahil etmek


9

Zaman içinde giderek daha ayrıntılı tahmin ediciler edindiğim bir değişkeni en iyi nasıl modelleyebileceğimi anlamaya çalışıyorum. Örneğin, temerrüde düşmüş kredilerdeki geri kazanım oranlarını modellemeyi düşünün. Diyelim ki 20 yıllık veri içeren bir veri setimiz var ve bu yılların ilk 15'inde kredinin teminatlı olup olmadığını biliyoruz, ancak bu teminatın özellikleri hakkında hiçbir şey bilmiyoruz. Bununla birlikte, son beş yıldır, teminatı, iyileşme oranının iyi bir öngörücüsü olması beklenen bir dizi kategoriye ayırabiliriz.

Bu kurulum göz önüne alındığında, verilere bir model sığdırmak, öngörücülerin istatistiksel önemi gibi önlemleri belirlemek ve sonra modelle tahmin etmek istiyorum.

Bu hangi eksik veri çerçevesine uyuyor? Tarihsel örneklemin etrafına dağılmak yerine, daha ayrıntılı açıklayıcı değişkenlerin sadece belirli bir noktadan sonra kullanılabilir hale gelmesiyle ilgili özel hususlar var mı?

Yanıtlar:


1

Tamam, tarihsel verileri kullanma deneyiminden daha fazla tarih, regresyon uyumunun daha iyi görünmesini sağlayabilir, ancak tahmin etmek eğer egzersiz noktasıysa, genel cevap uyarılır. Verilerin “dünya” nın çok farklı olduğu dönemleri yansıtması durumunda, korelasyonların kararlılığı sorgulanabilir. Bu özellikle piyasaların ve düzenlemelerin sürekli geliştiği ekonomide meydana gelir.

Bu, ek olarak uzun bir döngüye sahip olabilen emlak piyasası için de geçerlidir. Örneğin, ipoteğe dayalı menkul kıymetlerin icadı, ipotek piyasasını dönüştürdü ve ipotek oluşumuna yönelik sel kapılarını ve maalesef spekülasyonları (aslında borç kredisi olarak adlandırılan düşük / düşük belge kredisi sınıfının tamamı vardı).

Rejim değişikliklerini test eden yöntemler, tarihi ne zaman hariç tutacağına öznel olmayan bir şekilde karar vermede özellikle değerli olabilir.


1

Tipik olarak, bu sınırlı bir parametre değeri problemi olarak görülebilir. Sorunuzu anladığım gibi, verilerinizde daha az bilgilendirici bir parametreniz (bilinmeyen kalitede [Cu] teminat) ve sonraki veriler.

Model için gözlemlenmeyen parametrelerin zamanla değişmediğine inanıyorsanız, her birinin nokta tahminlerinin Cl <Cm <Ch ve Cl <= Cu <= Ch olduğunu varsayarsak yöntem basit olabilir. Mantık, Cl'nin en kötüsü ve Ch en iyisidir, bu nedenle veriler bilinmiyorsa, bunlar arasında veya bunlarla eşit olmalıdır. Biraz kısıtlayıcı olmaya istekliyseniz ve ilk 15 yıl boyunca tüm teminatların yüksek veya düşük kalitede olmadığını varsayarsanız, Cl <Cu <Ch'nin tahmin etmeyi oldukça basitleştirdiğini varsayabilirsiniz.

Matematiksel olarak, bunlar aşağıdaki gibi bir şeyle tahmin edilebilir:

Cl=tecrübe(β1)Cm=tecrübe(β1)+tecrübe(β2)Cu=tecrübe(β1)+tecrübe(β3)1+tecrübe(-β4)Ch=tecrübe(β1)+tecrübe(β2)+tecrübe(β3)

Cu'daki logit işlevinin değeri, Cm'ye göre sınırlamadan Cl ve Ch arasında olmasını kısıtlar. (0 ile 1 arasında sınırlanan diğer işlevler de kullanılabilir.)

Modeldeki diğer bir fark, varyansın, kalan varyansın süreye bağlı olacağı şekilde yapılandırılması gerektiğidir, çünkü her dönem içindeki bilgiler farklıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.