Aylık düzeyde davranış tahminleri sağlayan birkaç farklı modeli değerlendirmek istiyorum. Veriler dengelenmiştir ve 100.000 ve 12. Sonuç belirli bir ayda bir konsere katılmaktadır, bu nedenle herhangi bir ayda insanların ~% 80'i için sıfırdır, ancak ağır kullanıcıların uzun bir sağ kuyruğu vardır. Tahminlerimin sonucun doğasına saygılı görünmüyor: kesirli konserler yaygın.
Modeller hakkında hiçbir şey bilmiyorum. Her kişi için ayda yalnızca 6 farklı kara kutu tahmini . Model yapımcılarının tahmin için sahip olmadığı fazladan bir yıllık verim var (konser katılımcıları aynı kalmasına rağmen) ve her birinin iyi performans gösterdiği yeri (doğruluk ve kesinlik açısından) ölçmek istiyorum. Örneğin, bazı modeller sık sık konser verenler için iyi bir öngörüde bulunuyor, ancak kanepeli patateslerde başarısız oluyor? Ocak tahmini, Aralık tahmininden daha mı iyi? Alternatif olarak, tahminlerin, kesin büyüklüğe güvenilemese bile, gerçekler açısından insanları doğru bir şekilde sıralamama izin verdiğini bilmek güzel olurdu.
İlk düşüncem tahmin ve zaman mankenleri ve RMSEs veya bakmak fiili sabit etkiler regresyon çalıştırmak oldu her model için. Ancak bu, her modelin nerede iyi olduğu veya farklılıkların önemli olup olmadığı (RMSE'yi önyüklemediğim sürece) sorusuna cevap vermez. Sonucun dağılımı da bu yaklaşımla beni endişelendiriyor.
İkinci fikrim, sonucu 0, 1-3 ve 3+'ye bölmek ve karışıklık matrisini hesaplamaktı, ancak bunlardan 12'sini yapmadıkça bu zaman boyutunu yok sayar. Aynı zamanda oldukça kaba.
concord
TJ Steichen ve NJ Cox'un Stata komutlarının farkındayım - bu by()
seçenek var, ancak bu verilerin yıllık toplamlara daraltılmasını gerektirecek. Bu, Lin'in Uyum Korelasyon İndeksini diğer yararlı istatistiklerin yanı sıra güven aralıklarıyla hesaplar . CCC -1 ile 1 arasında değişmektedir ve 1'de mükemmel bir anlaşma vardır.
Orada Harrell'in da var (aracılığıyla hesaplanan
vardır, R. Newson tarafından) seçeneği, ama emin beni paneli verileri ile uğraşmak sağlayacak değilim. Bu size güven aralıkları verir. Harrell's c, sürekli bir sonuç için ROC eğrisi (AUC) altındaki alanın genelleştirilmesidir. Daha yüksek öngörüye sahip öznenin daha yüksek sonuca sahip olacağı şekilde sipariş edilebilen tüm çiftlerin oranıdır. Böylece c = 0.5 rastgele tahminler c = 1 mükemmel ayırt model. Bkz Harrell'in kitabı , p.493somersd
cluster
Bu sorunu nasıl çözersiniz? Tahminlerde yaygın olan MAPE gibi istatistiklerin hesaplanmasını önerir misiniz?
Şimdiye kadar bulunan faydalı şeyler:
- Lin'in Uyum Korelasyon Katsayısının tekrarlanan ölçüm versiyonundaki slaytlar