Spline veya kesirli polinomlar kullanılırken eksik veriler nasıl ele alınabilir?


12

Çok Değişkenli Model Oluşturma: Patrick Royston ve Willie Sauerbrei tarafından Sürekli Değişkenleri Modellemek için Kesirli Polinomlara Dayalı Regresyon Analizine Pragmatik Bir Yaklaşım okuyorum . Şimdiye kadar etkilendim ve daha önce düşünmediğim ilginç bir yaklaşım.

Ancak yazarlar eksik verilerle ilgilenmezler. Gerçekten de, s. 17 Kayıp verilerin "pek çok ek sorun yarattığını söylüyor. Burada dikkate alınmıyor."

Çok sayıda impütasyon fraksiyonel polinomlarla çalışır mı?

FP, bazı açılardan (hepsi değil) spline'a bir alternatiftir. Spline regresyonu için eksik verilerle başa çıkmak daha mı kolay?


Eksik x'ler veya eksik y'ler veya her ikisini birden mi ele alıyorsunuz?
Glen_b

2
+1 (!) Başka birisinin benzer bir soru sorduğunu görmek beni gerçekten memnun etti. Son zamanlarda bu soruyu gönderdim: R'nin farelerinde kısıtlı kübik spline'ların nasıl kullanılacağı hakkında stats.stackexchange.com/questions/295977/… . Splinelar çok sayıda fonksiyonel form için yeterince esnekken, fraksiyonel bir polinom belirtmeyi gerektirmedikleri için özellikle splineları tercih ederim. Bunun sorunuzu cevaplayıp yanıtlamadığını bilmiyorum (bu nedenle bu yorum).
IWS

2
Bu ilginç bir sorudur (olası bir cevabın bir boyutu olarak), eksik verileri barındırma yeteneklerini zıtlaştırarak bu birkaç düzleştirme / enterpolasyon tekniğini eleştirme olasılığını ortaya çıkarır. (Bir dereceye kadar, eksikliğe karşı kırılganlık, modern bir yönteme 'utançtır'.) Sadece Bayesli bir uygulamanın size 'özgür' dürüstlüğünüzü kazandıracağı bariz noktasını geçtiğinizde not ediyorum.
David C. Norris

2
@ DavidC.Norris Yorumunuz ilgimi çekiyor! Bayesian yöntemlerinin 'ücretsiz' eksikleri nasıl barındırdığını açıklayabilir misiniz (yani, analiz yöntemleriyle uygun, 'otomatik' ve varsayılan olarak ele alındığını kastediyorum)? (Ya da beni bir referansa göster)
IWS

2
Burada "serbest" in öğle yemeği olmayan kısmı, veri oluşturma süreci ( DGP ) hakkında açıkça düşünmeyi ima eden bir Bayes modeli yazmanız gerektiğidir . Bunu yaptıktan sonra, eksik değerleri [rahatsızlık] parametreleri olarak görürsünüz. (Bayesian'ta, "her şey bir parametredir." Ayrıca gizli değişkene bakın .) Ardından MCMC'niz, eksik değerleri "ücretsiz" olarak belirtmek için belirttiğiniz DGP'yi kullanır.
David C. Norris

Yanıtlar:


1

Kesirli polinomlar ve kamalar ile çoklu impütasyon kullanılabilir. Diyelim ki fonksiyonel formunuzu temsil eder (örneğin, ). , sentetik örneklerin her birinde tahmin edilen işlev olsun , sonra işleviniz .f(x)f(x)=x+x.5fm()M1MmMfm(x)

Kullandığınız yazılımın x'in her bir benzersiz değeri için standart bir hata tahmini sağlayabileceğini varsayarsak, standart hataları hesaplamak için Rubin's (anketlerde yanıt vermeme için çoklu gösterim; 1987) formülünü kullanabilirsiniz. Çoklu çarpma ile serbestlik dereceleri için küçük ve büyük örnek formüller vardır. Büyük numune formülü (Rubin'de de) standart hata ile aynı girdileri alır, bu yüzden de kullanılabilir. Küçük örnek olay, modelin serbestlik derecesini girdi olarak alır; bu formülün burada uygulanıp uygulanamayacağı açık değildir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.