Kategorik veriler için cezalandırılmış yöntemler: düzeyleri bir faktörde birleştirme


10

Cezalandırılmış modeller, parametre sayısının örnek boyutuna eşit veya daha büyük olduğu modelleri tahmin etmek için kullanılabilir. Bu durum, kategorik veya sayım verilerinin büyük seyrek tablolarının log-lineer modellerinde ortaya çıkabilir. Bu ayarlarda, bu seviyelerin diğer faktörlerle nasıl etkileşime girdiği açısından ayırt edilemediği bir faktörün seviyelerini birleştirerek tabloları daraltmak genellikle arzu edilir veya yararlıdır. İki soru:

  1. Her faktördeki seviyelerin çökebilirliğini test etmek için LASSO veya elastik ağ gibi cezalandırılmış modeller kullanmanın bir yolu var mı?
  2. İlk sorunun cevabı evet ise, bu, seviyelerin çöküşü ve model katsayılarının tahmini tek bir adımda gerçekleşecek şekilde ayarlanabilir mi ve olmalıdır?

1
Bu makale, doi.org/10.1177/1471082X16642560 , son on yılda bu alanda neler yapıldığına dair güzel bir genel bakış sunmaktadır.
Jorne Biccler

1
Not: Aşağıda tartıştığım ceza @JorneBiccler'ın bağlantısındaki denklem 3.4. (Bu sorunun daha önce dikkate alındığını görmek ilginç!)
user795305


Bunu, kendisinden önceki bir sorunun kopyası olarak nasıl adlandırabiliriz?
Michael R. Chernick

Yanıtlar:


4

Bu mümkün. Bunu başarmak için kaynaşmış kementin bir varyantını kullanabiliriz .

Tahminciyi kullanabiliriz

β^=argminβ-1nΣben=1n(ybenβTxben-eβTxben)+Σfaktörler gλg(Σjg|βj|+12Σj,kg|βj-βk|).

Not bu log-lineer zarar fonksiyonudur modelleri.-1nΣben=1n(ybenβTxben-eβTxben)

Bu, bir grup içindeki katsayıların eşit olmasını teşvik eder. Bu katsayı eşitliği , faktörün ve seviyelerinin birlikte çökmesine eşdeğerdir . Zaman durumunda , bu çöken eşdeğerdir referans seviyesi ile aynı seviyede. Ayar parametreleri sabit olarak ele alınabilir, ancak bu sadece birkaç faktör varsa, bunları ayrı olarak ele almak daha iyi olabilir.jthkthβ^j=0jthλg

Tahmin edici, dışbükey bir fonksiyonun bir minimizeridir, bu nedenle keyfi çözücülerle verimli bir şekilde hesaplanabilir. Bir faktörün çok, çok seviyesi varsa, bu ikili farklılıklar elden çıkacaktır - bu durumda, olası çöküş modelleri hakkında daha fazla yapı bilmek gerekli olacaktır.

Tüm bunların tek bir adımda gerçekleştirildiğini unutmayın! Bu, kement tipi tahmincileri bu kadar havalı yapan şeyin bir parçasıdır!


Bir başka ilginç yaklaşım da yerine .[-11][βbenβj]'1[βbenβj]

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.