Sürekli bağımlı y değişkeni ve sıra değişkeni X 1 dahil bağımsız değişkenler göz önüne alındığında , doğrusal bir modeli nasıl yerleştirebilirim R
? Bu tür model hakkında makaleler var mı?
Sürekli bağımlı y değişkeni ve sıra değişkeni X 1 dahil bağımsız değişkenler göz önüne alındığında , doğrusal bir modeli nasıl yerleştirebilirim R
? Bu tür model hakkında makaleler var mı?
Yanıtlar:
Scortchi en got @ sen kaplı bu cevap üzerine sıralı bir değişken için Kodlama . Ben tavsiye tekrarlanan ettik cevabım için anket cevaplara iki demografik IV enziminin Etkisi (Likert ölçeği) . Özellikle, tavsiye Gertheiss'in (2013) ordPens paketini kullanmak ve teorik arka plan ve bir simülasyon çalışması için Gertheiss ve Tutz'a (2009a) başvurmaktır.
Muhtemelen istediğiniz fonksiyon ordSmooth
* . Bu esasen sıra değişkenlerinin seviyeleri arasındaki kukla katsayıları, bitişik seviyelere göre daha az farklı olacak şekilde düzeltir, bu da fazla takmayı azaltır ve tahminleri geliştirir. Genellikle veriler sıralı olduğunda sürekli (veya kendi terimleriyle, metrik) veriler için bir regresyon modelinin tahminini, maksimum olasılıktan (veya bu durumda sıradan en küçük karelerden) daha iyi olarak veya (bazen çok daha iyi) gerçekleştirir. Her türlü genelleştirilmiş doğrusal model ile uyumlu görünmektedir ve nominal ve sürekli yordayıcıları ayrı matrisler olarak girmenize izin verir.
Gertheiss, Tutz ve meslektaşlarından birkaç ek referans mevcuttur ve aşağıda listelenmiştir. Bunlardan bazıları alternatifler içerebilir - Gertheiss ve Tutz (2009a) bile sırtın başka bir alternatif olarak ele alınmasını tartışıyor. Ben henüz hepsini kendim kazmadım, ama bunu söylemek için yeterli @ Erik'in sıralı tahmincilerle ilgili çok az edebiyat sorununu çözdü!
Referanslar
- Gertheiss, J. (2013, 14 Haziran). ordPens: Ordinal öngörücülerin seçimi ve / veya düzgünleştirilmesi , versiyon 0.2-1. Http://cran.r-project.org/web/packages/ordPens/ordPens.pdf adresinden erişildi .
- Gertheiss, J., Hogger, S., Oberhauser, C. ve Tutz, G. (2011). İşlevsel çekirdek kümelerinin uluslararası sınıflandırmasına başvurularla sıralı olarak ölçeklenmiş bağımsız değişkenlerin seçimi. Kraliyet İstatistik Kurumu Dergisi: Seri C (Uygulamalı İstatistik), 60 (3), 377-395.
- Gertheiss, J. ve Tutz, G. (2009a). Ordinal öngörücülerle cezalandırılmış regresyon. Uluslararası İstatistiksel İnceleme, 77 (3), 345-365. Http://epub.ub.uni-muenchen.de/2100/1/tr015.pdf adresinden erişildi .
- Gertheiss, J. ve Tutz, G. (2009b). Blok halinde güçlendirme ile kütle spektrometri tabanlı proteomik profil oluşturmada denetimli özellik seçimi Biyoinformatik, 25 (8), 1076-1077.
- Gertheiss, J. ve Tutz, G. (2009c). Değişken ölçeklendirme ve en yakın komşu yöntemleri. Journal of Chemometrics, 23 (3), 149-151. - Gertheiss, J. ve Tutz, G. (2010). Kategorik açıklayıcı değişkenlerin seyrek modellenmesi.
Yıllıklar Uygulamalı İstatistik, 4 , 2150–2180.
- Hofner, B., Hothorn, T., Kneib, T. ve Schmid, M. (2011). Arttırmaya dayalı tarafsız model seçimi için bir çerçeve. Hesaplamalı ve Grafik İstatistik Dergisi, 20 (4), 956-971. Http://epub.ub.uni-muenchen.de/11243/1/TR072.pdf adresinden erişildi .
- Oelker, M.-R., Gertheiss, J. ve Tutz, G. (2012). Genelleştirilmiş doğrusal modellerde kategorik öngörücüler ve efekt değiştiricilerle düzenlileştirme ve model seçimi. İstatistik Bölümü: Teknik Raporlar, No. 122 . Http://epub.ub.uni-muenchen.de/13082/1/tr.gvcm.cat.pdf adresinden erişildi .
- Oelker, M.-R. ve Tutz, G. (2013). Genelleştirilmiş yapılandırılmış modellerde farklı ceza türlerini birleştirmek için genel bir ceza ailesi. İstatistik Bölümü: Teknik Raporlar, No. 139 . Http://epub.ub.uni-muenchen.de/17664/1/tr.pirls.pdf adresinden erişildi .
- Petry, S., Flexeder, C. ve Tutz, G. (2011). Çift sigortalı kement. İstatistik Bölümü: Teknik Raporlar, No. 102. Http://epub.ub.uni-muenchen.de/12164/1/petry_etal_TR102_2011.pdf adresinden erişildi .
- Rufibach, K. (2010). Sıralı öngörücülere sahip genelleştirilmiş doğrusal modellerde parametreleri tahmin etmek için aktif bir set algoritması. Hesaplamalı İstatistik ve Veri Analizi, 54 (6), 1442-1456. Http://arxiv.org/pdf/0902.0240.pdf?origin=publication_detail adresinden erişildi .
- Tutz, G. (2011, Ekim). Kategorik veriler için düzenlileştirme yöntemleri. Münih: Ludwig-Maximilians-Universität. Http://m.wu.ac.at/it/departments/statmath/resseminar/talktutz.pdf adresinden erişildi .
- Tutz, G. ve Gertheiss, J. (2013). Derecelendirme ölçekler olarak belirteçler — Eski ölçek düzeyi sorunu ve bazı cevaplar.Psikometrik , 1-20.
Birden çok belirleyici olduğunda ve ilgili belirleyici sıralı olduğunda, değişkeni nasıl kodlayacağınıza karar vermek genellikle zordur. Kategorik olarak kodlamak sipariş bilgilerini kaybederken, sayısal olarak kodlamak sıralı kategorilerin gerçek etkilerinden uzak olabilecek etkileri üzerinde doğrusallık kazandırır. Birincisi için, izotonik regresyon, monotonluğun giderilmesinin bir yolu olarak önerilmiştir, ancak diğer birçok veriye dayalı prosedür gibi, nihai yerleştirilmiş modelin ve öneminin dikkatli bir şekilde değerlendirilmesini gerektiren veri odaklı bir model seçim prosedürüdür. parametrelerinin. İkincisi için, spline'lar katı doğrusallık varsayımını kısmen azaltabilir, ancak sayılar yine de sıralı kategorilere atanmalıdır ve sonuçlar bu seçimlere duyarlıdır. Makalemizde (Li ve Shepherd, 2010, Giriş, paragraf 3-5),
İzin Vermek sonuç değişkeni olmak, ilginin sıra belirleyicisi olmak ve diğer eş değişkenler olun. İki regresyon modeline uymayı teklif ettik, biri üzerinde ve diğer üzerinde , iki model için kalıntıları hesaplayın ve kalıntılar arasındaki korelasyonu değerlendirin. Li ve Shepherd'da (2010), bu yaklaşımı sıradan ve etkili olduğu sürece çok iyi ve sağlam bir yaklaşım olabileceğini gösterdi. kategoriler tekdüzedir. Şu anda bu yaklaşımın diğer sonuç türleri üzerindeki performansını değerlendiriyoruz.
Bu yaklaşım, ordinal regresyon için uygun bir artık gerektirir. üzerinde . Li ve Shepherd'da (2010) sıralı sonuçlar için yeni bir kalıntı önerdik ve bunu bir test istatistiği oluşturmak için kullandık. Ayrıca, bu artıkların özelliklerini ve diğer kullanımlarını ayrı bir makalede inceledik (Li ve Shepherd, 2012).
CRAN'dan temin edilebilen PResiduals adlı bir R paketi geliştirdik . Paket, doğrusal ve sıralı sonuç türleri için yaklaşımımızı gerçekleştirmek için işlevler içerir. Başka sonuç türleri (örn. Sayım) ve özellikler (ör. Etkileşimlere izin verme) eklemek için çalışıyoruz. Paket ayrıca, çeşitli regresyon modelleri için olasılık ölçeğinde bir artık olan kalıntımızın hesaplanması için fonksiyonlar içerir.
Referanslar
Li, C. ve Shepherd, BE (2010). Ortak değişkenler için ayarlama yaparken iki sıra değişken arasındaki ilişki testi. JASA, 105,612-620.
Li, C. ve Shepherd, BE (2012). Sıralı sonuçlar için yeni bir artık. Biometrika 99,473-480.
Genelde bağımlı değişkenler olarak ordinal değişkenler hakkında çok fazla literatür vardır ve bunları yordayıcı olarak kullanmak konusunda çok az şey vardır. İstatistik pratikte genellikle ya sürekli ya da kategorik oldukları varsayılır. Sürekli değişken olarak öngörücüye sahip doğrusal bir modelin kalıntıları kontrol ederek iyi bir uyum gibi olup olmadığını kontrol edebilirsiniz.
Bazen kümülatif olarak da kodlanırlar. Örnek olarak x1> 1 için bir kukla ikili değişken d1 ve x1> 2 için bir kukla ikili değişken d2 olması, 1,2 ve 3 seviyelerine sahip sıralı bir değişken x1 için olabilir. O zaman d1 katsayısı, ordinalinizi 2 ila 3 arttırdığınızda elde ettiğiniz etkidir ve d2 katsayısı, 2 ila 3 arasında ordinal yaptığınızda elde ettiğiniz etkidir.
Bu, yorumu daha kolay hale getirir, ancak pratik amaçlar için kategorik bir değişken olarak kullanmaya eşdeğerdir.
Gelman , modellerin esnekliğini arttırmak için ordinal öngörücüyü hem kategorik bir faktör (ana etkiler için) hem de sürekli değişken (etkileşimler için) olarak kullanabileceğini önermektedir.
Kişisel stratejim genellikle onlara sürekli muamele etmenin mantıklı olup olmadığını ve makul bir modelle sonuçlanıp sonuçlanmadığını araştırmak ve bunları sadece gerekirse kategorik olarak kullanmaktır.