Sonuç fraksiyonel olduğunda R'de lojistik regresyon nasıl yapılır (iki sayım oranı)?


24

Aşağıdaki biyolojik deneylere sahip bir makaleyi gözden geçiriyorum. Hücreleri değişen miktarlarda sıvı kayma stresine maruz bırakmak için bir cihaz kullanılır. Hücrelere daha büyük kayma gerilimi uygulandıkça, bunların çoğu substrattan ayrılmaya başlar. Kayma gerilmesinin her seviyesinde, bağlı kalan hücreleri sayarlar ve başlangıçta eklenmiş olan toplam hücre sayısını bildikleri için, kesirli bir eki (veya kopma) hesaplayabilirler.

Yapışkan kesri - kayma gerilmesini çizerseniz, sonuç bir lojistik eğridir. Teoride, her bir bireysel hücre tek bir gözlemdir, ancak açık bir şekilde binlerce veya onbinlerce hücre vardır, bu nedenle veri seti normal şekilde kurulursa devasa olur (her sıra bir gözlemdir).

Bu nedenle, doğal olarak, sorum (başlığında belirtildiği gibi) şimdi anlam ifade etmeli. Kesirli sonucu DV olarak kullanarak lojistik regresyon nasıl yapılır? Glm cinsinden yapılabilecek bazı otomatik dönüşüm var mı?

Aynı satırlar boyunca, potansiyel olarak 3 veya daha fazla (kesirli) ölçüm olsaydı, bir multinomial lojistik regresyon için bu nasıl olurdu?


İşte çok değişkenli bir sonuç lojistik regresyonu ile ilgili bazı örnekler:http://www.ats.ucla.edu/stat/r/dae/mlogit.htm
marbel

1
Tanımladığınız şey, bağımsız gözlemler yapmışsınız gibi görünmüyor (hücreler kayma arttıkça büyük olasılıkla yeniden birleşemediğinden, her bir yüksek stres ayarında hala bağlı olan sayı önceki sayıdan daha fazla olmamalıdır); bu bağımlılık dikkate alınmalıdır. (Büyüme eğrileri ile durumu hatırlatan şeydir.) --- sayıları bağımsız olarak sanki bir GLM'ye bağlayamazsınız ... ve cevapların hiçbiri bu konuyu ele almıyor gibi görünüyor.
Glen_b -Reinstate Monica

2
@Glen_b Her deney farklı hücrelerle, yani "% 100" bağlanma ile başlayıp farklı bir kayma gerilmesi değeri uygulayarak gerçekleştirilecektir.
thecity2

Ah tamam. Bu bağımsız sonuçlar verecektir.
Glen_b

Yanıtlar:


37

glmİşlevi Rbir lojistik regresyon modeli için formülünü belirlemek için 3 yol verir.

En yaygın olanı, veri çerçevesinin her bir satırının tek bir gözlemi temsil etmesi ve yanıt değişkeninin ya 0 ya da 1 olması (ya da 2 seviyeli bir faktör ya da sadece 2 benzersiz değere sahip başka bir değişken) olmasıdır.

Diğer bir seçenek ise, 2 sütunu matrisini, ilk sütunun 'başarıların' sayısı ve ikinci sütunun 'başarısızlıkların sayısı' olduğu yanıt yanıt değişkeni olarak kullanmaktır.

Yanıtı ayrıca 0 ile 1 arasında bir oran olarak da belirtebilir, daha sonra, oranın olduğu toplam sayıyı veren 'ağırlık' olarak başka bir sütun belirleyebilirsiniz (bu nedenle, 0.3'ün yanıtı ve 10'un ağırlığı 3 ile aynıdır). başarılar 've 7' başarısızlıklar ').

Son 2 yoldan biri, yapmaya çalıştığınız şeye uyacak, en son verilerinizi nasıl tarif ettiğinize en doğrudan benziyor.


9

Başlangıç ​​olarak, orantılı bir bağımlı değişkeniniz varsa, Beta Regresyon kullanabilirsiniz. Bu, (sınırlı bilgim dahilinde) çoklu oranlara uzanmıyor.

Beta Regresyon genel bakış ve bir R uygulaması için betareg'i kontrol edin .


Teşekkürler! Binom olayı için ihtiyacım olana benziyor.
thecity2

2

I'v kullanıyorum nnet::multinombenzer bir amaç için (paket -NMR MASS parçası olan), bu [0, 1] sürekli girişini kabul eder.

Bir referansa ihtiyacınız varsa: C. Beleites et.al .: Astrositom dokularının Raman spektroskopik sınıflandırması: Yumuşak referans bilgileri kullanarak. Anal Bioanal Chem, 2011, Cilt. 400 (9), sayfa 2801-2816


Harika! Bu pakete sahibim ve bu özelliğe sahip olduğunu anlamadım.
thecity2

@cbeleites: Bağımlılığın [0,1] olmasına izin veriyor mu? Ben bunun nominal bir bağımlılık işlevi olduğunu
düşünmüştüm

@B_Miner: evet, bağımlı [0, 1] olabilir. Bu fonksiyon, gizli katman olmadan ve lojistik sigmoid ile yapay bir sinir ağına uyar. Ve evet, daha iyi yakınsama için tahmin edicilerin kabaca [0, 1] 'e ölçeklendirilmesi önerilir.
cbeleites
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.