Lojistik regresyon sonuçlarının raporlanması


13

Aşağıdaki lojistik regresyon çıktısı var:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

Bunu aşağıdaki şekilde bildirmek uygun mu?

Beta katsayısı, Oran oranı, Z değeri, P değeri. Evetse, Oran oranını nasıl alabilirim?


Yanıtlar:


9

Bir tablo için önerilen raporlamanız makul görünüyor, ancak z değerleri ve p değerleri gereksiz. Bildiğim birçok dergi z-değerini / p-değerini hiç bildirmez ve yalnızca istatistiksel önemi bildirmek için yıldız işareti kullanır. Ayrıca şahsen bir tabloda boşluk izin veriyorsa, hem günlük oranları hem de oranları oranlarını tercih etsem de, lojistik tabloları sadece tek oranlar ile rapor ettim.

Ancak farklı mekânların raporlama prosedürleri konusunda farklı rehberleri olabilir, bu nedenle beklenenler değişebilir. Bir dergiye makale gönderiyorsam, sık sık diğer son makalelerin tablolarını nasıl yaptığını göreceğim ve sadece bunları taklit edeceğim. Kendi kişisel makalenizse, kimin gözden geçirebileceğini sormak makul bir talep olacaktır. Yukarıda bahsettiğim gibi, bazı yerlerdeki alan kısıtlamaları, en sonunda gereksiz bilgileri (hem günlük oranları hem de olasılık oranları gibi) rapor etmenizi engelleyebilir. Bazı yerler sonuçları tamamen metin olarak bildirmeye zorlayabilir!

R2R2

eβ^eβ^exp(coefficient)

Ayrıca, şu anda kabul edilen cevap bu olsa da, lejohn ve Frank Harrell her ikisi de çok yararlı tavsiyeler veriyor. Tipik olarak her zaman sorudaki istatistiklerin bir yerde rapor edilmesini istesem de, diğer cevaplar hakkındaki diğer tavsiyeler, modeldeki diğer tahmini etkilere göre etki boyutlarını değerlendirmek için yararlı yollardır. Grafiksel prosedürler göreceli etki büyüklüklerini incelemek ve tabloları grafiklere dönüştürmekle ilgili bu iki makaleyi örnek olarak görmek için de yararlıdır ( Kastellec ve Leoni, 2007 ; Gelman ve diğerleri, 2002 )


Kastellec & Leoni, 2007 bağlantısı koptu, ancak burada aynı makaleden kodla bir örnek var.
ACNB

11

Bu sorunun cevabı, disiplin geçmişinize bağlı olabilir.

İşte bazı genel düşünceler.

Lojistik regresyondaki betaların doğrudan yorumlanması oldukça zordur. Bu nedenle, bunları açıkça bildirmek sadece çok sınırlı bir kullanıma sahiptir. Oran oranlarına, hatta marjinal etkilere bağlı kalmalısınız. Değişken x'in marjinal etkisi, bağımlı değişkenlerinizin x'e göre 1'e eşit olma olasılığının türevidir. Sonuçların bu şekilde sunulması ekonomistler arasında çok popülerdir. Şahsen, marjinal etkilerin olasılıklar oranlarından daha çok laymenler tarafından (ancak onlar tarafından değil ...) daha kolay anlaşıldığına inanıyorum.

Bir başka ilginç olasılık da grafik ekranlar kullanmaktır. Bu yaklaşımın bazı resimlerini bulacağınız bir yer Gelman ve Hill kitabı . Bunu marjinal etkileri bildirmekten daha iyi buluyorum.

Oran oranlarını nasıl alacağınız sorusu ile ilgili olarak, R'de bunu nasıl yapabileceğiniz aşağıda açıklanmıştır:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))

Marjinal etki tahminlerini tablolara (veya Gelman ve Hill'deki belirli sayfa referanslarına) dönüştürmek için herhangi bir örneğiniz var mı?
Andy W

1
Gelman ve Hill, marjinal etkileri değil, tahmin edilen olasılıklara dayanan grafikleri kullanıyor. 79. sayfadan başlayarak beşinci bölüme bakınız.

10

Sadece katsayıların ve bunların kütük karşıtı kayıtlarının (olasılık oranları) iyi özetler olduğu özel durumlarda. Bu, ilişkiler doğrusal olduğunda ve bir öngörücüyle ilişkili bir katsayı olduğunda ve tek bir birim değişikliği olasılık oranını hesaplamak için iyi bir temel olduğunda (yaş için daha iyi, bir dizi aralığı olan beyaz kan sayımı için çok fazla değil) 500-100,000). Genel olarak, çeyrekler arası aralıklı oranlar gibi şeyler yararlıdır. Bu konuda http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf adresinde daha fazla ayrıntı var ve R rmspaketi tüm bunları otomatik olarak yapıyor (doğrusal olmayan terimleri ve etkileşimleri işleme, X'in hesaplama dörtlüklerini, vb.).


5

Muhtemelen kitlenize ve disiplinize bağlıdır. Aşağıdaki cevap normalde Epidemiyoloji dergileri ve daha az ölçüde tıp dergileri için yapılır.

Açık sözlü olmak için p değerlerini umursamıyoruz. Cidden, bilmiyoruz. Epidemiyoloji , gerçekten, gerçekten acil bir gereksiniminiz olmadığı ve alanın esasen uygun olmadığı sürece bunları rapor etmenize bile izin vermeyecektir.

Soruya bağlı olarak beta tahminlerini bile önemsemeyebiliriz. Raporunuz daha metodolojik veya simülasyon odaklı bir şeye yönelikse, muhtemelen beta tahmini ve standart hatayı bildirirdim. Bir etkiyi popülasyonda tahmin edildiği gibi bildirmeye çalışıyorsanız, Oran Oranına ve% 95 Güven Aralığı'na sadık kalacağım. Bu sizin tahmininizin eti ve bu alandaki okuyucuların neyi arayacağını.

Oranlar oranını nasıl alacağınız için yukarıda, ancak OR ve% 95 CI için yanıtlar gönderildi:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)

Cevap için teşekkürler! hesaplamada 1.96'nın ne anlama geldiğini sorabilir miyim?
yukarı

1
Sorun değil :)% 95 güven aralığı, beta tahmininizin normal dağılımının kabaca 2.5. Bu noktaların her biri ortalamadan yaklaşık 1.96 standart sapmadır (bu durumda, beta).
Fomite

evet ama bunu her beta katsayısı için yapmalıyım? 1.96 da değişiyor mu? ayrıca bu binom verileri hala normal dağılıma dayanıyor mu?
yukarı

2
Evet - her beta katsayısı için bir oran oranı ve% 95 güven sınırı elde edebilirsiniz. Güven aralığı için farklı bir yüzdelik değeri (% 90,% 99 vb.) Hesaplamak istemediğiniz sürece 1.96 değişmeyecektir, ancak% 95 standart olduğu için, buna gerek yoktur. Ve günlük ölçeği üzerinde çalıştığınız sürece, bir lojistik regresyon modelinden parametreler normal olarak dağıtılır. Onları imledikten sonra, bu gerçek olmayı durdurur.
Fomite
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.