İkili sonuçlar için göreceli riski tahmin etmek için Poisson regresyonu


42

Kısa özet

Poisson regresyonunun aksine (göreceli risklerle), ikili sonuçlara sahip kohort çalışmalarında lojistik regresyonun (oran oranlarıyla) kullanılması neden daha yaygın?

Arka fon

Lisans ve lisansüstü istatistik ve epidemiyoloji kursları, benim deneyimlerime göre, genellikle risk oranları tahmin oranları olarak rapor edilen ikili tahminlerle verileri modellemek için lojistik regresyonun kullanılması gerektiğini öğretiyor.

Bununla birlikte, Poisson regresyonu (ve ilgili: quasi-Poisson, negatif binom vb.) Verileri ikili sonuçlarla modellemek için kullanılabilir ve uygun yöntemlerle (örn. Sağlam sandviç varyans tahmincisi) geçerli risk tahminleri ve güven seviyeleri sağlar. Örneğin,

Poisson regresyonundan, bazılarının, özellikle sık sonuçlar için ve özellikle istatistiklerde güçlü bir geçmişi olmayan bireyler için, oran oranlarıyla karşılaştırılmasının daha kolay olduğunu iddia ettiği göreceli riskler rapor edilebilir. Zhang J. ve Yu KF'yi görün , göreceli risk nedir? Ortak sonuçların kohort çalışmalarında oran oranını düzeltme yöntemi , JAMA. 1998 Kas 18; 280 (19): 1690-1.

Tıbbi literatürü okumaktan, ikili sonuçlara sahip olan kohort çalışmaları arasında, Poisson regresyonlarının nispi risklerinden ziyade lojistik regresyonlardan olasılık oranlarını bildirmenin çok daha yaygın olduğu görülmektedir.

Sorular

İkili sonuçları olan kohort çalışmaları için:

  1. Poisson regresyonlarının göreceli risklerinden ziyade lojistik oranlarındaki oranları rapor etmek için iyi bir sebep var mı?
  2. Olmazsa, Poisson regresyonlarının tıbbi literatürdeki göreceli risklere sahip olma sıklığı, çoğunlukla bilim adamları, klinisyenler, istatistikçiler ve epidemiyologlar arasındaki metodolojik teori ve pratik arasındaki gecikmeye bağlanabilir mi?
  3. Orta seviye istatistikler ve epidemiyoloji kursları ikili sonuçlar için Poisson regresyonunun daha fazla tartışılmasını içermeli midir?
  4. Öğrencileri ve meslektaşları uygun olduğunda lojistik regresyonda Poisson regresyonunu düşünmeye teşvik etmeli miyim?

Göreceli bir risk istiyorsanız, neden sadece logom ile binom regresyon kullanmıyorsunuz (lojistik yerine)? Poisson ailesinin ortalama varyans ilişkisi, gözlem başına olası olayların sayısını belirlemişseniz çok anlamlı değildir.
Andrew M,

@AndrewM Log linkli Binom regresyonunu nasıl uygularsınız? Regresörün pozitif değerleri, 1'den büyük olasılık değerleri anlamına gelir.
Rufo

@Rufo: Seni anlarsam, buna regresör yerine doğrusal öngörücü derim. Ve evet, parametre alanı şimdi sınırlandırılmıştır, böylece lojistik link için sınırlandırılmamış durumdan farklı olarak doğrusal öngörücü negatif olur. Tahmini cevabınız (yeni verilerde) dışında olabilir , ancak bir MLE'nin her zaman var olacağına inanıyorum (belki parametre alanının sınırında olabilir). Bu modeller bazen sığacak kadar titiz. [0,1]
Andrew M

@AndrewM Evet, doğrusal yordayıcılığım var, teşekkür ederim :). Ancak modeli uygulamayı başarsanız bile, bunun yeterli olduğundan emin değilim. İlk cevapta yaptığım bir yorumda belirttiğim gibi, 1s için 0s değiştirirseniz ve yanıt değişkeni için tersi yaparsanız, log bağlantısı 0,5 civarında simetrik olmadığı için, göreceli risklerin tahminleri farklıdır ( exp(beta_M1) =/= 1/exp(beta_M2)). Bu beni biraz rahatsız ediyor.
Rufo

1
@Rufo: Tabii ki karşılıklı değil. Göreceli bir risk hesaplıyorsunuz: ve , hangi bağlantı işlevini kullanırsanız kullanın, genel olarak. P(Y|X)/P(Y|Xc)P(Y|X)/P(Y|Xc)P(Yc|X)/P(Yc|Xc)
Andrew M

Yanıtlar:


28

Dördüncü sorularınızın tümüne bir not tarafından cevap olarak cevap verilmiştir:

Modern epidemiyoloji çalışmalarında, bir kohort çalışması için lojistik bir regresyondan bir olasılık oranı bildirmesi bu kadar yaygın değildir . Vaka kontrol çalışmaları için tercih edilen regresyon tekniği olmaya devam etmektedir, ancak daha sofistike teknikler artık Epidemiyoloji , AJE veya IJE gibi büyük epidemiyoloji dergilerinde analiz için fiili standartlardır.. Gözlemsel çalışmaların sonuçlarını bildiren klinik dergilerde ortaya çıkma eğilimi daha fazla olacaktır. Poisson regresyonu iki bağlamda kullanılabileceğinden, bazı problemler de ortaya çıkacaktır: Bahsettiğiniz şey, binom regresyon modelinin yerine geçiyor ve kohort için son derece yaygın olan bir olay olayı bağlamında çalışmaları. Belirli soru cevaplarında daha fazla ayrıntı:

  1. Bir kohort çalışması için, gerçekten hayır. Parçalı bir lojistik modelin kullanılmış olabileceği son derece spesifik bazı durumlar vardır , ancak bunlar aykırı değerlerdir. Bütün noktası bir kohort çalışmanın doğrudan göreceli risk veya birçok ilgili tedbirler ölçebilir ve bir olasılık oranı güvenmek zorunda kalmamasıdır. Ancak iki not yazacağım: Poisson regresyonu genellikle bir oran tahmin ediyorBir risk değil ve bu nedenle bundan kaynaklanan etki oranı genellikle oran oranı (özellikle zihnimde, dolayısıyla RR'yi kısaltabilirsiniz) veya bir sıklık yoğunluğu oranını (IRR veya IDR) kısaltabilirsiniz. Bu nedenle, aramanızda gerçekten doğru terimleri aradığınızdan emin olun: hayatta kalma analizi yöntemlerini kullanan birçok kohort çalışması vardır. Bu çalışmalar için Poisson regresyonu, tehlikenin sabit olduğu konusunda problemli bazı varsayımlarda bulunur. Bu nedenle, Poisson modelleri yerine Cox orantılı tehlike modelleri kullanarak bir kohort çalışmasını analiz etmek ve daha sonraki tehlike oranını (İK) bildirmek çok daha yaygındır. Bir kohortu analiz etmek için bir "varsayılan" yöntem belirtmek için basılırsa, epidemiyolojinin aslında Cox modelinin hakim olduğunu söyleyebilirim. Bunun kendine has sorunları var ve çok iyi epidemiyologlar bunu değiştirmek istiyor.

  2. Bu sıklığı atfedilebileceğim iki şey var - önerdiğiniz ölçüde var olduğunu sanmadığım bir sıklık. Birincisi, evet - bir alan olarak "epidemiyoloji" tam olarak kapalı değildir ve klinisyenler, sosyal bilimciler vb. Gibi çeşitli istatistiksel geçmişlere sahip epidemiyologlardan çok sayıda makale alırsınız. Lojistik modeli genel olarak öğretilir ve benim deneyimlerime göre birçok araştırmacı daha iyi bir araç üzerinde tanıdık araca yönelecek.

    İkincisi, aslında "kohort" çalışması ile ne demek istediğinizi sorudur. Cox modeli veya Poisson modeli gibi bir şey, gerçek bir insan-zaman tahminine ihtiyaç duyar. Poisson veya Cox modelleri gibi hayatta kalma yöntemlerinin çok yararlı olmadığı, özellikle de belirli bir süre için biraz kapalı bir popülasyonu izleyen bir kohort çalışması yapmak mümkündür - özellikle de Epi'ye erken giriş örnekleri. Lojistik modeli kutuyeterince düşük hastalık prevalansı ile göreceli bir riske yaklaşan bir oran oranını tahmin etmek için kullanılabilir. Onu doğrudan tahmin eden diğer regresyon teknikleri, binom regresyon gibi, yeni bir öğrenciyi kolayca raydan çıkarabilecek yakınsama sorunları var. Aldığın Zou kağıtlarının her ikisinin de binom regresyonun yakınsama sorunlarını çözmek için Poisson regresyon tekniği kullandığını unutmayın. Fakat binom uygun kohort çalışmaları aslında "kohort çalışma pastası" nın küçük bir kesitidir.

  3. Evet. Açıkçası, hayatta kalma analizi yöntemleri sık sık olduğundan daha erken gelmelidir. Evcil hayvan teorim, bunun böyle olmamasının nedeni lojistik regresyon gibi yöntemlerin kodlanmasının daha kolay olmasıdır . Kodlanması daha kolay olan ancak etki tahminlerinin geçerliliği hakkında daha fazla bilgi içeren teknikler, sorun olan "temel" standart olarak öğretilir.

  4. Öğrencileri ve meslektaşları uygun aracı kullanmaya teşvik etmelisiniz. Genel olarak bu alan için, çoğu gözden geçirenin hızlı bir şekilde sürekli bir tehlike varsayımıyla ilgili endişeleri ortaya koyacağı (ve gerektiği gibi), Poisson regresyonu üzerine Cox modelini göz önüne almaktan muhtemelen daha iyi olacağını düşünüyorum. Ama evet, onları en kısa sürede "Sorumumu lojistik bir regresyon modeline nasıl bağlarım?" daha iyi kapalı hepimiz olacağız. Ancak evet, zamansız bir çalışmaya bakarsanız, öğrenciler hem binom regresyonu ile hem de yakınsama problemleri durumunda kullanılabilecek Poisson regresyonu gibi alternatif yaklaşımlarla tanıştırılmalıdır.


Bunu doğrudan tahmin eden diğer regresyon teknikleri derken [göreceli risk, sanırım], binom regresyon gibi, yakınsama sorunları var [...] , binom regresyonunu nasıl göreceli olarak size uygularsınız? @AndrewM bir log bağlantısı öneriyor, ancak başarı ihtimalini 1'den daha yüksek tahmin etme probleminden nasıl kaçınacağınızı göremiyorum.
Rufo

@Rufo Bir kohortla çalıştırıldığında log-linkli binom model, göreceli riski tahmin edecektir. Bu modellerin bazen 1'den büyük olasılıkları tahmin etmesinin gerçekten de binom modellerinin uygulanması gerekenden daha zor olmasının nedenlerinden biridir. Ancak bunları kullanmayı başardım - verilerinizin genellikle 1'in altında olasılıklara sahip olması yararlıdır , bu nedenle model hiçbir zaman endişelendiğiniz bir problemle sonuçlanmayabilir.
Fomite

Günlük bağlantı işlevi, yanıt değişkeninizi kodlamanıza bağlı olarak farklı sonuçlar vermez mi? Yani, 1s için 0s değiştirirseniz ve bunun tersi varsa, log bağlantısı 0,5 civarında simetrik olmadığı için , eş değişkenlerin belirli değerleri verilen parametresi için tahminler ve tahmin tahminleri farklıdır. Bu beni biraz rahatsız ediyor. p
Rufo

9

Ben de göreceli bir risk modelinin daha uygun olacağı durumlarda, literatürdeki lojistik modellerin prevalansını da tahmin ediyorum. Biz istatistikçiler olarak hepimiz kongreye uymayı ya da "açılır menü" analizlerine sadık kalmayı biliyoruz. Bunlar çözdüklerinden çok daha fazla sorun yaratırlar. Lojistik regresyon, bir bireyin ölüm veya sakatlık gibi evet / hayır şeklinde bir sonucu olduğu ikili sonuçları analiz etmek için "raf aracından standart" olarak öğretilir.

Poisson regresyonu sıklıkla sayıları analiz etmek için bir yöntem olarak öğretilir . Böyle bir olasılık modelinin, özellikle nadir olduklarında, 0/1 sonuçlarının modellenmesinde son derece iyi çalıştığını biraz vurgulamak gerekir. Bununla birlikte, lojistik bir model de nadir sonuçlarla iyi bir şekilde uygulanmaktadır: olasılık oranı, vaka kontrol çalışmalarında olduğu gibi sonuca bağlı örneklemede bile yaklaşık bir risk oranıdır. Aynısı göreceli risk veya Poisson modelleri için söylenemez.

Bir poisson modeli, bireylerin bir kereden fazla “sonucu” olduğu zaman faydalıdır ve herpes salgınları, hastaneye yatış veya meme kanserleri gibi kümülatif insidans ile ilgilenebilirsiniz. Bu sebeple, üstelleştirilmiş katsayılar göreceli oranlar olarak yorumlanabilir . Oranlar ve riskler arasındaki farkı belaborlamak için: 1000 kişi-yıl başına 100 vaka varsa, ancak bir bireyde her 100 vaka olsaydı, insidans (oran) hala 10 kişi-yıl başına 1 vakadır. Bir sağlık hizmeti sunumu ortamında, hala 100 vakayı tedavi etmeniz gerekir ve insanların% 80'ini aşılama oranının% 80'lik bir oranda azalma (bir priori) vardır. Ancak en az bir sonucun riski 1/1000'dir. Sonuç ve sorunun doğası birlikte hangi modelin uygun olduğunu belirler.

"Göreceli oranları tahmin etmek için bir Poisson regresyon modeline uyuyoruz" derken endişeleneceğim çünkü bu, sonucun doğası ve bir kişinin bunu birden fazla deneyimleyip deneyemeyeceği konusunda bir karışıklık yaratabilir. Göreceli risklerle ilgileniyorsanız, bunu söylemelisiniz ve ikili olaylar aşağıdaki ortalama varyans ilişkisine sahip olduğunda, ortalamanın sonuçla orantılı olduğu uygun olmayan varyans varsayımının hassasiyetlerini tartışmaya hazır olun:var(y)=E(y)(1E(y))

Anladığım kadarıyla eğer bilimsel ilgi göreceli oranları tahmin etmekteyse, melez bir model var: lojistik varyans yapısını ve poisson ortalama yapısını kullanan bir GLM olan göreceli risk regresyonu. Yani: ve ,var ( Y ) = E [ Y ] ( 1 - D [ E ] )log(E[Y|X])=β0+β1Xvar(Y)=E[Y](1E[Y])

Bu arada, Zhang makalesi, durdurma terimindeki değişkenliği hesaba katmayan göreceli risk tahminine dayanan önyargılı çıkarım tahmininde bulunur. Tahminciyi önyükleme yaparak düzeltebilirsiniz.

Belirli soruları cevaplamak için:

  1. Sonuç nadir ise, yaklaşık olarak aynıdır. Eğer sonuç yaygınsa, Poisson’tan göreceli oran tahmin edicinin varyansı aşırı şişmiş olabilir ve oran oranını bir ikili sonuç ile birkaç maruz kalma arasındaki ilişkinin yanlı ama etkili bir tahmini olarak tercih edebiliriz. Ayrıca vaka kontrol çalışmalarının, oran oranının, sonuca bağlı örneklemeyle değişmeyen bir ölçü olarak kullanılmasını haklı çıkardığını düşünüyorum. Scott ve Wild 97 bununla ilgili yöntemleri tartışıyor. Tabii ki, diğer dergilerde istatistiksel eleştirmenler olmayabilir.

2.3. Bence tıbbi inceleme ve akademisyenler için neler olduğu konusunda fazla suçluyor ve varsayıyorsunuz.

  1. Her zaman öğrencilerinizi mümkün olduğunda uygun modelleri kullanmaya teşvik etmelisiniz.

http://biostats.bepress.com/cgi/viewcontent.cgi?article=1128&context=uwbiostat


2
“Anladığım kadarıyla eğer bilimsel ilgi göreceli oranları tahmin etmekten ibaretse, hibrit bir model var: lojistik varyans yapısını ve poisson ortalama yapısını kullanan bir GLM olan göreceli risk regresyonu”: Ayrıca log bağlantısı olan binom regresyonu olarak da bilinir.
Andrew M,

2
@AndrewM Gerçekten. Aslında, bunun tercih edilen dil olduğunu düşünüyorum. Gösterdiğin için teşekkürler. Poisson modelinin yanlış bir ortalama-varyans ilişkisi olduğu için Poisson modelinin "çalışma modeli" olduğunu vurgulayan Thomas Lumley'den bir çalışma makalesine atıfta bulunma sorusunu değiştirdim.
AdamO, 17:16

"Sonuç nadirse bunlar yaklaşık olarak aynı" derken ne demek istiyorsunuz ? Prevalansı tahmin etmek için RR yerine OR kullanmak için "nadir" sonucun maksimum yüzdesi nedir?
vasili111

1
@ vasili111 bu açıkça bir cevabı olmayan çok tartışılan bir konudur. Günümüzde, insidansın o kadar nadir olmadığı durumlarda “nadir” bir varsayım yapan birçok eleştiriyi görüyorsunuz, örneğin 1/30 gibi. Ve çok değişkenli modellerde her şey yolunda gider!
AdamO
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.