Olasılığı en üst düzeye çıkaran bir lojistik regresyon, lineer modellere göre AUC'yi mutlaka en üst düzeye çıkarıyor mu?


13

İkili sonuçlar y{0,1}n ve bazı tahmin matrisi XRn×p olan bir veri seti verildiğinde , standart lojistik regresyon modeli binom olasılığını en üst düzeye çıkaran βMLE katsayılarını tahmin eder. X dolu olduğunda βMLE benzersizdir; mükemmel bir ayrılma olmadığında, sonludur.

Bu, maksimum olabilirlik modeli aynı zamanda ROC AUC (aka maksimize mu c -statistic), ya da bir katsayı tahmin vardır halen mevcut βAUCβMLE daha yüksek bir ROC AUC elde edecektir? MLE'nin mutlaka ROC AUC'yi maksimuma çıkarmadığı doğruysa, bu soruya bakmanın başka bir yolu da "Lojistik regresyonun ROC AUC'sini her zaman maksimize edecek olan olasılık maksimizasyonuna bir alternatif var mı?"

Modellerin aynı olduğunu varsayıyorum: X öngörücüler eklemiyor veya kaldırmıyoruz veya model spesifikasyonunu başka bir şekilde değiştirmiyoruz ve olasılık maksimize edici ve AUC maksimize edici modellerin aynı bağlantı işlevini kullandığını varsayıyorum.


2
Şüphesiz örneğin bazı bağlantı işlevi logit daha iyi bir uyum oluşturur olur? Bunun dışında, veri oluşturma sürecinin logit olarak kabul edilip edilemeyeceği iyi bir soru. βAUCβMLE
Nutle

Güzel soru ama bunu düşün. ROC ve AUC iki farklı modeli karşılaştırmak için kullanılır, bu nedenle herhangi bir modelin MLE tahmini için bir çözüm benzersizse, bu, yalnızca mevcut modelin özelliklerini değiştirirseniz ve yeni bir farklı tahmin ederseniz farklı bir AUC elde edebileceğiniz anlamına gelir. MLE üzerinden model. Bu noktada başka bir soru şu olurdu: Yeni “daha ​​iyi” betalara yol açan katsayıların farklı tahminlerine ulaşabilmem için aynı model için geçerli olan basit MLE dışında başka bir “daha ​​iyi” tahmin yöntemi (maksimizasyon algoritması ecc) var mı? yüksek AUC ile?
Fr1

@Nutle tam olarak, bu farklı bir özellik olurdu
Fr1

@ Fr1 Evet, benzersiz olan budur. Sorumda ima ettiğim şey "ne daha yüksek bir AUC elde eden MLE'ye bir alternatif varsa?" Daha yüksek bir AUC elde eden farklı bir doğrusal modelin (MLE'den başka bir model) olduğu doğruysa, bunu bilmek ilginç olacaktır.
Sycorax, Reinstate Monica'ya

1
@Sycorax Başka türlü varsayalım ne? :) biz eğer bu yana Varsayımlar, önemli olan bilmek kullanılan bağlantı ve değişkenleri ile gerçek DGP, MLE değişmez en güçlü tarafsız bir istatistiktir.
Nutle

Yanıtlar:


11

βMLE=βAUC olması durum böyle değildir .

Bunu açıklamak için AUC'nin

P(y^1>y^0|y1=1,y0=0)

βMLE

βAUCββMLEβAUC

EDIT (yorumu cevaba taşıyor)

xx>6βxxβMLE<0


1
(+1) Ah! Tabii ki - sipariş vermekle ilgili olduğundan, olasılık değerini değiştirmesi gereken kesişmeyi keyfi olarak değiştirebiliriz, ancak özellik aynı katsayıların değişmediği için sipariş aynı olmalıdır, bu nedenle AUC sabit kalacaktır.
Sycorax, Reinstate Monica'ya

nxn

nnn

xn
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.