Lojistik bir regresyon modeline uymak


28

Lojistik bir regresyon modelini giymek mümkün mü? ROC eğrisinin altındaki alanım% 95'in üzerindeyse, fazla takılma ihtimalinin yüksek olduğunu, ancak bir lojistik regresyon modelinin üstesinden gelmenin mümkün olduğunu söyleyen bir video gördüm.


1
Hangi videoyu söyleyebilir veya en azından biraz daha fazla içerik verebilir mi?
Glen_b -Reinstate Monica 12:13

2
Tabii @Glen_b, video şuydu: link Yorum 40 dakika idi. Şöyle diyordu: ROC 0,5 ile 0,6 arasında AUC ye sahipse Zayıftı. 0,6 ile 0,7 arasında ise ortalamanın altındadır. 0,7 ile 0,75 arasında ise ortalama / İyi. 0,75 ve 0,8 arasında iyidir. 0,8 ile 0,9 arasındaysa, Mükemmel. 0,9'dan yüksekse şüphelidir ve 0,95'ten yüksekse aşırı donuktur. Bu açıklamanın anlaşılması çok kolay, ancak doğru mu buldum? Çünkü bu düşünceyi yedekleyecek bir şey arıyorum ama bulamıyorum.
carlosedubarreto

Ve @ AdamO’nun verdiği açıklama Glen_B, videoda gördüğüm açıklamanın tam olarak doğru olmadığını, ama belki de Adam’ın açıklamasını yanlış anladığımı gösteriyor. Bu Statiscs olayı çok karmaşık, ama derinlere dalmak gerçekten büyük bir zevk. :)
carlosedubarreto 12:13

AdamO'nun açıklamasının iyi olduğunu düşünüyorum. daha sonraki bir okuyucu (örneğin benzer sorusu olan biri), ne söylendiğini bilme bağlamını isteyebilir. Yorumdaki açıklamanızın çoğu insan için yeterli bağlam sağladığını ve bağlantının geri kalanını yapacağını düşünüyorum. Çok teşekkür ederim! Sorunuzu daha kullanışlı hale getirdiniz.
Glen_b -Reinstate Monica 12:13

Çok teşekkürler @Glen_b, sahip olduğumuz bu harika aracı (bu forum) nasıl kullanacağımı öğreniyorum. Yeni sorular sorurken ipucunuzu aklımda tutacağım.
carlosedubarreto 12:13

Yanıtlar:


35

Evet, lojistik regresyon modellerinin üzerine geçebilirsiniz. Ama önce, AUC (Alıcının Çalışma Karakteristik Eğrisi Altındaki Alan) hakkındaki noktaya değinmek istiyorum: AUC ile hiçbir zaman evrensel bir kural yoktur.

AUC'nin anlamı , rastgele örneklenmiş bir pozitifin (veya durumun) negatif ((kontrol)) değerinden daha yüksek bir marker değerine sahip olma olasılığıdır, çünkü AUC matematiksel olarak U istatistikine eşdeğerdir.

AUC'nin ne olmadığı standart bir prediktif doğruluk ölçütüdür. Çok deterministik olaylar,% 95 veya daha yüksek tekli tahminli AUC'lere sahip olabilir (örneğin, kontrollü mekatronik, robotik veya optikler gibi), bazı karmaşık çok değişkenli lojistik risk tahmin modelleri, meme kanseri risk tahminleri gibi% 64 veya daha düşük AUC değerlerine sahiptir. Muhtemelen yüksek düzeyde tahminsel doğruluk.

Bir güç analizinde olduğu gibi mantıklı bir AUC değeri, apriori çalışmasının arka planı ve amaçları hakkında bilgi toplanarak belirlenir . Doktor / mühendis ne istediklerini açıklar ve istatistikçi, öngörücü modeliniz için hedef AUC değerine karar verirsiniz. Ardından soruşturmaya başlar.

Lojistik bir regresyon modelinin üstesinden gelmek gerçekten mümkün. Doğrusal bağımlılığın yanı sıra (eğer model matris eksikse), aynı zamanda mükemmel bir uyumluluğa sahip olabilirsiniz veya bu, Y'ye karşı verilen değerlerin grafiği durumları ve kontrolleri mükemmel şekilde ayırt eder. Bu durumda, parametreleriniz bir araya gelmedi, ancak basitçe, bir olasılığı veren sınır alanı üzerinde bir yerde durdu . Bununla birlikte, bazen, AUC tek başına rastgele şans eseri 1'dir.

2βpnπ(1π)π=Prob(Y=1)p


y

π

Amaçlanacak uygun AUC değerini nasıl belirlersiniz?
Kevin H. Lin,

1
@ KevinH.Lin Sorunun doğasına bağlıdır. Bağlamsal olarak uygun bilgiyi ne kadar çok dahil ederseniz, o kadar iyidir. Bu, modelin değerlendirdiği, mevcut (rekabet eden) modellerin performansını, maliyet etkinliği değişimlerini ve yeni uygulamaların ve / veya tavsiyelerin benimsenmesini çevreleyen politikaları değerlendiren hastalığın veya durumun altında yatan prevalans ya da yük olacaktır. Bu konuda hiçbir şey siyah ve beyaz değil, ama pek çok şey gibi, istatistikçi olarak belirlediğiniz bir AUC değeri lehine ikna etmeyi ve mantıklı bir şekilde ikna etmeyi savunmanız gerekir.
AdamO

1
@ KevinH.Lin Herhangi bir geçerli cevabın istediğiniz göründüğü kadar açık ve öz olacağını sanmıyorum. "Hangi arabayı almalıyım?" Diye sormak gibi. :) Sizi ilgilendiren ilgili araştırma alanındaki AUC'leri inceleyen makaleleri incelemenizi öneririm. Meme kanseri için risk tahmin modellerinde ve Tice, Gail ve Barlow'un çalışmalarında diğerleri arasında 0.65'lik bir AUC'nin, 1-20'den az vaka vakası prevalansı olan popülasyona dayalı tahmin modelleri için çok çekici olduğunu gördüm. RR 1.5 ve 3.
RR'ye

6

Basit bir ifadeyle .... bir çok donanıma bağlı lojistik regresyon modelinin büyük bir varyansı vardır, karar değişkeni büyük ölçüde değişken büyüklükteki küçük değişiklikler için değişir. görüntüyü takip etmeyi düşünün, çoğu en fazla donanımlı lojistik modeldir, karar sınırında çok fazla sayıda yoktur. iniş ve çıkışların ortaları sadece uygun iken orta derecede değişkenlik ve orta derecede önyargıya sahiptir. soldaki kişi yüksek önyargıya sahip ancak çok daha az farklı. bir şey daha_ Bir kıyafeti giydirme modelinde çok fazla özellik bulunurken, iç çamaşırı modelinde daha az hayır bulunur. özelliklerin. görüntü altında kıyafet, sadece kıyafet ve kıyafet lojistik resion modeli.  Mavi renkli işaretleyici karar sınırlarını gösteriyor.


8
Lütfen resim için referans ekleyin (aslında Andrew Ng'un kursu).
Alexander Rodin,

5

Tüm popülasyona uysa bile (popülasyon sınırlıysa), herhangi bir yöntemle daha fazla donanım kullanabilirsiniz. Sorunun iki genel çözümü vardır: (1) cezalandırılmış azami olabilirlik tahmini (ridge regresyonu, elastik ağ, kement, vb.) Ve (2) Bayesian modelinde bilgilendirici önceliklerin kullanılması.

YYYY


4

Herhangi bir model var mı, lojistik regresyonu bir kenara bırakın, fazladan giymenin mümkün olmadığı?

Aşırı uyum temel olarak ortaya çıkar, çünkü tüm popülasyona değil bir örneğe uyursunuz. Örneğinizin eserleri nüfusun özellikleri gibi görünebilir ve bunlar değildir ve bu nedenle fazladan acı çeker.

Dış geçerlilik meselesine benziyor. Yalnızca örnek kullanarak, göremediğiniz gerçek popülasyonda size en iyi performansı veren bir model almaya çalışıyorsunuz.

Elbette, bazı model biçimlerinin veya prosedürlerinin diğerlerine göre daha fazla giydirilebileceği daha muhtemeldir, ancak hiçbir model gereğinden fazla giydirmekten gerçekten bağışık değildir, öyle değil mi?

Numune dışı doğrulama, düzenlileştirme prosedürleri vb. Sadece aşırı uyuma karşı koruyabilir, ancak gümüş mermi yoktur. Aslında eğer biri, monte edilmiş bir modele dayalı gerçek bir dünya tahmininde bulunma konusundaki güvenini tahmin etmek istiyorsa, her zaman bir miktar fazla abartmanın gerçekten gerçekleştiğini varsaymalıdır.

Ne ölçüde değişebileceği, ancak bir veri tutma veri setinde doğrulanmış bir model bile, veri tutma veri setinde elde edilenlerle eşleşecek nadiren vahşi performans gösterecektir. Aşırı uyum ve büyük bir nedensel faktördür.


0

Aşırı uyumu kontrol etmek için Roc ile yaptığımız şey, eğitim setinde veri setini rastgele ayırmak ve AUC'yi bu gruplar arasında karşılaştırmak. Eğer AUC “fazla” ise (eğitim kurallarında da bir kural yoktur) eğitimde daha büyük olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.