ROC eğrisi analizinde ortak değişkenler için ayarlama


20

Bu soru, ilişkili ölçeklerin varlığında ikili bir uç noktayı tahmin etmek için çok boyutlu bir tarama anketinde kesme puanlarının tahmin edilmesiyle ilgilidir.

Alkolizm taraması için kullanılabilecek bir ölçüm ölçeğinin (kişilik özellikleri) her boyutunda kesme puanları oluştururken ilişkili alt puanları kontrol etmenin ilgisi soruldu. Yani, bu özel durumda, kişi, ortak değişkenlerle ayarlanmış ROC eğrisi altında (kısmi) alana (örneğin 1-2) yol açan dış eş değişkenler (öngörücüler) üzerinde ayarlama yapmakla ilgilenmiyordu, ancak esasen diğer puanlarda aynı anketten aynıdır çünkü birbirleriyle korelasyon gösterirler (örneğin "dürtüsellik" ile "sansasyon arayışı"). Sol tarafta ilgi puanını (bir kesim aradığımız) ve aynı anketten hesaplanan başka bir puanı içeren bir GLM oluşturmak, sağ tarafta ise sonuç içme durumu olabilir.

Açıklığa kavuşturmak için (@robin isteğine göre), diyelim ki skorumuz var , diyelim x j (örneğin, kaygı, dürtüsellik, nevrotiklik, sansasyon arayışı) ve t j (yani "pozitif vaka" " x j > t j ," negatif durum "aksi takdirde) her biri için. Genellikle bu tür bir kesim yaparken (ROC eğrisi analizi kullanarak) cinsiyet veya yaş gibi diğer risk faktörleri için ayar yaparız. Şimdi, SS'nin IMP ile ilişkili olduğu bilindiğinden, dürtüsellik (IMP) 'yi cinsiyet, yaş ve sansasyon arayışı (SS) üzerinde ayarlamaya ne dersiniz? Başka bir deyişle, yaş, cinsiyet ve kaygı düzeyinin etkisinin ortadan kalktığı IMP için bir kesme değerine sahip olurduk.j=4xjtjxj>tj

Bir kesintinin olabildiğince basit kalması gerektiğini söylemenin yanı sıra, yanıtım

Değişkenler hakkında, sadece tahmin performansının artıp artmadığını görmek için ayarlamalı ve ayarsız AUC'lerin tahmin edilmesini tavsiye ederim. Burada, ortak değişkenleriniz sadece aynı ölçüm cihazından tanımlanan diğer alt skorlardır ve böyle bir durumla hiç karşılaşmadım (genellikle Yaş veya Cinsiyet gibi bilinen risk faktörlerini ayarlıyorum). [...] Ayrıca, prognostik konularla (yani anketin tarama etkinliği) ilgilendiğiniz için, pozitif tahmin değerini (PPV, doğru test sonuçları doğru olarak sınıflandırılan pozitif test sonuçları olan hastaların olasılığı) tahmin etmek de ilginizi çekebilir. anketinizdeki alt puanlarına bağlı olarak konuları "pozitif" veya "negatif" olarak sınıflandırabilirsiniz. Ancak,

Mümkün olduğunda ilgili makalelere bağlantı vererek bu özel durumu daha iyi anlıyor musunuz?

Referanslar

  1. Janes, H ve Pepe, MS (2008). Teşhis, Tarama veya Prognostik Belirteç Çalışmalarında Eş Değişkenlerin Ayarlanması: Yeni Bir Ortamda Eski Bir Kavram . Amerikan Epidemiyoloji Dergisi , 168 (1): 89-97.
  2. Janes, H ve Pepe, MS (2008). ROC Analizinde Değişkenlere Uyum Sağlama . UW Biyoistatistik Çalışma Kağıdı Serisi , Kağıt 322.

Ben bir uzman değilim ama "bir ölçüm ölçeğinin her bir boyutunda kesme puanları tasarlanırken ilişkili alt puanlar için kontrol" cümlesini biraz ezoterik buldum. Bana bir açıklama daha verebilir misiniz (aksi takdirde soruyu anlamakta zorlandım)?
robin girard

@robin Evet, temelde demek istediğim: puanımız var (örn. kaygı, dürtüsellik, nevrotiklik, sansasyon arayışı) ve t j (yani x j > t j ise "pozitif durum" , "negatif durum" aksi halde). Genellikle bu tür bir kesim yaparken (ROC eğrisi analizi kullanarak) cinsiyet veya yaş gibi diğer risk faktörlerini ayarlıyoruz. Şimdi, SS'nin IMP ile ilişkili olduğu bilindiğinden , dürtüsellik (IMP) 'yi cinsiyet, yaş ve sansasyon arayışı (SS) üzerinde ayarlamak ne olacak ? Başka bir deyişle, yaş, cinsiyet ve kaygı düzeyinin etkisinin ortadan kalktığı IMP için bir kesme değerine sahip olurduk. j=4tjxj>tj
chl

Nihai hedef, anket sorularına [ilişkili] cevaplar verildiğinde ikili bir değer tahmin etmekse, bu standart bir ikili sınıflandırma problemine çok benzemektedir. Bu şekilde düşünmek uygun olur mu? Yoksa "kesim değerleri" (ki hakkında hiçbir şey bilmediğim) bulmak çok mu önemli?
DavidR

@DavidR Fikir, istatistiksel açıdan çok sayıda uyarı ile gelen bir kesme değerine (okuma, "belirli bir değerin üzerinde risk altındaki konu") karar vermek, ancak çoğu klinisyen işe alışkın veya tercih ediyor bu yoldan. (
Yorumunuzu

Yanıtlar:


7

Analizi öngördüğünüz yol gerçekten bunu düşünmeye başlamanızı önerdiğim gibi değil. Her şeyden önce, eğer kesmeler kullanılması gerekiyorsa , kesimlerin tek tek özelliklere değil, genel olarak tahmin edilen olasılığa uygulandığını göstermek kolaydır . Tek bir ortak değişken için en uygun kesme, diğer ortak değişkenlerin tüm düzeylerine bağlıdır; sabit olamaz. İkincisi, ROC eğrileri, bireysel bir konu için optimum kararlar verme hedefine ulaşmada hiçbir rol oynamaz .

İlişkili ölçekleri ele almak için yardımcı olabilecek birçok veri azaltma tekniği vardır. Bunlardan biri, her bir öngörücünün diğer tüm öngörücülerden doğrusal olmayan bir şekilde tahmin edildiği resmi bir artıklık analizidir. Bu, redunR Hmiscpaketindeki işlevde uygulanır . Değişken kümeleme, temel bileşen analizi ve faktör analizi diğer olasılıklardır. Ancak analizin ana kısmı, benim görüşüme göre, iyi bir olasılık modeli oluşturmak olmalıdır (örneğin, ikili lojistik modeli).


1
Bireysel ve grup kararı arasındaki önemli ayrım için +1. Burada cevabınız veya medstats posta listesindeki başka bir cevabınız göz önüne alındığında, cevabınızı beklemeliydim . Ayrıca bu konuda özellikle aydınlatıcı olan Teşhis Risk Modellerine Dayalı Teşhis Yardımcı Programının Doğrudan Ölçümleri konusundaki konuşmanızı da buldum .
chl

Teşhis Riskine Dayalı Teşhis Yardımcı Programının Doğrudan Önlemleri Üzerine Konuşma artık burada bulunabilir kc.vanderbilt.edu/quant/Seminar/HarrellPresentMay12.pdf
Epifunky

3

Janes'in noktası olan ve ortak değişkenli ROC eğrileri hakkındaki Pepe makalesi, tahmini ROC eğrisi değerlerinin daha esnek bir şekilde yorumlanmasına izin vermektedir. Bu, ilgili popülasyondaki belirli gruplar arasında ROC eğrilerini katmanlaştırma yöntemidir. Tahmini gerçek pozitif fraksiyon (TPF; eşdeğer duyarlılık) ve gerçek negatif fraksiyon (TNF; eşdeğer özgüllük), "aynı [ayarlanmış değişkenin bireyleri arasında hastalık durumu göz önüne alındığında doğru bir tarama sonucunun olasılığı olasılığı" olarak yorumlanır. liste]". Bir bakışta, yapmaya çalıştığınız şey, panelinize daha fazla işaretleyici ekleyerek tanılama testinizi iyileştirmek gibi görünüyor.

Bu yöntemleri biraz daha iyi anlamak için Cox orantılı tehlikeler modeli hakkında daha iyi okumak ve Pepe'nin "Sınıflandırma ve Tıbbi Testlerin İstatistiksel Değerlendirilmesi" adlı kitabına bakmak olacaktır. Tarama güvenilirlik önlemlerinin, bir oturuş eğrisi ile birçok benzer özelliği paylaştığını ve uygun puanı bir hayatta kalma süresi olarak düşündüğünü göreceksiniz. Cox modelinin hayatta kalma eğrisinin tabakalaşmasına izin verdiği gibi, tabakalı güvenilirlik önlemleri vermeyi öneriyorlar.

Bunun bizim için önemli olmasının nedeni, ikili karma efekt modeli bağlamında haklı olabilir: varsayalım, meth bağımlısı olma riskini tahmin etmekle ilgileniyorsunuz. SES'in bu kadar bariz bir etkisi var, kişisel davranışlara dayalı olabilecek bir teşhis testini bir şekilde katmanlaştırmadan değerlendirmek aptalca görünüyor. Çünkü zengin bir insan manik ve depresif belirtiler gösterse bile, muhtemelen asla met deneyemezler. Bununla birlikte, fakir bir kişi bu tür psikolojik semptomlara (ve daha yüksek risk puanına) sahip çok daha büyük bir risk gösterecektir. Riskin kaba analizi, tahmin modelinizin performansının çok düşük olduğunu gösterecektir, çünkü iki gruptaki aynı farklılıklar güvenilir değildi. Ancak, katmanlaştıysanız (zenginlere karşı fakir),

Ortak değişken ayarının noktası, farklı katmanlar arasındaki risk modelinde düşük prevalans ve etkileşim nedeniyle farklı grupları homojen olarak değerlendirmektir.


(+1) Bu ilginç bir yanıt, çok teşekkür ederim. Bu yazı sırasındaki temel kaygım, kesme değerlerinin bir şekilde "birbirine bağlı" olacağıydı. Ama Pepe'nin kitabını kontrol edeceğim ( bu arada burada bazı bildiriler buldum ).
chl

Bir tıbbi testi geliştirmek ve değerlendirmek için aynı verileri kullanmayla ilgili sorunlar vardır, ancak düzeltme kolaydır. Bir çeşit çapraz doğrulamayı veya verileri "eğitim" ve "doğrulama" alt kümelerine bölmeyi düşünmelisiniz. Bu genellikle bir tanı / prognostik / risk tahmin modeli geliştirmek için geçerli bir yaklaşımdır.
AdamO
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.