Duyarlılık veya özgüllük bir yaygınlık işlevi midir?


10

Standart öğretim, duyarlılık ve özgüllüğün testin özellikleri olduğunu ve yaygınlıktan bağımsız olduğunu söylüyor. Ama bu sadece bir varsayım değil mi?

Harrison'ın dahiliye prensipleri 19. baskı diyor

Duyarlılık ve özgüllüğün test doğruluğunun yaygınlığından bağımsız parametreler olduğu uzun zamandır iddia edilmektedir ve birçok metin hala bu ifadeyi yapmaktadır. Bununla birlikte, bu istatistiksel olarak yararlı varsayım klinik olarak basittir. ... hastanede yatan hastalarda test duyarlılığı daha yüksek ve ayakta tedavi gören hastalarda test özgüllüğü daha yüksek olacaktır.

(Prevalans yatarak tedavi gören hastalarda tipik olarak ayakta tedavi görenlerden daha yüksektir)

Bu parametreler arasında matematiksel veya yaklaşık bir grafik ilişki var mı?

Bu bağlantı bile ona 'basitleştirme' diyor. Neden?

Düzenleme: Hassasiyetin nasıl tanımlandığını biliyorum. Cevaplarda belirtildiği gibi, herhangi bir yaygınlık terimi yoktur. Ben, bunların, bu ifadeyle karşılaşana kadar soruyu, kullanılan popülasyondan etkilenmeyen testin özellikleri olduğunu iddia ettim. Ama sanırım bu karışıklık, tanımlamanın değil, bu değerlerin pratik hesaplamasından kaynaklanıyor. Özgüllük ve duyarlılık 2x2 tablolar kullanılarak hesaplanır, burada referans popülasyonun yaygınlığı önemli midir? Bahsettikleri bu mu? Varsa, işlevi nedir?

Yanıtlar:


4

@ Tim ♦ ve @ gung ♦ 'ın cevapları hemen hemen her şeyi kapsıyor olsa da, her ikisini de tek bir sentezlemeye çalışacağım ve daha fazla açıklama sunacağım.

Alıntılanan çizgilerin bağlamı, en yaygın olduğu gibi, çoğunlukla belirli bir Eşik şeklinde klinik testlere atıfta bulunabilir. Bir hastalık düşünün ve olarak adlandırılan sağlıklı durumu içeren dışındaki her şeyi düşünün . Testimiz için, için iyi bir tahmin elde etmemizi sağlayan bazı proxy ölçümleri bulmak istiyoruz . (1) Mutlak özgüllük / duyarlılık almamamızın nedeni, proxy miktarımızın değerleriyle mükemmel bir şekilde ilişkili olmamasıdır. hastalık durumu, ancak sadece genel olarak bununla bağlantılıdır ve bu nedenle, bireysel ölçümlerde, bu miktarın için eşikimizi geçme şansımız olabilir.D D c D D cDDDcDDcbireyler ve tersi. Anlaşılır olması açısından, değişkenlik için bir Gauss Modelini varsayalım.

Diyelim ki proxy miktarı olarak kullanıyoruz . Eğer güzel seçilmiş olup, daha sonra daha yüksek olmalıdır ( beklenen değer operatörüdür). Şimdi, nin aslında her biri için gittikçe artan bir beklenen değere sahip 3 derece , , şiddetinden oluşan kompozit bir durum ( ) olduğunu fark ettiğimizde ortaya çıkar . Tek bir kişi için, kategorisinden veya seçilenx E [ x D ] E [ x D c ]xxE[xD]E[xDc]D D c D 1 D 2 D 3 x D D c x T D D c x T D x D cEDDcD1D2D3xDDckategorisinde, 'testin' pozitif çıkıp çıkma olasılığı, seçtiğimiz eşik değerine bağlı olacaktır. Bize seçim diyelim ikisine birden sahip gerçekten rastgele bir örneği inceleyerek dayalı ve bireyler. Bizim bazı yanlış pozitif ve negatif neden olacaktır. Rastgele bir kişisi , yeşil grafik tarafından verilirse değerini ve kırmızı grafikle rastgele seçilmiş bir kişisininkini .xTDDcxTDxDcresim açıklamasını buraya girin

Elde edilen gerçek sayılar ve bireylerin gerçek sayılarına bağlı olacaktır, ancak ortaya çıkan özgüllük ve duyarlılık değişmeyecektir. Let kümülatif olasılık fonksiyonu. Daha sonra, hastalığının prevalansı için, testimizin kombine popülasyonda gerçekte nasıl performans gösterdiğini görmeye çalıştığımızda, genel durumdan bekleneceği gibi 2x2'lik bir tablo.D c F ( ) p DDDcF()pD

(D,+)=p(1FD(xT))
(Dc,)=(1p)(1FDc(xT))
(D,)=p(FD(xT))
(Dc,+)=(1p)FDc(xT)

Gerçek sayılar bağımlıdır, ancak hassasiyet ve özgüllük bağımsızdır. Ancak, bunların her ikisi de ve ' bağımlıdır . Dolayısıyla, bunları etkileyen tüm faktörler bu metrikleri kesinlikle değiştirecektir. Örneğin, yoğun bakım ünitesinde , yerine ile değiştirilecekti ve ayaktan hastalardan bahsediyorsak, . Hastanede, prevalansın da farklı olması ayrı bir konudur,ppFDFDcFDFD3FD1ancak duyarlılıkların ve özelliklerin farklı olmasına neden olan farklı yaygınlık değil, farklı dağılımdır, çünkü eşiğin tanımlandığı model ayaktan veya yatan hasta olarak görünen popülasyon için geçerli değildi . Birden fazla alt popülasyonda devam edebilir ve parçalayabilirsiniz , çünkü yatan alt bölümünün de diğer nedenlerden dolayı yükselmiş bir olması gerekir (çünkü çoğu proxy de diğer ciddi koşullarda 'yükseltilir'). Ve kırılma bu ise alt popülasyonunun içine nüfus, sensitivite değişikliği açıklayan popülasyonunda değişiklikler karşılık gelen (spesifiklik değişikliği açıklayan veDcDcxDDcFDFDc ) .Bu bileşik grafiğinin gerçekte içerdiği şeydir . Renklerin Her aslında kendi olacaktır ve dolayısıyla sürece bu differes olarak hangi orijinal duyarlılık ve özgüllük hesaplandı bu ölçümler değişecektir.DFF

resim açıklamasını buraya girin

Misal

Sırasıyla 10000 Dc, 500.750.300 D1, D2, D3 ile 11550 kişilik bir nüfusu varsayalım. Yorumlanan kısım, yukarıdaki grafikler için kullanılan koddur.

set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))

#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')

Dc, D1, D2, D3 ve D bileşiği dahil olmak üzere çeşitli popülasyonlar için x-araçlarını kolayca hesaplayabiliriz.

mean(dc) 
mean(d1) 
mean(d2) 
mean(d3) 
mean(as.numeric(d[,1]))

> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382

Orijinal Test durumumuz için 2x2'lik bir tablo elde etmek için, ilk önce verilere göre bir eşik belirleriz (gerçek durumda test @ gung gösterdiği gibi çalıştırıldıktan sonra ayarlanır). Her neyse, 13.5 eşiği varsayarak, tüm popülasyonda hesaplandığında aşağıdaki hassasiyet ve özgüllüğü elde ederiz.

sdc<-sample(dc,0.1*length(dc)) 
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3))) 
threshold<-13.5 
truepositive<-sum(sdcomposite>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sdcomposite<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity<-truepositive/length(sdcomposite) 
specificity<-truenegative/length(sdc) 
print(c(sensitivity,specificity))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928  72  16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000

Ayaktan hastalarla çalıştığımızı ve hastalıklı hastaları sadece D1 oranından aldığımızı varsayalım ya da sadece D3 aldığımız YBÜ'de çalışıyoruz. (daha genel bir durum için, Dc bileşenini de ayırmamız gerekir) Hassasiyetimiz ve özgüllüğümüz nasıl değişir? Prevalansı değiştirerek (yani, her iki duruma ait hastaların nispi oranını değiştirerek, özgüllüğü ve duyarlılığı hiç değiştirmiyoruz.

sdc<-sample(dc,0.1*length(dc)) 
sd1<-sample(d1,0.1*length(d1)) 
truepositive<-sum(sd1>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd1<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity1<-truepositive/length(sd1) 
specificity1<-truenegative/length(sdc) 
print(c(sensitivity1,specificity1)) 
sdc<-sample(dc,0.1*length(dc)) 
sd3<-sample(d3,0.1*length(d3)) 
truepositive<-sum(sd3>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd3<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity3<-truepositive/length(sd3) 
specificity3<-truenegative/length(sdc) 
print(c(sensitivity3,specificity3))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  38 931  69  12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  30 944  56   0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944

Özetlemek gerekirse, duyarlılık değişimini gösteren bir grafik (özgüllük benzer bir eğilimi izleyecekti, alt popülasyonlardan Dc popülasyonunu da bestelemiş olsaydık) popülasyon için değişen ortalama x ile, işte bir grafik

df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3))) 
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))

resim açıklamasını buraya girin

  1. Proxy değilse, teknik olarak% 100 özgüllük ve duyarlılığa sahip oluruz. Diyelim ki, Karaciğer Biyopsisi üzerinde objektif olarak tanımlanmış belirli bir patolojik tabloya sahip olarak tanımlıyoruz , o zaman Karaciğer Biyopsi testi altın standart olacak ve duyarlılığımız kendisine karşı ölçülecek ve böylece% 100 verim elde edilecektir.D

9

İlk olarak, duyarlılığı tipik olarak özgüllükten bağımsız olarak değiştiremeyeceğinizi veya tam tersini fark edemeyeceğinizi fark etmekte fayda var. Bu bir ROC eğrisinin noktasıdır. Veri oluşturma sürecinin doğası ve özel veri ve modeliniz göz önüne alındığında, her zaman hassasiyet ve özgüllük arasında bir miktar takasla karşılaşacaksınız. Elbette aynı anda% 100 duyarlılığa ve% 100 özgüllüğe sahip olmayı tercih edersiniz, ancak genellikle yapamazsınız. Daha iyi hassasiyet elde edebilirsiniz, ancak daha kötü özgüllük veya daha iyi özgüllük pahasına, ancak en kötü hassasiyet pahasına. ROC eğrisi, aralarından seçim yapmak zorunda kaldığınız ödünleşim kümesini gösterir. (Birkaç not: 1. veri kümenizde bir boşluk olduğu için bazen bir boyutta başka bir şey kaybetmeden kazanç elde edebilirsiniz, ancak bu çoğunlukla yanıltıcıdır; 2.ROC eğrisi, 1-özgüllüğün bir fonksiyonu olarak hassasiyettir, duyarlılığa karşı özgüllüğün çizilmesi, yansıyan bir ROC eğrisidir.

resim açıklamasını buraya girin

Her durumda, görünen duyarlılık ve özgüllük yaygınlıkla nasıl değişebilir? Bu, pratikte nasıl çalışabileceğini görmek için bazı verileri simüle etmeye ve oynatmaya yardımcı olduğu bir konudur. Bir modelin belirli bir yaygınlığa sahip oldukça büyük bir veri kümesine uyduğunu ve x ekseni 1 üzerinde bir eşik ayarlandığını düşünelim . Daha sonra bu testin performansı, oldukça farklı prevalanslara (ve dolayısıyla farklı x değerlerine) sahip numunelerle hesaplanır. Sonuç, aynı eşiği kullanan aynı modelin, farklı yaygınlığa sahip veri kümelerine uygulandığında farklı performans göstermesidir.

library(caret)  # we'll use these packages
library(binom)
  # we'll use this function to convert log odds to probabilities
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

##### training dataset for original model
set.seed(734)                     # these make the examples exactly reproducible
Nt = 1000
xt = rnorm(Nt, mean=5, sd=1)      # this is the distribution of X
lo = -1.386 + .308*xt             # this is the data generating process
pt = lo2p(lo)
yt = rbinom(Nt, size=1, prob=pt)
mt = glm(yt~xt, family=binomial)
summary(mt)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept) -1.16736    0.32794  -3.560 0.000371 ***
# xt           0.24980    0.06429   3.886 0.000102 ***
# ...
#     Null deviance: 1384.5  on 999  degrees of freedom
# Residual deviance: 1369.1  on 998  degrees of freedom
# AIC: 1373.1

## determine threshold
# prob(Y) = 50%, where log odds = 0, so:
-coef(mt)[1]/coef(mt)[2]  # 4.673159
threshold = 4.7  # a simple round number
classt    = ifelse(xt>threshold, 1, 0)
tabt      = table(classt, yt)[2:1,2:1]

confusionMatrix(tabt)
#       yt
# classt   1   0
#      1 346 279
#      0 175 200
#                                           
#                Accuracy : 0.546           
#                     ...                                          
#             Sensitivity : 0.6641          
#             Specificity : 0.4175          
#          Pos Pred Value : 0.5536          
#          Neg Pred Value : 0.5333          
#              Prevalence : 0.5210          


##### high prevalence dataset from hospital
set.seed(4528)
Nh = 500
xh = rnorm(Nh, mean=6, sd=1)  # a different distribution of X
lo = -1.386 + .308*xh         # but the same data generating process
ph = lo2p(lo)
yh = rbinom(Nh, size=1, prob=ph)
classh = ifelse(xh>threshold, 1, 0)  # the same threshold is used
tabh   = table(classh, yh)[2:1,2:1]

confusionMatrix(tabh)
#       yh
# classh   1   0
#      1 284 163
#      0  20  33
#                                           
#                Accuracy : 0.634           
#                     ...
#             Sensitivity : 0.9342          
#             Specificity : 0.1684          
#          Pos Pred Value : 0.6353          
#          Neg Pred Value : 0.6226          
#              Prevalence : 0.6080          


##### low prevalence dataset from outpatients
set.seed(1027)
Nl = 500
xl = rnorm(Nl, mean=3, sd=1)
lo = -1.386 + .308*xl
pl = lo2p(lo)
yl = rbinom(Nl, size=1, prob=pl)
classl = ifelse(xl>threshold, 1, 0)
tabl   = table(classl, yl)[2:1,2:1]

confusionMatrix(tabl)
#       yl
# classl   1   0
#      1   9  14
#      0 190 287
#                                           
#                Accuracy : 0.592           
#                     ...
#             Sensitivity : 0.04523         
#             Specificity : 0.95349         
#          Pos Pred Value : 0.39130         
#          Neg Pred Value : 0.60168         
#              Prevalence : 0.39800         


##### sensitivities
binom.confint(346, 521, method="e")
#   method   x   n      mean     lower    upper
# 1  exact 346 521 0.6641075 0.6217484 0.704592
binom.confint(284, 304, method="e")
#   method   x   n      mean   lower     upper
# 1  exact 284 304 0.9342105 0.90022 0.9593543
binom.confint(  9, 199, method="e")
#   method x   n       mean      lower      upper
# 1  exact 9 199 0.04522613 0.02088589 0.08411464

##### specificities
binom.confint(200, 479, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 200 479 0.4175365 0.3729575 0.4631398
binom.confint( 33, 196, method="e")
#   method  x   n      mean     lower     upper
# 1  exact 33 196 0.1683673 0.1188206 0.2282441
binom.confint(287, 301, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 287 301 0.9534884 0.9231921 0.9743417

% 95 güven aralıklarıyla, yaygınlıkların bir fonksiyonu olarak hassasiyetler ve özgüllükler şunlardır:

resim açıklamasını buraya girin

Peki burada neler oluyor? Prototip bir lojistik regresyonun aşağıdaki şekle benzeyebileceğini düşünün. Tüm 'eylemin' x ekseni üzerindeki [4, 6] aralığında gerçekleştiğine dikkat edin. Aşağıdaki veriler çok düşük yaygınlığa sahip olacak ve model zayıf ayrımcılık ve duyarlılık gösterecektir. Bu aralığın üzerindeki veriler çok yüksek yaygınlığa sahip olacaktır, ancak model yine iyi bir şekilde ayrım yapmayacak ve zayıf özgüllüğe sahip olacaktır.

resim açıklamasını buraya girin

Bunun nasıl olabileceğini anlamaya yardımcı olmak için, hastanın karaciğerinin başarısız olup olmadığını belirlemek için Alanine transaminaz testini düşünün 2. Fikir, karaciğerin normal olarak ALT kullanmasıdır, ancak karaciğer çalışmayı durdurduysa, ALT kan dolaşımına atılacaktır. Bu nedenle, bir hastanın kan dolaşımındaki ALT seviyesi bir eşiğin üzerindeyse, karaciğerin başarısız olduğu anlamına gelir. Yüksek karaciğer yetmezliği prevalansı olan bir örnek çizerseniz, kanda yüksek ALT seviyeleri olan bir örnek çizeceksiniz. Böylece, eşiğin üzerinde daha fazla hasta olacak. Yüksek kan seviyesi ALT olan herkesin karaciğer yetmezliği olmaz - bazı hastalar için başka bir neden olacaktır. Ancak karaciğer yetmezliği olanların yakalanması gerekir. Bu, daha yüksek hassasiyete yol açar. Benzer şekilde, normal ALT seviyesine sahip tüm hastaların sağlıklı karaciğerleri yoktur, ancak düşük prevalanslı bir örnek düşük ALT seviyelerine sahip olacak ve daha fazla hasta testi geçecektir. Cankurtaranları t başarısız, ancak normal ALT seviyelerine sahip olanlar gözden kaçırılacaktır. Bu, daha düşük hassasiyete, ancak daha yüksek özgüllüğe yol açar.

Daha genel olarak, tıbbi testin tüm fikri, bir şeyin veya başka bir şeyin, doğrudan önlem almak isteyebileceğiniz, ancak yapamayacağınız bir hastalık durumunun bir korelasyonu olduğudur. Korelasyonun bir ölçüsünü almak size hastalık durumu hakkında bilgi verir. Bunun doğru olmadığı bir (potansiyel) testin değeri olmaz ve kullanılmaz. Bu nedenle, pratikte, yüksek prevalanslı numuneler, daha yüksek hassasiyete yol açan daha anormal değerlerle korelasyon dağılımına sahip olmalıdır ve bunun tersi de geçerlidir. (Korelasyonun hastalığın bir nedeni olması gerekmediğine dikkat edin; ALT örneğinde, bir etkidir, diğer örneklerde, hem hastalık hem de korelasyon ortak bir nedenin etkileri olabilir.)

1. Bu aslında tıpta oldukça yaygındır. Kolesterolün <200, sistolik kan basıncı <140, vb. Eşikler hakkında bazı (belki de uzaktan) ilgili tartışmalar için, 0-1 eşikleri her zaman x ekseni eşiklerine eşdeğer mi? ve İki bağımsız veri kümesini karşılaştırmak için p değerlerini kullanırsak, yanlış pozitiflerin sayısı neden örnek boyutundan bağımsızdır?
2. Lütfen doktor olmadığımı ve bu örneğin kötü bir şekilde alınabileceğini unutmayın. Karaciğer fonksiyonu, testleri ve ilgili konular hakkında doğru bilgi edinmek istiyorsanız gerçek bir doktora danışın.


Teşekkürler! Aslında değiştiğini göstermek için. Peki @Tim'in cevabını nasıl değerlendiriyor? Çelişkili değil mi?
Polisetty

1
@Polisetty, Tim, "yatarak ve ayakta tedavi gören hastalar sadece prevalansta değil birçok yönden de farklılık gösterebilir, bu nedenle diğer bazı faktörlerin duyarlılığı etkileyebileceğini" belirtir. Test, hastaların bazı özelliklerinin (örneğin kolesterol) bir fonksiyonuysa ve hastalık, bu özellik ile de güçlü bir şekilde ilişkiliyse (genellikle tüm nokta), o zaman "diğer faktörler" yaygınlık. Bu nedenle, prevalans değiştiğinde, diğeri değişimi ilişkilendirir ve test, belirli bir gruba göre az ya da çok duyarlılığa sahiptir.
gung - Monica'yı eski

7

Başkaları tarafından zaten söylendiği gibi, hassasiyet ve özgüllük yaygınlığa bağlı değildir. Duyarlılık , tüm pozitifler arasındaki gerçek pozitiflerin oranıdır ve özgüllük, tüm negatifler arasındaki gerçek negatiflerin oranıdır. Hassasiyet% 90 ise, test pozitif olan vakaların% 90'ı için doğru olacaktır. Açıkçası daha küçük bir şeyin% 90'ı ve daha büyük bir şeyin% 90'ı hala% 90'dır ...

Bahsettiğiniz tablo verileri göz önüne alındığında,

positiveconditionnegativeconditionpositivetestacnegativetestbd

duyarlılık ( koşullu olasılık tanımı ) ve özgüllük . Metriklerin her biri için, o sırada yalnızca sütunlardan birine bakarsınız, dolayısıyla bu metrikler için yaygınlık (sütunların göreli boyutları) önemli değildir. Prevalans denklemlere gelmez. Ayrıca, "pratik" duyarlılığın teorik olarak farklı bir şekilde tanımlanması ve farklı sonuçlara yol açması oldukça garip olacaktır.aa+b+c+d/a+ba+b+c+d=aa+b p(YX)=p(YX)p(X)da+b+c+d/c+da+b+c+d=dc+d

Ama alıntı aynı zamanda başka bir şey söylüyor gibi görünüyor

hastanede yatan hastalarda test duyarlılığı daha yüksek, polikliniklerde test özgüllüğü daha yüksek olacaktır

bu nedenle yazarlar duyarlılığın farklı gruplarda farklı olduğunu söylüyor. Yatan ve ayakta tedavi gören hastaların sadece prevalansta değil, birçok açıdan farklılık gösterebileceğini düşünüyorum, bu nedenle diğer bazı faktörler duyarlılığı etkileyebilir. Onlar kabul Yani olabilir (gösterildiği gibi yaygınlık bakımından farklılık gösteren farklı veri setleri arasında değişebilir ama değişim yaygınlık kendisi bir fonksiyonu olmayacak @gung onun cevabını).

Bir başka yandan, tahmin etmem gerekirse, belki yazarlar hassasiyeti posterior olasılıkla karıştırıyorlar . Duyarlılık iken posterior olasılıkp(positive testcondition)

p(conditionpositive test)p(positive testcondition)×p(condition)

ve birçok durumda bu, insanların ilgilendiği olasılıktır ("pozitif test sonucuna sahip bir hastanın hastalığa yakalanma olasılığı ne kadar?") ve yaygınlığına bağlıdır. Bağlantınızın da yaygınlığın, Pozitif Öngörülü Değer üzerindeki etkisini, yani posterior olasılık, duyarlılık üzerindeki etkisini tartıştığını unutmayın .


Önceki cevaplardan birinde bahsettiğim gibi, yazarların bunu posterior olasılıkla karıştırmadıklarından eminim, çünkü açıkça "birçok metin hala bu ifadeyi yapıyorlar". Ayrıca, Harrison'unki kadar güvenilir olmayan başka bir kaynak da söylüyorum, bu onun güvenli bir 'varsayım' olduğunu söylüyor. Tüm sormak istediğim, 'varsayım' nedir?
Polisetty

2
@Polisetty Yazarlar için söyleyemem, ancak alıntıdan, yaygınlık üzerindeki bağımsızlığı "varsayım" olarak adlandırıyorlar, ancak bu daha sonra varsayımdan sonra matematiksel bir gerçektir. Eğer tutmasaydı, olasılık teorisinin kırıldığı ve olmadığı anlamına gelirdi.
Tim

Hassasiyet ve özgüllük, bir tanı testinin sabit özellikleri olarak düşünülebilir. [Bu hafif bir sadeleştirmedir, ancak amaçlarımız için yeterince iyidir]. - söylediği şey bu
Polisetty

3

Doğru / yanlış pozitif / negatif oranları hakkındaki cevabımı burada görebilirsiniz .

Duyarlılık gerçek pozitif oran için başka bir isimdir ve özgüllük gerçek negatif oranla aynıdır. Hem duyarlılık hem de özgüllük koşullu olasılıklardır; hastanın hastalık durumu üzerinde durum gösterirler. Bu nedenle, belirli bir hastalık durumunu varsaydığınız için hastalığın prevalansı (yani, bir hastanın hastalığa sahip olduğu priori olasılığı) önemsizdir .

Ders kitabı yazarının neden duyarlılığın ve özgüllüğün klinik bağlama bağlı olduğunu iddia ettiği konusunda yorum yapamıyorum. Bu ampirik gözlemler mi?


Kesinlikle. Dolayısıyla soru. Bir testin duyarlılığı kullanılan popülasyona bağlıdır. Bağımsız olduğu varsayımı her zaman doğru değildir. Nasıl ve neden olduğunu soruyorum. Kitap daha sonra değerleri de
aktarıyor

Duyarlılık ve özgüllüğü etkileyen popülasyona özgü faktörler olabilir. Ancak, duyarlılığın ve özgüllüğün matematiksel tanımlarından, yaygınlığın bu faktörlerden biri olamaz , en azından doğrudan değil. (Bu arada, matematiksel tanımları açıklamamdan memnun
kaldıysanız cevabımı kabul etmekten çekinmeyin

Üzgünüm, sanırım net değildi. Duyarlılık ve yaygınlık arasındaki ilişkiyi matematiksel olarak bilmek istedim. Nasıl tanımlandıklarını biliyorum. İlişki, hesaplanma şekli nedeniyle gelir. Hassasiyet tp / (tp + fn) iken yaygınlık tp + fn / (tp + fn + fp + tn)
Polisetty

P(Disease)P(+|disease)

Harrison yanlýţ olmaz. Bu bağlantı bile ona basitlik diyor. med.uottawa.ca/sim/data/Sensitivity_and_Prevalence_e.htm
Polisetty

1

Elbette yazarın niyetiyle konuşamam, ama işte bu ifadenin mantığı şöyle olurdu:

Klinik bağlamı bir tanı testi olarak düşünün. Tek çok kötü duyarlılık ve özgüllük, ama daha az bir test hiçbiri. Eğer hastanedeyseniz, hasta olursunuz. Hastanede değilseniz, hastalanma olasılığınız yoktur.

Bu açıdan, gerçekleştirdiğiniz gerçek tanı testi aslında seri olarak yapılan iki testin ikinci kısmıdır.


Açıklamanızda, a priori değişiyor ve bu da posterior olasılığın artmasına neden oluyor. Bu doğru. Ancak, duyarlılığın kendisi nasıl değişiyor soru.
Polisetty

@Polisetty Yüksek posterior pozitif test olarak adlandırırsanız ne olur? "Klinik Bağlamın kendisi bir testtir." Bence herhangi bir keyfi karar test yaygınlığı bu şekilde bağlı yapılabilir, bu nedenle "test" daha spesifik olarak tanımlanmalıdır. İfadenin, bazı vekil ölçüm eşiğine dayanan olağan test çeşitliliği için geçerli olduğunu düşünüyorum.
stochastic13

1

Bu bir hata olmalı. Belki de yazarın pozitif ve negatif prediktif değerin (PPV ve NPV) yaygınlığa (duyarlılık ve özgüllük) bağlı olduğunu öne sürmeye çalıştığını düşünüyorum. Bunlar sıklıkla tanısal testlerle ve bir klinisyene duyarlılık ve özgüllüğün ham yorumundan daha değerli olarak tartışılır.

Bu grafik,% 95 hassasiyet ve% 85 özgüllük içeren bir test için PPV ve NPV yaygınlığı arasındaki ilişkiyi göstermektedir.

Mausner JS, Kramer S: Mausner ve Bahn Epidemiyolojisi: Bir Giriş Metni.  Philadelphia, WB Saunders, 1985, s.  221.

Mausner JS, Kramer S: Mausner ve Bahn Epidemiyolojisi: Bir Giriş Metni. Philadelphia, WB Saunders, 1985, s. 221.


1

@Satwik, @gung ve @Tim zaten çok fazla ayrıntı sağladı, ancak altta yatan faktörlerin durumunun böyle bir etkiye neden olabileceğine dair küçük bir örnek ekleyeceğim.

Anahtar Bir İlke: Önyargı

Duyarlılık / Özgüllük ve TÜM istatistiksel testler aynı uyarıyı paylaşır: yalnızca önceki örneklem prosedürünün tarafsız bir şekilde tekrarlanması için geçerlidir.

Hastaneler, genel popülasyonu kabul ve tedavi gerektirenlere filtrelemek için kabul politikalarını kullanarak önyargılı örnekleme yapmak üzere tasarlanmış işlevsel organizasyonlardır. Bu bilimsel prosedürün çok antitezidir. Bir testin farklı popülasyonlarda nasıl performans gösterdiğini bilmek istiyorsanız, testin farklı popülasyonlarda test edilmesi gerekir.

Gizli etki: Korelasyon

Bir tanının bir hastalık için diğer tüm risk faktörlerine bağımsız / dikey olması nadirdir (veya gerçek dünyada imkansızdır), bu nedenle bir dereceye kadar korelasyon vardır.

Hastaneye yatış ekranı tanı ile pozitif bir şekilde ilişkiliyse, o zaman bulabileceğiniz şey, kabul testini geçen kişilerin, tanı ile orantılı olarak, korelasyonla orantılı olarak pozitif sonuçlara yatkın olmasıdır. Böylece gerçek pozitifler zenginleşmekte ve yanlış negatifler korelasyonla orantılı miktarlarda azaltılmaktadır.

Bu daha sonra hassasiyetin daha büyük görünmesini sağlar.

Fenomenin açıklaması

Hastane tabanlı bir bağlamda duyarlılığın daha yüksek olabileceğine dair bir gözlem bu nedenle gerçekçi değildir. Aslında, kabul politikası iyi düşünülmüş ve amaca uygunsa, bunun gerçekleşmesi beklenir.

Duyarlılık ve özgüllüğün yaygınlıktan bağımsız olduğu varsayımında bir bozulma kanıtı değil, hastaneye kabul politikasına dayanan taraflı bir örneklemenin kanıtıdır.

Bir hastane göz önüne alındığında, insanları tedavi etmek ve bilimsel deneyler yapmamak için var, kesinlikle iyi bir şey.

Ancak bilim insanlarına baş ağrısı veriyor.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.