Oranları ve ikili sınıflandırıcıyı test edin


10

Parçaları üreten bir prototip makinem var.

Birinci testte makine üreten N1 parça ve bir ikili sınıflandırıcı olduğunu söyler parça arızalı (vardır , genellikle ve ) ve parça iyidir.d 1 < N 1 d 1 / N 1 < 0,01 N 110 4 N 1 - d 1d1d1<N1d1/N1<0.01N1104N1d1

Daha sonra bir teknisyen, arızalı parça sayısını azaltmak için makinede bazı değişiklikler yapar.

Test aşağıdaki saniyenin ve modifiye makine üreten parçalar ve aynı ikili sınıflandırıcı (bakir) olduğunu söylüyor parçalar zaten bozuk oldukça benzer .d 2 d 2 / N 2 d 1 / N 1N2d2d2/N2d1/N1

Teknisyen, değişikliklerinin etkili olup olmadığını bilmek istiyor.

Sınıflandırıcıların mükemmel olduğunu varsayarsak (duyarlılığı% 100 ve özgüllüğü% 100'dür), oranlar için bir test yapabilirim (R ile sadece yazıyorum prop.test(c(d1,d2),c(N1,N2))).

Ancak sınıflandırıcı mükemmel değildir, bu yüzden teknisyene düzgün bir şekilde cevap vermek için sınıflandırıcının bilinmeyenliğini ve özgüllüğünü nasıl dikkate alabilirim?


Sınıflandırıcının doğruluk oranını teyit edebilir misiniz?
Michelle

@Michelle ve d 2 hatasız olduğunu biliyorum, ancak kaç hatalı parçanın iyi olarak yanlış sınıflandırıldığını bilmiyorum. d1d2
Alessandro Jacopson

Tekrar merhaba. Yanlış pozitif oranı tahmin etmek için ayrı ayrı N1 ve N2'den iyi parçaların rastgele bir örneğini yapabilir misiniz?
Michelle

1
Bu bilgilerle, değişiklikleri karşılaştırmak için bu yöntemi kullanabilir misiniz? onlinelibrary.wiley.com/doi/10.1002/sim.906/abstract burada da bakınız ncbi.nlm.nih.gov/pubmed/18224558 ve burada diğer fikir tam metin: stat.colostate.edu/~bradb/papers/lrgraphfinal. pdf
Michelle

2
(+1) bu harika bir soru!
steffen

Yanıtlar:


4

Bu yüzden bunu ilk ilkelerden elde ediyorum ve bu yüzden doğru olduğundan emin değilim. İşte düşüncelerim:

EDIT: Bu daha önce doğru değildi. Güncelledim.

  1. Edelim Let gerçek pozitifler gerçek sayısı arasındaki beklenen farklılığı gösterdiği d 1 ve ikili sınıflandırıcı tarafından sayı çıktı diyeceğiz ki ^ d 1 . Sınıflandırıcıyı bilinen etiketleri olan bir kümede çalıştırarak bunu ölçebilirsiniz. Gerçek pozitiflerin sayısını sınıflandırıcı tarafından üretilen pozitiflerin sayısından çıkarın ve sonra α elde etmek için N'ye bölün .αd1d1^Nα

  2. Böylece, arızalı parçaların gerçek oranı için bir nokta tahmini şu şekilde verilir: . Yani, gözlemlenen kusurlu parça sayısı, beklenen yanlış pozitif sayısının az olması ve beklenen yanlış negatif sayısının artması.d1N1^=d1+αN1N1

  3. Benzer şekilde, d2N2^=d2+αN2N2

  4. Şimdi bir pervane testi yapalım. Standart pervane testinde, önce boş değer olarak kullanılan toplanmış oranı hesaplıyoruz: . Yani burada, ^ d bizim nokta tahminleri koymak 1p=p1N1+p2N2N1+N2 ve^d2d1N1^ elde etmek için:p=d1+d2+α*(N1+K2)d2N2^p=d1+d2+α(N1+N2)N1+N2

  5. Sonra standart hata sadece olağandır: p(1p)(1N1+1N2)

  6. Ve test istatistiği aynı: z=d1N1d2N2se

Yorum hakkında bazı düşünceler:

  • p<0

  • Bunu düşünmenin başka bir yolu, arızalı parçaların sayısı sınıflandırıcı için hata payı içinde ise, elbette bir fark olup olmadığını söyleyemeyiz: herhangi bir parçanın arızalı olup olmadığını bile söyleyemeyiz!

α

  • αα

h

  • h2ααh2lowl,lowr)(highl,highr)α(highl,lowr) (önceki aralıkların her ikisini de içerir), oranlardaki fark için bir (1-h) *% 100 CI olmalıdır ... Bence ...

α


+1, teşekkürler. 6'da "statik" yazdınız, "istatistik" mi demek istediniz?
Alessandro Jacopson

p<00<p<10<p<1

0.01(N1d1)100β=7100ββprop.test(7,100)

@ uvts_cvs Evet, bu "istatistik" olmalı. Birazdan tamir edeceğim. Standart hata hesaplamasında bunun yerine p * (1-p) olması gereken bir yazım hatası da vardır. Sınıflandırıcınız gerçekten kötü ve d büyükse P hariç her zaman <1 olmalıdır. Üçüncü yorumunuz için, evet, fikir bu. Bu tahminin modele nasıl dahil edileceğinden emin değilim. Belki burada başka biri bilir?
John Doucette

αβ
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.