% 100 isabet oranı olasılığı ve% 0 yanlış alarm olasılığı ile d ana


11

Eski ve yeni öğeleri tespit etmeyi içeren bir bellek görevi için d üssü hesaplamak istiyorum . Sahip olduğum problem, bazı deneklerin isabet oranının 1 ve / veya yanlış alarm oranının 0 olması, bu da olasılıkları sırasıyla% 100 ve% 0 yapar.

Formülü d asal olan d' = z(H) - z(F), burada z(H)ve z(F)sırasıyla isabet oranı ve yanlış alarm, z dönüşümleri bulunmaktadır.

Z dönüşümünü hesaplamak için, NORMSINV (yani z(H)=NORMSINV(hit rate)) Excel işlevini kullanıyorum . Ancak, isabet oranı veya yanlış alarm oranı sırasıyla 1 veya 0 ise, işlev bir hata döndürür. Çünkü z dönüşümü, anladığım kadarıyla, matematiksel olarak% 100 veya% 0 olasılığa izin vermeyen ROC eğrisinin altındaki alanı gösterir. Bu durumda, tavan performansı olan denekler için d '' nin nasıl hesaplanacağından emin değilim.

Bir web sitesi , 1 ve 0 oranının 1 - 1 / (2N) ve 1 / 2N ile değiştirilmesini önerir ve N, maksimum isabet sayısı ve yanlış alarm sayısıdır. Başka bir web sitesi "Ne H ne de F 0 veya 1 olamaz (eğer öyleyse, hafifçe yukarı veya aşağı ayarlayın)" diyor. Bu keyfi görünüyor. Bu konuda bir fikri olan veya beni doğru kaynaklara yönlendirmek isteyen var mı?

Yanıtlar:


14

Stanislaw & Todorov (1999) , Hit veya False-Alarm Rate of Zero ya da One başlığı altında bu konuda iyi bir tartışmaya sahiptir .

Bu aşırı değerlerle başa çıkmak için çeşitli yöntemlerin artılarını ve eksilerini tartışıyorlar:

  • Gibi bir non-parametrik istatistiğini kullanarak yerine (1979 Craig)d Ad

  • İstatistiği hesaplamadan önce birden çok denekten veri toplayın (Macmillan ve Kaplan, 1985)

  • hem isabet sayısına hem de yanlış alarm sayısına 0,5 ekleyin ve hem sinyal denemelerinin sayısına hem de gürültü denemelerinin sayısına 1 ekleyin; mantıksal yaklaşım olarak adlandırılır (Hautus, 1995)

  • 0'ın oranlarını ve 1 oranlarını ile değiştirerek yalnızca uç değerleri ayarlayın burada , sinyal veya gürültü denemelerinin sayısıdır) (Macmillan & Kaplan, 1985)( n - 0,5 ) / n n0.5/n(n0.5)/nn

Seçim nihayetinde size kalmış. Şahsen üçüncü yaklaşımı tercih ediyorum. İlk yaklaşımın dezavantajı, nın daha aşina olan okuyucularınız için daha az yorumlanabilir olmasıdır . Tek denekli davranışla ilgileniyorsanız ikinci yaklaşım uygun olmayabilir. Dördüncü yaklaşım önyargılı çünkü veri noktalarınıza eşit davranmıyorsunuz.d Ad


MacMillan & Kaplan popüler bir referans ama sanırım aynı tavsiyeden önce onları yayan bir Yunan ya da Rus yazar var ... adı hatırlamak için çok uzun. S & T'ye hızlı bir bakışım çok kapsamlı olmadığı, ancak muhtemelen A 'dan bahsetmemekle yanıldığımı hatırlatıyor. Tabii ki, bunu yaptıktan sonra parametrik olmayan duruma geçmenin ne anlama geldiğini açıklamanız gerekir.
John

6

Her iki site de aynı şeyi öneriyor ancak bir tanesi sürekli olarak ayarlama miktarını seçmenin bir yolunu sunuyor. Bu birkaç kişiye atfedildi, ancak kimsenin ilk önce kimin gerçekten geldiğini bildiğini sanmıyorum. Farklı alanların sinyal algılama konusunda farklı bir seminal kitabı veya yazarı vardır. Önemli olan seçtiğiniz yöntemin makul olmasıdır.

Gönderdiğiniz tek yöntem genellikle çok daha büyük bir öğe kümeniz (2N) varsa, en az bir hata tespit edebileceğiniz anlamına gelir. Bu, sorunu düşünmenin makul bir yoluysa işiniz bitti demektir. Bir hafıza testi için olduğundan şüpheliyim. Gelecekte bunun daha az olası olduğundan emin olmak için N'yi yükseltmek isteyebilirsiniz. Bununla birlikte, farklı bir yol olarak düşünürseniz, yöntem kurtarılabilir. Aynı sayıda bellek öğesinin iki çalışmasının varsayımsal bir ortalamasını ayarlıyorsunuz. Bu durumda, denemenin başka bir işleminde (yeni öğeleri varsayarak veya eski olanları unuttuklarını varsayarak) bir hata olacağını söylüyorsunuz. Ya da, daha basit bir şekilde, ölçebileceğiniz en yüksek kusurlu skor ile mükemmel bir skor arasında sadece bir yol seçersiniz.

Bu basit bir evrensel çözümü olmayan bir sorundur. Sormanız gereken ilk soru, sizin durumunuzda gerçek bir mükemmel sınıflandırmaya inanıp inanmadığınızdır. Bu durumda verileriniz sizin verilerinizdir. Değilse, örnekte değişkenliğin isabetlerin% 100 olmasına neden olduğuna inanıyorsunuz. Böyle bir sonuca varınca, ne olduğuna inandığınıza dair bir tahmin oluşturmak için makul yolları düşünmelisiniz. Ve böylece kendinize gerçekte ne olduğunu sormalısınız.

D 'nin ne olması gerektiğini belirlemenin en kolay yolu, aynı koşuldaki diğer verilere bakmaktır. Bu katılımcının doğruluğunun, sahip olduğunuz bir sonraki en iyi değerin yarısı ile% 100 arasında olduğunu tahmin edebilirsiniz (bu, bulduğunuz değerle tamamen aynı olabilir). Veya çok az miktarda olabilir. Veya en iyi değerlere eşit olabilir. Verilerinize dayanarak en iyi cevap olduğuna inandığınız şeyi seçmelisiniz. Gönderilen daha spesifik bir soru burada size yardımcı olabilir.

Yaptığınız ölçüt üzerinde olabildiğince az etki bıraktığından emin olmalısınız. Sizin durumunuzda, isabetler ve FA'lar üzerinde yapılan bir ayarlama, ölçütün hiç kaymamasına neden olur. Bununla birlikte, FAs = 0.2 dediği zaman isabetleri ayarlarsanız, bu ayarlamanın ölçütün yorumunu nasıl etkileyeceğine dikkat etmelisiniz. Bu durumda, isabetlerin çok yüksek olduğundan emin olmak için bir miktar yükümlülüğünüz vardır.


Bakış açınız ve gerekçeniz için teşekkürler, John. Bu gerçekten yardımcı oluyor. Artan N sayısının iyi bir çözüm olduğunu eklemeliyim, ancak görevimiz fMRI tarayıcısında yapılıyor ve deneklerin huzursuzluk kazanmadan ve verilerimizi hareketle bozmadan önce kaç deneme yapabileceğimizle sınırlı kalıyoruz.
A.Rainer

"Bu katılımcının doğruluğunun, sahip olduğunuz bir sonraki en iyi değerin yarısı ile% 100 (bu, bulduğunuz değerle tamamen aynı olduğu ortaya çıkabilir) arasında yarım olduğunu tahmin edebilirsiniz." Bu, konu performans sıralamasının sırasını koruyacaktır.
A.Rainer
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.