Ki-Kare mesafesini kullanarak iki histogramı karşılaştırma


18

İki yüz görüntüsünü karşılaştırmak istiyorum. LBP-histogramlarını hesapladım. Şimdi bu iki histogramı karşılaştırmam ve bu histogramların ne kadar eşit olduğunu söyleyecek bir şey elde etmem gerekiyor (% 0 - 100).

Bu görevi çözmenin birçok yolu vardır, ancak LBP yönteminin yazarları (Yerel İkili Desenlerle Yüz Tanımı: Yüz Tanıma Uygulaması. 2004) Ki-Kare mesafe perfomlarının Histogram kesişme ve Log-olasılık istatistiklerinden daha iyi olduğunu vurgulamaktadır.

Yazarlar ayrıca Chi-Square mesafesinin bir formülünü gösterir:

i=1n(xiyi)2(xi+yi)

Burada kutuları bir sayıdır, ilk bin bir değerdir ikinci sepet bir değerdir.x i y inxiyi

Bazı araştırmalarda (örneğin, Quadratic-Chi Histogram Mesafe Ailesi) Chi-Square mesafesi formülünün:

12i=1n(xiyi)2(xi+yi)

Ve orada http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm Ki-Kare mesafesi formülünün şu olduğunu görüyorum:

i=1n(xiyi)2yi

Ben onunla takılıp kaldım. Birkaç sorum var:

  1. Hangi ifadeyi kullanmalıyım?
  2. Farkın sonucunu nasıl yorumlamalıyım? 0'a eşit olan farkın her iki histogramın eşit olduğu anlamına geldiğini biliyorum, ancak her iki histogramın tamamen farklı olduğunu nasıl bilebilirim? Bunun için bir Ki-Kare masa kullanmam gerekir mi? Yoksa bir eşik mi kullanmam gerekiyor? Temel olarak farkı yüzdelere eşlemek istiyorum.
  3. Bu üç ifade neden farklı?

Yi, xi ile aynı selenin değeri değil, ikinci bir sel yerine karşılaştırıcı dağılımında mıdır?
ReneBt

Yanıtlar:


7

@Silverfish, PolatAlemdar tarafından verilen cevabın genişletilmesini istedi, ki bu verilmemişti, bu yüzden burada genişletmeye çalışacağım.

Neden adı chisquare mesafesi? Beklenmedik tablolar için ki kare testi χ 2 = hücrelerine ( O i - E i ) 2 dayanmaktadır öylesine bir fikir bu formu tutmak ve onu bir mesafe ölçüsü olarak kullanmaktır. Bu OP'nin üçüncü formülünü verir,xigözlem veyibeklentiolarak yorumlanır, PolatAlemdar'ın örneğin uyum iyiliği testinde olduğu gibi "ayrık olasılık dağılımlarında kullanılır" yorumunu açıklar. Bu üçüncü form,veydeğişkenlerinde asimetrik olduğu için bir mesafe işlevideğildir. Histogram karşılaştırması için,xveycinsinden simetrik olan bir mesafe fonksiyonu isteyeceğizve ilk iki form bunu veriyor. Aralarındaki fark sadece sabit bir faktördür1

χ2=cells(OiEi)2Ei
xiyixyxy , sadece bir formu tutarlı bir şekilde seçtiğiniz sürece önemsizdir (asimetrik formla karşılaştırmak istiyorsanızekstra faktörolan sürümdaha iyidir). Bu formüllerdeki kareli öklid mesafeli, yani tesadüf olmayan benzerliklere dikkat edin, ki-kare mesafesi bir türağırlıklıöklid mesafesidir. Bu nedenle, OP'deki formüllermesafelerialmak için genellikle bir kök işaretinin altına yerleştirilir. Aşağıda bunu takip ediyoruz.1212

Chisquare mesafesi yazışma analizinde de kullanılır. Burada kullanılan formla olan ilişkiyi görmek için , satırları ve sütunları olan bir beklenmedik durum tablosu hücreleri olsun . Satır toplamlarını ve sütun toplamlarını . Sıralar arasındaki mesafe ki-kare ile verilir Yalnızca iki satırlı (iki histogram) durumda, bunlar OP'nin ilk formülünü (modulo kök işaretini) kurtarır. R C x + j = i x i j x i + = j x i j l , k χ 2 ( l , k ) = xijRCx+j=ixijxi+=jxijl,k

χ2(l,k)=j1x+j(xljxl+xkjxk+)2
EDIT

Aşağıdaki yorumlarda soruya cevap: Ki-kare mesafesinin uzun tartışmaları olan bir kitap, Michael Greenacre (Chapman & Hall) tarafından yazılan "UYGULAMADA KORUNMA ANALİZİ (İkinci Baskı)" dir. Beklenmedik tablolarla kullanılan chisquare'e benzerliğinden gelen, köklü bir isimdir. Ne gibi bir dağılımı var? Bunu hiç çalışmadım, ama muhtemelen (bazı koşullar altında ...) yaklaşık bir miktar chisquare dağılımı olurdu. İspatlar beklenmedik durum tablolarıyla yapılanlara benzer olmalıdır, yazışma analizi hakkındaki çoğu literatür dağıtım teorisine girmez. Biraz, belki de bu tür bir teoriye sahip bir makale http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0101-74382016000100023 . Ayrıca bakınızBu sitedeki diğer alakalı yayınlar için /stats//search?q=%22chisquare+distance%22 .


Son denkleminize niçin ki-kare mesafesi denir? Bu şekilde dağıtılıyor mu? Lütfen bir derivasyon veya bir link sağlayabilir misiniz? Bir tane bulamıyorum.
LeastSquaresWonderer

1
Yukarıdaki düzenlemelerime bakın.
kjetil b halvorsen

3

Bu bağlantıyı oldukça kullanışlı buldum: http://docs.opencv.org/2.4/doc/tutorials/imgproc/histograms/histogram_comparison/histogram_comparison.html

Neden olduğundan tam olarak emin değilim, ancak OpenCV, Chi-Square histogram karşılaştırması için listelediğiniz 3. formülü kullanıyor.

Anlam açısından, herhangi bir ölçüm algoritmasının size% 0 ila% 100 gibi sınırlı bir aralık vereceğinden emin değilim. Başka bir deyişle, iki görüntünün aynı olduğundan emin olabilirsiniz: korelasyon değeri 1.0 ya da ki-kare değeri 0.0; ancak iki görüntünün ne kadar farklı olduğu konusunda bir sınır belirlemek zordur: tamamen beyaz bir görüntüyü tamamen siyah bir görüntüyle karşılaştırdığınızı hayal edin, sayısal değer Sonsuzluk veya Belki Sayı Değil olabilir.


2

xy

Diğer ikisi histogram benzerliklerinin hesaplanmasında kullanılır.


1
$x$x

2
xy

0

OP'nin istediği gibi yüzde değeri (denklem 1 için):

p=χS100N

pχNS

Talep edildiği gibi tamamlandı:

Bu denklemi hesaplamak, tam bir histogramdan fark yüzdesine sahip olabilir. Bunu her iki histogram için hesaplayıp sonra birini diğerinden çıkararak yüzde olarak fark olabilir.


2
Bunun herhangi bir soruya nasıl bir cevap olduğunu görmekte zorlanıyorum. Detaylandırabilir misin?
Laconic

Bu, bir histogramın tam bir histogramdan ne kadar farklı olduğunu (istendiği gibi yüzde olarak) verecektir. Bu denklemi her iki histogramdan hesaplarsanız, nirengi için kullanılan bir diğerinden farkı bileceğiz.
Carlos Barcellos
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.