Ki-Kare mesafesini kullanarak iki histogramı karşılaştırma

18

İki yüz görüntüsünü karşılaştırmak istiyorum. LBP-histogramlarını hesapladım. Şimdi bu iki histogramı karşılaştırmam ve bu histogramların ne kadar eşit olduğunu söyleyecek bir şey elde etmem gerekiyor (% 0 - 100).

Bu görevi çözmenin birçok yolu vardır, ancak LBP yönteminin yazarları (Yerel İkili Desenlerle Yüz Tanımı: Yüz Tanıma Uygulaması. 2004) Ki-Kare mesafe perfomlarının Histogram kesişme ve Log-olasılık istatistiklerinden daha iyi olduğunu vurgulamaktadır.

Yazarlar ayrıca Chi-Square mesafesinin bir formülünü gösterir:

\sum_{i = 1}^{n} \frac{(x_{i} - y_{i})^{2}}{(x_{i} + y_{i})}

$\sum_{i=1}^{n} \cfrac{(x_i - y_i)^2} {(x_i + y_i)}$

Burada kutuları bir sayıdır, ilk bin bir değerdir ikinci sepet bir değerdir. $n$ $x_i$ $y_i$

Bazı araştırmalarda (örneğin, Quadratic-Chi Histogram Mesafe Ailesi) Chi-Square mesafesi formülünün:

\frac{1}{2} \sum_{i = 1}^{n} \frac{(x_{i} - y_{i})^{2}}{(x_{i} + y_{i})}

$\cfrac{1}{2}\sum_{i=1}^{n} \cfrac{(x_i - y_i)^2} {(x_i + y_i)}$

Ve orada http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm Ki-Kare mesafesi formülünün şu olduğunu görüyorum:

\sum_{i = 1}^{n} \frac{(x_{i} - y_{i})^{2}}{y_{i}}

$\sum_{i=1}^{n} \cfrac{(x_i - y_i)^2} {y_i}$

Ben onunla takılıp kaldım. Birkaç sorum var:

Hangi ifadeyi kullanmalıyım?
Farkın sonucunu nasıl yorumlamalıyım? 0'a eşit olan farkın her iki histogramın eşit olduğu anlamına geldiğini biliyorum, ancak her iki histogramın tamamen farklı olduğunu nasıl bilebilirim? Bunun için bir Ki-Kare masa kullanmam gerekir mi? Yoksa bir eşik mi kullanmam gerekiyor? Temel olarak farkı yüzdelere eşlemek istiyorum.
Bu üç ifade neden farklı?

chi-squared histogram image-processing

— Anton Holovin
kaynak

Yi, xi ile aynı selenin değeri değil, ikinci bir sel yerine karşılaştırıcı dağılımında mıdır?

— ReneBt

7

@Silverfish, PolatAlemdar tarafından verilen cevabın genişletilmesini istedi, ki bu verilmemişti, bu yüzden burada genişletmeye çalışacağım.

Neden adı chisquare mesafesi? Beklenmedik tablolar için ki kare testi dayanmaktadır öylesine bir fikir bu formu tutmak ve onu bir mesafe ölçüsü olarak kullanmaktır. Bu OP'nin üçüncü formülünü verir,gözlem vebeklentiolarak yorumlanır, PolatAlemdar'ın örneğin uyum iyiliği testinde olduğu gibi "ayrık olasılık dağılımlarında kullanılır" yorumunu açıklar. Bu üçüncü form,vedeğişkenlerinde asimetrik olduğu için bir mesafe işlevideğildir. Histogram karşılaştırması için,vecinsinden simetrik olan bir mesafe fonksiyonu isteyeceğizve ilk iki form bunu veriyor. Aralarındaki fark sadece sabit bir faktördür

χ^{2} = \sum_{cells} \frac{(O_{i} - E_{i})^{2}}{E_{i}}

$\chi^2 = \sum_{\text{cells}} \frac{(O_i-E_i)^2}{E_i}$

x_{i}

$x_i$

y_{i}

$y_i$

x

$x$

y

$y$

x

$x$

y

$y$

, sadece bir formu tutarlı bir şekilde seçtiğiniz sürece önemsizdir (asimetrik formla karşılaştırmak istiyorsanızekstra faktörolan sürümdaha iyidir). Bu formüllerdeki kareli öklid mesafeli, yani tesadüf olmayan benzerliklere dikkat edin, ki-kare mesafesi bir türağırlıklıöklid mesafesidir. Bu nedenle, OP'deki formüllermesafelerialmak için genellikle bir kök işaretinin altına yerleştirilir. Aşağıda bunu takip ediyoruz.

\frac{1}{2}

$\frac12$

\frac{1}{2}

$\frac12$

Chisquare mesafesi yazışma analizinde de kullanılır. Burada kullanılan formla olan ilişkiyi görmek için , satırları ve sütunları olan bir beklenmedik durum tablosu hücreleri olsun . Satır toplamlarını ve sütun toplamlarını . Sıralar arasındaki mesafe ki-kare ile verilir Yalnızca iki satırlı (iki histogram) durumda, bunlar OP'nin ilk formülünü (modulo kök işaretini) kurtarır. $x_{ij}$ $R$ $C$ $x_{+j}=\sum_i x_{ij}$ $x_{i+}=\sum_j x_{ij}$ $l,k$

χ^{2} (l, k) = \sqrt{\sum_{j} \frac{1}{x_{+ j}} {(\frac{x_{l j}}{x_{l +}} - \frac{x_{k j}}{x_{k +}})}^{2}}

$\chi^2(l,k) = \sqrt{\sum_j \frac1{x_{+j}}\left(\frac{x_{lj}}{x_{l+}}-\frac{x_{kj}}{x_{k+}} \right)^2 }$

EDIT

Aşağıdaki yorumlarda soruya cevap: Ki-kare mesafesinin uzun tartışmaları olan bir kitap, Michael Greenacre (Chapman & Hall) tarafından yazılan "UYGULAMADA KORUNMA ANALİZİ (İkinci Baskı)" dir. Beklenmedik tablolarla kullanılan chisquare'e benzerliğinden gelen, köklü bir isimdir. Ne gibi bir dağılımı var? Bunu hiç çalışmadım, ama muhtemelen (bazı koşullar altında ...) yaklaşık bir miktar chisquare dağılımı olurdu. İspatlar beklenmedik durum tablolarıyla yapılanlara benzer olmalıdır, yazışma analizi hakkındaki çoğu literatür dağıtım teorisine girmez. Biraz, belki de bu tür bir teoriye sahip bir makale http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0101-74382016000100023 . Ayrıca bakınızBu sitedeki diğer alakalı yayınlar için /stats//search?q=%22chisquare+distance%22 .

— kjetil b halvorsen
kaynak

Son denkleminize niçin ki-kare mesafesi denir? Bu şekilde dağıtılıyor mu? Lütfen bir derivasyon veya bir link sağlayabilir misiniz? Bir tane bulamıyorum.

— LeastSquaresWonderer

1

Yukarıdaki düzenlemelerime bakın.

— kjetil b halvorsen

3

Bu bağlantıyı oldukça kullanışlı buldum: http://docs.opencv.org/2.4/doc/tutorials/imgproc/histograms/histogram_comparison/histogram_comparison.html

Neden olduğundan tam olarak emin değilim, ancak OpenCV, Chi-Square histogram karşılaştırması için listelediğiniz 3. formülü kullanıyor.

Anlam açısından, herhangi bir ölçüm algoritmasının size% 0 ila% 100 gibi sınırlı bir aralık vereceğinden emin değilim. Başka bir deyişle, iki görüntünün aynı olduğundan emin olabilirsiniz: korelasyon değeri 1.0 ya da ki-kare değeri 0.0; ancak iki görüntünün ne kadar farklı olduğu konusunda bir sınır belirlemek zordur: tamamen beyaz bir görüntüyü tamamen siyah bir görüntüyle karşılaştırdığınızı hayal edin, sayısal değer Sonsuzluk veya Belki Sayı Değil olabilir.

— Russell
kaynak

2

$x$ $y$

Diğer ikisi histogram benzerliklerinin hesaplanmasında kullanılır.

— Polat Alemdar
kaynak

1

$x$

x

$x$

2

x

$x$

y

$y$

0

OP'nin istediği gibi yüzde değeri (denklem 1 için):

$p = \frac{\chi * S * 100}{N}$

$p$ $\chi$ $N$ $S$

Talep edildiği gibi tamamlandı:

Bu denklemi hesaplamak, tam bir histogramdan fark yüzdesine sahip olabilir. Bunu her iki histogram için hesaplayıp sonra birini diğerinden çıkararak yüzde olarak fark olabilir.

— Carlos Barcellos
kaynak

2

Bunun herhangi bir soruya nasıl bir cevap olduğunu görmekte zorlanıyorum. Detaylandırabilir misin?

— Laconic

Bu, bir histogramın tam bir histogramdan ne kadar farklı olduğunu (istendiği gibi yüzde olarak) verecektir. Bu denklemi her iki histogramdan hesaplarsanız, nirengi için kullanılan bir diğerinden farkı bileceğiz.

— Carlos Barcellos