@Silverfish, PolatAlemdar tarafından verilen cevabın genişletilmesini istedi, ki bu verilmemişti, bu yüzden burada genişletmeye çalışacağım.
Neden adı chisquare mesafesi? Beklenmedik tablolar için ki kare testi χ 2 = ∑ hücrelerine ( O i - E i ) 2 dayanmaktadır
öylesine bir fikir bu formu tutmak ve onu bir mesafe ölçüsü olarak kullanmaktır. Bu OP'nin üçüncü formülünü verir,xigözlem veyibeklentiolarak yorumlanır, PolatAlemdar'ın örneğin uyum iyiliği testinde olduğu gibi "ayrık olasılık dağılımlarında kullanılır" yorumunu açıklar. Bu üçüncü form,veydeğişkenlerinde asimetrik olduğu için bir mesafe işlevideğildir. Histogram karşılaştırması için,xveycinsinden simetrik olan bir mesafe fonksiyonu isteyeceğizve ilk iki form bunu veriyor. Aralarındaki fark sadece sabit bir faktördür1
χ2=∑cells(Oi−Ei)2Ei
xiyixyxy , sadece bir formu tutarlı bir şekilde seçtiğiniz sürece önemsizdir (asimetrik formla karşılaştırmak istiyorsanızekstra faktörolan sürümdaha iyidir). Bu formüllerdeki kareli öklid mesafeli, yani tesadüf olmayan benzerliklere dikkat edin, ki-kare mesafesi bir tür
ağırlıklıöklid mesafesidir. Bu nedenle, OP'deki formüller
mesafelerialmak için genellikle bir kök işaretinin altına yerleştirilir. Aşağıda bunu takip ediyoruz.
1212
Chisquare mesafesi yazışma analizinde de kullanılır. Burada kullanılan formla olan ilişkiyi görmek için , satırları ve sütunları olan bir beklenmedik durum tablosu hücreleri olsun . Satır toplamlarını ve sütun toplamlarını . Sıralar arasındaki mesafe ki-kare ile verilir
Yalnızca iki satırlı (iki histogram) durumda, bunlar OP'nin ilk formülünü (modulo kök işaretini) kurtarır. R C x + j = ∑ i x i j x i + = ∑ j x i j l , k χ 2 ( l , k ) = √xijRCx+j=∑ixijxi+=∑jxijl,k
χ2(l,k)=∑j1x+j(xljxl+−xkjxk+)2−−−−−−−−−−−−−−−−−−−⎷
EDIT
Aşağıdaki yorumlarda soruya cevap: Ki-kare mesafesinin uzun tartışmaları olan bir kitap, Michael Greenacre (Chapman & Hall) tarafından yazılan "UYGULAMADA KORUNMA ANALİZİ (İkinci Baskı)" dir. Beklenmedik tablolarla kullanılan chisquare'e benzerliğinden gelen, köklü bir isimdir. Ne gibi bir dağılımı var? Bunu hiç çalışmadım, ama muhtemelen (bazı koşullar altında ...) yaklaşık bir miktar chisquare dağılımı olurdu. İspatlar beklenmedik durum tablolarıyla yapılanlara benzer olmalıdır, yazışma analizi hakkındaki çoğu literatür dağıtım teorisine girmez. Biraz, belki de bu tür bir teoriye sahip bir makale http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0101-74382016000100023 . Ayrıca bakınızBu sitedeki diğer alakalı yayınlar için /stats//search?q=%22chisquare+distance%22 .