Birden çok veri setindeki çoklu algoritmaların performansını karşılaştırıyorum. Bu performans ölçümlerinin normal olarak dağıtılacağı garanti edilmediğinden, Demšar'a (2006) dayanan Nemenyi post-hoc testiyle Friedman Testini seçtim .
Daha sonra, Shaffer post-hoc testiyle Quade testi gibi diğer yöntemleri önermek dışında, Nemenyi testini farklı şekilde uygulayan başka bir makale buldum.
Nemenyi post-hoc testini nasıl doğru şekilde uygulayabilirim?
1. Öğrenci aralığı istatistiğini mi kullanıyorsunuz?
Demšar'ın makalesinde, ortalama sıralama farkı kritik mesafe CD'sinden daha büyükse, boş hipotezi (iki algoritmanın performans farkı yok) reddettiğini söyler.
"qα değerlerinin Studentized range istatistiğine bölünmesiyle "
Biraz kazmadan sonra, bu "kritik değerler" in belirli alfalar için aranabileceğini buldum, örneğin bir tabloda, sonsuz serbestlik dereceleri için (her tablonun altında).
2. veya normal dağılımı mı kullanıyorsunuz?
Ne yapacağımı bildiğimi düşündüğümde, beni yine şaşırtan başka bir kağıt buldum, çünkü sadece normal dağılımı kullanıyorlardı. Demšar benzer bir şeyi 12. sayfada belirtiyor:
Bu yöntemleri kullanarak i-th ve j-th sınıflarını karşılaştırmak için test istatistikleri:
Z değeri, normal dağılım tablosundan karşılık gelen olasılığı bulmak için kullanılır ve daha sonra uygun bir değerle karşılaştırılır. . Testler, değerleri çoklu karşılaştırmaları telafi etmek.
Bu paragrafta, tüm algoritmaları bir kontrol algoritmasıyla karşılaştırmaktan bahsediyordu, ancak "çoklu karşılaştırmaları telafi etmek için ayarladıkları şekilde farklılık gösteriyor" ifadesi, bunun Nemenyi testi için de geçerli olması gerektiğini gösteriyor.
Benim için mantıklı görünen şey p- değerini test istatistiğine dayanarak hesaplamak, normal olarak dağıtılır ve .
Ancak bu, sıfır hipotezini reddetmek için tamamen farklı rütbe farklılıkları verir. Ve şimdi takıldım ve hangi yöntemi uygulayacağımı bilmiyorum. Benim için daha basit ve daha mantıklı olduğu için normal dağılımı kullanarak birine doğru eğiliyordum . Ayrıca tablolarda değerleri aramak gerek yok ve belirli önem değerlerine bağlı değilim.
Sonra tekrar, öğrenci aralığı istatistiği ile hiç çalışmadım ve anlamıyorum.