(Şimdi fazla zamanım yok, bu yüzden kısaca cevaplayacağım ve sonra genişleteceğim)
Diyelim ki bir ikili sınıflandırma problemi düşünüyoruz ve m sınıf 1 örnekleri ve nsınıf 2 örnekleri. Özellik seçimi için permütasyon testi, her özelliğe ayrı ayrı bakar. Bir test istatistiğiθbilgi kazancı veya araçlar arasındaki normalleştirilmiş fark gibi özellik için hesaplanır. Özellik için veriler daha sonra rasgele izin verilir ve biri boyutta olmak üzere iki kümeye bölünürm ve biri n. Test istatistiğiθp daha sonra bu yeni bölüme göre hesaplanır p. Sorunun hesaplama karmaşıklığına bağlı olarak, bu daha sonra özelliğin tüm olası bölümleri üzerinde iki sıraya göre tekrarlanır.m ve nveya bunların rastgele bir alt kümesini içerir.
Artık, θp, gözlemlenen test istatistiği olan p-değerini hesaplıyoruz θözelliğin rastgele bir bölümünden ortaya çıktı. Boş hipotez, her sınıftan örneklerin aynı temel dağılımdan gelmesidir (özellik ilgisizdir).
Bu işlem tüm özellikler üzerinde tekrarlanır ve daha sonra sınıflandırma için kullanılan özelliklerin alt kümesi iki şekilde seçilebilir:
- N en düşük p değerine sahip özellikler
- P değerine sahip tüm özellikler<ϵ