Sınıflardan birinin 'diğerlerinden değil' ile tanımlandığı bir sınıflandırma problemine nasıl yaklaşırım?


9

Üç sınıf , , ilgilendiğimi varsayalım . Ancak veri aslında birkaç gerçek sınıf daha içeriyor .c1c2c3(cj)j=4n

Açık cevap, , tüm sınıfları ifade eden yeni bir sınıfı tanımlamaktır , ancak örnekler nadir ve birbirine çok bunun iyi bir fikir olmadığından şüpheleniyorum .c^4cjj>3c^4

Söylemeye çalıştığım şeyi görselleştirmek için aşağıdaki iki değişken alanım olduğunu ve , , , kırmızı, til, yeşil ve sırasıyla siyah. Verilerimin böyle görüneceğinden şüpheleniyorum.c1c2c3c^4=j=4ncj

resim açıklamasını buraya girin

Bu probleme yaklaşmanın standart bir yolu var mı? En verimli sınıflandırıcı nedir ve neden?


Dinlenmeye karşı tek bir
tr

1
Olumlu etiketlenmemiş modelleri keşfetmek isteyebilirsiniz . Benzer bir soruna benziyor, ancak çoğu PU problemi gibi ikili değil, çok sınıflı.
Ricardo Cruz

Yanıtlar:


4

sınıfı fikrini kullanarak iki aşamalı bir yaklaşım kullanırdım .c4^

İlk adımda, bir örneğin sınıfına (yani ilginç olmayan herhangi bir sınıfta) ait olup olmadığına karar vermek için bir ikili sınıflandırıcı (tüm veri kümesinde eğitilmiş) kullanın . Bunun için adım , "ilginç" sınıflara ait örnekler diğerlerinden çok farklıysa, aykırı algılama yöntemlerine de bakabilirsiniz .c4^

Sonuç negatifse, yalnızca sınıflarına ait örnekler üzerinde eğitilmiş yeni bir sınıflandırıcı olan bir sonraki adıma ve bu tahmini son tahmininiz olarak kullanın.c1,c2,c3

İlk adım olarak basit bir kümeleme yaklaşımı kullanmanın bile (örn. 4 kümeleme k- başlangıçtaki merkez değerleri olarak ortalama anlamına gelir Her için ) yine de faydalı olacaktır.centj=xiD:yi=jxixiD:yi=j1c1,c2,c3,c4^


Çok fazla sınıf çakışması yoksa Bogas önerisi harika. Aksi takdirde, çok etiketli bir modelle devam edin.
Ricardo Cruz

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.