Bir dizi girdi verildiğinde, bu dizinin istenen belirli bir özelliğe sahip olup olmadığını belirlemem gerekir. Özellik yalnızca doğru veya yanlış olabilir, yani bir dizinin ait olabileceği yalnızca iki olası sınıf vardır.
Dizi ve özellik arasındaki kesin ilişki belirsizdir, ancak bunun çok tutarlı olduğuna ve istatistiksel sınıflandırmaya uygun olması gerektiğine inanıyorum. Sınıflandırıcıyı eğitmek için çok sayıda vaka var, biraz gürültülü olsa da, bu eğitim setinde bir sıraya yanlış sınıf atanması ihtimali düşüktür.
Örnek eğitim verileri:
Sequence 1: (7 5 21 3 3) -> true
Sequence 2: (21 7 5 1) -> true
Sequence 3: (12 21 7 5 11 1) -> false
Sequence 4: (21 5 7 1) -> false
...
Kaba terimlerle, özellik dizideki değerler kümesi ile belirlenir (örneğin, bir "11" varlığı, özelliğin neredeyse kesinlikle yanlış olacağı anlamına gelir) ve değerlerin sırası (örn. "21 7 5 msgstr "mülkiyetin gerçek olma şansını önemli ölçüde artırır).
Eğitimden sonra, sınıflandırıcıya daha önce görülmemiş bir dizi verebilmeliyim (1 21 7 5 3)
ve özelliğin gerçek olduğuna dair güvenini vermelidir. Bu tür girdi / çıktılarla bir sınıflandırıcıyı eğitmek için iyi bilinen bir algoritma var mı?
Saf Bayesian sınıflandırıcıyı düşündüm (bu, siparişin önemli olduğu gerçeğine uyarlanamaz, en azından girdilerin bağımsız olduğu varsayımını ciddi bir şekilde bozmadan). Ayrıca, giriş başına bir çıkış yerine yalnızca tek bir çıktı kullanılabilir olduğu için uygulanamayacak gibi görünen gizli Markov modeli yaklaşımını araştırdım. Ne kaçırdım?