Belirsiz verilerle denetimli öğrenme?


11

Belirsiz bir veri kümesine denetimli bir öğrenme modeli uygulamak için mevcut bir metodoloji var mı? Örneğin, A ve B sınıflarına sahip bir veri kümemiz olduğunu varsayalım:

+----------+----------+-------+-----------+
| FeatureA | FeatureB | Label | Certainty |
+----------+----------+-------+-----------+
|        2 |        3 | A     | 50%       |
|        3 |        1 | B     | 80%       |
|        1 |        1 | A     | 100%      |
+----------+----------+-------+-----------+

Bu konuda bir makine öğrenme modelini nasıl eğitebiliriz? Teşekkürler.

Yanıtlar:


11

Verilerinize atfettiğiniz sayısal bir kalite olarak, bu "kesinlik" in kesinlikle bir ağırlık olarak kullanılabileceğini düşünüyorum. Daha yüksek "kesinlik" puanları, bir datumun karar fonksiyonu üzerindeki ağırlığını arttırır ve bu da mantıklıdır.

Denetimli birçok öğrenme algoritması ağırlıkları destekler, bu nedenle kullanmak istediğinizin ağırlıklı bir sürümünü bulmanız yeterlidir.


2
(+1) Ve esas olarak ağırlıklar noktaların "replikatları" olma eğiliminde olacağından, muhtemelen herhangi bir algoritma, örneğin OP örneğinde, [5,8,10] [50,80,100] kesinliklerini yansıtan 3 puan. (Bu hiçbir zaman gerçekten gerekli olmamalıdır, sanki prensipte yapılabilirmiş gibi, algoritmanın karşılık gelen ağırlıklı bir versiyonu olmalıdır.)
GeoMatt22

5

1A0B0.6AAB01

Örneğin, doğrusal bir model sığdırabilirsinizlogp(A|x)p(B|x)=logp(A|x)1P(A|x)β0+β1Txp(A|x)Aβ0+β1Tx>0B


Eğer çok sınıflı bir sınıflandırma probleminiz varsa hedeflerinizi sınıf sayısına eşit vektörler olarak ayarlayabilirsiniz?
hyperdo

Kesinliklerin% 100 olduğu varsayılarak -1 sınıfı sayısı; örnek lojistik regresyona benzer. Bir çok sınıflandırıcı skor üretmektedir (örneğin, bazı model altında p (sınıf | veri) tahminleri). Tüm bu cevap, sınıfları doğrudan tahmin etmek yerine, kesinlikleri puanlar olarak görmek ve onları tahmin etmektir. Sonra puanları ile bir şey yapın.
Batman
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.