Bir güven düzeyini denetimli öğrenme olasılığına göre kalibre etmek için (örneğin, bir SVM'den veya aşırı örneklenmiş veriler kullanarak bir karar ağacından güveni haritalamak için) bir yöntem Platt'ın Ölçeklendirmesini kullanmaktır (örn. Kalibre Edilmiş Olasılıkları Artırmaktan Almak ).
Temel olarak haritalamak için lojistik regresyon kullanılır ila . Bağımlı değişken gerçek etikettir ve öngörücü, kalibre edilmemiş modele olan güvendir. Ne anlamıyorum 1 veya 0 dışında bir hedef değişken kullanımıdır. Yöntem yeni bir "etiket" oluşturulması için çağırır:
Sigmoid tren setine aşırı sığmayı önlemek için örnek dışı bir model kullanılır. Varsa pozitif örnekler ve tren setinde olumsuz örnekler, her eğitim örneğin Platt Kalibrasyon hedef değerlerini kullanır ve (sırasıyla yerine 1 ve 0,),
Anlamadığım şey, bu yeni hedefin ne kadar yararlı olduğudur. Lojistik regresyon, bağımlı değişkeni ikili bir etiket olarak ele almayacak mıdır (hangi etikete bakılmaksızın)?
GÜNCELLEME:
SAS'ta bağımlı başka bir şeye değiştirerek aynı modele (kullanarak ) geri döndüğünü buldum . Belki benim hatam ya da SAS'ın çok yönlülüğü eksikliği. R modelini değiştirebildim. Örnek olarak:PROC GENMOD
data(ToothGrowth)
attach(ToothGrowth)
# 1/0 coding
dep <- ifelse(supp == "VC", 1, 0)
OneZeroModel <- glm(dep~len, family=binomial)
OneZeroModel
predict(OneZeroModel)
# Platt coding
dep2 <- ifelse(supp == "VC", 31/32, 1/32)
plattCodeModel <- glm(dep2~len, family=binomial)
plattCodeModel
predict(plattCodeModel)
compare <- cbind(predict(OneZeroModel), predict(plattCodeModel))
plot(predict(OneZeroModel), predict(plattCodeModel))