Bağımlı değişkenin yüzde olduğu tekrarlanan ölçümler deneyim var ve bağımsız değişkenler olarak birden fazla faktör var. glmer
R paketinden lme4
, bunu bir lojistik regresyon problemi olarak (belirterek family=binomial
) tedavi etmek için kullanmak istiyorum .
Verilerim şuna benzer:
> head(data.xvsy)
foldnum featureset noisered pooldur dpoolmode auc
1 0 mfcc-ms nr0 1 mean 0.6760438
2 1 mfcc-ms nr0 1 mean 0.6739482
3 0 melspec-maxp nr075 1 max 0.8141421
4 1 melspec-maxp nr075 1 max 0.7822994
5 0 chrmpeak-tpor1d nr075 1 max 0.6547476
6 1 chrmpeak-tpor1d nr075 1 max 0.6699825
ve işte umduğum R komutu uygun olurdu:
glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)
Bununla ilgili sorun, komutun bağımlı değişkenimde tamsayı olmadığından şikayet etmesidir:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
ve bu (pilot) verilerin analizi sonuç olarak garip cevaplar verir.
binomial
Ailenin neden tamsayılar beklediğini (evet-hayır sayıyor) anlıyorum, ancak yüzde verilerini doğrudan doğruya çekmenin doğru olması gerektiği görünüyor. Bu nasıl yapılır?