Ölçekler oluştururken puanların düz toplamı üzerinden " faktör puanlarının " ne zaman kullanılacağı hakkında öneriler almak isterim . Yani bir faktörü puanlamak için "rafine edilmiş" üzerinden "rafine edilmemiş" yöntemler. DiStefano ve ark. (2009; pdf ), vurgu eklenmiştir:
Faktör skoru hesaplama yöntemlerinin iki ana sınıfı vardır: rafine ve rafine edilmemiş. Rafine edilmemiş yöntemler, bireylerin faktör dağılımı üzerine yerleşimi hakkında bilgi sağlamak için nispeten basit, kümülatif prosedürlerdir. Basitlik, bazı çekici özelliklere sahiptir, yani rafine edilmemiş yöntemlerin hem hesaplanması hem de yorumlanması kolaydır. Rafine hesaplama yöntemleri, daha sofistike ve teknik yaklaşımlar kullanarak faktör skorları yaratır. Rafine edilmemiş yöntemlerden daha kesin ve karmaşıktırlar ve standartlaştırılmış puanlar olan tahminler sağlarlar.
Aklıma göre, amaç çalışmalar ve ortamlarda kullanılabilecek bir ölçek oluşturmaksa, tüm ölçek öğelerinin basit bir toplamı veya ortalama puanı mantıklıdır. Ancak diyelim ki amaç bir programın tedavi etkilerini değerlendirmek ve önemli kontrast numune - tedavi - kontrol grubu). Ölçek toplamlarını veya ortalamaları seçmek için faktör puanlarını tercih etmemizin bir nedeni var mı?
Alternatifler konusunda somut olmak için şu basit örneği ele alalım:
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
They are more exact
Bu ilave vurgu bizi faktör puanlarının bile kaçınılmaz olarak hatalı olduğu gerçeğinden uzaklaştırmamalıdır (" belirsiz ").
"more exact"
. Doğrusal olarak hesaplanan faktör puanları arasında regresyon yöntemi en çok "kesin" anlamında "bilinmeyen gerçek faktör değerleri ile en çok ilişkili" dir. Yani evet, daha kesin (doğrusal cebirsel yaklaşım içinde), ama tam olarak kesin değil.