Puanların toplamı ile tahmini faktör puanlarının toplamı?


12

Ölçekler oluştururken puanların düz toplamı üzerinden " faktör puanlarının " ne zaman kullanılacağı hakkında öneriler almak isterim . Yani bir faktörü puanlamak için "rafine edilmiş" üzerinden "rafine edilmemiş" yöntemler. DiStefano ve ark. (2009; pdf ), vurgu eklenmiştir:

Faktör skoru hesaplama yöntemlerinin iki ana sınıfı vardır: rafine ve rafine edilmemiş. Rafine edilmemiş yöntemler, bireylerin faktör dağılımı üzerine yerleşimi hakkında bilgi sağlamak için nispeten basit, kümülatif prosedürlerdir. Basitlik, bazı çekici özelliklere sahiptir, yani rafine edilmemiş yöntemlerin hem hesaplanması hem de yorumlanması kolaydır. Rafine hesaplama yöntemleri, daha sofistike ve teknik yaklaşımlar kullanarak faktör skorları yaratır. Rafine edilmemiş yöntemlerden daha kesin ve karmaşıktırlar ve standartlaştırılmış puanlar olan tahminler sağlarlar.

Aklıma göre, amaç çalışmalar ve ortamlarda kullanılabilecek bir ölçek oluşturmaksa, tüm ölçek öğelerinin basit bir toplamı veya ortalama puanı mantıklıdır. Ancak diyelim ki amaç bir programın tedavi etkilerini değerlendirmek ve önemli kontrast numune - tedavi - kontrol grubu). Ölçek toplamlarını veya ortalamaları seçmek için faktör puanlarını tercih etmemizin bir nedeni var mı?

Alternatifler konusunda somut olmak için şu basit örneği ele alalım:

library(lavaan)
library(devtools)

# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
  gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
  source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
  head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1  3  4  3  4  3  3  4  4  3
# 2  2  1  2  2  4  3  2  1  3
# 3  1  3  4  4  4  2  1  2  2
# 4  1  2  1  2  1  2  1  3  2
# 5  3  3  4  4  1  1  2  4  1
# 6  2  2  2  2  2  2  1  1  1

# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf

# non-refined -----------------------------------------------------------------
  mydata$sumScore <- rowSums(mydata[, 1:9])
      mydata$avgScore <- rowSums(mydata[, 1:9])/9
  hist(mydata$avgScore)

# refined ---------------------------------------------------------------------
  model <- '
            tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
           '
  fit <- sem(model, data = mydata, meanstructure = TRUE,
             missing = "pairwise", estimator = "WLSMV")
  factorScore <- predict(fit)
  hist(factorScore[,1])

Sorunun daha genel olmasını sağlamak için "müdahaleleri" başlıktan kaldırdım ve müdahalelerin muhtemelen iki tür yapı hesaplaması arasındaki ayrım üzerinde benzersiz, belirgin bir etkisi olmadığı için. Kabul etmiyorsanız, lütfen düzenlememi geri alabilirsiniz.
ttnphns

1
They are more exactBu ilave vurgu bizi faktör puanlarının bile kaçınılmaz olarak hatalı olduğu gerçeğinden uzaklaştırmamalıdır (" belirsiz ").
ttnphns

Benzer soruya da bakınız: stats.stackexchange.com/q/31967/3277 .
ttnphns

"Müdahalelerin" özel bir kullanım durumu olarak geçerli olduğunu düşünüyorum, ancak başlığında olması gerekmiyor. Sorudaki kilit konuyu vurguladım. "Daha kesin" vurgusuna gelince, faktör puanlarının belirsiz olmasıyla ilgili yaptığınız gözlem göz önüne alındığında, bu nokta hakkında düşünceler almak istedim. Diğer soruların bağlantıları için teşekkürler.
Eric Green

"more exact". Doğrusal olarak hesaplanan faktör puanları arasında regresyon yöntemi en çok "kesin" anlamında "bilinmeyen gerçek faktör değerleri ile en çok ilişkili" dir. Yani evet, daha kesin (doğrusal cebirsel yaklaşım içinde), ama tam olarak kesin değil.
ttnphns

Yanıtlar:


6

Bazı güncel projelerde bu fikirle kendim güreştim. Sanırım burada neyin tahmin edildiğini sormanız gerekiyor. Tek faktörlü bir model uyuyorsa, faktör puanları gizli faktörü tahmin eder. Her gözlem, faktöre eşit olarak yüklenmediği ve benzersizliklerin aynı olmadığı sürece, tezahür değişkenlerinizin düz toplamı veya ortalaması başka bir şey tahmin eder. Ve başka bir şey muhtemelen büyük miktarda teorik ilgi değildir.

Dolayısıyla, tek faktörlü bir model uyuyorsa, büyük olasılıkla faktör skorlarını kullanmanız önerilir. Çalışmalar arasında karşılaştırılabilirlik konusundaki fikrinizi anlıyorum, ancak belirli bir çalışmada, faktör puanlarının onlar için çok şey olduğunu düşünüyorum.

İlginç olduğu yerde, tek faktörlü bir modelin uygun olmaması, ya iki faktörlü bir modelin uygulanması (ya da daha yüksek olması) ya da kovaryans yapısının bir faktör modelinin öngördüğünden daha karmaşık olmasıdır. Bana göre soru, değişkenlerin düz toplamının gerçek herhangi bir şeye işaret edip etmediğidir.. Bu özellikle verilerin birden fazla boyutu varsa doğrudur. Pratikte, sık sık olan şey, bir ya da iki tanesinin diğerlerinden çok farklı olduğu bir grup ilişkili değişkeniniz (belki de bir anketteki öğeler) olmasıdır. "Bununla cehenneme" diyebilir ve ne anlama geldiğine bakılmaksızın her şeyin ortalamasını alabilirsiniz. Veya faktör puanları ile gidebilirsiniz. Tek faktörlü bir model takarsanız, tipik olarak olacak olan, faktör analizinin daha az yararlı değişkenleri (veya en azından ikinci bir faktör skoruna ait olan değişkenleri) zayıflatacağıdır. Aslında, onları farklı bir boyuta ait olarak görür ve yok sayar.

Bu yüzden faktör puanının, başladığınızdan daha tek boyutlu bir şey vermek için verileri bir şekilde budanabileceğine inanıyorum. Ama bununla ilgili bir referansım yok ve bu yaklaşımı beğenirsem kendi çalışmamda hala anlamaya çalışıyorum. Bana göre, puanları aynı verilere sahip başka bir modele sürdüğünüzde büyük tehlike fazladır. Skorlar zaten bir optimizasyon sorusunun cevabıdır, bu yüzden analizin geri kalan kısmı nerede kalıyor? Düşünmekten nefret ediyorum.

Bir tek faktörlü modeli gibi bir şey Ama eğer günün sonunda, bir miktar ya da değişkenlerin toplam aslında mantıklı geliyor değil geçerlidir?

İnsanlar başlamak için daha iyi ölçekler tasarlarsa bu soruların çoğu ortaya çıkmaz.


Yorumlarınızı takdir ediyorum, @Placidia. Bize daha büyük karışıklığı hatırlatırken biraz netlik getir! Bunun dikkate alınması gereken ilginç bir nokta olduğunu düşünüyorum: "Faktör modeli uyuyorsa, faktör puanları gizli faktörü tahmin eder. Her gözlem faktöre eşit yüklenmediği sürece, tezahür değişkenlerinizin düz toplamı veya ortalaması başka bir şey tahmin eder ve benzersizlikler de aynıdır ve başka bir şey muhtemelen büyük bir teorik ilgi miktarı değildir. "
Eric Green

Çok düşünceli bir cevap için +1. Eklenecek birkaç düşünce: 1) çalışmalarda karşılaştırılabilirlik ile ilgili olarak, modelden dahil edilen / hariç tutulan değişkenlere yanıt olarak biraz değişebilen bileşen yüklemelerinin aksine - ortak faktör yüklemelerinin parametre tahminleri olduğunu bilmek önemlidir. Daha sonra, çalışmadan çalışmaya örnekleme (örnekleme hatası dahilinde) ve dolayısıyla faktör skorları da çoğaltılmalıdır. 2) Faktör skorlarını kullanma konusunda endişeleriniz varsa, kararlılık indekslerine ve faktör skor korelasyonlarınızın gizli korelasyonları ne kadar iyi yansıttığına
bakabilirsiniz

1
... bence bu DiStefanno ve diğ. ark. faktör skorlarının "güvenilir" olup olmadığını değerlendirmek için bir çalışma. Ve son olarak 3) Hedefiniz, Placidia'nın açıkladığı gibi, büyük ölçüde tek boyutlu olan bir şeyi analiz etmekse, anladığım kadarıyla, önce her değişkenin yüklediği ortak bir faktörü ve ardından müteakip dikey olan bir faktör analiz yaklaşımı düşünebilirsiniz. tüm değişkenleri birbirine bağlayan ortak boyutun ötesinde, görünüşte en önemli ayırt edilebilir faktörleri yansıtan değişken alt kümeleri için faktörler çıkarılır.
jsakaluk

Placidia, cevabınızın son düzenlemesinde, kendinizi ifade ile tekrar tekrar kısıtlıyorsunuz one-factor model. Sadece nedenini merak ediyorum. 2 faktörlü bir model faktör skorunun estimate the latent factorartık olmadığını mı söylüyorsunuz ? Neden öyle? Ayrıca, geliştirilen bir anket (Q'nun muhtemel bağlamı) bağlamında "tek faktörlü modeli" nasıl tanımlarsınız: anketin tek faktörlü / ölçekli olması veya dahil edilen her bir öğenin kesinlikle bir faktöre ait sayılmasıdır / ölçek? Lütfen, daha açık hale getirebilir misin?
ttnphns

Olası yanlış anlamalardan kaçınmak istedim. İki faktörlü bir modele inanıyorsanız, muhtemelen özet toplamları kullanmak tablo dışında olacaktır. Verilerdeki iki boyut için iki özete ihtiyacınız vardır. Cevabımın özet istatistik ile tek faktörlü modelin faktör puanı arasında seçim yapmak olduğunu açıklığa kavuşturmak istedim. Model yanlış olsa bile tek faktörlü puanın yararlı olabileceğini iddia ediyorum. @ jsakaluk'un çok faktörlü bir modelin takılması ve ilk faktörün seçilmesi önerisi de mümkündür ve bazı durumlarda daha iyi olabilir.
Placidia

4

Ortak faktör tarafından yüklenen öğelerin toplanması veya ortalamasının alınması, yapı puanını (bu faktörü temsil eden yapı) hesaba katmanın geleneksel bir yoludur. Hesaplama faktörü puanlarının "kaba yöntem" in en basit sürümüdür ; yöntemin ana noktası faktör yüklerinin skor ağırlıkları olarak kullanılmasıdır. İşlem skorlarına rafine yöntemler özel olarak tahmin edilen kullanım sırasında mı katsayıları (hesaplanan gelen ağırlık olarak yükler).

Bu cevap, evrensel olarak "geniş bir alan olan düz madde puanlarının toplamı üzerinde [rafine edilmiş faktör puanlarının ne zaman kullanılacağına dair öneride bulunmaz”, ancak bir yapıyı diğerine göre hesaplamanın bir yolunu tercih etmeye devam eden somut bariz etkiler göstermeye odaklanır. yol.

Bazı faktör ve yüklediği iki öğe ile basit bir durumu düşünün . Dipnot 1'e göre burada faktör skorları, faktör skor katsayıları hesaplanmıştır nasıl regresyonel açıklayan b 1 ve b 2 faktör puanları hesaplamak için F gelenFb1b2F

,s1=b1r11+b2r12

,s2=b1r12+b2r22

burada ve s 2 , faktör ve maddeler - faktör yükleri arasındaki korelasyonlardır; r 12 öğeler arasında korelasyon olduğunu. B katsayıları faktör basit sonuçlarını, madde puanlarının ağırlıksız toplamı ayırt şeylerdir. Çünkü, sadece toplamı (veya ortalama) hesapladığınızda, her iki b'yi de eşit olarak ayarlarsınız . "Rafine" faktörü puanlarında iken b ler yukarıdaki denklemlerinden var ve değillerdir genellikle eşittir.s1s2r12bbb

rr11r22

b1=s2r12-s1r122-1

b2=s1r12-s2r122-1

b1-b2=-(r12+1)(s1-s2)r122-1.

bsr12b1-b2

resim açıklamasını buraya girin

resim açıklamasını buraya girin

s1-s2=0bs1-s2b1-b2r12

b

s1=.70s2=.450,25

c. Eğer kuvvetle korelasyon gösterirlerse, zayıf yüklenen madde diğerinin küçük kopyasıdır. Daha güçlü ikamesi karşısında zayıf göstergeyi / semptomu saymanın nedeni nedir? Sebep yok. Ve faktör puanları buna göre ayarlanır (basit toplama olmasa da). Çok faktörlü bir ankette "zayıf yüklenen kalem" genellikle başka bir faktörün, daha yüksek yüklü bir kalem olduğunu unutmayın; mevcut faktörde ise, bu madde şu anda gördüğümüz gibi faktör puanlarının hesaplanmasında kısıtlanmaktadır - ve bu doğru bir şekilde hizmet vermektedir.

b. Ancak, öğeler, daha önce olduğu gibi eşit olmayan bir şekilde yüklenirken, bunu güçlü bir şekilde ilişkilendirmezlerse, bunlar bizim için farklı göstergeler / belirtilerdir. Ve "iki kez" sayılabilir, yani sadece toplanabilir. Bu durumda, faktör puanları, faktörün farklı bir düzenlemesi olduğu için, zayıf öğeye yükünün hala izin verdiği ölçüde saygı göstermeye çalışır.

a. İki madde de iki kez sayılabilir, yani, bu maddeler arasındaki korelasyon ne olursa olsun, faktöre göre benzer, yeterince yüksek yüklere sahip olduklarında toplanabilir. (Faktör puanları her iki maddeye de çok sıkı korelasyon göstermediklerinde daha fazla ağırlık katmaktadır, ancak ağırlıklar eşittir.) Tamamen yüklü olmaları durumunda genellikle çoğaltılmış öğeleri genellikle tolere etmemiz veya kabul etmemiz mantıksız görünmektedir. Bunu beğenmediyseniz (bazen yapmak isteyebilirsiniz), kopyaları faktörden manuel olarak ortadan kaldırabilirsiniz.

resim açıklamasını buraya girin

Dolayısıyla, (rafine edilmiş) faktör puanlarının (en azından regresyon yöntemiyle) hesaplanmasında, kurumu oluşturan değişkenler arasında puanlar üzerindeki etkileriyle " geçin / dışarı çık" entrikaları görülür . Eşit derecede güçlü ve güçlü bir şekilde ilişkili olmayanlar da eşit derecede güçlü göstergeler birbirlerine tahammül eder. "Kapatma", daha güçlü göstergelerle güçlü bir korelasyon içinde olan zayıf bir göstergenin ortaya çıkmasıdır. Basit toplama / ortalamanın "zayıf bir kopyasını çıkar" entrikaları yoktur.

Lütfen bu faktörü teorik olarak uyaran bu cevaba, brüt bir "onun" gösterge fenomeni topluluğu veya yığınından ziyade bir "öz" olduğu uyarısına bakınız . Bu nedenle, ne yüklerini ne de korelasyonlarını göz önünde bulundurarak körü körüne özetlemek potansiyel olarak sorunludur. Öte yandan, puanlandığı gibi faktör, öğelerinin bir miktarından başka bir şey olabilir ve bu nedenle her şey, toplamdaki ağırlıkların daha iyi bir anlayışı ile ilgilidir.


Daha genel ve soyut olarak kaba veya toplama yönteminin eksikliğine de bakalım .

bbir

F^benbenFbenX1X2bir1bir2FUb

F^ben=b1X1ben+b2X2ben=b1(Fben+U1ben)+b2(Fben+U2ben)=(b1+b2)Fben+b1U1ben+b2U2ben

b1U1ben+b2U2benF^benFbenUF^Fbvar[b1U1ben+b2U2ben]F^FbbirXF^F

birbFF^

F^ben=bir1X1ben+bir2X2ben= ... =(bir1+bir2)Fben+bir1U1ben+bir2U2ben

bbirbirbir


Yararlı yanıt için teşekkürler, @ttnphns. Yaklaşık eşit yüke sahip öğelerin toplanabilmesi mantıklıdır (a). Ne yazık ki, işimde, tek boyutlu olduğu düşünülen mevcut bir ölçeği kullanırken, öğelerin eşit yüklere sahip olduğunu bulduğum bir durumla karşılaştığımı sanmıyorum.
Eric Green

Bu nedenle, yüklemelerin farklı olduğu bir durumu ve öğeler arası korelasyonları inceleme önerisini açıklamakla özellikle ilgilenmiştim. (A) 'da "güçlü" (c) / "güçlü değil" korelasyonları (b) veya "yeterince yüksek" yükler için herhangi bir başparmak kuralınız olup olmadığını bilmek istiyorum.
Eric Green

1
Son olarak, bu sorunun arka planının, ölçeği norm olmayan yeni nüfusa uygularken bile basit toplamlar (ortalamalar) gerektiren "onaylanmış" ölçekleri kullanmak için ezici bir disiplin normu (en azından psikolojide) olduğunu not edeceğim. Çoğunlukla amaç, basit toplamları ortak bir yaklaşım haline getiren çapraz örnek karşılaştırmalarıdır (yetkisiz olsa bile).
Eric Green

Müdahale çalışmaları aklımdaki ilginç bir kullanım örneğidir çünkü ilgi karşılaştırması örneklem içinde. Bana göre, tedavi etkisi büyüklüğünün her iki gruptan da ölçekteki "ham" puanından daha fazla önem verdiğimiz görülüyor - özellikle ölçeği geliştirmek / normlamak için kullanılan popülasyonun dışındaki ölçeği kullanırken. Faktör skorları bazı durumlarda "daha iyi" ise, o zaman basit bir yaklaşımı, nihayetinde sadece tedavi etkisi boyutlarına bakmak istediğimizi bilerek daha kavramsal mantıklı bir yaklaşım lehine atmaya değer gibi görünmektedir.
Eric Green

1
(devam) Use "validated" scaleskendisi mutlaka basit toplamlar gerektirmez: eğer validasyon iyi ise (temsili büyük örnek, iyi korelasyonlar, doğru faktör sayısı, iyi uyum, vb.) hesaplanan faktör skorları (katsayıları) normatif olarak alınabilir yeni popülasyonlarda kullanılacak ağırlıklar. Gelen bu bağlamda, ben basit toplamı herhangi bir avantaj göremiyorum.
ttnphns
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.