Faktör analizi, iç tutarlılık ve madde yanıt teorisi ile birlikte madde sayısı nasıl azaltılır?


12

Ampirik olarak bir anket geliştirme sürecindeyim ve bu örnekte rasgele sayılar kullanacağım. Bağlam için, anksiyete bozuklukları olan bireylerde sıkça tanımlanan düşünce kalıplarını değerlendirmeye yönelik psikolojik bir anket geliştiriyorum. Bir öğe, " Kapalı olduğundan emin olamadığım için fırını tekrar tekrar kontrol etmem gerekiyor " gibi görünebilir .

Bir ya da iki faktörden oluşabilecek 20 sorum (5'li Likert) var (gerçekte 10 sorudan oluşan 200 soruya daha yakın olduğumu ve her bir ölçeğin iki faktörden oluşabileceğini unutmayın). İki faktörden birine 10 soru bırakarak, öğelerin yaklaşık yarısını silmek istiyorum.

Maddi yanıt teorisinde (IRT) açımlayıcı faktör analizi (EFA), iç tutarlılık (Cronbach alfa) ve madde karakteristik eğrilerini biliyorum. Hangi maddelerin herhangi bir ölçek içinde "daha kötü" olduğunu belirlemek için bu yöntemlerden herhangi birini nasıl kullanabilirsiniz görebilirsiniz. Benzer sonuçlara yol açsalar da her yöntemin farklı soruları yanıtladığını takdir ediyorum ve hangi "sorunun" en önemli olduğundan emin değilim.

Başlamadan önce, bu yöntemlerin her biri ile ayrı ayrı ne yaptığımı bildiğimden emin olalım.

  • EFA kullanarak, faktörlerin sayısını belirleyeceğim ve kendi faktörlerine en az yük veren (<<30 diyelim) veya faktörler arasında büyük ölçüde çapraz yüklenen öğeleri kaldıracağım.

  • İç tutarlılığı kullanarak, daha kötü "öğe silindiğinde alfa" olan öğeleri kaldıracağım. Ölçeğimde bir faktör olduğunu varsayabilirim ya da faktör sayısını tanımlamak ve daha sonra her bir faktör için alfa'mı çalıştırmak için ilk EFA'dan sonra yapabilirim.

  • IRT kullanarak, (5 Likert) yanıt seçenekleri boyunca ilgi faktörünü değerlendirmeyen öğeleri kaldıracağım. Göze çarpan öğe karakteristik eğrileri olurdu. Temelde, Likert ölçeğinde seçenek 1'den gizli puan boyunca 5'e kadar 45 derecelik bir açıyla bir çizgi arıyordum. Bir faktörün varsayılarak, ya da ilk
    EFA'dan sonra , faktör sayısını tanımlamak ve daha sonra her bir faktör için eğrileri çalıştırmak için bunu yapabilirim.

Hangi öğeleri "en kötü" en iyi tanımlamak için bu yöntemlerden hangisini kullanmak emin değilim. Geniş anlamda, öğenin hem benim için hem de eşit derecede önemli olan güvenilirlik veya geçerlilik açısından ölçüme zarar vereceği şekilde en kötü şekilde kullanıyorum. Muhtemelen onları birlikte kullanabilirim, ama nasıl olduğundan emin değilim.

Şimdi bildiklerimle devam edip en iyi atışımı yapsaydım aşağıdakileri yapardım:

  1. Faktör sayısını belirlemek için bir EFA yapın. Ayrıca, diğer analizlerde nasıl yapacağından bağımsız olarak kötü yüklenen öğeleri istemediğim için, kendi faktörleri üzerinde kötü yüklemeleri olan öğeleri silin.
  2. IRT yapın ve EFA'dan kalırsa, bu analiz tarafından değerlendirilen kötü öğeleri de kaldırın.
  3. Sadece Cronbach's Alpha rapor edin ve bu metriği öğeleri silmek için bir araç olarak kullanmayın.

Herhangi bir genel kural çok takdir edilecektir!

Ayrıca, belki de cevaplayabileceğiniz belirli soruların bir listesi:

  1. Faktör yüklerine dayalı maddeleri kaldırmak ve Chronbach alfa'sına dayalı öğeleri kaldırmak arasındaki pratik fark nedir (her iki analiz için de aynı faktör düzenini kullandığınız varsayılarak)?

  2. Önce hangisini yapmalıyım? EFA ve IRT'yi tek bir faktörle yaptığımı ve her ikisinin de kaldırılması gereken farklı öğeleri belirlediğini varsayarsak, hangi analizin önceliği olmalıdır?

Chronbach'ın alfa'sını ne olursa olsun rapor edeceğim halde, tüm bu analizleri yapmakta zorlanmıyorum. Sadece IRT yapmanın bir şeyleri eksik bıraktığını hissediyorum ve aynı şekilde sadece EFA için.


FA aracılığıyla yapı geçerliliği elde etmeyi seçerseniz, elbette FA ile başlamalısınız ("bozuk" olan öğeleri eledikten sonra, örneğin çok eğimli dağılımlar). FA ile ilişkiniz karmaşık ve yinelemeli olacaktır. "Zayıf" öğelerin çoğunu
attıktan


1
En yüksek "alfa kaldırılırsa alfa" olan öğeleri kaldırmak en düşük değil ...

Bu garip! Bu temel soruya gelince, 3 yıl içinde kabul edilmiş bir cevabımız yok.
WhiteGirl

Yanıtlar:


3

Hiç alıntım yok, ama önereceğim şey:

Sıfır: Mümkünse, verileri bir eğitim ve test setine bölün.

Önce EFA yapın. Sorular hakkındaki bilginize dayanarak hangilerinin anlamlı olduğunu görmek için çeşitli çözümlere bakın. Bunu Cronbach'ın alfa'sından önce yapmanız gerekir, ya da hangi öğelerin hangi faktöre girdiğini bilemezsiniz. (TÜM öğeler üzerinde alfa çalıştırmak muhtemelen iyi bir fikir değildir).

Ardından, alfa çalıştırın ve her bir faktördeki diğerlerinden çok daha zayıf korelasyonları olan öğeleri silin. Ben keyfi bir kesim yapmazdım, diğerlerinden çok daha düşük olanları ararım. Bunları silmenin mantıklı olup olmadığına bakın.

Son olarak, IRT'den çeşitli "zorluk" seviyeleri olan öğeleri seçin.

Ardından, mümkünse, bunu test setinde, ancak herhangi bir araştırma yapmadan tekrarlayın. Yani, eğitim setinde bulunan sonucun test setinde ne kadar iyi çalıştığını görün.


Cevap için teşekkürler. Verileri bölmek için davalara sahip olup olmadığımdan emin olmasam da, bu düşündüğüm doğrultuda. Ayrıca, eşyalar 5'li Likert ölçeğinde olduğundan, çoğunun ya da en azından "iyi olanların" benzer bir zorluk sergileyeceğini umuyorum.
Behacad

1
Şüphesiz, iyi referanslar biliyorsunuz :-) Aşağıdaki noktalarda sizi kızdırırdım (çünkü bu konu muhtemelen gelecekteki sorular için bir referans görevi görecektir). (a) Genellikle, Cronbach alfa'sına dayalı madde silme, çapraz doğrulama şeması dikkate alınmadan yapılır. Açıkçası, aynı bireyler her iki ölçüyü tahmin etmek için kullanıldığından, taraflı bir yaklaşımdır. (b) Diğer bir alternatif, dinlenme puanı (yani, göz önünde bulundurulan öğeyi içermeyen toplam puan) dikkate alınarak madde / ölçek korelasyonunu temellemektir: bu durumda önemli olduğunu düşünüyor musunuz? (...)
chl

1
(...) (c) Son olarak, IRT modelleri genellikle eşya uyum istatistiklerine ve benzerine dayanarak maddeleri ( ölçek arındırma ruhuyla) atmak için kullanılır . Bu yaklaşım hakkında ne düşünüyorsunuz?
chl

FYI Muhtemelen bu yöntemlerin her biri için ayrı ayrı referanslar bulabilirim, ancak bu yöntemlerden herhangi birini birlikte kullanma konusunda olası referansları takdir ediyorum. Herhangi bir referans gerçekten harika olurdu! Bilirsiniz (ve muhtemelen vardır!) Yorumcular ...
Behacad

@chl Referansları kazabilirdim, ama onları kafamın üstünden bilmiyorum. A) ve b) 'de, muhtemelen çoğu insanın düşündüğünden daha önemlidir; birisi simülasyon yapmalı. c) IRT şeyler yaptığımdan beri bir süredir (derecem psikometride, ama bu uzun zaman önceydi).
Peter Flom - Monica'yı eski durumuna döndürün

2

Önerilen kriterlerin üçü de aslında IRT'de, daha spesifik olarak çok boyutlu IRT'de gerçekleştirilebilir. Örnek büyüklüğünüz oldukça büyükse, muhtemelen her alt ölçek için tutarlı bir yol olacaktır. Bu şekilde, IRT'nin öğeyi bağımsız olarak modellemesinde fayda sağlayabilirsiniz (bazı öğeler için nominal modeller kullanarak, genel kısmi kredi veya diğerleri için notlandırılabilir veya mümkünse çok renkli öğeleri daha cimri bir şekilde yorumlamaya yardımcı olmak için derecelendirme ölçekleri ayarlayabilirsiniz).

θ

θ

Çoğu IRT yazılımının tek boyutlu gereksinimlerine uymayan öğeleri kaldırmayı deneyebilirsiniz, ancak eldeki yapıların teorik temsilini etkiliyorsa bunu mutlaka tavsiye etmem. Ampirik uygulamalarda, modellerimizi teoriye uydurmaya çalışmak genellikle daha iyidir, tersi değil. Ayrıca, bifaktör / iki katmanlı modellerin uygun olma eğilimi olduğu için, sistematik ve teorik olarak arzu edilen bir şekilde çokboyutluluk için hesap verirken tüm olası öğeleri dahil etmek istersiniz.


Teşekkürler! IRT'deki ampirik güvenilirliği nasıl ölçersiniz? Bu bilgi ile aynı mı?
Behacad

θ^rxx=T/(T+E)θmirtfscores()sirtTAM

@ philchalmers, pls cevap verebilir bir göz soru almak .
WhiteGirl
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.