Daha büyük varyanslı bir belirteç “daha ​​iyi” midir?


13

"Temel istatistik" kavramıyla ilgili bir sorum var. Bir öğrenci olarak bunu tamamen yanlış düşünüp düşünmediğimi ve neden öyleyse bilmek istiyorum:

Diyelim ki "öfke yönetimi sorunları" arasındaki ilişkiye bakmaya çalışıyorum ve lojistik regresyonda boşanma (evet / hayır) diyorum ve iki farklı öfke yönetimi puanı kullanma seçeneğim var - her ikisi de 100 üzerinden.
Puan 1 anket değerlendirme aracından 1 ve diğer seçimimden geliyor; puan 2 farklı bir anketten gelmektedir. Varsayımsal olarak, önceki çalışmalardan öfke yönetimi konularının boşanmaya yol açtığına inanmak için nedenimiz var.
500 kişilik örneklemde, puan 1'in varyansı, puan 2'ninkinden çok daha yüksekse, puan 1'in varyansına bağlı olarak boşanmanın bir yordayıcısı olarak kullanmak için daha iyi bir puan olacağına inanmak için herhangi bir neden var mı?

Bana göre bu içgüdüsel olarak doğru görünüyor, ama öyle mi?


İlginç bir soru, Whuber'ın cevabının mükemmel açıkladığını düşünüyorum. Bu soruya ilk cevabım şuydu: 'artan varyans daha yüksek sınıf ayrımcı bilgi içermez'.
Zhubarb

Yanıtlar:


11

Birkaç hızlı nokta:

  • Değişkeniniz için farklı bir ölçek benimsenerek varyans keyfi olarak artırılabilir veya azaltılabilir. Bir ölçeğin birden fazla sabitle çarpılması, varyansı artıracak, ancak değişkenin tahmin gücünü değiştirmeyecektir.
  • Farklılığı güvenilirlikle karıştırıyor olabilirsiniz. Diğer her şey eşittir (ve en azından bazı gerçek puan tahmini olduğunu varsayarak), bir yapıyı ölçtüğünüz güvenilirliği artırmak, tahmin gücünü arttırmalıdır. Zayıflatma için bu düzeltme tartışmasına göz atın .
  • Her iki ölçeğin yirmi 5 puanlık bir maddeden oluştuğunu ve dolayısıyla 20 ile 100 arasında değişen toplam puanlara sahip olduğunu varsayarsak, daha büyük varyansa sahip sürüm de daha güvenilir olacaktır (en azından iç tutarlılık açısından).
  • İç tutarlılık güvenilirliği, psikolojik bir testi yargılamak için tek standart değildir ve belirli bir yapı için bir ölçeğin öngörme gücünü diğerine karşı ayıran tek faktör değildir.

9

Basit bir örnek neyin önemli olduğunu belirlememize yardımcı olur.

Y=C+γX1+ε

CγX1ε

X1=αX2+β.

X1=2X250X1α2X2

Y=C+γ(αX2+β)=(C+βγ)+(γα)X2+ε=C+γX2+ε.

Parametreler değişir ve bağımsız değişkenin varyansı değişir , ancak modelin tahmin yeteneği değişmeden kalır .

X1X2YYXi

X1X2YYX1X2X2


1

Her zaman kullandığınız istatistiksel test için varsayımları kontrol edin!

Lojistik regresyonun varsayımlarından biri, hataların bağımsızlığıdır, bu da veri vakalarının ilişkili olmaması gerektiği anlamına gelir. Örneğin. öfke yönetimi anketlerinizle yapmış olabileceğinizden korktuğum aynı insanları farklı zamanlarda ölçemezsiniz.

Ayrıca, 2 öfke yönetimi anketi ile temelde aynı şeyi ölçtüğünüzden ve analizinizin çoklu bağlantıdan muzdarip olabileceğinden endişe ediyorum.


1
Bence N26 bir düşünce deneyi öneriyor. Yani, bir çalışma tasarlarken iki ölçek arasında bir seçiminiz varsa, tercih etmelisiniz, prima facie, daha büyük varyansa sahip olanı. Ayrıca, aynı yapıyı temsil eden, ancak farklı ölçülen iki yordayıcıya sahip olmak, gözlemlerin bağımsızlığı varsayımını ihlal etmez.
Jeromy Anglim
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.