Soru formundaki sıralı verileri uygun aralıklı verilere nasıl dönüştürebilirim?


13

Ordinal seviye verilerini aralık seviyesine dönüştürmek için herhangi bir basit yöntem var mı (tam tersi yapmak için olduğu gibi)? Ve Excel veya SPSS'de uygulanabilir mi?

Verilere sahip olmak, diyelim ki: Ordinal düzeyde 10 soru (0-5 ölçeği deyin, burada 0 = "hiç değil", 5 = "her zaman"), onları uygun şekilde ele alınabilecek şekilde dönüştürmek istiyorum parametrik test amaçlı aralık seviyesi verileri (normal dağılım, parametrik olmayan testler söz konusu değildir).

Cevaplar için son derece minnettar olurum!


0-5 ölçeğinde 6, 7, 8, 9, 10 değerlerine nasıl sahip olabilirim veya bir şeyleri özleyebilir miyim?
ttnphns

3
Kolayca ne demek istiyorsun? Kategorik değişkenleri metrik ölçeklere dönüştürmek basit bir iş değildir. Bazı varsayımlara göre, bunu yapmasına izin veren bazı gizli değişken modeller (IRT modelleri gibi) vardır. Başka bir yol da optimum ölçeklendirmedir. Ancak bunun için R ile bir şeyler yapmaya ve gizli değişken modeller veya doğrusal olmayan PCA gibi bazı gelişmiş istatistiklere girmeye istekli olmalısınız. Kulağa hoş geliyor mu?
Momo

Yanıtlar:


25

Bu yanıt, bir dizi gözlemlenmiş (tezahür) birbiriyle ilişkili değişkenler veya paylaşılan varyansın iyi tanımlanmış ancak doğrudan gözlemlenemeyen bir yapıyı (genellikle bir yansıtıcıda ölçtüğü varsayıldığı) ölçüldüğü bir ölçüm perspektifinden olası modelleri tartışacaktır. bir olarak kabul edilecektir şekilde), gizli değişkenin . Gizli özellik ölçüm modeline aşina değilseniz, şu iki makaleyi tavsiye ederim: psikometriklerin Denny Borsbooom tarafından saldırıları ve Gizli Değişken Modelleme: Anders Skrondal ve Sophia Rabe-Hesketh tarafından yapılan bir anket . Birden fazla yanıt kategorisine sahip öğelerle uğraşmadan önce ikili göstergelerle hafif bir inceleme yapacağım.

Sıra düzeyindeki verileri aralık ölçeğine dönüştürmenin bir yolu, bir çeşit Öğe Yanıt modeli kullanmaktır. Bilinen bir örnek, paralel test modeli fikrini klasik test teorisinden ikili puanlı öğelerle başa çıkmak için genişleten Rasch modelidir.genelleştirilmiş (logit linkli) karma efektli doğrusal model aracılığıyla ('modern' yazılım uygulamasının bazılarında), belirli bir öğeyi onaylama olasılığının 'madde zorluğu' ve 'kişi yeteneği' işlevi olduğu ( ölçülmekte olan gizli özellikteki konumu ile aynı logit ölçeğindeki (ek bir öğe ayrım parametresi ile yakalanabilen öğe konumu) veya diferansiyel öğe işlevi olarak adlandırılan, kişiye özgü özelliklerle etkileşim) arasındaki etkileşim . Altta yatan yapının tek boyutlu olduğu varsayılır ve Rasch modelinin mantığı sadece yanıtlayıcının belirli bir 'yapı miktarı' olmasıdır - öznenin sorumluluğu (onun 'yeteneği') hakkında konuşalım,θθBu yapıyı tanımlayan herhangi bir öğe ('zorlukları') gibi. İlgilenilen, katılımcı ölçeği ile ölçüm ölçeğindeki madde konumu arasındaki farktır . Somut bir örnek vermek gerekirse şu soruyu düşünün: "Endişemden başka bir şeye odaklanmakta zorlandım" (evet / hayır). Anksiyete bozukluklarından muzdarip bir kişinin , genel popülasyondan alınan ve geçmişte depresyon veya anksiyete ile ilişkili bozukluk öyküsü olmayan rastgele bir kişiye kıyasla bu soruya olumlu cevap vermesi daha olasıdır.θ

Anksiyete ile ilişkili bozuklukları (1,2) değerlendiren, kalibre edilmiş bir ürün bankası oluşturmayı amaçlayan büyük ölçekli bir ABD çalışmasından türetilen 29 madde yanıt eğrisinin bir örneği aşağıda gösterilmiştir. Numune boyutu ; açımlayıcı faktör analizi ölçeğin tek boyutsuzluğunu (birinci özdeğer büyük ölçüde ikinci özdeğerden büyük olan (17 kat miktarla) ve güvenilir olmayan 2. faktör eksenini (1'in üstündeki özdeğer juste) paralel analizle doğruladığını doğruladı ve bu ölçek güvenilirlik gösteriyor Cronbach alfa tarafından değerlendirilen kabul edilebilir aralıktaki indeks ( % 95 bootstrap CI ileα = 0.971 [ 0.967 ; 0.975 ]N=766α=0.971[0.967;0.975]). Başlangıçta, her madde için beş yanıt kategorisi önerildi (1 = 'Asla', 2 = 'Nadiren', 3 = 'Bazen', 4 = 'Sıklıkla' ve 5 = 'Her zaman'). Burada sadece ikili puanlı yanıtları ele alacağız.

resim açıklamasını buraya girin
(Burada, Likert tipi öğelere verilen yanıtlar ikili yanıtlar olarak kodlanmıştır (1/2 = 0, 3-5 = 1) ve her bir öğenin bireyler arasında eşit derecede ayrımcı olduğunu, dolayısıyla öğe eğrisi eğimleri arasındaki paralelliğin (Rasch) olduğunu düşünüyoruz. modeli).)

Görüldüğü gibi, bu özelliğin daha fazlasını ifade ettiği düşünülen gizli özelliği (kaygı) yansıtan ekseninin sağında bulunan kişilerin, " Korkmuş hissettim" (müthiş hissettim) gibi sorulara olumlu cevap verme olasılığı daha yüksektir ) veya "solda bulunan insanlardan daha ani panik duygularım vardı" (panik) (normal popülasyon, vaka olarak görülmesi olası değildir); Öte yandan, genel popülasyondan birisinin uykuya dalmakta zorlandığını (uykuda) bildirmesi pek olası değildir: gizli özelliğin ara aralığında bulunan biri için, örneğin 0 logit, 3 veya daha yüksek puan alma olasılığı yaklaşık 0.5 (madde zorluğu).x

İçin düzeyli öğeler : sipariş kategorilerle, çeşitli seçenekler vardır kısmi kredi modeli , derecelendirme ölçeği modelini veya dereceli tepki modeli , isim ama çoğunlukla uygulamalı araştırmalarda kullanılan bir kaç. İlk ikisi, IRT modellerinin "Rasch ailesine" aittir ve aşağıdaki özellikleri paylaşır: (a) yanıt olasılığı fonksiyonunun tekdüzeliği (madde / kategori yanıt eğrisi), (b) toplam bireysel puanın yeterliliği (gizli ile) parametresi sabit olarak kabul edilir), (c) öğelere verilen yanıtların bağımsız olduğu, gizli özelliğe bağlı olduğu ve (d) diferansiyel öğe işlevinin olmadığı anlamına gelen yerel bağımsızlık yani, gizli özelliğe bağlı olarak, yanıtlar harici bireysel spesifik değişkenlerden (ör. cinsiyet, yaş, etnik köken, SES) bağımsızdır.

Önceki örneği, beş yanıt kategorisinin etkili bir şekilde hesaba katıldığı duruma genişletmek için, bir hasta, kaygı ile ilgili bozuklukların öncülüne gerek olmadan, genel popülasyondan örneklenen birine kıyasla 3 ila 5 yanıt kategorisi seçme olasılığına daha yüksek olacaktır. Yukarıda açıklanan ikili fotoğraf modellemesi ile karşılaştırıldığında, bu modeller Agresti'nin Kategorisinde de tartışılan kümülatif (örneğin 3'e 2 veya daha az cevap verme olasılığı) veya bitişik kategori eşiğini (3'e 2'ye cevap verme olasılığı) dikkate alır. Veri analizi(bölüm 12). Yukarıda belirtilen modeller arasındaki temel fark, bir yanıt kategorisinden diğerine geçişin ele alınmasında yatmaktadır: kısmi kredi modeli, herhangi bir eşik konumu ile gizli özellikteki eşik konumlarının ortalaması arasındaki farkın eşit olduğunu varsaymaz veya derecelendirme ölçeği modelinin aksine, öğeler arasında üniform. Bu modeller arasındaki bir diğer ince fark, bazılarının (kısıtsız derecelendirilmiş yanıt veya kısmi kredi modeli gibi) öğe arasında eşit olmayan ayrımcılık parametrelerine izin vermesidir. Daha fazla bilgi için bkz. Anket madde ve ölçek özelliklerini değerlendirmek için madde yanıt teorisi modelini uygulama : Reeve ve Fayers veya Madde yanıt teorisinin temeli, Frank B. Baker.

Önceki durumda, iki puanlı maddeler için yanıtların olasılık eğrilerinin yorumlanmasını tartıştığımızdan, aynı hedef öğeleri vurgulayarak dereceli bir yanıt modelinden türetilen madde yanıt eğrilerine bakalım:

resim açıklamasını buraya girin
(Kısıtlı derecelendirilmiş yanıt modeli, öğeler arasında eşit olmayan ayrımcılığa izin verir.)

Burada, aşağıdaki gözlemler dikkate alınmayı hak etmektedir:

  • 'Uyuyan' madde için cevap kategorileri, örneğin 'müthiş' olanlara göre daha az ayrımcıdır: 'uyku' durumunda , latent üzerindeki aralığın aralığının iki ekstrüzyonunda bulunan iki kişi için özellik (logit birimlerinde), dördüncü yanıtı seçme olasılıkları (" genellikle uyumakta zorlanıyordu") yakl. 0.35 ila 0.4; 'müthiş' ile, bu olasılık 0.1'den yaklaşık 0.25'e (kesikli mavi çizgi) gider. Anksiyete belirtileri gösteren iki hasta arasında ayrım yapmak istiyorsanız, ikinci madde daha bilgilendiricidir.[2;2.5]
  • Uyku kalitesini nadiren değerlendirmekle birlikte, soldan sağa doğru, uyku kalitesini değerlendiren madde ile daha şiddetli koşulları değerlendirenler arasında genel bir değişim vardır. Bu beklenir: sonuçta, genel popülasyondaki insanlar bile sağlık durumlarından bağımsız olarak uykuya dalmakta bazı zorluklarla karşılaşabilir ve şiddetli depresyonda veya endişeli olan insanların bu tür problemler göstermesi muhtemeldir. Bununla birlikte, 'normal kişilerin' (bunun herhangi bir anlamı varsa) bazı panik bozukluğu belirtileri göstermesi olası değildir (en yüksek yanıt kategorisini seçme olasılığı, ara aralığa veya daha fazla gizli özelliğe kadar olan insanlar için sıfırdır, [ 0, 1]).

Her iki durumda da, yukarıda tartışılan bu örtük özellikler bir özelliğine sahiptir farz bireysel sorumluluk yansıtan ölçek aralığı ölçekteθ .

Gerçek ölçüm modelleri olarak düşünülmenin yanı sıra , Rasch modellerini çekici kılan, toplam puanların, yeterli bir istatistik olarak, gizli puanlar için taşıyıcı olarak kullanılabilmesidir. Dahası, yeterlilik özelliği, model (kişiler ve eşyalar) parametrelerinin ayrılabilirliğini açıkça ifade eder (çok renkli eşyalar söz konusu olduğunda, her şeyin madde yanıt kategorisi düzeyinde geçerli olduğunu unutmamak gerekir), dolayısıyla birleşik katkı.

IR uygulaması modeli hiyerarşisi, R uygulaması ile ilgili iyi bir derleme Mair ve Hatzinger'in Journal of Statistics Software ( Genişletilmiş Yazılım) : Extended Rasch Modeling: IRR Modellerinin R'de Uygulanması için eRm Paketi'nde bulunmaktadır . Diğer modeller arasında log-lineer modeller , Mokken modeli gibi parametrik olmayan model veya grafik modeller bulunur .

R dışında, Excel uygulamalarının farkında değilim, ancak bu iş parçacığında birkaç istatistiksel paket önerildi: Madde yanıt teorisini ve hangi yazılımı kullanacağım?

Son olarak, bir ölçüm modeline başvurmadan bir dizi öğe ile bir yanıt değişkeni arasındaki ilişkileri incelemek istiyorsanız, optimum ölçekleme yoluyla bir çeşit değişken nicelendirme de ilginç olabilir. Bu ipliklerde tartışılan R uygulamaları dışında, ilgili ipliklerde SPSS çözümleri de önerilmiştir .

Referanslar

  1. Pilkonis, P., Choi, S., Reise, S., Stover, A. ve Riley, W. ve ark. (2011). Hastanın bildirdiği sonuç ölçüm bilgi sisteminden (PROMIS) duygusal sıkıntıyı ölçmek için bankalar: Depresyon, kaygı ve öfke . Değerlendirme , 18 (3), 263-283.
  2. Choi, S., Gibbons, L. ve Crane, P. (2011). lordif: Yinelemeli hibrid sıralı lojistik regresyon / Madde Tepki Teorisi ve monte carlo simülasyonları kullanılarak farklı madde fonksiyonlarını tespit etmek için bir R paketi . İstatistiksel Yazılım Dergisi , 39 (8).

@Momo Teşekkürler. Bu meraklı. Yanıtlarken (ve bugün bu yanıtı yeniden düzenlerken), büyük bir +1 değerinde olan yorumunuzu fark etmedim. Lütfen yanıtımı uygun gördüğünüz yerde düzenlemekten çekinmeyin.
chl

3

Alan Agresti, Sıralı Kategorik Verilerin Analizi kitabında birkaç tanesini kapsar. Bir tanesi üzerinde tartışmak ridits olduğunu blogumda


1
Bunu biraz daha açıklayabilir misiniz? İlk düşüncede, sıralı verileri aralıklı verilere nesnel olarak çevirdiğini iddia eden herhangi bir yöntem gibi görünebilir, çünkü her zaman herhangi bir yöntemi "bozacak" kadar patolojik olmayan karşı örnekler verebilirsiniz, ancak eksik olabilirim önemli birşey. Ayrıca , sıralı kategoriler arasındaki mesafenin a priori bir nosyonunu gerektirecek gibi görünüyor - bu nereden geliyor?
Makro

Formüller blog gönderisindedir ve tam bir tartışma Agresti'nin kitabındadır, ancak temel olarak verileri "ortalama kümülatif oranlar" oluşturmak için kullanır ve sonra bunları puanlar olarak kullanır. Mesafe, kategorilerdeki herhangi bir şeyden ziyade her bir yanıttaki oranlardan gelir.
Peter Flom - Monica'yı eski durumuna döndürün

2
+1. Bölmeler kolayca kesirsiz + (1/2) kesir eşit olarak açıklanabilir. Dolayısıyla, 1, 2, 3, 4, 5, 0.2, 0.4, 0.2, 0.1, 0.1 fraksiyonlarını veya olasılıklarını gözlemlediyse, 1'in ridit'i 0.1 olur; Ridits, kategorileri simetrik olarak tedavi eder ve sonuç olarak kesirden daha az veya kesirden daha fazla olması muhtemeldir ve sonuç olarak genellikle garip olan 0 veya 1'i içerir.
Nick Cox

Ridit isminin kendisi Bross tarafından dikkatle tasarlanmıştı (not: referans gerekli) ve sözde açıklama anlamsız. Daha iyi isimler orta dağılım fonksiyonu (Parzen 1993) ve sınıf fonksiyonu Haberman (1996) 'dır. Haberman, SJ 1996. İleri İstatistik Cilt I: Nüfusun Tanımı . New York: Springer. Parzen, E. 1993. PP grafiğini ve sürekli numune kuantil fonksiyonunu değiştirin. İstatistikte İletişim - Teori ve Yöntemler 22: 3287-3304.
Nick Cox

1
Sürücülerin kendileri, örneğin normal veya Gauss kantil işlevleri aracılığıyla itilebilir.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.