Veri azaltımı için tekrarlanan önlemler hakkında bir PCA yapabilir miyim?


13

2 bağlamın her birinde 87 hayvan üzerinde 3 deneme var (bazı eksik veriler; eksik veri yok = 64 hayvan). Ben (onlara diyoruz bu bağlamda davranışını tanımlamak 2 ila 3 kompozit davranış puanları geliştirmek isteyen böylece bir çerçevede, ben, birçok özel tedbirleri (girmek için zaman, barınak dönen kaç kez, vs.) sahip C1, C2, C3). Bunu C1, 3 denemede ve 87 hayvanda aynı anlama gelir, böylece yaş, cinsiyet, soyağacı ve bireysel hayvanların davranış üzerindeki etkisini incelemek için bir regresyon yapabilirim. Daha sonra C1, belirli bir yaş içinde, diğer bağlamdaki davranış puanları ile nasıl ilişkili olduğunu incelemek istiyorum . (1 yaşındayken, bağlam 1'deki aktivite bağlam 2'deki etkinliği güçlü bir şekilde öngörüyor mu?)

Bu tekrarlanan ölçümler olmasaydı, bir PCA iyi çalışırdı - bir bağlamın çoklu ölçümlerinde bir PCA yapın, ardından PC1, PC2, vb. Kullanarak PC1 ile bir bağlamda PC1 (veya 2 veya 3) diğer bağlamda. Sorun, yalancı uygulamaya giren tekrarlanan önlemlerdir. Ben kategorik olarak no-go demek bir inceleme vardı, ama veri azaltma yaparken bu sorunlu olup olmadığı hakkında net referanslar bulamıyorum.

Akıl yürütme şöyle devam ediyor: tekrarlanan ölçümler bir sorun değil, çünkü PCA'da yaptığım şey orijinal önlemler karşısında tamamen açıklayıcı . Fiat tarafından, içeriğe 1. bağlamda “cesurluk” ölçütüm olarak arenaya girmek için kullandığımı beyan etsem, her yaştan tüm bireyler arasında karşılaştırılabilecek bir bağlam 1 cesaret ölçüme sahip olurdum ve kimse gözünü kırpmazdı. Fiat ile girmek için zaman zamana kadar kullanacağımı beyan edersem , aynı şey geçerli. Ben indirgeyici amaçlıdır PCA kullanıyorum Yani eğer, neden PC1 (yani olabileceğini olamaz girmek bitirmek+ 0,5 0,28 + 0,63 + 0,02 0.5+ 0.50.28+ 0.63+ 0.02 toplam süre ...), girme zamanının genel olarak bilgilendirici ve temsili bir özellik olduğunu tahmin etmek yerine en azından birden fazla önlemimle bilgilendirilen?

(I am Not değil ... sorularım biz bağlam özgü davranışlar olarak yorumlamak ne olduğunu önlemlerin temel yapısında ilgilenen. "Ben bağlam 1 kullanılmış ve Harry diğer hayvanlara oranla aktif olduğu sonucuna, ben görüyorum Harry bağlam 2'de aktif mi? Eğer bağlam 1'de aktivite olarak yorumladığımız şeyi yaşlandıkça değiştirirse, bağlam 2 aktivitesini de değiştirir mi?)

PARAFAC'a baktım ve SEM'e baktım ve bu yaklaşımlardan herhangi birinin örneklem boyutum için daha iyi veya daha uygun olduğuna ikna olmadım. Birisi ağırlayabilir mi? Teşekkürler.


Ben size 2 içinde-konu faktörleri olduğunu düzeltmek anladı mı: 1) bağlamı, bazı deneysel koşul açık deneyde vs (örneğin kapalı deneme) tarafından hangi farklıdır, 2) çalışmasında, sadece deney tekrarı, bir girişim. Her koşulda bir PCA yapmak istiyorsunuz, ancak deneyin bir değil birkaç denemesini yaptığınız sizi durduruyor.
ttnphns

İki bağlam iki ayrı testtir ve her birinde alınan önlemler farklıdır. Yani, evet, durumumu anlıyorsun.
Leann

Her üç denemede de sorunu ortadan kaldırmaya ve bir PCA çalıştırmaya ne dersiniz?
Gala

Yanıtlar:


7

Sen içine bakmak olabilir Çoklu Faktör Analizi . Bu, FactoMineR ile R'de uygulanabilir.

GÜNCELLEME:

Ayrıntılı olarak, Leann - uzun zaman önce - tekrarlanan önlemlerle bir veri kümesinde bir PCA yürütmeyi teklif ediyordu. Veri kümesinin yapısını doğru anlarsam, belirli bir 'bağlam' için hayvan x'spesifik bir önlemi' (girme zamanı, barınağa dönüş sayısı, vb.) 64 hayvanın her biri (özürlü olmayanlar) üç kez takip edildi. Bu yüzden daha sonra hayvanların davranışları üzerindeki üç 64 × 10 matrisler olurdu, en o 10 'özel önlemler' vardı diyelim (biz matrisleri çağırabilir X1, X2, X3). Üç matris üzerinde aynı anda bir PCA çalıştırmak için, üç matrisi (ör.PCA(rbind(X1,X2,X3))). Ancak bu, ilk ve 64. gözlemin aynı hayvan üzerinde olduğu gerçeğini göz ardı eder. Bu sorunu atlatmak için, üç matrisi 'sütun bağlayabilir' ve Çoklu Faktör Analizi ile çalıştırabilir. MFA, aynı kişiler veya nesneler üzerinde farklı noktalarda ölçülen çok sayıda değişken kümesini analiz etmenin faydalı bir yoludur. MFA'dan temel bileşenleri bir PCA'da olduğu gibi çıkarabilir, ancak her hayvan için tek bir koordinatı olacaktır. Hayvan nesneleri şimdi üç gözlemiyle sınırlanmış çok değişkenli bir uzlaşma alanına yerleştirilmiş olacak.

Analizi R'deki FactoMineR paketini kullanarak gerçekleştirebilecektir. Örnek kod şöyle görünecektir:

df=data.frame(X1, X2, X3)
mfa1=MFA(df, group=c(10, 10, 10), type=c("s", "s", "s"), 
 name.group=c("Observation 1", "Observation 2", "Observation 3")) 
 #presuming the data is quantitative and needs to be scaled to unit variance

Ayrıca, ilk üç bileşeni MFA'dan çıkarmak ve birden fazla regresyona sokmak yerine, açıklayıcı değişkenlerini doğrudan MFA'ya 'ek tablolar' olarak yansıtmayı düşünebilir (bkz. ?FactoMineR). Diğer bir yaklaşım, MFA'dan (örneğin dist1=vegdist(mfa1$ind$coord, "euc")) nesne koordinatlarının bir Öklid uzaklık matrisini hesaplamak dist1ve hayvana özgü değişkenlerin bir fonksiyonu olarak (örneğin rda(dist1~age+sex+pedigree)vegan paketini kullanarak) bir RDA'ya koymak olacaktır .


2
Merhaba Kyle, Cevabınız için teşekkürler. Bununla birlikte, esasen bir bağlantıdan biraz daha fazlasından oluşan veya sadece bir cümle ile ilgili olan cevaplar genellikle cevaplar olarak değil, yorumlar olarak kabul edilir. Özellikle, yalnızca bağlantı yanıtları bağlantı-çürüklüğünden muzdariptir, bu nedenle bağlantı artık çalışmıyor olsa bile yanıtların yararlı olması için yeterli bilgiye sahip olması gerekir. Cevabınızı biraz daha genişletebilir misiniz, belki bunun ne olduğunu / bunun faktör analizi ile nasıl ilişkili olduğunu çok kısa bir şekilde özetleyebilir misiniz?
Glen_b

(+1) Bunun eski bir gönderi olduğunu anlıyorum, ancak bu cevap çok faydalı! Bağlantının ölmesi durumunda belki de referans tamamen eklenmelidir: Abdi Hervé, Williams Lynne J., Valentin Domininique. Çoklu faktör analizi: çoklu tablo ve çoklu blok veri setleri için temel bileşen analizi. WIREs Comp Stat 2013, 5: 149-179. doi: 10.1002 / wics.1246
Frans Rodenburg

4

Tekrarlanan ölçümleri analiz ederken PCA kullanmak yaygındır (örneğin, satış verilerini, hisse senedi fiyatlarını ve döviz kurlarını analiz etmek için kullanılır) Mantık, ifade ettiğiniz gibidir (yani, gerekçe PCA'nın çıkarımsal bir araç değil bir veri azaltma aracı olmasıdır) ).

Oldukça iyi bir istatistikçinin yayınlarından biri: Bradlow, ET (2002). " Temel Bileşenler Analizini kullanarak kilit özellikler için tekrarlanan ölçüm veri setlerinin araştırılması. " Pazarlama Araştırmaları Dergisi 19: 167-179.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.