Bir makalede “Temel bileşenlerin sayısını belirlemek için Monte Carlo simülasyonu” ifadesi yer almaktadır; o nasıl çalışır?


10

10304 voksel sayısı (piksel olarak düşünün) ve 236 saat noktası sayısı olan 10304x236 boyutunda bir matris üzerinde PCA gerçekleştirdiğim MRI verileri üzerinde bir Matlab analizi yapıyorum. PCA bana 236 Özdeğer ve ilgili katsayıları veriyor. Her şey yolunda. Bununla birlikte, kaç bileşenin tutulacağına karar verme zamanı geldiğinde, çoğalttığım kağıt aşağıdakileri söylüyor (tüm kağıdın kısa bir kısmı olduğu için herhangi bir açıklama gerekip gerekmediğini lütfen bana bildirin):

Daha sonra, her tarama için rahatsızlık ROI verilerinden çıkarılacak ana bileşenlerin (PC) sayısını belirlemek için Monte Carlo simülasyonları gerçekleştirdik. Her özne için kodlama ve dinlenme verileri için ayrı ayrı, kodlama ve dinlenme rahatsızlığı yatırım getirisi verisine eşit derecedeki normal olarak dağıtılmış veriler üzerinde PCA gerçekleştirilerek, beklenen özdeğerlerin null dağılımı oluşturuldu. Daha sonra, ilişkili özdeğerleri Monte Carlo simülasyonlarından özdeğerlerin 99. güven aralığını aşarsa, gerçek rahatsızlık ROI verilerinden PC'ler belirli bir dinlenme veya kodlama taraması için seçildi.

Tambini ve Davachi, PNAS 2013, Hipokampal multivoksel paternlerinin post-kodlama dinlenmesine kalıcılığı hafıza ile ilgilidir .

Burada ne yapacağım hakkında hiçbir fikrim yok. Açıklanan kümülatif varyansa dayalı bileşenleri seçmeye alışkınım. Benim düşüncem bu olsa da:

Daha sonra, her tarama için rahatsızlık ROI verilerinden çıkarılacak ana bileşenlerin (PC) sayısını belirlemek için Monte Carlo simülasyonları gerçekleştirdik.

Monte Carlo sims sadece şu 1000 (ya da böyle) zamanı yapmak demek, değil mi?

Kodlama ve geri kalan rahatsızlık ROI verilerine normal olarak dağıtılmış veriler üzerinde PCA gerçekleştirilerek beklenen özdeğerlerin boş dağılımı oluşturuldu.

Birincisi, 'eşit sıralamanın' temelde orijinalle aynı boyutta bir matris oluşturacağım anlamına geldiğini varsayıyorum (10304x236). 'Normal olarak eşit değerde dağıtılmış veri' açısından ... bu normal dağılımdan rasgele sayıların 10304x236 matrisini oluşturmam gerektiği anlamına mı geliyor? Matlab, bunu yapan ancak mu ve sigma girişi gerektiren 'normrnd' adlı bir işleve sahiptir. İlk veri kümesinden türetilenlerle aynı mu ve sigmayı kullanır mıyım? BEKLENEN özdeğerlerin bir dağılımının nasıl görüneceğine dair hiçbir fikrim olmadığından bu, 'beklenen özdeğerler' ile kastedilen nedir?

Sanırım benim sorunum az çok özdeğerlerin 'boş bir dağıtımını' nasıl yapacağımı bilmiyorum.

Yanıtlar:


6

Bu soruya ilişkin bir terim "Paralel Analiz" dir.

Basit bir ifadeyle, monte carlo simülasyonu, rastgele normal dağıtılmış verilerin 1000 (veya benzeri) 10304x236 matrisini üretecektir (bu, elbette analiz ettiğiniz verilerin normal olarak dağıtıldığını varsayar; verileriniz farklı dağıtıldıysa, farklı rastgele dağılım). Daha sonra, oluşturduğunuz her veri kümesi için özdeğerleri ayıklar ve her bir özdeğer değerini tüm 1000 (veya bu tür) çoğaltmalar arasında ortalamaya alırken, aynı zamanda güven aralıkları da oluşturursunuz. Daha sonra veri kümenizdeki özdeğerleri simülasyonunuzdaki ortalama özdeğerlerle karşılaştırırsınız.

Veri kümenizdeki özdeğerlerin, monte carlo simülasyonundaki özdeğerlerin 99. güven aralığını aştığı yerlerde, analizin kaç faktör önermesi gerektiği budur.

Örneğin, verilerinizden 25. özdeğer 2.10 ve 26. 1.97 ise ve 1000 (veya bu tür) rasgele veri kümesindeki 25. özdeğerlerin 99. güven aralığı 2.04 ve 26. 2.01 ise, bu 25 bileşen saklayın.

Bunu sizin için yapabilecek fonksiyonlar var. Matlab için bir bağlantı şudur:

http://www.mathworks.com/matlabcentral/fileexchange/44996-parallel-analysis--pa--to-for-determining-the-number-of-components-to-retain-from-pca/content/pa_test. m

Bunu "Matlab'da Paralel Analiz" i arayarak buldum.


+1. Bu çok açık ve bağlantı bana çok yardımcı olacak! Rastgele dağıtılan özdeğerlerin doğru bir şekilde çıkarılmasını kodladım, ancak güven aralıklarını doğru şekilde kullanmıyordum. Yanıtınız için çok teşekkür ederim.
chainhomelow

Memnuniyetle yardım ettim! Bunun sizin için yararlı olduğuna sevindim.
maxwelldeux
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.