Gizli Sınıf Analizi ve Küme Analizi - çıkarımlardaki farklılıklar?


30

Gizli sınıf analizinden (LCA) kümelenme analizine karşı çıkarılan çıkarımlardaki farklar nelerdir? Bir LCA'nın sınıflara yol açan temel bir gizli değişken varsaydığı doğru mu, oysa küme analizi kümelenme algoritmasından elde edilen ilişkili özelliklerin ampirik bir açıklaması mı? Sosyal bilimlerde, LCA'nın popülerlik kazandığı ve küme analizinin yapmadığı resmi bir ki-kare anlamlılık testi olması koşuluyla metodolojik olarak üstün olduğu görülüyor.

"LCA bunun için uygun olur (ancak küme analizi değil) ve küme analizi bunun için uygun olur (ancak gizli sınıf analizi olmaz) şeklinde örnekler sunulabilirse harika olurdu.

Teşekkürler! Brian


1
inferencesBu bağlamda ne diyorsunuz ve neden sadece çıkarımdaki farklılıklar ilginizi çekiyor?
ttnphns

1
@ Ttnphns Çıkarımlarla, sonuçların esaslı yorumunu kastediyorum. "Çıkarımlardaki sadece farklılıklar?" Konusundaki ilgim hakkındaki sorunuzun son bölümünden emin değilim. İlgili algoritmalarının ya da temel matematiğinin icrası ile ilgilenmiyorum. Sonuçların nasıl yorumlanacağıyla ilgileniyorum.
Brian P

Yanıtlar:


27

Gizli Sınıf Analizi aslında bir Sonlu Karışım Modelidir ( buraya bakın ). FMM ve diğer kümeleme algoritmaları arasındaki temel fark, FMM’lerin, verilerinizin dağılımını açıklayan olasılıksal bir model kullanarak kümeleri türeten bir "model tabanlı kümeleme" yaklaşımı sunmasıdır. Bu nedenle, rastgele seçilmiş bir mesafe ölçüsüne sahip kümeleri bulmak yerine, verilerinizin dağılımını tanımlayan bir model kullanırsınız ve bu modele dayanarak, belirli vakaların belirli gizli sınıfların üyeleri olma ihtimalini değerlendirirsiniz. Bu yüzden, yukarıdan aşağıya bir yaklaşım olduğunu söyleyebilirsiniz (verilerinizin dağılımını tanımlamakla başlarsınız), diğer kümeleme algoritmaları ise aşağıdan yukarıya yaklaşımlardır (vakalar arasında benzerlikler bulursunuz).

Çünkü, veri modeli seçiminiz için istatistiksel bir model kullanıyorsunuz ve kümelenmenin aksine, uygunluk derecesini değerlendirmek mümkün. Ayrıca, verilerinizin yapısının altında yatan bir işlem veya “gizli yapı” olduğunu varsayarsanız, FMM'ler gizli bir yapıyı verilerinizin arkasına modellemenizi sağladığından (sadece o zaman sadece benzerlikleri aramanızı sağlar) uygun bir seçim gibi görünmektedir.

Diğer bir fark, FMM'lerin kümelemeden daha esnek olmasıdır. Kümeleme algoritmaları sadece kümeleme yapar, FMM ve LCA tabanlı modeller ise

  • doğrulayıcı, gruplar arası analiz yapmanıza olanak sağlar,
  • Madde Cevap Teorisi (ve diğer) modellerini LCA ile birleştirmek,
  • bireylerin gizli sınıf üyeliğini tahmin etmek için değişkenleri dahil etmek,
  • ve / veya gizli sınıf regresyonunda küme içi regresyon modellerini ,
  • Verilerinizin yapısı, zaman içindeki değişiklikleri modellemenizi sağlar

Daha fazla örnek için bakınız:

Hagenaars JA ve McCutcheon, AL (2009). Uygulamalı Latent Sınıf Analizi. Cambridge Üniversitesi Basını.

ve aşağıdaki belgeler dahil, R'deki flexmix ve poLCA paketlerinin belgelendirilmesi :

Linzer, DA ve Lewis, JB (2011). poLCA: Çok değişkenli latent sınıf analizi için bir R paketi. İstatistiksel Yazılım Dergisi, 42 (10), 1-29.

Leisch, F. (2004). Flexmix: R. , İstatistiksel Yazılım Dergisi, 11 (8), 1-18'de sonlu karışım modelleri ve gizli cam regresyonu için genel bir çerçeve .

Grün, B. ve Leisch, F. (2008). FlexMix sürüm 2: eşzamanlı değişkenlerle ve değişken ve sabit parametrelerle sonlu karışımlar . İstatistiksel Yazılım Dergisi, 28 (4), 1-35.


3

Bir gizli sınıf modeli (veya gizli profil veya daha genel olarak sonlu bir karışım modeli) kümelenme (veya denetimsiz sınıflandırma) için olasılıklı bir model olarak düşünülebilir. Amaç genellikle aynıdır - daha büyük bir popülasyondaki homojen grupları belirlemek. Gizli sınıf modelleri ile kümelemeye algoritmik yaklaşımlar arasındaki temel farklar, öncekinin kümelenmenin doğası hakkında daha teorik bir spekülasyona katkısı olduğunu düşünüyorum; ve gizli sınıf modeli olasılıklı olduğu için, olasılık istatistiklerini kullanarak model uyumunu değerlendirmek için ek alternatifler sunar ve sınıflandırmadaki belirsizliği daha iyi yakalar / korur.

Bu başlıkta bazı yararlı bilgiler ve ayrıca chl tarafından ilgili bir yazıya bu cevabı bulabilirsiniz .

PCA-faktör analizi ile ilgili bu soruyla (kavramsal düzeyde) paralellikler de var ve bu da.


2

Aradaki fark, Gizli Sınıf Analizi, sınıftaki özelliklerin olasılıklarını belirlemek için gizli verileri (genellikle özelliklerde birleşme kalıplarıdır) kullanır. Ardından, öğeleri özelliklerine göre sınıflara ayırma ihtimalinin azlığı kullanılarak çıkarımlar yapılabilir.

Küme analizi, özellikleri çizer ve bir öğenin hangi sınıflara ait olduğunu belirlemek için en yakın komşular, yoğunluk veya hiyerarşi gibi algoritmaları kullanır.

Temel olarak LCA çıkarımı, "olasılık kullanılarak en benzer kalıpların ne olduğu" ve "Küme analizi" "mesafeyi kullanan en yakın şey" olarak düşünülebilir.


Küme analizi ile ilgili ifadede "şey" in ne anlama geldiğini açıklayabilir misiniz? Bir mesafe ölçüsüne dayanarak en yakın 'özellik' midir?
Brian P

bir şey nesne ya da özellik parametreleri ile girdiğiniz verilerden biri olacaktır.
ccsv
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.