Doğası gereği keşif yapan çok çeşitli kümeleme yöntemleri vardır ve hiyerarşik veya bölüm tabanlı olan herhangi birinin, varyansı analiz etmek için karşılaması gereken varsayımlara bağlı olduğunu düşünmüyorum.
Sorunuzu cevaplamak için Stata'daki [MV] belgelerine bir göz atarak, bu eğlenceli teklifi 85. sayfada buldum:
Bazıları küme analizi yapan insanlar kadar küme analizi yöntemleri olduğunu söylemiş olsalar da. Bu iğrenç bir ifade! Bir küme analizi yapmanın, bunları gerçekleştiren insanlardan çok daha fazla yolu vardır.
Bu bağlamda, kümeleme yöntemine uygulanan herhangi bir varsayım olduğundan şüpheliyim. Metnin geri kalanı, kümeler oluşturmak için metrik mesafe bile olması gerekmeyen bir çeşit "benzerlik ölçüsü" ne ihtiyaç duyduğunuz genel bir kural olarak ortaya çıkar.
Bununla birlikte, bir istisna vardır; bu, tahmin sonrası analizin bir parçası olarak gözlemleri kümelediğiniz zamandır. Stata'da, vce
komut aynı kaynağın 86. sayfasında aşağıdaki uyarıyla birlikte gelir:
Stata'nın geniş tahmin komutları dizisine aşina iseniz, küme analizi (küme komutu) ile birçok tahmin komutunda izin verilen vce (küme clustvar) seçeneğini birbirinden ayırmaya dikkat edin. Küme analizi verilerdeki grupları bulur. Çeşitli tahmin komutlarıyla izin verilen vce (cluster clustvar) seçeneği, gözlemlerin seçenek tarafından tanımlanan gruplar arasında bağımsız olduğunu, ancak bu gruplar içinde bağımsız olması gerekmediğini gösterir. Küme komutu tarafından üretilen bir gruplama değişkeni, vce (cluster clustvar) seçeneğinin kullanımının ardındaki varsayımı nadiren karşılar.
Buna dayanarak, söz konusu olayın dışında bağımsız gözlemlerin gerekli olmadığını varsayacağım. Sezgisel olarak, küme analizinin, gözlemlerin ne ölçüde bağımsız olup olmadığını tam olarak araştırmak için bile kullanılabileceğini de ekleyebilirim.
Ben de, o bahsederek bitirmek edeceğiz sayfa 356 arasında Stata ile İstatistik o konuyla ilgili ayrıntılı bilgileri daha gitmez rağmen Lawrence Hamilton, küme analizi bir "temel" yönü olarak değişkenleri standardize bahseder.