Hangi koşullar altında çoklu seviye / hiyerarşik analiz kullanılmalı?


36

Hangi koşullar altında birisi daha temel / geleneksel analizlerin (örneğin, ANOVA, OLS regresyon vb.) Aksine çok düzeyli / hiyerarşik analiz kullanmayı düşünmelidir? Bunun zorunlu olarak kabul edilebileceği durumlar var mı? Çok düzeyli / hiyerarşik analiz kullanmanın uygun olmadığı durumlar var mı? Son olarak, yeni başlayanlar için çok düzeyli / hiyerarşik analizi öğrenmek için bazı iyi kaynaklar nelerdir?


Yanıtlar:


22

Verilerinizin yapısı doğal olarak hiyerarşik veya iç içe olduğunda, çok düzeyli modelleme iyi bir adaydır. Daha genel olarak, etkileşimleri modellemek için bir yöntemdir.

Doğal bir örnek, verilerinizin, bu seviyelerdeki etkileri incelemek istediğiniz ülke, eyalet, ilçeler gibi organize bir yapıdan gelmesidir. Böyle bir yapıya uyabileceğiniz başka bir örnek, zamanla birçok denekten ölçümleri tekrarladığınız (örneğin bir ilaç dozuna bazı biyolojik tepkiler) uzunlamasına analizdir. Modelinizin bir seviyesi, zaman içinde tüm denekler için bir grup ortalama cevabı alır. Daha sonra modelinizin bir başka seviyesi, bireysel farklılıkların modellenmesi için grup ortalamasından kaynaklanan sapmalara (rastgele etkiler) izin verir.

Başlamak için popüler ve iyi bir kitap Gelman'ın Regresyon Kullanarak Veri Analizi ve Çok Düzeyli / Hierachical Modelleri'dir .


3
Bu cevabı ikinci olarak verdim ve bu konuda başka bir büyük referans daha eklemek istiyorum: Şarkıcının Uygulamalı Uzunlamasına Veri Analizi metni < gseacademic.harvard.edu/alda >. Uzunlamasına analize özgü olmasına rağmen, genel olarak MLM'ye güzel bir genel bakış sunar. Snidjers ve Bosker'in Çok Düzeyli Analizini iyi ve okunabilir buldum < stat.gamma.rug.nl/multilevel.htm >. John Fox ayrıca buradaki R modelinde güzel bir giriş sağlar < cran.r-project.org/doc/contrib/Fox-Companion/… >.
Brett,

Cevaplarınız için hepinize teşekkür ederim :) Bir takip sorusu olarak, çoğu veri doğal olarak hiyerarşik / iç içe geçmiş olarak kavramsallaştırılamaz mı? Örneğin, çoğu psikolojik araştırmada, iki veya daha fazla grup içinde (rastgele veya rastgele atanmamış) daha da iç içe geçmiş, bireyler içine yerleştirilmiş bir dizi bağımlı değişken (anket, uyaran yanıtı, vb.) Vardır. Bunun doğal olarak hiyerarşik ve / veya iç içe geçmiş bir veri yapısını temsil ettiği konusunda hemfikir misiniz?
Patrick

Çok seviyeli / hiyerarşik gurularınız birkaç dakikanızı ayırabilirse , farklı bir gönderide verilen analiz sorularına ağırlık verebilirseniz çok mutlu olurum ( stats.stackexchange.com/questions/1799/… ). Özellikle, bu yazıdaki ana hatlarıyla belirtilen ağrı algı verilerinin hiyerarşik olmayan analizlerle hiyerarşik analizlerle daha iyi analiz edilebileceğini düşünüyor musunuz? Yoksa bir fark yaratmaz mı, hatta uygunsuz mu? Teşekkürler: D
Patrick

18

Çok Düzeyli Modelleme Merkezi'nin çok seviyeli modelleme için ücretsiz iyi çevrimiçi öğreticileri vardır ve hem MLwiN yazılımlarında hem de STATA'larında modelleri yerleştirmek için yazılım öğreticileri vardır.

Bunu sapkınlık olarak kabul edin, çünkü kitapta bir bölümden fazlasını okumamıştım, ancak Hiyerarşik doğrusal modeller: uygulamalar ve veri analiz yöntemleri Stephen W. Raudenbush tarafından Anthony S. Bryk şiddetle tavsiye edilir. Ayrıca Springer Use R! 'Deki R yazılımını kullanarak çok seviyeli modelleme üzerine bir kitap olduğuna yemin ettim. dizi, ancak şu anda onu bulamıyorum (A kitabının R kitabını yazan kişi tarafından yazıldığını düşündüm).

edit: Çok seviyeli modeller için R kullanma kitabı Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM tarafından R ile Ekolojide Karma Etki Modelleri ve Uzantıları'dır.

iyi şanslar


9

Çok seviyeli ve regresyon modellerinin kullanımına ilişkin başka bir bakış açısı: Afshartous ve de Leeuw'un ilginç bir makalesinde, modellemenin amacı öngörücü ise (yani, yeni gözlemleri tahmin etmek için), model seçiminin ne zamandan farklı olduğunu göstermektedir. amaç çıkarımdır (modeli veri yapısıyla eşleştirmeye çalışırsınız). Bahsettiğim makale

Afshartous, D., de Leeuw, J. (2005). Çok düzeyli modellerde tahmin. J. Educat. Behav. Devletçi. 30 (2): 109-139.

Bu yazarlar tarafından ilgili başka bir makale daha buldum: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf


6

İşte çok seviyeli bir modelin "temel" olabileceği bir örnek. Öğrencilerin test puanlarını kullanarak bir dizi okul tarafından sağlanan eğitimin kalitesini değerlendirmek istediğinizi varsayalım. Okul kalitesini tanımlamanın bir yolu, öğrenci özelliklerini göz önünde bulundurduktan sonra ortalama test performansıdır. Sen, bu conceptualized olabilir nerede öğrenci için sürekli test puanı olan okul içinde , olduğu Okulda merkezli öğrenci özellikleri, bu özellikler üzerinde okula özgü bir katsayıdır, okul kalitesini ölçen "okul etkisi" dir vey ı s ı s x i s β s α s ε i s α s

yis=αs+Xisβs+ϵis,
yisisXisβsαsϵis , sınama performansındaki öğrenci düzeyinde özel durumlardır. Buradaki ilgi , okulun özellikleri dikkate alındığında öğrencilere sağladığı "katma değeri" ölçen tahmin etmeye odaklanır . Öğrenci özelliklerini dikkate almak istiyorsunuz, çünkü belirli dezavantajları olan öğrencilerle uğraşmak zorunda olan iyi bir okulu cezalandırmak istemezsiniz, bu nedenle okulun öğrencilerine sağladığı yüksek "katma değeri" düşüren ortalama sınav puanlarını düşürmek istemezsiniz. αs

Elimizdeki modelde mesele bir tahmin haline gelir. Her okul için çok sayıda okulunuz ve birçok verileriniz varsa, OLS'nin güzel özellikleri (bkz. Angrist ve Pischke, Çoğunlukla Zararsız ...(şimdiki gözden geçirme için), bağımlılıkları hesaba katacak standart hatalara uygun ayarlamalar yaparak ve okul düzeyinde etkilere ve okula özgü müdahalelere ulaşmak için kukla değişkenleri ve etkileşimleri kullanmak istediğinizi önerir. OLS yetersiz olabilir, ancak o kadar şeffaf ki, eğer kullanırsanız şüpheci izleyicileri ikna etmek daha kolay olabilir. Ancak, verileriniz belirli şekillerde seyrekse - özellikle bazı okullar için çok az gözleminiz varsa --- soruna daha fazla "yapı" uygulamak isteyebilirsiniz. Eğer tahminde yapı yokmuşsa, küçük örneklemli okullarda alacağınız gürültülü tahminleri iyileştirmek için daha büyük örneklemli okullardan "güç almak" isteyebilirsiniz. Ardından, FGLS ile tahmin edilen rastgele bir etki modeline dönüştürebilirsiniz,

Bu örnekte, çok seviyeli bir modelin kullanılması (ancak sonuçta buna uymaya karar veriyoruz), okul düzeyinde yakalamalara doğrudan ilgi ile motive edilmektedir. Tabii ki, diğer durumlarda, bu grup seviyesi parametreleri rahatsızlıktan başka bir şey olmayabilir. Bunları ayarlamanız gerekip gerekmediği (ve bu nedenle, hala bir çeşit çok seviyeli model ile çalışabilirsiniz), belirli koşullu dışsallık varsayımlarının geçerli olup olmadığına bağlıdır. Bunun üzerine, ekonometrik literatüre panel veri yöntemleri hakkında danışmanlık yapılmasını tavsiye ederim; Oradaki görüşler, genel gruplanmış veri bağlamlarına taşınır.


1
Bu eski bir iş parçacığıdır, ancak bunu okuyorsanız: Kukla değişkenler ve etkileşimler içeren OLS, bahsettiğiniz diğer teknikler kadar güç almaz, değil mi? Analizimi iki bölüme ayırdığım ve iki bölümü modellemek için iki lm (R doğrusal model) komutları kullandığım bazı verilerim var. İki parçayı belirtmek için bir kukla değişken tanıttım, sonra tekrar bu "birleşik" modelde kullandım ve cevaplar aynı, ancak aynı değildi. Sorum şu: bu cevap "daha iyi" mi, yoksa algoritma nedeniyle sadece farklı mı?
Wayne

@Wayne: Eğer ikinci aptallar ve ikinci tam etkileşimler kullanıyorsanız, nokta tahminleri aynı olmalıdır. Standart hatalar farklılık gösterebilir, çünkü ikinci yöntem daha yüksek serbestlik derecelerine sahip olabilir, ancak bunun doğru bir modelleme varsayımı olup olmadığını kontrol etmek istersiniz.
Cyrus S

6

Çok seviyeli modelleme, adından da anlaşılacağı gibi, verilerinizin farklı düzeylerde meydana gelen etkileri olduğunda (bireysel, zaman içinde, etki alanları vb.) Uygundur. Tek seviyeli modelleme her şeyin en düşük seviyede gerçekleştiğini varsayar. Çok seviyeli bir modelin yaptığı başka bir şey, iç içe geçmiş birimler arasında korelasyonlar ortaya koymaktır. Dolayısıyla, aynı seviye-2 birim içindeki seviye-1 birimler ilişkilendirilecektir.

Bir anlamda, çok seviyeli modellemeyi “bireyci yanlışlık” ve “ekolojik yanlışlık” arasındaki orta temeli bulmak olarak düşünebilirsiniz. Bireyci yanılsama, bir öğretmen tarzının öğrencinin öğrenme stiliyle uyumu gibi "topluluk etkileri" dikkate alınmadığı zamandır (örneğin, etkinin yalnız bireyden geldiği varsayılır, sadece seviye 1'deki regresyon yapılır). "ekolojik yanılsama" zıttır ve en iyi öğretmenin en iyi notlara sahip öğrencilere sahip olduğunu varsaymak ister (ve seviye-1’e ihtiyaç duyulmasın, sadece seviye 2’de tamamen regresyon yapın). Çoğu ortamda, hiçbiri uygun değildir (öğrenci öğretmeni "klasik" bir örnektir).

Okul örneğinde, verilerde "doğal" bir kümelenme veya yapı bulunduğunu unutmayın. Ancak bu, çoklu seviye / hierachical modellemenin önemli bir özelliği değildir. Ancak, doğal kümeleme matematik ve hesaplamaları kolaylaştırır. Temel bileşen, farklı seviyelerde gerçekleşen süreçlerin olduğunu söyleyen önceki bilgilerdir. Aslında, verileriniz üzerinde hangi birimin hangi seviyede olduğu konusunda belirsizlik bulunan çok düzeyli bir yapı yükleyerek kümeleme algoritmaları oluşturabilirsiniz. Yani , alt bilinmeyen var . jyijj


4

Genel olarak, hiyerarşik bir bayesian (HB) analizinden bahsetmek, verileriniz bireysel seviye etkilerinin tamamen homojen olmadığı (gerçekçi olmayan bir senaryo) olmadığı sürece, verimli ve istikrarlı bireysel seviye tahminlerine yol açacaktır. Seyrek verilere sahip olduğunuzda (örneğin, bireysel seviyedeki parametre sayısından az olmamak üzere) ve bireysel seviye tahminlerini tahmin etmek istediğinizde HB modellerinin verimliliği ve kararlı parametre tahminleri gerçekten önemlidir.

Ancak, HB modellerinin tahmin edilmesi her zaman kolay değildir. Bu nedenle, HB analizi genellikle HB olmayan analizi zorlaştırırken, geçmiş deneyimlerinize ve mevcut önceliklerinize göre zaman ve maliyet açısından göreceli maliyetleri karşılaştırmanız gerekir.

Bireysel seviye tahminleriyle ilgilenmiyorsanız, o zaman sadece bir toplam seviye modelini tahmin edebileceğinizi söyleyebilirsiniz, ancak bu bağlamlarda bile bireysel seviye tahminlerini kullanarak HB aracılığıyla toplam modelleri tahmin etmenin çok mantıklı olabileceği söylenebilir.

Özet olarak, HB modellerine uymak, onlara uygun zamanınız ve sabrınız olduğu sürece önerilen yaklaşımdır. Daha sonra, HB modelinizin performansını değerlendirmek için toplu modelleri bir ölçüt olarak kullanabilirsiniz.


Ayrıntılı cevabınız için teşekkür ederiz Srikant :) Şu anda Bayesian analizlerine aşina değilim, ancak araştırmak istediğim konulardan biriyim. Hiyerarşik Bayesian analizi bu sayfada tartışılan diğer çok düzeyli / hiyerarşik analizlerden farklı mıdır? Eğer öyleyse ilgilenen taraflar için daha fazla bilgi edinmek için önerilen bir kaynağınız var mı?
Patrick

Analitik bir bakış açısından HB analizi = çok seviyeli modeller. Bununla birlikte, çok seviyeli modeller terimi, doğal olarak gerçekleşen farklı seviyeleriniz olduğunda kullanılır (Bkz. @Ar örneği). HB modelleri terimi, durumda mutlaka farklı seviyelere sahip olmadığınız zaman kullanılır. Örneğin, bir tüketicinin çeşitli pazarlama değişkenlerine (örneğin, fiyat, reklam harcaması vb.) , tüketici düzeyinde aşağıdaki yapıya sahip olabilirsiniz: ve popülasyon düzeyinde . Referanslar için: Diğer cevaplara bakınız. βiN(β¯,Σ)β¯N(.,.)

4

Snijders ve Bosker'den Çok Düzeyli Analiz: Öğrendim temel ve ileri düzey çok seviyeli modellemeye giriş. Başlangıçta çok iyi durumda olduğunu düşünüyorum, çünkü bu şeylerin endişe duyduğu ve bana mantıklı geldiği için çok kalın olduğum için olmalı.

Ben de Gelman ve Hill'den, gerçekten mükemmel bir kitaptan.


1

Çok seviyeli modeller, veriler hiyerarşik bir yapıya yerleştirildiğinde, özellikle bağımlı değişkende daha yüksek seviyeli birimler arasında önemli farklılıklar olduğunda kullanılmalıdır (örneğin, öğrenci başarısı oryantasyonu öğrenciler arasında ve aynı zamanda öğrencilerin sınıfları arasında değişir). iç içe geçmiş). Bu şartlarda, gözlemler bağımsız değil kümelenmiştir. Kümelemenin dikkate alınmaması, parametre tahminindeki hataların, önyargılı anlamlılık testinin ve tutulması gerektiğinde boş değeri reddetme eğiliminin hafife alınmasına yol açmaktadır. Çok seviyeli modellerin kullanılmasının gerekçesinin yanı sıra analizlerin nasıl yapılacağına dair ayrıntılı açıklamalar da sunulmaktadır.

Raudenbush, SW Bryk, AS (2002). Hiyerarşik doğrusal modeller: Uygulamalar ve veri analizi yöntemleri. 2. Baskı. Newbury Park, CA: Adaçayı.

Ar - Ge kitabı, aynı zamanda, paketin öğrenilmesinde büyük ölçüde yardımcı olan yazarların HLM yazılım paketi ile iyi bir şekilde bütünleşmiştir. Çok seviyeli modellerin neden gerekli olduğuna ve bazı alternatiflere tercih edildiğine dair bir açıklama (daha yüksek seviyedeki birimlerin kuklalanması gibi) klasik bir makalede sunulmuştur

Hoffman, DA (1997). Hierachical Linear Modellerin mantığına ve mantığına genel bir bakış. Yönetim Dergisi, 23, 723-744.

Google’dan "Hoffman 1997 HLM" yazıp pdf’ye erişebiliyorsanız, Hoffman makalesi ücretsiz olarak indirilebilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.