Büyüme grafikleri oluşturmak için en iyi yöntem


10

Negatif olmayan, sürekli ve sürekli bir sağlık değişkeni için 5 ila 15 yaş arası çocuklar için (büyüme çizelgelerine benzer) grafikler oluşturmak zorundayım (sadece 5,6,7 vb; 2.6 yıl gibi kesirli değerler yoktur) 50-150 aralığı (bu aralığın dışında yalnızca birkaç değerle). 90., 95. ve 99. yüzdelik eğrileri oluşturmam ve bu yüzdelikler için tablolar oluşturmam gerekiyor. Örnek boyutu yaklaşık 8000'dir.

Aşağıdaki yolları kontrol ettim ve buldum:

  1. Quantiles bulun ve daha sonra bu quantiles düzgün bir eğri elde etmek için loess yöntemi kullanın. Pürüzsüzlük derecesi 'span' parametresi ile ayarlanabilir.

  2. LMS (Lambda-Mu-Sigma) yöntemini kullanın (örneğin, R'de gamlss veya VGAM paketleri kullanma).

  3. Kantil regresyon kullanın.

  4. Her yaş grubunun ortalamasını ve SD'sini, o yaş için yüzdelik değeri tahmin etmek ve yüzdelik eğriler oluşturmak için kullanın.

Bunu yapmanın en iyi yolu ne? 'En iyi' ile, bu tür büyüme eğrilerinin oluşturulması için standart yöntem olan ve herkes için kabul edilebilir olan ideal yöntemi kastediyorum. Veya bazı sınırlamaları olabilen, ancak kabul edilebilir, daha hızlı bir yöntem olan, uygulanması daha kolay ve basit bir yöntemdir. (Örneğin, yüzdelik değerlerde loess kullanmak, LMS gamlss paketi kullanmaktan çok daha hızlıdır).

Ayrıca bu yöntem için temel R kodu ne olacaktır.

Yardımın için teşekkürler.


2
Kesinlikle tartışılması zor ve imkansız olan her yerde "en iyi" istiyorsun. ("En iyi" seviye ölçüsü yeterince zordur.) Sorunuzu çocuklarda sağlık değişikliklerine açık bir şekilde bağladınız, ancak "en iyi" ölçütleriniz açık değildir, özellikle ne tür bir yumuşaklık derecesi veya kabul edilebilir veya kabul edilemez.
Nick Cox

Girişimi memnuniyetle karşılıyorum, ama a) açık bir şekilde mevcut değil, başka neden neden rakip çözümler var, ya da bu okumakta olduğunuz literatürde neden belirgin değil? Bu soruna ilgi yüzyıllarca olmasa da kesinlikle on yıllardır. Daha kolay araçlar: anlaşılması daha kolay, sağlık görevlilerine veya genel olarak istatistiki fikir sahibi olmayan profesyonellere açıklanması daha kolay, uygulanması daha kolay, ...? Hiç şüphe yok ki seçici görünüyor, ama neden burada hızı önemsesin ki? Bu yöntemlerin hiçbiri hesaplama gerektirmez.
Nick Cox

@ NickCox: Soruyu yorumlarınıza göre düzenledim. Gerçek bir cevabı takdir edeceğim.
rnso

1
Üzgünüm, ama bu alanda çalışmıyorum ve sorunuzun cevaplanması çok zor. Yorumlar vardır, çünkü insanlar cevaplayamayabilir veya istemeyebilir ancak yine de söyleyecek bir şeyleri vardır. Siparişe cevap yazmıyorum.
Nick Cox

Yanıtlar:


6

Büyüme eğrileri üzerine geniş bir literatür vardır. Zihnimde üç "üst" yaklaşım var. Her üçünde de, zaman, yeterli sayıda düğüm (örneğin, 6) ile sınırlı bir kübik spline olarak modellenmiştir. Bu mükemmel performans ve kolay yorumlama ile parametrik bir pürüzsüzdür.

  1. Sürekli zaman AR1 gibi anlamlı bir korelasyon paterni olan uzunlamasına veriler için klasik büyüme eğrisi modelleri (genelleştirilmiş en küçük kareler). Kalıntıların Gauss olduğunu gösterebilirseniz, tahmini araçları ve ortak standart sapmayı kullanarak kantillerin MLE'lerini alabilirsiniz.
  2. Kuantil regresyon. Bu sigara geniş için verimli değildir . Hassasiyet optimal olmasa da, yöntem minimal varsayımlar yapar (çünkü bir kantil için tahminler farklı bir kantil tahminlerine bağlı değildir) ve tarafsızdır.n
  3. Sıradan regresyon. Bu orantılı olasılık modeli gibi yarı parametrik modeller kullanarak sürekli sağlam olarak sıralı olarak ele alır . Sıralı modellerden, ortalamayı ve herhangi bir kantili tahmin edebilirsiniz, ikincisi sadece sürekli ise.YY

Orantılı oranları kullandığınızda, PO varsayımını (başarısız olduğu varsayılarak) sonucun pek çok seviyesi ile nasıl karşıladınız? Teşekkürler.
julieth

2
Başarısız olsa bile, genel olarak daha az varsayım nedeniyle model diğer modellerden daha iyi performans gösterebilir. Veya orantılı tehlikeler (log-log kümülatif prob bağlantısı) gibi diğer sıralı model kümülatif olasılık ailesinden birine geçin.
Frank Harrell

1

Gauss süreç gerilemesi . Kareli üstel çekirdekle başlayın ve parametreleri göze göre ayarlayın. Daha sonra, işleri düzgün bir şekilde yapmak istiyorsanız, farklı çekirdeklerle deneme yapın ve parametreleri optimize etmek için marjinal olasılığı kullanın.

Yukarıda verilen öğreticiden daha fazla ayrıntı istiyorsanız, bu kitap harika .


Cevabınız için teşekkürler. Belirtilen diğer yöntemlere kıyasla Gauss süreç gerilemesini nasıl değerlendirirsiniz? Scikit-learn.org/0.11/auto_examples/gaussian_process/… adresindeki ikinci Gauss arsa, LOESS'in bu sayfasındaki son son arsaya çok benziyor (yerel regresyon): princeofslides.blogspot.in/2011/05/… . LOESS'in gerçekleştirilmesi çok daha kolaydır.
rnso

Şahsen, GPR'yi sığdırmanıza izin verecek kadar küçük herhangi bir veri kümesi için kesinlikle tercih ediyorum. Teorik açıdan çok daha "hoş" olmasının yanı sıra, daha esnek, sağlam ve iyi kalibre edilmiş olasılıksal çıktı sağlar. Tüm bunları söyledikten sonra, verileriniz yoğun ve iyi davranıyorsa, kitleniz istatistikçi olmadıkça muhtemelen LOESS ve GPR arasındaki farkı söyleyemez.
Andy Jones

3
yx

1
@Nick: Amaçlanan tavsiyem verilerinizin bir modelini oluşturmak ve daha sonra bu modeli (düzgün) yüzdelik eğrileri oluşturmak için kullanmaktı. Şimdi bundan bahsettiniz, evet ikinci bileşeni tamamen kaçırdım (yani asıl soru).
Andy Jones

1
1.96
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.