Oranları analiz et


13

1'e kadar birden fazla oranlar içeren bir veri kümesi var. Ben degrade boyunca bu oranlarda değişiklik ilgileniyorum (örnek veri için aşağıya bakın).

gradient <- 1:99
A1 <- gradient * 0.005
A2 <- gradient * 0.004
A3 <- 1 - (A1 + A2)

df <- data.frame(gradient = gradient,
                 A1 = A1,
                 A2 = A2,
                 A3 = A3)

require(ggplot2)
require(reshape2)
dfm <- melt(df, id = "gradient")
ggplot(dfm, aes(x = gradient, y = value, fill = variable)) +
  geom_area()

resim açıklamasını buraya girin

Ek bilgi: Mutlaka doğrusal olması gerekmez, bunu sadece örneğin kolaylığı için yaptım. Bu oranların hesaplandığı orijinal sayımlar da mevcuttur. Gerçek veri kümesi 1'e kadar daha fazla değişken ekler (örn. B1, B2 ve B3, C1 ila C4, vb.) - bu nedenle çok değişkenli bir çözüm için bir ipucu da yardımcı olacaktır ... Ama şimdilik tek değişkene bağlı kalacağım istatistik tarafı.

Soru: Bu tür veriler nasıl analiz edilebilir? Biraz okudum ve belki de çok terimli bir model veya bir glm uygun mu? - 3 (veya 2) glm çalıştırırsam, öngörülen değerlerin 1'e kadar olduğu kısıtlamayı nasıl ekleyebilirim? Sadece bu tür verileri çizmek istemiyorum, aynı zamanda analiz gibi daha derin bir regresyon yapmak istiyorum. Tercihen R kullanmak istiyorum - bunu R'de nasıl yapabilirim?


proprcsplineStata'daki komut aradığınız şey olabilir (kullanmak istediğinizi biliyorum R, ancak belki de bu bir başlangıç ​​noktası olabilir): proprcspline, xvar verilen her bir yvar kategorisindeki gözlem oranlarının pürüzsüz bir kısıtlı kübik spline'ı hesaplar ve bunları yığılmış alan grafiği olarak çizer. İsteğe bağlı olarak, bu düzleştirilmiş oranlar bir dizi kontrol değişkeni (cvars) için ayarlanabilir.
boscovich

"İlgilenmek" ne anlama geldiğini açıklayabilir misiniz? Sadece oranları eğime karşı çizmek mi istiyorsunuz? Yoksa daha derin bir analiziniz mi var? Eğer öyleyse, doğası nedir - bu verilerden tam olarak ne öğrenmeyi umuyorsunuz? Ayrıca, orijinal sayımlarınız var mı (hangisi iyi olurdu) veya sadece oranlar? Bu verilerin nelerden oluştuğu ve nasıl toplandığı hakkında biraz daha bilgi verebilir misiniz?
whuber

1
@whuber: Bu verilerle daha derinlemesine bir analiz yapmak istiyorum. Benim hipotezim oranların gradyanla değişeceğidir. Sayımlar da mevcuttur.
EDi

1
Kompozisyon verileriniz var gibi görünüyor. Bu konuda pek bir şey bilmiyorum, ama Aitchison'un işi başlangıç ​​noktası. CRAN'da bir paket, kompozisyonlar var.
Aaron Stack Overflow'dan ayrıldı

Yanıtlar:


13

Bir boyutta, bu, beta regresyonu için bir iş gibi görünür (değişken dağılımlı veya değişken dağılımsız). Bu, beta-dağıtılmış bağımlı değişkenli, doğal olarak 0-1 kısıtlı bir regresyon modelidir. Bir R paketi betareg'dir ve kullanımını açıklayan bir makale buradadır .
İkiden fazla oran için Beta dağılımının olağan uzantısı, Dirichlet regresyonuna yol açar. Örneğin burada tarif edilen bir R paketi DirichletReg mevcuttur .

Gerçek kompozit veriler için logit linkleri ve multinomiyal lojistik regresyonu kullanmamanın, çoğunlukla varyans için hangi güçlü varsayımlarla ilgili olduklarını yapmak için bazı nedenler vardır. Veri Ancak, eğer tüm gerçekte normalize sayıları (bollukları?), Bu varsayımlar doğru olabilir ve Peter'ın öneri muhtemelen gitmek için yol olacaktır.


Bağlantılar için teşekkür ederim, onlara bir göz atacağım. DirichletReg umut verici görünüyor! Örneğin bağlantınızın Slayt 3'ü: "Belirli bir kategoride cevap verme olasılığı 'seçenekler arasında yayılıyorsa, bir Dirichlet yaklaşımı daha bilgilendiricidir." . Çünkü mlogit ile bunu nasıl yapacağımı bilmiyordum, çünkü seçimlerin benzersiz olması gerekmiyor. Ayrıca grafiksel
sunumun

Grafikler için, splineplot ve cdplot işlevlerini yararlı bulabilirsiniz. Gerçekten de sadece monte edilmiş hatları istediyseniz ve çok fazla regresyon makinesine ihtiyacınız yoksa, muhtemelen ilgili eğrileri vermek için cdplot koaksiyel olabilir (sadece altındaki yoğunluk )
konjugateprior

Üzgünüm, açıkça spineplot yazmak istedim .
konjugateprior

DirichletReg paketinin artık CRAN'da bulunduğunu ve bir skeç yayınlandığını unutmayın.
jbaums

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.