1'e kadar birden fazla oranlar içeren bir veri kümesi var. Ben degrade boyunca bu oranlarda değişiklik ilgileniyorum (örnek veri için aşağıya bakın).
gradient <- 1:99
A1 <- gradient * 0.005
A2 <- gradient * 0.004
A3 <- 1 - (A1 + A2)
df <- data.frame(gradient = gradient,
A1 = A1,
A2 = A2,
A3 = A3)
require(ggplot2)
require(reshape2)
dfm <- melt(df, id = "gradient")
ggplot(dfm, aes(x = gradient, y = value, fill = variable)) +
geom_area()
Ek bilgi: Mutlaka doğrusal olması gerekmez, bunu sadece örneğin kolaylığı için yaptım. Bu oranların hesaplandığı orijinal sayımlar da mevcuttur. Gerçek veri kümesi 1'e kadar daha fazla değişken ekler (örn. B1, B2 ve B3, C1 ila C4, vb.) - bu nedenle çok değişkenli bir çözüm için bir ipucu da yardımcı olacaktır ... Ama şimdilik tek değişkene bağlı kalacağım istatistik tarafı.
Soru: Bu tür veriler nasıl analiz edilebilir? Biraz okudum ve belki de çok terimli bir model veya bir glm uygun mu? - 3 (veya 2) glm çalıştırırsam, öngörülen değerlerin 1'e kadar olduğu kısıtlamayı nasıl ekleyebilirim? Sadece bu tür verileri çizmek istemiyorum, aynı zamanda analiz gibi daha derin bir regresyon yapmak istiyorum. Tercihen R kullanmak istiyorum - bunu R'de nasıl yapabilirim?
proprcspline
Stata'daki komut aradığınız şey olabilir (kullanmak istediğinizi biliyorumR
, ancak belki de bu bir başlangıç noktası olabilir): proprcspline, xvar verilen her bir yvar kategorisindeki gözlem oranlarının pürüzsüz bir kısıtlı kübik spline'ı hesaplar ve bunları yığılmış alan grafiği olarak çizer. İsteğe bağlı olarak, bu düzleştirilmiş oranlar bir dizi kontrol değişkeni (cvars) için ayarlanabilir.