Normal olarak dağıtılan iki değişkenin veya bir tersinin oranı nasıl parametrelendirilir?


12

Sorun: Bayes meta-analizinde öncelikler ve veriler olarak kullanılacak dağılımları parametrelendiriyorum. Veriler literatürde neredeyse sadece normal olarak dağıtıldığı varsayılan özet istatistikler olarak verilmektedir (değişkenlerin hiçbiri <0 olmamasına rağmen, bazıları oranlardır, bazıları kütle vb.).

Çözümü olmayan iki davaya rastladım. Bazen ilgili parametre, verilerin tersi veya iki değişkenin oranıdır.

Örnekler:

  1. normal olarak dağılmış iki değişkenin oranı:
    • veri: yüzde azot ve yüzde karbon için ortalama ve sd
    • parametre: karbonun azota oranı.
  2. normal olarak dağıtılmış bir değişkenin tersi:
    • veri: kütle / alan
    • parametre: alan / kütle

Mevcut yaklaşımım simülasyon kullanmaktır:

örneğin: xbar.n, c, varyans: se.n, c ve örnek büyüklüğü: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Oranı parametrelendirmek istiyorum. Cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Sonra benim önceliği için aralığı ile en uygun dağıtımları seçin0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Soru: Bu geçerli bir yaklaşım mı? Başka / daha iyi yaklaşımlar var mı?

Şimdiden teşekkürler!

Güncelleme: olan iki normalin oranı olarak tanımlanan Cauchy dağılımı, varyansı tahmin etmek istediğim için sınırlı faydaya sahiptir. Belki de bir Cauchy'den n çekiliş simülasyonunun varyansını hesaplayabilir miyim?μ=0

Aşağıdaki kapalı form yaklaşımlarını buldum, ancak aynı sonuçları verip vermediklerini test etmedim ... Hayya ve ark., 1975

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. ve Armstrong, D. ve Gressis, N., 1975. Normal olarak dağılmış iki değişkenin oranı hakkında bir not. Yönetim Bilimi 21: 1338--1341


Cauchy'den rastgele çekilişlerdeki varyansın ayrı bir soru olarak hesaplanmasıyla ilgili Güncelleme sorusunu göndermeliyim?
David LeBauer

david - değişkenlerinizin hepsi pozitif olduğundan, neden ile uğraşmak istiyorsunuz ? btw - simülasyonunuzda, bağımsız olan per.c ve per.n değişkenleri üretiyor gibi görünüyorsunuz. bu doğru mu - eğer öyleyse, istediğin bu mu? μ=0
Ekim'de ronaf

hayır, = 0 ile uğraşmak istemiyorum ; bu değişkenler genellikle bağımsız olarak ele alınır ve kovaryans verileri nadiren bulunur. C oldukça sabit olduğu için bağımsızlık makul bir varsayımdır. μ
David LeBauer

Oran beklentisinin neden olmadığını anlamıyorum. Eğer ve birlikte, normal olarak o sıfır, ortalama daha ortalama farklı şekilde dağıtıldığı verilir , ne eksik? Y Z = XXYxZ=XYxyp(x,y)dxdy
Royi

Yanıtlar:


6

Oran Dağılımı hakkındaki Wikipedia makalesi altındaki bazı referanslara bakmak isteyebilirsiniz . Kullanmak için daha iyi yaklaşımlar veya dağılımlar bulmanız mümkündür. Aksi takdirde yaklaşımınız sağlam görünür.

Güncelleme Bence daha iyi bir referans olabilir:

Bkz. Formül 2-4, sayfa 195.

Güncelleme 2

Bir Cauchy'den varyans ile ilgili güncellenmiş sorunuzda - John Cook'un yorumlarda belirttiği gibi, varyans mevcut değil. Dolayısıyla, örnek bir varyans almak bir "tahmin edici" olarak işe yaramaz. Aslında, örnek varyansınızın hiç bir şekilde birleşmediğini ve örnek almaya devam ederken çılgınca dalgalandığını göreceksiniz.


Referans için teşekkürler, burası Haaya 1975 referansını ve denklemimi bulduğum yerdi, ancak denklemlerin sorunum için uygun olduğuna dair güvence takdir ediyorum.
David LeBauer

Haaya'ya hızlı bir bakışla, oran için Normal bir yaklaşım elde etmekle ilgilendikleri ve bunun ne zaman geçerli olduğunu belirlemek için simülasyonlar kullandıkları anlaşılıyor (varyasyon katsayısı, cv). Davanızdaki cv kriterleri karşılıyor mu? Eğer öyleyse, yaklaşımlar geçerlidir.
ars

1
@David: cevapta güncellenen yerine Marsaglia 1965 kullanın.
ars

Not: Marsaglia 2004 yılında JSS'de bir güncelleme yayınladı .
David LeBauer

Oran beklentisinin neden olmadığını anlamıyorum. Eğer ve birlikte, normal olarak o sıfır, ortalama daha ortalama farklı şekilde dağıtıldığı verilir , ne eksik? Y Z = XXYxZ=XYxyp(x,y)dxdy
Royi

0

Bu bürünemeyecekti normal bir rasgele değişkenin ters ve normal dağılım için uygun parametreleri tespit ettikten sonra, gerekli Bayes hesaplama yapmak.y1N(.,.)

Cauchy'yi kullanmak için aşağıdaki önerim, ars ve John'un yorumlarında belirtildiği gibi çalışmıyor.

Normalde rastgele iki değişkenin oranı Cauchy dağılımını takip eder . Bu fikri, sahip olduğunuz verilere en çok uyan cauchy parametrelerini tanımlamak için kullanmak isteyebilirsiniz.


a. Cauchy dağılımının varyansını ve varyansını tanımlamam gerekiyor.
David LeBauer

b. İkinci noktanızı anlarsam, evet, y-1 ~ N (mu, sigma) olduğunu varsayabilirim, ancak yine de y ve sigma'yı y için verilen özet istatistiklerden hesaplamam gerekir; Ayrıca, sadece tanımlanmış> 0 değişkenleri için <0 değerlerine sahip dağılımları düşünmemeyi seçtim (çoğu durumda p (X <0 | X ~ N (mu, s)) -> 0)
David LeBauer

Cauchy sıfır ortalama normal için geçerli değil mi?
ars

@ars Doğru. Cauchy sınırlı kullanımda olabilir.

Ars: Evet, Cauchy sonucunun sıfır yol gerektirdiğine inanıyorum. Ancak bu, en azından bu özel durumda, David'in tahmin etmeye çalıştığı varyansın VAR OLMADIĞI anlamına gelir.
John D. Cook
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.