Aritmetik ortalama geometrik ortama çok yakın olduğu zaman veriler hakkında ne söylenebilir?


24

Geometrik ortalama ve aritmetik ortalama hakkında birbirlerine çok yakın düşen önemli bir şey var mı, yani ~% 0.1? Böyle bir veri seti hakkında ne gibi varsayımlar yapılabilir?

Bir veri setini analiz etmeye çalışıyorum ve ironik bir şekilde değerlerin çok, çok yakın olduğunu fark ettim. Tam değil, ama yakın. Ayrıca, aritmetik ortalama-geometrik ortalama eşitsizliği ile ilgili hızlı bir kontrol ve veri kazanımının gözden geçirilmesi, değerlerimin nasıl gerçekleştiğiyle ilgili olarak veri setimin bütünlüğü hakkında balıksal bir şey olmadığını ortaya koymaktadır.


6
Küçük not: Öncelikle verilerinizin olumlu olduğunu kontrol edin; hatta eşit sayıda negatif değer sizi pozitif bir ürüne bırakabilir ve bazı paketler potansiyel sorunu işaretlemeyebilir (AM-GM eşitsizliği tüm değerlerin pozitif olmasına dayanır). Örneğin bakınız (R cinsinden):x=c(-5,-5,1,2,3,10); prod(x)^(1/length(x)) [1] 3.383363 (aritmetik ortalama 1 iken)
Glen_b -Reinstate Monica

1
@ Glen_b'in noktasını ele almak için, veri kümesinin {x,0,x}her zaman eşit aritmetik ve geometrik ortalamaları vardır, yani sıfır. Ancak bu üç değeri dilediğimiz kadar uzağa yayabiliriz.
hardmath

Hem aritmetik hem de geometrik araçlar aynı genelleştirilmiş formüle sahiptir ; p=1 birinciyi verirken, p0 ise ikincisini verir. Daha sonra, veri değerleri xgittikçe eşitleştiklerinde, sabit olarak yaklaşırken , ikisinin birbirine daha da yakınlaştığı sezgisel olarak anlaşılır hale gelir .
ttnphns

Yanıtlar:


29

Aritmetik ortalama, şunları ifade eden Aritmetik-Ortalama-Geometrik-Ortalama (AMGM) eşitsizliği yoluyla geometrik ortalamayla ilgilidir:

x1+x2++xnnx1x2xnn,

eşitlik sağlandığı yerlerde iff . Bu yüzden muhtemelen veri noktalarınız birbirine çok yakındır.x1=x2==xn


4
Bu doğru. Tipik olarak, değerlerin varyansı ne kadar küçükse, iki araç o kadar yakındır.
Michael M

16
Varyansın, gözlemlerin boyutlarına göre BY COMPARISON tarafından küçük olması gerekir. Bu nedenle küçük olması gereken değişkenlik katsayısıdır .σ/μ
Michael Hardy,

1
AMGM herhangi bir şeyi temsil ediyor mu? Eğer öyleyse, hecelenmesi iyi olurdu.
Richard Hardy,

@RichardHardy: AMGM 'aritmetik ortalama - geometrik ortalama' anlamına gelir

1
@ user1108, teşekkürler, aslında, diğer yazıları okuduktan sonra anladım. Sadece cevabın hecelendiğini düşünüyorum (sadece yorumlarda değil).
Richard Hardy,

15

@Alex R'nin cevabını detaylandırarak, AMGM eşitsizliğini görmenin bir yolu da Jensen'in eşitsizlik etkisidir. By Jensen'in eşitsizliği : Ardından her iki tarafın da üstel atın: 1

log(1nixi)1nilogxi
1nixiexp(1nilogxi)

Sağ taraf şu yana verilen geometrik ortalamadır (x1x2xn)1/n=exp(1nilogxi)

AMGM eşitsizliği ne zaman eşitlikle ilgilidir? Jensen eşitsizliği etkisi küçük olduğunda. Jensen'ın buradaki eşitsizlik etkisini yönlendiren şey tutarlılık, logaritmanın eğriliğidir. Verileriniz logaritmanın eğrili olduğu bir alana yayılmışsa, etki büyük olacaktır. Verileriniz logaritmanın temelde afin olduğu bir bölgeye yayılmışsa, etki küçük olacaktır.

Örneğin, verilerin çok az çeşitliliği varsa, yeterince küçük bir mahallede bir araya toplanırsa, o zaman logaritma o bölgedeki bir afin işlevi gibi gözükecektir (bir hesaplama teması, düzgün, sürekli bir işlevi yeterince yakınlaştırırsanız, bir çizgi gibi görünecek). Birbirine yeterince yakın olan veriler için, verinin aritmetik ortalaması geometrik ortalamaya yakın olacaktır.


12

Diyelim aralığını araştırmak aritmetik ortalaması (PM), küçük bir çok göz önüne alındığında bu 1 + δ ile (geometrik ortalama (GM) ve ö 0 ). Soruda, ö 0.001 ama biz bilmiyoruz n .x1x2xn1+δδ0δ0.001n

Bu araçların oranı ölçüm birimleri değiştirildiğinde değişmediğinden GM'nin olduğu bir birim seçin . Böylece, en üst düzeye çıkarmak için aramaya x n kısıtlama tabi x 1 + x 2 + + x , n = n ( 1 + δ ) ve x 1x 2X , n = 1 .1xnx1+x2++xn=n(1+δ)x1x2xn=1

Bu, , say ve x n = z x yaparak yapılacaktır . Böylecex1=x2==xn1=xxn=zx

n(1+δ)=x1++xn=(n1)x+z

ve

1=x1x2xn=xn1z.

Çözelti arasında bir kök olduğu , 0 ve 1 arasındax01

(1n)xn+n(1+δ)xn11.

Kolayca yinelemeli bulunur. Sağdan sola , n = 6 , 20 , 50 , 150 için δ'nin bir fonksiyonu olarak optimal ve z grafikleri :xzδn=6,20,50,150

şekil

En kısa sürede herhangi bir kayda değer bir boyuta ulaştığında, hatta çok küçük bir oranı, 1.001 büyük bir uzak ile tutarlıdır x n (üst kırmızı eğrileri) ve kümelenmiş sıkı bir grup X i (alt mavi eğri).n1.001xnxi

Diğer uçta eşit olduğunu varsayalım (basitlik için). Yarım zaman minimum aralık elde edilir X i , bir değer ile aynı X 1 ve diğer yarısı başka bir değer eşit z 1 . Şimdi çözüm (kolayca kontrol edilir)n=2kxix1z1

xk=1+δ±δ2+2δ.

Minik için , biz göz ardı edebilir Í 2 yaklaşık bir değer olarak hem de tahmin k inci vererek birinci sırasına kökδδ2kth

x1+δ2δk; z1+δ+2δk.

Menzil yaklaşık .32δ/n

nδ

xi


n=150,δ=0.002,x0.9954,z1.983,k=75x0.99918,z1.00087

n=150x149z=1149x+z=150(1.002)=150.3x=0.995416z=1.98308

z1+δ+2δk=1+0.002+2×0.002751.00087x

xz75x+75z150.3x75z751
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.