Varyasyon katsayısı nasıl yorumlanır?


33

Varyasyon Katsayısını anlamaya çalışıyorum . Bunu aşağıdaki iki veri örneğine uygulamaya çalıştığımda, sonuçları nasıl yorumlayacağımı anlayamıyorum.

Diyelim ki örnek 1 ve örnek 2 10 , 15 , 17 , 22 , 21 , 27'dir . Burada örnek 2 = örnek 1 + 10 gördüğünüz gibi.0,5,7,12,11,1710,15,17,22,21,27=+ 10

Her ikisi de aynı standart sapma σ2=σ1=5.95539 ancak ve .μ2=18.67μ1=8.66667

Şimdi varyasyon katsayısı farklı olacaktır. Örnek 2 için örnek 1'den daha az olacaktır. Fakat bu sonucu nasıl yorumlayabilirim? Varyans açısından ikisi de aynıdır; sadece araçları farklı. Öyleyse, burada varyasyon katsayısının kullanımı nedir? Bu sadece beni yanıltıcı, ya da belki sonuçları yorumlayamıyorum.σ/μ


10 eklemek yerine 1000 eklerseniz, ikinci sayı grubu ilk ayardan ortalamaya göre çok daha az farklılık gösterir. Varyasyon katsayısı bunun bir ifadesidir.

Yanıtlar:


42

Veriler tamamen farklı olduğunda sizinki gibi örneklerde, yani her şeye bir miktar ekleriz , o zaman standart sapmanın değişmediğine işaret ettiğinizde, ortalama tam olarak bu sabit tarafından değiştirilir ve bu nedenle varyasyon katsayısı σ / μ ila σ / ( μ + k ) , ki bu ne ilginç ne de faydalı değildir.kσ/μσ/(μ+k)

Bu ilginç ve değişkenlik katsayısının bir miktar kullanımı olan çarpımsal değişimdir. Bazı sabit her şeyi çarparak İçin varyasyon katsayısı olur ima k σ / k μ yani eskisi gibi kalır. Ölçü birimlerinin değiştirilmesi, @Aksalal ve @Macond'un cevaplarında olduğu gibi, bir konudur.kkσ/kμ

Varyasyon katsayısı ünite içermemediğinden, aynı zamanda boyutsuzdur, çünkü temel değişken tarafından sahip olunan herhangi bir ünite veya boyut bölünme tarafından yıkanır. Bu, varyasyon katsayısını, göreceli değişkenliğin bir ölçüsü haline getirir , böylece uzunlukların göreceli değişkenliği, ağırlıklar vb. İle karşılaştırılabilir. Varyasyon katsayısının tanımlayıcı bir kullanım bulduğu alanlardan biri biyolojideki organizma büyüklüğünün morfometrisidir.

Prensip ve pratikte, varyasyon katsayısı sadece tamamen tanımlanmıştır ve tamamen pozitif olan değişkenler için faydalıdır. Bu nedenle ayrıntılı olarak olan ilk örneğiniz uygun bir örnek değildir. Bunu görmenin bir başka yolu, katsayının sıfır olduğu, katsayının belirsiz olacağını ve son durumda, standart sapmanın pozitif olduğunu varsayarak katsayının negatif olacağını not etmektir. Her iki durumda da, önlemi göreceli değişkenliğin bir ölçüsü olarak ya da gerçekten başka bir amaç için işe yaramaz hale getirilir. 0

Eşdeğer bir ifade, varyasyon katsayısının, sadece tüm değerler için logaritmalar olağan şekilde tanımlanması durumunda ve gerçekten de varyasyon katsayılarının kullanılması, logaritmaların değişkenliğine bakmaya eşdeğer olması durumunda ilginç ve faydalıdır.

Her ne kadar buradaki okuyucular için inanılmaz gözükse de, Celsius sıcaklığının değişkenlik katsayılarının, ortalama sıcaklıklar C'ye yaklaşırken ve ortalama sıcaklıklar için negatif olduklarını belirten saf bilim insanlarını şaşırtdığı iklimsel ve coğrafi yayınlar gördüm. donma noktasının altındaki. Daha da tuhaf bir şekilde, sorunun Fahrenheit kullanarak çözüldüğü konusunda öneriler gördüm. Bunun tersine, varyasyon katsayısı sıklıkla doğru bir şekilde belirtilir, ancak eğer ölçüm ölçekleri oran ölçeği olarak nitelendirilirse ve sadece ölçülen ölçeklerin tanımlanması halinde tanımlanmış bir özet ölçü olarak. Olduğu gibi, varyasyon katsayısı, kelvin'de ölçülen sıcaklıklar için bile değil, matematiksel veya istatistiksel olmaktan ziyade fiziksel nedenler için özellikle yararlıdır.0

Yazarların ne krediyi ne de utancı hakettiği için kayıtsız bıraktığım klimatolojiden tuhaf örnekler örneğinde olduğu gibi, varyasyon katsayısı bazı alanlarda aşırı kullanılmıştır. Bazen, hem ortalama hem de standart sapmayı içine alan bir tür sihirli özet ölçüsü olarak görülme eğilimi vardır. Bu doğal olarak ilkel bir düşüncedir; oran anlamlı olsa bile, ortalama ve standart sapma ondan geri alınamaz.

İstatistiklerde, varyasyonun gama veya lognormali takip etmesi durumunda, varyasyon katsayısı formuna bakarak, varyasyon katsayısı oldukça doğal bir parametredir.

Her ne kadar varyasyon katsayısı bir miktar kullanımda olsa da, uygulamanın uygulandığı durumlarda daha kullanışlı olan adım logaritmik dönüşümle veya genelleştirilmiş doğrusal bir modelde logaritmik bir link fonksiyonu kullanarak logaritmik ölçekte çalışmaktır.

EDIT: Tüm değerler negatifse, işareti sadece ihmal edilebilecek bir kural olarak görebiliriz. Aynı durumda, Etkili bir değişim varyasyon katsayısı ikizidir.σ/|μ|


3
+1 Bu gönderi, konuyla ilgili herhangi bir tartışmanın parçası olması gereken logaritma ve pozitifliğe ilişkin kilit noktaları içerir. "Savaş hikayeleri" de iyi bir okuma yapıyor.
whuber

Bir değişken = 0 ise CV hesaplayamadığınızı düşündüm?

1
@Jerf: Üzerinden düşün. Tüm değerler 0 ise, hiçbir değişiklik yoktur ve hesaplanacak bir şey yoktur. Bazı bireysel değerler 0 olduğu için problem yoktur, çünkü kendisi 0 anlamına gelmez bu durumda CV belirsizdir. Ancak pratikte CV tüm değerler pozitif olduğunda en faydalı olanıdır.
Nick Cox

13

"Bu şehirde 1.625.330 kişi var. Artı veya eksi beş" demiştim. Doğru demografik bilgilerimden etkileneceksiniz.

Ama eğer "Bu evde beş kişi var. Artı veya eksi beş." Evde kaç insan olduğu hakkında hiçbir fikrim olmadığını düşünürdünüz.

Aynı standart sapma, çok farklı CV'ler.


1
Bu, CoV'un ne olduğunu açıklamanın makul bir yoludur, ancak OP'nin sorusuyla ne kadar alakalı olduğu belli değil.
dediklerinin - Eski Monica

OP: “Varyans açısından her ikisi de aynıdır; sadece araçları farklıdır. Öyleyse, burada varyasyon katsayısının kullanımı nedir?” Bence benim örneğim CV'nin varyansı yorumlamanın bir yolu olduğunu gösteriyor.
Bart

1
Sana oy vermedim. OP'nin 2 açık sorusu şudur: "bu sonucu nasıl yorumlarım?", Ve "burada varyasyon katsayısının kullanımı nedir?". Sizce açıklama iyidir, ancak CoV'un ne olduğunu anlamak, bu sorulara cevap vermenin ilk adımıdır, bu soruların cevaplarının tamamı değil.
gung - Monica

4

Normalde, farklı ölçü birimlerinin değişkeni veya çok farklı ölçeklerde değişkenlik katsayısı kullanırsınız. Bunu gürültü / sinyal oranı olarak düşünebilirsiniz. Örneğin, öğrencilerin ağırlık ve boylarındaki değişkenliği karşılaştırmak isteyebilirsiniz; ABD ve Monako GSYİH değişkenliği.

Durumunuzda, değerler çok farklı olmadığından, değişkenlik katsayısı hiç bir anlam ifade etmeyebilir.



2

Gerçekte, hipotezinizi ve denemenizi bilmiyorsanız veya anlamazsanız, her iki istatistik de yanıltıcı olabilir. Bu ürkütücü örneği düşünün ... Bir tahta üzerinde yürümeye karşı, iki yüksek binada ip üstünde ip üzerinde yürümek. Diyelim ki ipin çapı 1 inç, tahta ise 12 inç genişliğinde. Halattan 5 kişi, tahtadan 5 kişi yürümek istedi. Aşağıdaki sonuçları bulduk:

Her basamağın ipin kenarından (veya kenarından) ortalama mesafesi: 0,5, 0,2, 0,3, 0,6, 0,1

Her bir basamağın, tahtanın (veya kenardan) kenarından (inç) ortalama uzaklığı: 5.5, 5.2, 5.3, 5.6, 5.1

Örneğinizde olduğu gibi, bu örnek eşit düzlem sapmalarla sonuçlanacaktır, çünkü tahta için değerler ip üzerindeki olanlar için sadece +5 bir farktır. Ancak, eğer her bir deney için standart sapmanın 0,2074 olduğunu söyleseydim, o zaman iki deney eşdeğerdi diyebilirdiniz. Bununla birlikte, ip ipi deneyinin özgeçmişinin, tahta için% 4'ün altına oranla neredeyse% 61 olduğunu söylersem, bana kaç kişinin halattan düştüğünü sormaya meyilli olabilirsiniz.


0

CV, farklı örnek veri kümelerinin değişkenliğini karşılaştırmak için kullanılan nispi bir değişkenliktir. Size bir örnek için, daha küçük ortalamalarla aynı standart sapma / varyans daha küçük bir CV üretecektir. daha küçük CV veri setinin daha küçük göreceli değişkenliğe sahip olduğunu gösterir. Aylık 10000 kazandığınızı ve 100 kazandığınızı varsayalım. (Farklı ortalama) hepimiz muhtemelen 100 aylık kaybediyoruz. daha fazla varyasyon.


1
Bunun mevcut cevaplara bir şey eklemediğini söylemeliyim.
Nick Cox

0

Bu durumda, cv sonucu açıklayan doğru istatistiksel araç değildir.

Bu nedenle yürütülen araştırmanın niteliğine bağlı olarak, araştırmacının belirli bir hipotezi veya kanıtı göstermesi gerekir. En iyi ve en uygun istatistiksel aracı kullanarak deney tasarlamalı, yürütmeli ve verileri analiz etmeli, yani her ikisi de cv aynı olsa da, ancak T-testi veya eşleştirilmiş T- kullanarak deney grup 1 ve grup 2'nin büyümesini karşılaştırmaksa Test veya Anova (daha büyük deney) kolayca iki grup arasındaki farkı kanıtlayabilir.

Burada anahtar, sonuç hakkında anlamlı bir açıklama yapmak için uygun istatistiksel aracı uygulamaktır. Cv'nin Betimleyici istatistikteki seçeneklerden sadece biri olduğunu unutmayın.

benim 2 kuruş

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.