Çarpık ve normal olmayan verilerle Z puanı kullanabilir miyim? [kapalı]


12

Tam döngü süresinin bölümleri arasında karşılaştırma yapmak için standart z-skoru kullanarak bazı süreç döngü süresi verileri ve ölçekleme ile çalışıyorum.

Veriler aşırı derecede sağa eğik / normal olmadığından başka bir dönüşüm kullanmalı mıyım? ('aykırı değerler' asla negatif zaman alamaz ve genellikle 'ortalamadan' daha uzun sürebilir)

Z-skorunu kullanmak hala "çalışıyor" gibi görünüyor ...

###############
# R code    
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))

5
tam olarak ne soruyorsun? Tabii ki, hala puanını hesaplayabilirsiniz , ama ne için kullanmaya çalışıyorsunuz? Ortalamadan standart sapmaların sayısı ( puanının ne olduğu) bazı durumlarda özellikle yararlı bir istatistik olmayabilir. zz
Makro

Yanıtlar:


5

Eğer X çok eğri ise, Z istatistiği normal olarak dağıtılmayacaktır (ya da standart sapmanın tahmin edilmesi gerekiyorsa t. Bu nedenle Z yüzdelik değerleri standart normal olmayacaktır, bu nedenle çalışmaz.


Anladığım kadarıyla, X çok eğri olmak, örneklem büyüklüğünün yeterince büyük olmadığı anlamına gelir (merkezi limit teoremi). Ancak, Z istatistiğinin çalışması için nüfusun normal olması gerekip gerekmediğinden emin değilim. Yapar?
Andrzej Gis

1
OP ortalamanın dağılımı değil nüfus dağılımı hakkında konuşuyor. Bu nedenle numune boyutu ve merkezi limit teoremi geçerli değildir.
Michael R. Chernick

2

R kodu işe yarayacaktır, ancak z skoru "Üzüm dolmakalemini hafifçe arıyor" cümlesi kadar anlamlı olacaktır. Bu geçerli bir cümle, ancak anlamlı bir şey ifade etmiyor.

R kodunuza bakılırsa, verilerinizin Weibull dağıtılmış olduğunu düşünüyorsunuz. Bu durumda, sadece Weibull istatistiğini kullanırdım ve kesinlikle gerekmedikçe hiçbir şeyi ölçeklemem. Her intro istatistik sınıfında z skorları öğretilmiş olsa da, bu onları her zaman kullanmanız gerektiği anlamına gelmez ve özellikle simetrik verileriniz yoksa değil.


1

Popülasyon normal olarak dağıtılmamışsa. Bu durumda, çubuk (X) {örnek ortalaması} dağılımı, merkezi limit teoremine göre normal bir dağılıma yaklaşır; büyük örnek boyutu için. Teorik olarak Student-t kullandığımızı söylese de, daha yüksek n (örnek boyutu veya serbestlik derecesi) değerleri için, t dağılımı ve Z dağılımı neredeyse eşittir.


-4

VERİLERİNİZİN Z-TESTİ İÇİN NORMAL OLMASI GEREKMEZ. (TOWNEND, 2002) ANCAK ÇEŞİTLER YAKLAŞIK EŞİT OLMALIDIR. İKİ VERİTİNİZDE F TESTİ YAPTIĞINI VE DEĞİŞTİRMEK İÇİN DEĞİŞİKLİKLERİNİN EŞİTE OLDUĞUNU KONTROL ETMEK İÇİN Z TEST SONUCU YARARLI. Aksi takdirde, VERİLERİ DÖNÜŞTÜRÜN.


9
Soru, bir değişkenin test değil dönüşümüyle ilgilidir, bu yüzden cevabınızın geçerli olduğunu düşünmüyorum. Ayrıca, sadece bir isim yılı referansı yerine tam referansı verirseniz ve bazı insanlar SHOUTING'e itiraz ederse, muhtemelen daha bilgilendiricidir.
Maarten Buis

@MaartenBuis ile aynı fikirdeyim ama ondan farklı olarak bunu küçümseyeceğim.
Erik
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.