Neden ortalama 0 ve standart sapma 1 dağılımları her zaman kullanılır?


15

İstatistiklerim kendi kendine öğretildi, ancak okuduğum birçok malzeme ortalama 0 ve standart sapma 1 olan bir veri kümesine işaret ediyor.

Bu durumda:

  1. Ortalama 0 ve SD 1 neden güzel bir mülk?

  2. Bu örnekten çizilen rastgele bir değişken neden 0.5'e eşittir? 0.001 çizim şansı 0.5 ile aynıdır, bu yüzden düz dağıtım olmalıdır ...

  3. İnsanlar Z Skorları hakkında konuştuğunda, burada gerçekten ne anlama geliyorlar?

Yanıtlar:


11
  1. Başlangıçta en yararlı cevap muhtemelen 0 ve sd'nin 1 ortalamasının matematiksel olarak uygun olmasıdır. Ortalama 0 ve standart sapma 1 ile dağılım olasılıklarını hesaplayabilirseniz, çok basit bir denklemle puanların benzer dağılımları için bunları çalışabilirsiniz.

  2. Bu soruyu takip etmiyorum. 0 ortalaması ve 1 standart sapması genellikle çan eğrisi olarak adlandırılan standart normal dağılım için geçerlidir. En olası değer ortalamadır ve uzaklaştıkça düşer. Gerçekten düz bir dağılımınız varsa, o zaman diğerinden daha büyük bir değer yoktur. Buradaki sorunuz zayıf biçimlendirilmiş. Belki bozuk paralarla ilgili sorulara mı bakıyordunuz? Binom dağılımı ve merkezi limit teoremine bakınız.

  3. "burada demek"? Nerede? Z-skorlarının basit cevabı, ortalamanız 0 ve standart sapma 1 gibi ölçeklenmiş puanlarınızdır. Bunu düşünmenin başka bir yolu, puanın standart sapmaların sayısının anlamına gelmek. Denklem (skor - ortalama) / standart sapmayı hesaplıyor. Bunu yapmanın nedenleri oldukça çeşitlidir, ancak bir tanesi, giriş istatistik derslerinde farklı z skorları için olasılık tablolarına sahip olmanızdır (bkz. Cevap 1).

Önce z skoruna baksaydınız, wikipedia'da bile, oldukça iyi cevaplar alırsınız.


2) X sürekli X rasgele bir değişken olduğunda karışıklığın p (X = .01) ne anlama geldiğine inanıyorum. Sezgisel olarak, olasılık her yerde sıfır gibi görünüyor çünkü X'in tam olarak .01 olma şansı yok. Soru soran kişi, sürekli vakada, yoğunluk yoğunluğu fonksiyonunun türevi olarak tanımlanan bir yoğunluk fonksiyonunun tanımını gözden geçirmelidir.
Tristan

7

Burada bahsettiğimiz şeyle başlamak için standart normal dağılım, ortalama 0 ile normal dağılım ve standart sapma 1'dir. Standart normal dağılım olarak dağıtılan bir değişken için kısa el Z'dir.

İşte sorularınıza cevaplarım.

(1) Standart normal dağılımların cazip olmasının iki temel nedeni olduğunu düşünüyorum. İlk olarak, normal olarak dağıtılmış herhangi bir değişken, her bir gözlemin standart sapma ile bölünmesinden önce ortalamasını her bir gözlemden çıkararak bir standart normal haline dönüştürülebilir veya dönüştürülebilir. Buna Z-dönüşümü veya Z-skorlarının oluşturulması denir. Bu özellikle bilgisayarlardan önceki günlerde çok kullanışlıdır.

Değişkeninizden normalde ortalama 10.6 standart 10.2 sapma ile dağıtılan bir olayın olasılığını öğrenmek istiyorsanız, bilgisayar olmadan arka tarafta doğru bir ağrı olmaz mı? Diyelim ki bu değişken Amerikalı kadınların inç cinsinden yükseklikleri. Ve diyelim ki, popülasyondan rastgele çekilen bir kadının çok uzun olma olasılığını bulmak istiyoruz - 75 inç uzunluğunda. Bu, bilgisayarla öğrenmek için biraz acı çekiyor çünkü benimle olası her normal dağılım için bir masa etrafında taşımak zorunda kalacağım. Ancak, bunu bir Z-puanına dönüştürürsem olasılığı bulmak için tek tabloyu kullanabilirim, böylece:

(xix¯)σx=Z(7565.6)10.2=0.9215
Z tablosunu kullanarak, kümülatif olasılığın P (z <Z) - 0.8212 olduğunu ve bu nedenle 75 inçten daha uzun veya daha uzun bir kadın bulma olasılığının% 17,88 olduğunu buldum. Bunu normal olarak dağıtılmış herhangi bir değişkenle yapabiliriz ve bu nedenle bu standart normal dağılım çok kullanışlıdır.

Standart normal dağılımın sık kullanılmasının ikinci nedeni, yorumlamanın Z-skorları açısından sağlanmasıdır. Z-dönüşümü yapılan bir değişkende her "gözlem", orijinal dönüştürülmemiş gözlemin ortalamadan kaç standart sapma olduğudur. Bu özellikle ham veya mutlak performansın göreceli performanstan daha az önemli olduğu standart testler için kullanışlıdır.

(2) Seni burada takip etmiyorum. Kümülatif bir dağıtım fonksiyonu ile ne demek istediğimiz konusunda kafanız karışmış olabilir. Standart bir normal dağılımın beklenen değerinin 0 olduğunu ve bu değerin, ilişkili kümülatif dağılım işlevindeki .5 değerine karşılık geldiğini unutmayın.

(3) Z-skorları, Z-dönüşümü yapılmış bir değişkende tek tek "gözlemler" veya referans noktasıdır. Amerikan kadınlarının inç cinsinden değişken yüksekliğindeki örneğime geri dön. Özel bir gözlemi, 75 inç yüksekliğinde uzun bir kadın olabilir. Bunun için Z skoru, değişkeni daha önce yaptığımız gibi Z dönüşümünün sonucudur: Bu durumda Z puanı 0,9215'tir. Z-skorunun yorumu, bu kadının ortalama yükseklikten daha uzun 0.9215 standart sapma olduğudur. 55.4 inç boyunda olan bir kişinin Z skoru 1'dir ve ortalama yüksekliğin altında 1 standart sapma olacaktır.

(xix¯)σx=Z(7565.6)10.2=0.9215

1

Graham ve John'dan mükemmel açıklamalar aldığınız için, sadece son sorunuza cevap vereceğim:

İnsanlar Z Skorları hakkında konuştuğunda, burada gerçekten ne anlama geliyorlar?

Buna cevap vermenin en iyi yolu şu soruyu düşünmektir: CS 101 sınıfındaki notlar normalde = 80 ve = 5 ile dağıtılır. 65. sınıfın z puanı nedir?μσ

Yani: (65-80) / 5 = -3

65. sınıfın z-puanının -3 ; veya diğer bir deyişle, sola doğru 3 standart sapma.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.