Yoğunluk grafiğinin yüksekliği nasıl yorumlanır


12

Yoğunluk grafiklerinin yüksekliğini nasıl yorumlamalıyım:

resim açıklamasını buraya girin

Örneğin yukarıdaki grafikte pik, x = 18'de yaklaşık 0.07'dir. Değerlerin yaklaşık% 7'sinin 18 civarında olduğunu çıkarabilir miyim? Bundan daha spesifik olabilir miyim? Ayrıca x = 30'da 0.02 yüksekliğinde ikinci bir tepe vardır. Bu, değerlerin yaklaşık% 2'sinin 30 civarında olduğu anlamına mı gelir?

Düzenleme: 1'i aşan bir olasılık dağılım değeri sorun olabilir mi?Burada bir sorun olmayan> 1 olasılık değerini tartışıyor. Ayrıca, burada da önemli olmayan saf Bayes sınıfları ile ilgili olarak da tartışıyor. Basit bir dille, bu tür yoğunluk eğrilerinden çizebileceğimiz sayısal çıkarımlara sahip olmak istiyorum. Eğrinin altındaki alanın rolü tartışılır, ancak sorum şu: eğride var olan belirli bir x ve y kombinasyonu ile ilgili olarak ne tür bir çıkarım yapabiliriz. Örneğin, bu grafikte x = 30 ve y = 0.02'yi nasıl ilişkilendirebiliriz. Burada 30 ile 0.02 arasındaki ilişki hakkında ne yazabiliriz. Yoğunluklar bir birim değer olduğundan, değerlerin% 2'sinin 29,5 ile 30,5 arasında olduğunu söyleyebilir miyiz? Bu durumda, değerlerin aşağıdaki grafikte olduğu gibi sadece 0'dan 1'e değişip değişmediğini nasıl yorumlayabiliriz:

resim açıklamasını buraya girin

Değerlerin% 100'ü 0 ile 1 arasında gerçekleşirse, neden 0 ve 1 dışında herhangi bir eğri var?

Burada x = 0,1 ila x = 0,2'de düz bir kısım vardır, burada y 0,8'dir. Bir dikdörtgen oluşturur. X = 0.1 ve x = 0.2 arasında hangi değerlerin gerçekleştiğini nasıl öğrenebiliriz?

(PS: Bu soruyu ilginç / önemli buluyorsanız lütfen oy verin;)



4
Yinelenen olarak belirtilen ilk iş parçacığı, başlığındaki kesin ifadelere rağmen, sürekli değişkenler için hesaplandığı gibi bir olasılık yoğunluğunun bir olasılık olmadığını ortaya çıkardığı için önemlidir. (Daha ince bir versiyon yoğunluğu titizlikle tanımlar ve yoğunluğun sayımla tanımlanması olasılığını içerir.)
Nick Cox

@NickCox ile hemfikirim, ancak ekstra düzenlemelerle, Tim'in çok ilgili yakın sorular listesinde çok iyi bir odak (üçüncü soru gibi) ve yükseklik (ikinci soru gibi daha fazla) var.
Silverfish

3
Ayrı bir mesele de var değil ben neden olduğu bu sorulara büyüdü, değil bu sandığın sorulardan herhangi birinin kopyası bireysel olarak genel edilir: teorik yoğunluk araziler aksine neden Ampirik, olamaz "yoğunluğu" dışarıda dağılımı (veya gözlenen değerler)? Bu, bant genişliği ve çekirdek yoğunluğu grafiklerinin oluşturulması ve yorumlanması hakkında ek tartışma gerektirir . Belki de bu soru, mevcut soruları tekrarlamayan sorunların düzenlenmesinden ve yeniden odaklanmasından fayda sağlayacaktır.
Gümüş Balık

Yanıtlar:


6

Burada ifadelerinize dikkat etmelisiniz. X'in sürekli bir değişken olduğu varsayılarak , herhangi bir değerin olasılığı tam olarak sıfırdır. Eğer yaptığımız gibi yatan bir değerli olasılığına dair, konuşmak etrafında biraz daha hassas olmak isteyebilirsiniz ama bazı noktalarda, gayet iyi. Olasılıkla birlikte aralığı sağladığınız ikinci ifadeniz, aradığım bir şeydir.

Özünde, x'e göre yoğunluk fonksiyonunun bir integrali size olasılığın kendisini anlatacaktır (buna yoğunluk denir ). Açıkçası, entegre edeceğiniz aralık keyfi olarak küçük olabilir, böylece bir noktaya keyfi bir dereceye yaklaşabilirsiniz. Bununla birlikte, yoğunluk fonksiyonu bu aralıkta çok yavaş değiştiğinde, integrali trapezoidal kural gibi bazı sayısal tekniklerle yaklaşık olarak tahmin edebilirsiniz .

Özetlemek gerekirse: yoğunluk fonksiyonunun yüksekliği tam da budur, yüksekliği. Olasılık hakkında sonuçlandırmak isteyebileceğiniz her şey, bir formun veya başka bir formun entegrasyonunu içermelidir.


bu tür grafikte eğrinin altındaki alan her zaman 1.0'a eşit midir?
ecologist1234

1
@ ecologist1234 Evet, bu olasılık yoğunluk dağılımı olduğundan, - ("en kötü" de) integrali 1.0 ile sonuçlanacaktır. Bu, tüm verilerin% 100 olasılıkla bu aralık boyunca bir yerde olduğu anlamına gelir.
Fato39
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.