Dağıtımlar neden önemlidir?


11

Bu yanı sıra bu forumda sordu en silik sorular gibi aşağı gidebilir, ama bir önceki soruya ses ve anlamlı cevaplar aldıktan sonra, ben tekrar şansımı germek düşündüm.

Bir süredir, özellikle varlık getirileri ve daha da özel olarak varlık dağılımıyla ilgili olduğu için, istatistiksel dağılımların önemi konusunda çok kafam karıştı.

Benim sorum şu: 20 yıllık S & P 500 aylık getiri verisine sahip olduğumu varsayalım, neden basitçe yapabileceğim zaman varlık tahsisi kararım için belirli bir dağıtım türü (yani Normal / Johnson / Levy uçuş vb.) sadece varlık tahsisi kararlarımı yanımdaki geçmiş verilere göre mi vereceğim?


3
önceki sorunuzun yanıtlarını yararlı bulduysanız, yanıtın yanındaki onay kutusunu tıklayarak bunları 'kabul edildi' olarak işaretleyebilirsiniz. bu, başkalarının sorunuzun çözüldüğünü bilmelerini sağlar.
Jeff

2
Aslında JDCook'tan bu konuda yeni bir yazı var . Sorunuza olan ilgisini belirtmek için, "İstatistikçiler verileri analiz ettiğinde, yalnızca kendilerine getirdiğiniz verilere bakarak değil, getirebileceğiniz varsayımsal verileri de dikkate alırlar. Başka bir deyişle. , ne olabileceğini ve gerçekte ne olduğunu düşünüyorlar. "
user603

Talebin sadece tarihsel verilerden karar alma problemleri hakkında söyleyecek bir şeyi olduğuna inanıyorum :-). (Geçmiş veriler genellikle çok geç olana kadar nadir fakat muhtemelen ölümcül olan "kara kuğu" olaylarını doğrudan ortaya
çıkarmaz

2
... çoğu hindi birkaç hafta içinde fark edecek.
Ryogi

@ User603'ün noktasını genişletmek için, örneğinizin dışında çıkarımlar yapmak istiyorsunuz. Özellikle, varlık ayırmanızın noktası geçmiş davranışlarla değil gelecekteki davranışlarla ilgilidir . Bu, örneğin, az gözleminizin olduğu şeylerin kuyrukta nasıl davrandığını içerir. Dağıtım varsayımları ile süreç hakkında ek bilgi / anlayış / önyargı getirebilirsiniz. Bu varsayımlar sağa yakın bir yerdeyse çok fazla bilgi ekleyebilirsiniz.
Glen_b -18

Yanıtlar:


5

Varsayılan bir dağılım (yani parametrik analiz) kullanmak, yönteminizin hesaplama maliyetini azaltacaktır. Bir regresyon veya sınıflandırma görevi gerçekleştirmek istediğinizi varsayıyorum. Bu, bir noktada bazı verilerin dağılımını tahmin edeceğiniz anlamına gelir. Parametrik olmayan yöntemler, veriler iyi çalışılmış bir dağılıma uymadığında yararlıdır, ancak genellikle hesaplamak için daha fazla zaman veya depolamak için daha fazla bellek gerekir.

Ayrıca, veriler, eşit dağılımlı bazı rasgele işlemlerin ortalaması gibi bir dağılıma uyan bir işlemle üretilirse, bu dağılımı kullanmak daha mantıklıdır. Bir dizi tekdüze değişkenin ortalamasının alınması durumunda, doğru dağılım muhtemelen Gauss Dağılımı'dır.


0

James cevabını tamamlamak : parametrik modeller de (genellikle) iyi bir uyum için daha az numune gerektirir: bu, genelleme güçlerini artırabilir: yani, yeni verileri daha iyi, hatta yanlış bile tahmin edebilirler. Tabii ki, bu duruma, modellere ve örnek boyutlarına bağlıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.