İstatistiksel ve matematiksel kavramlar tamamen aynıdır, "aile" nin farklı koşullara uyarlanmış teknik varyasyonları olan genel bir matematiksel terim olduğu anlaşılmaktadır:
Parametrik bir aile, tüm dağılımların uzayda bir eğridir (veya bunun yüzeyi veya başka bir sonlu boyutlu genellemesi).
Bu yazının geri kalanı bunun ne anlama geldiğini açıklıyor. Bir yana, bunların hiçbirinin matematiksel veya istatistiksel olarak tartışmalı olduğunu düşünmüyorum (aşağıda belirtilen küçük bir sorun dışında). Bu görüşü desteklemek için birçok referans sağladım (çoğunlukla Wikipedia makalelerine).
Bu "aileler" terminolojisi, sınıflar fonksiyonlarını bir küme veya "haritalar" olarak incelerken kullanılma eğilimindedir . Bir etki alanı verildiğinde , bazı set ("parametreler") tarafından parametrelendirilen üzerindeki haritaların bir ailesi bir işlevdir YX F X ΘCYYX FX Θ
F:X×Θ→Y
için olan (1) için, her , fonksiyon ile verilen olan içerisinde ve (2) kendisinin belirli "hoş" özelliklere sahiptir.F θ : X → Y F θ ( x ) = F ( x , θ ) C Y Fθ∈ΘFθ:X→YFθ(x)=F(x,θ)CYF
Fikir biz işlevleri değişir istiyorum ki için "yumuşak" veya kontrollü bir şekilde. İşletme (1) araçlarının her belirtir böyle bir fonksiyon, bir özellik (2) ait detayları anlamda ele ise de bir "küçük" bir değişiklik de uyarmaktadır yeterince "küçük" bir değişiklik .Y θ θ F θXYθθFθ
Soruda belirtilene yakın standart bir matematiksel örnek bir homotopidir . Bu durumda, olduğu kategori sürekli haritaları topolojik alanlarda topolojik boşluğa ; olağan topolojisi ile birimi aralığı olduğunu ve gerektirir bir olmak sürekli topolojik üründen harita içine . "Haritanın - sürekli deformasyonu" olarak düşünülebilir . Ne zaman XYΘ=[0,1]⊂ R F X×ΘY F 0 F 1 X=[0,1]YCY XYΘ=[0,1]⊂RFX×ΘYF0F1X=[0,1] kendisi bir aralık, bu tür haritalarıdır eğrileri de ve Homotopy bir eğriden başka yumuşak bir deformasyondur.Y
İstatistiksel uygulamalar için, (veya pratikte, bazı için üzerindeki tüm dağılımların kümesidir , ancak açıklamayı basit tutmak için odaklanacağım ). Tüm azalmayan grubu ile tespit edebilir càdlàg fonksiyonları onların aralığının kapatılması içerir burada ve : bunlar kümülatif dağılım fonksiyonu, ya da sadece dağılım fonksiyonları. Böylece, ve .R R n nn=1 R →[0,1]01X= R Y=[0,1]CYRRnnn=1R→[0,1]01X=RY=[0,1]
Bir dağıtım ailesi herhangi bir alt kümesidir . CY Bir aile için başka bir isim istatistiksel modeldir. Gözlemlerimizi yönettiğimizi düşündüğümüz tüm dağıtımlardan oluşur, ancak gerçekte hangi dağıtımın olduğunu bilmiyoruz.
- Bir aile boş olabilir.
- kendisi ailesidir.CY
- Bir aile, tek bir dağılımdan veya sadece sınırlı sayıda olabilir.
Bu soyut küme-teorik özellikler nispeten az ilgi veya faydaya sahiptir. Biz ek (ilgili) matematiksel yapıyı göz önüne aldığımızda bu sadece bu kavram yararlı olur. Ama ne özellikleri C Y istatistiksel ilgi çekiyor? Sık görülen bazı kişiler:CYCY
dışbükeybirkümedir:iki dağılımı göz önüne alındığındaiçinkarışım dağılımıoluşturabiliriz.hepsi. Bu gelen "homotopi" bir türiçin.CY ( 1 - t ) F + t G ∈ Y t ∈ [ 0 , 1 ] F GF,G∈CY (1−t)F+tG∈Yt∈[0,1]FG
büyük bölümleri , Kullback-Leibler sapması veya yakından ilişkili Fisher Information metriği gibi çeşitli sahte metrikleri destekler .CY
FG F ⋆ GCY ek bir yapıya sahiptir: iki ve dağılımına karşılık gelen toplamları, .FGF⋆G
CY , genellikle "özellikler" olarak adlandırılan birçok yararlı, doğal işlevi destekler. Bunlar arasında herhangi bir sabit kantil (medyan gibi) ve kümülanlar bulunur .
CY , bir işlev alanının alt kümesidir . Bu nedenle, tarafından verilen sup norm ( norm) gibi birçok yararlı metriği devralır.L∞
||F−G||∞=supx∈R|F(x)−G(x)|.
üzerindeki doğal grup eylemleri üzerindeki eylemleri . Sık işlemler olan çeviriler ve ölçekleme için . Bunların bir dağıtım üzerindeki etkisi , tarafından verilen dağılıma göndermektir . Bunlar, konum ölçeğinde ailelerin kavramlarına ve genellemelerine yol açmaktadır. (Bir referans sağlamıyorum, çünkü kapsamlı Web aramaları çeşitli tanımları ortaya çıkarır: en azından burada küçük bir tartışma olabilir.)RT μ :x→x+μ S σ :x→xσσ>0F F μ , σ (x)=F((x-μ) / σ)CY Tμ:x→x+μ Sσ:x→xσσ>0FFμ,σ(x)=F((x−μ)/σ)
Önemli olan özellikler istatistiksel soruna ve verileri nasıl analiz etmek istediğinize bağlıdır. Önceki özelliklerin önerdiği tüm varyasyonları ele almak, bu ortam için çok fazla yer kaplayacaktır. Bir ortak önemli uygulamaya odaklanalım.
Örneğin, Maksimum Olabilirliği ele alalım. Çoğu uygulamada bir tahmin elde etmek için Matematik kullanmak isteyeceksiniz. Bunun işe yaraması için, ailede "türev alabilir" olmanız gerekir.
( Kenara Teknik: Bu gerçekleştirilir ki burada her zamanki gibi bir alan adı seçmektir için ve belirtmek sürekli yerel olarak ters çevrilebilir fonksiyonu gelen içine (bu araçlarının her. bir top vardır ile olan bire bir, Başka bir deyişle, değiştirirsek d ≥ 0 p Θ C Y θ ∈ Θ B ( θ , ϵ ) ϵ > 0 p ∣ B ( θ , ϵ ) : B ( θ , ϵ ) ∩ Θ → C Y θΘ⊂Rdd≥0pΘCYθ∈ΘB(θ,ϵ)ϵ>0p∣B(θ,ϵ):B(θ,ϵ)∩Θ→CYθ yeterince küçük bir miktarda her zaman farklı bir dağıtım elde edeceğiz.))
Sonuç olarak, çoğu ML uygulamasında bileşeninde sürekli (ve umarım neredeyse her yerde farklılaşabilir) olmasını istiyoruz . (Süreklilik olmadan, olasılığı en üst düzeye çıkarmak genellikle zor bir sorun haline gelir.) Bu, parametrik bir ailenin aşağıdaki olasılık odaklı tanımına yol açar :ΘpΘ
(Tek değişkenli) dağılımlarının bir parametrik ailesi yerel olarak tersinir haritasıdır ile için burada (a) her olan her biri için bir dağılım fonksiyonu ve (b) , fonksiyon tarafından verilen süreklidir ve hemen hemen her yerde farklılaşabilir.Θ ⊂ R n F θ x ∈ R L x : θ → [ 0 , 1 ] L x ( θ ) = F ( x , θ )
F:R×Θ→[0,1],
Θ⊂RnFθx∈RLx:θ→[0,1]Lx(θ)=F(x,θ)
Bir parametrik aile sadece topluluğundan daha fazlasıdır : parametre değerlerinin dağılımlara karşılık gelmesinin belirli bir yolunu da içerir .F θ θFFθθ
Sonunda açıklayıcı örnekler verelim.
Let tüm kümesi Normal dağılımlar. Verildiği gibi, bu parametrik bir aile değil : sadece bir aile. Parametrik olmak için, bir parametreleştirme seçmeliyiz. Bunun bir yolu, seçmek
ve ile Normal dağılım ortalama
ve varyans . Θ={(μ,σ)∈ R 2 ∣σ>0}(μ,σ)μ σ 2CYΘ={(μ,σ)∈R2∣σ>0}(μ,σ)μσ2
Poisson dağılımları(λ) λ ∈ Θ = ( 0 , ∞ ) ⊂ R 1 kümesi bir parametrik ailedir .λ∈Θ=(0,∞)⊂R1
Tekdüzen dağılımları (birçok ders kitabı alıştırmasında belirgin bir şekilde yer alan), bir parametrik ailedir
. Bu durumda, olduğu türevlenebilir içinde haricinde
.θ ∈ R 1 F θ ( x ) = maks. ( 0 , dk. ( 1 , x - θ ) ) θ(θ,θ+1)θ∈R1Fθ(x)=max(0,min(1,x−θ))θθ∈{x,x−1}
Let ve olmak herhangi iki dağılımları. O zaman , için bir parametrik ailedir . (Test: görüntü dağılımları bir dizi ve kısmi türevi eşittir her tanımlanmaktadır.)G F ( x , θ ) = ( 1 - θ ) F ( x ) + θ G ( x ) θ ∈ [ 0 , 1 ] F θ - F ( x ) + G ( x )FGF(x,θ)=(1−θ)F(x)+θG(x)θ∈[0,1]Fθ−F(x)+G(x)
Pearson ailesi dört boyutlu bir aile olduğunu (diğerleri arasında) normal dağılımlar, beta dağılımları ve ters Gama dağılımları içerir. Bu, herhangi bir dağıtımın birçok farklı dağıtım ailesine ait olabileceğini göstermektedir . Bu, (yeterince büyük) bir alandaki herhangi bir noktanın orada kesişen birçok yola ait olabileceğini gözlemlemeye mükemmel bir şekilde benzemektedir. Bu, önceki yapı ile birlikte, hiçbir dağıtımın ait olduğu bir aileyi benzersiz bir şekilde belirlemediğini gösterir .Θ⊂R4
Kesin sürekli dağılımların tümünün ailesi parametrik değildir . Dayanıklı topoloji derin teoremi gerektirir: Biz miktarda bağış ise ile herhangi bir ve (istatistiksel olarak yararlı bir ya da değil) topolojisi süreklidir ve yerel olarak sürekli bir ters sahiptir, yerel olarak aynı boyuta sahip olmalıdır . Bununla birlikte, tüm istatistiksel olarak anlamlı topolojileri, olan sonsuz boyutlu.C Y p:Θ→ C Y C Y Θ C YCYCYp:Θ→CYCYΘCY