Üçgen dağılımı için MLE?


12

Üçgen dağılımına normal MLE prosedürünü uygulamak mümkün müdür? - Deniyorum ama matematikte bir veya daha fazla adımda dağılımın tanımlanmasıyla engellenmiş gibi görünüyor. Ben c (ve bilmeden) c yukarıda ve altında örnek sayısını biliyorum gerçeğini kullanmaya çalışıyorum: n toplam örnek sayısı ise, bu 2 sayı cn ve (1-c) n vardır. Ancak, bu türetmede yardımcı görünmüyor. Anlar anı, c için çok problemsiz bir tahminci verir. Burada MLE'deki tıkanıklığın kesin doğası nedir (eğer gerçekten varsa)?

Daha fazla detay:

En düşünelim içinde [ 0 , 1 ] ve tanımlanan dağıtım [ 0 , 1 ] ile: c[0,1][0,1]

x <cf(x;c)=2 ise(1-x)f(x;c)=2xc
c <= x ise f(x;c)=2(1x)(1c)

Bu dağıtım formundan xid örneklerini { x i } alalım , bu örnek verilen c'nin günlük olasılığını:n{xi}

l^(c|{xi})=i=1nln(f(xi|c))

Sonra şeklini verilmiş olduğu gerçeğini kullanmaya çalışıyorum , bunu biliyoruz c n örnekleri (bilinmeyen) altına düşecek c ve ( 1 - c ) n yukarıdaki düşecek c . IMHO, bu, log olabilirliğinin ifadesindeki toplamın ayrıştırılmasına izin verir:fcnc(1c)nc

l^(c|{xi})=i=1cnln2xic+i=1(1c)nln2(1xi)1c

cc

l^(c|{xi})=i=1n{xi<c}ln2xic+i=1n{c<=xi}ln2(1xi)1c

Ancak, Dirac deltalarının devam etmesine izin verebilmesine rağmen, göstergeleri türetmek de kolay görünmüyor (yine de göstergeleri elde ederken, ürün türetmemiz gerektiğinden).

Yani, burada MLE'de engellendim. Herhangi bir fikir?


Bu konu içinse lütfen kendi kendine çalışma etiketini ekleyin. Değilse, lütfen sorunun nasıl ortaya çıktığını açıklayın.
Glen_b

Güncelleme için teşekkürler; yanıt vermek için mantıklı şeyler söylemeyi çok daha kolay hale getirir, çünkü ele alınacak davaların kapsamını büyük ölçüde azaltır. Önceki yorumumu düşünebilir misiniz? Ya bu, kendi kendine çalışma etiketi altına girer ya da değildir, her iki durumda da bir şey yapıp yapmayacağınızı sordum.
Glen_b - Monica'yı

Bu bir ödev ya da sınıf için değil. Benim işimde ortaya çıkıyor. Anlar yönteminden başka bir tahmincimiz var, ama burada MLE'de neler olup bittiğini daha iyi anlamaya çalışıyorum.
Frank

Tamam; bu bana daha fazla boşluk bırakıyor. Güncellenmiş cevabımı görün. Muhtemelen yakında daha fazla ekleme yapacağım
Glen_b -Restate Monica

Ek referanslar / bağlantılar
Glen_b -Reinstate Monica

Yanıtlar:


10

Üçgen dağılımına normal MLE prosedürünü uygulamak mümkün müdür?

Kesinlikle! Bununla başa çıkmak için bazı tuhaflıklar olsa da, bu durumda MLE'leri hesaplamak mümkündür.

Bununla birlikte, 'olağan prosedür' ile 'mantık olasılığının türevlerini alıp sıfıra eşitlediğinizi' kastediyorsanız, belki olmayabilir.

Burada MLE'deki tıkanıklığın kesin doğası nedir (eğer gerçekten varsa)?

Olasılığı çizmeyi denedin mi?

-

Sorunun açıklanmasından sonra takip:

Olasılığın çizilmesiyle ilgili soru, boş bir yorum değil, sorunun merkezinde yer aldı.

MLE bir türev almayı içerecektir

Hayır. MLE, bir işlevin argmax'ını bulmayı içerir. Bu sadece bir türevin sıfırlarını belirli koşullar altında bulmayı içerir ... burada tutmayan. En iyi ihtimalle, bunu başarabilirseniz birkaç yerel minimayı tespit edersiniz .

Benim daha önceki soru önerildiği gibi bakmak olasılığı en.

y

0.5067705 0.2345473 0.4121822 0.3780912 0.3085981 0.3867052 0.4177924
0.5009028 0.8420312 0.2588613

cüçgen zirve olasılığı

üçgen zirve için log-olasılık

Gri çizgiler veri değerlerini işaretler (değerlerin daha iyi ayrılması için muhtemelen yeni bir örnek oluşturmuş olmalıydım). Siyah noktalar bu değerlerin olasılığını / log-olasılığını gösterir.

Daha fazla ayrıntı görmek için, olasılığın maksimuma yakın bir yakınlaştırma:

Olabilirlik detayı

Olasılıktan da görebileceğiniz gibi, sipariş istatistiklerinin çoğunda, olasılık fonksiyonunun keskin 'köşeleri' vardır - türevin bulunmadığı noktalar (bu şaşırtıcı değildir - orijinal pdf'nin bir köşesi vardır ve pdfs ürünü). Bu (sipariş istatistiklerinde cipsler olması) üçgen dağılımda söz konusudur ve maksimum her zaman sipariş istatistiklerinden birinde gerçekleşir. (Cusps'un sipariş istatistiklerinde meydana gelmesi üçgen dağılımlara özgü değildir; örneğin Laplace yoğunluğunun bir köşesi vardır ve sonuç olarak merkezinin her sipariş istatistiğinde bir tane olması olasılığı vardır.)

Örneğimde olduğu gibi, maksimum dördüncü derece istatistiği olarak gerçekleşir, 0.3780912

cc

Yararlı bir referans Johan van Dorp ve Samuel Kotz'un " Beta'nın Ötesinde " bölüm 1'dir. Böyle olduğundan, Bölüm 1 kitap için ücretsiz 'örnek' bölüm - eğer indirebilirsiniz burada .

Üçgen dağılımla ilgili bu konuda Eddie Oliver'ın hoş bir küçük kağıdı var, bence Amerikan İstatistikçi'de (temelde aynı noktaları yapar; Sanırım bir Öğretmen Köşesinde). Bulmayı başarabilirsem referans olarak vereceğim.

Düzenleme: işte burada:

EH Oliver (1972), Maksimum Olasılık Tuhaflığı,
Amerikalı İstatistikçi , Cilt 26, Sayı 3, Haziran, s43-44

(yayıncı bağlantısı )

Kolayca ele alabiliyorsanız, bir göz atmaya değer, ancak Dorp ve Kotz bölümü ilgili sorunların çoğunu kapsıyor, bu yüzden çok önemli değil.


Yorumlarda soruyu takip ederek - köşeleri 'yumuşatmanın' bir yolunu bulsanız bile, yine de birden fazla yerel maksimum alabileceğinizi ele almanız gerekir:

en fazla iki yerel

Bununla birlikte, kolayca yazabileceğiniz çok iyi özelliklere (moment yönteminden daha iyi) sahip tahmin ediciler bulmak mümkün olabilir. Ancak (0,1) üzerindeki üçgen üzerindeki ML birkaç kod satırıdır.

Eğer çok büyük miktarda veri söz konusuysa, bu da ele alınabilir, ancak başka bir soru olurdu diye düşünüyorum. Örneğin, her veri noktası maksimum olamaz, bu da işi azaltır ve yapılabilecek başka tasarruflar da vardır.


Teşekkürler - Başarısız girişimimi yayınlamaya çalışacağım, tam olarak hangi dağıtımdan bahsettiğimi ve nerede engellendiğimi düşünüyorum.
Frank

Detaylı açıklama için teşekkürler! Yine de başka bir fikrim vardı: Üçgenin dağılımına yaklaşan, ancak parça parça olmayacak bir fonksiyon ailesi bulabileceğimi varsayalım - bunu bir MLE'yi analitik olarak türetmek için kullanabilir miyim, sonra sınırı alıp MLE'nin üçgen dağılım kendisi?
Frank

Muhtemelen - bu, kullandığınız belirli limit sürecine bağlı olabilir ... ve muhtemelen yine de birkaç yerel maksima ile sonuçlanacaksınız, bu yüzden muhtemelen sadece aşırı sipariş istatistiklerinin yakınındaki olasılığı değerlendirmenizi sağlar - ama yine de neden bu kadar karmaşık bir şey yapmaya çalışsın ki? Üçgen dağılımda ML ile ilgili sorun nedir? Pratik yapmak gerçekten çok basit.
Glen_b -Mons Monica

2
Söylemeliyim ki, sipariş istatistiklerine dayanan c için bu MLE, oldukça güzel olsa da, yukarıdaki bölümde türetme biraz iş gerektirse de (çok zor değil) - MLE'nin özünün argmax'ta olduğu elbette (elbette!), Türevden ziyade (işaret ettiğiniz gibi ve tamamen katılıyorum, "olağan" türev adımının yukarı akışında çalışmak bana geldi (yani, ne anlama gelirse maksimize etme konusunda endişeleniyorum), ama takip etmedim).
Frank

1
xi
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.