Kuantil regresyon: Kayıp fonksiyonu


24

Kuantil regresyonu anlamaya çalışıyorum, fakat beni acı çeken bir şey, kayıp fonksiyonunun seçimi.

ρτ(u)=u(τ1{u<0})

beklentisinin -quantile değerine eşit olduğunu biliyorum, ancak bu işlevle başlamak için sezgisel neden nedir? Bu işlevi minimize etmek ile nicelik arasındaki ilişkiyi görmüyorum. Biri bana açıklayabilir mi?ρτ(yu)τ%

Yanıtlar:


28

Bu soruyu , temel dağılım ne olursa olsun, bir zararı en aza indirgeyici olarak belirli bir miktar üreten herhangi bir kayıp fonksiyonu ile nasıl bir araya gelebileceği hakkında bir fikir edinmek istediğini anlıyorum . O zaman, sadece Wikipedia'da veya bu belirli kayıp fonksiyonunun çalıştığını gösteren başka bir yerde analizi tekrarlamak tatmin edici olmazdı .

Tanıdık ve basit bir şeyle başlayalım.

Bahsettiğiniz şey, bir dağıtım veya veri kümesine göre bir "konum" bulmak . Örneğin, değerinin beklenen kare kalıntısını en aza indirdiği iyi bilinmektedir ; yani, bunun için bir değer F ˉ xxFx¯

LF(x¯)=R(xx¯)2dF(x)

mümkün olduğu kadar küçük. Bu notu bize nin bir kayıptan kaynaklandığını , ile belirlendiğini hatırlatmak için kullandım , ama en önemlisi de, sayısına bağlı .Lˉ xFx¯

Standart yol olduğunu göstermek için hiçbir işlevi en aza indirir zaman azalmaz işlevin değerini göstererek başlar biraz değiştirilir. Böyle bir değere fonksiyonun kritik noktası denir . x xx

Ne tür bir kayıp işlevi , yüzde bir kritik noktaya neden olur? Bu değerin kaybıF - 1 ( α )ΛF1(α)

LF(F1(α))=RΛ(xF1(α))dF(x)=01Λ(F1(u)F1(α))du.

Bunun kritik bir nokta olması için türevinin sıfır olması gerekir. Biz sadece biraz çözüm bulmaya çalışıyoruz yana, manipülasyonlar meşru olup olmadığını görmek için pause olmaz: biz (örneğin biz gerçekten ayırt edip edemeyeceğini gibi teknik ayrıntıları kontrol planı edeceğiz , vb sonunda). BöyleceΛ

(1)0=LF(x)=LF(F1(α))=01Λ(F1(u)F1(α))du=0αΛ(F1(u)F1(α))duα1Λ(F1(u)F1(α))du.

Sol tarafta argümanı negatif, sağ tarafta ise olumlu. Bunun dışında, bu integrallerin değerleri üzerinde çok az kontrolümüz var, çünkü herhangi bir dağıtım işlevi olabilir. Sonuç olarak , tek umudumuz üssünü sadece argümanının işaretine bağlı kılmaktır , aksi halde sabit kalması gerekir.F Λ ΛFΛ

Bu, parçalı olarak doğrusal olacaktır, potansiyel olarak sıfırın sağına ve soluna doğru farklı eğimler. Açıkça, sıfıra yaklaşıldıkça azalması gerekir - sonuçta, bir kayıptır , kazanç değildir . Dahası, sabit bir şekilde yeniden ölçeklendirmek özelliklerini değiştirmez, bu nedenle sol eğimi olarak ayarlamaktan . Let olması sağ eğim. Sonra basitleştirirN- - 1 τ > 0 ( 1 )ΛΛ1τ>0(1)

0=ατ(1α),

bu nedenle, eşsiz çözüm pozitif bir çarpıma kadar,

Λ(x)={x, x0α1αx, x0.

Bu (doğal) çözümün ile çarpılması, paydayı temizlemek için, soruda sunulan kayıp işlevini oluşturur.1α

Açıkçası, tüm manipülasyonlarımız bu forma sahip olduğunda matematiksel olarak meşrudur . Λ


19

Bu kayıp işlevinin ifade şekli hoş ve ama bence şeklinde yeniden yazarak anlaşılması daha kolay olur.

ρτ(Xm)=(Xm)(τ1(Xm<0))={τ|Xm|ifXm0(1τ)|Xm|ifXm<0)

Bu kayıp fonksiyonunu minimize verir neden sezgisel fikir edinmek istiyorsanız inci kuantil, bu basit bir örnek göz önünde bulundurmak yararlıdır. Let Let da bir beton değeri tercih var 0 ile 1 arasında düzgün bir rastgele değişken , diyelim ki, .τXτ0.25

Öyleyse şimdi soru, bu kayıp işlevinin neden en aza indirgenmesi gerektiğidir ? Açıkçası, tekdüze dağılımda sağında , sola göre üç kat daha fazla kütle var. Kayıp fonksiyonu, bu sayıdan daha büyük olan değerleri, ondan daha küçük olan değerlere verilen ağırlığın sadece üçte birinde ağırlaştırır. Bu nedenle, zaman ölçekleri dengelenir bu tür sezgisel var inci miktarsal isimli fonksiyon kaybı bükülme noktası olarak kullanılır.m=0.25mτ


1
Öbür yol olmaz mıydı? Yetersiz tahmin, üç kat daha pahalıya mal olacak?
Edi Bice

Onu yakaladığın için teşekkürler. Formül haklı, ancak başlangıçta açıklamamda yanlış ifade ettim.
jjet
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.