Hastie'nin ESL Kitabından bu sorun hakkında 5 yaşındaymışım gibi biri açıklayabilir mi?


9

Hastie'nin ESL kitabında çalışıyorum ve Soru 2.3 ile zor anlar yaşıyorum. Soru şudur:

resim açıklamasını buraya girin

Başlangıç ​​noktasında en yakın komşu tahminini düşünüyoruz ve başlangıç ​​noktasından en yakın veri noktasına olan ortalama mesafe bu denklemle verilmiştir. Bunu türetmek için nereden başlayacağımı bilmiyorum.

Çoğu veri noktasının diğer herhangi bir veri noktasına (boyutsallığın laneti) kıyasla örnek alanının sınırına daha yakın olduğunu biliyorum, ancak bunu Doğrusal Cebir / Olasılık duygusuna çevirmekte sorun yaşıyorum.

Teşekkürler!


4
Başlıktaki "ELI5" ne anlama geliyor? Bu denklemi türetmek istiyorsanız, toptaki puanlar için bir olasılık modeliyle başlamanız gerekir: bu model nedir? (Lütfen sorunuzu anlamak için okuyucularınızın bir kitaba veya başka bir siteye
yönlendirmelerini istemeyin

3
@whuber katılıyorum - Kısaltmalar korkunç bir karma düzenidir.
Sycorax, Reinstate Monica

14
Beş yaşındasın. ESL'yi anlamak istediğiniz için size teşekkür ederiz, ancak altı yaşına kadar beklemeniz gerekir. Büyük erkekler ve kızlar için bir kitap.
Nick Cox

4
Beş yaşında bir çocuk tek boyutlu duruma bakarak başlayabilir (p = 1). Ve el ele geçtiğinde, oradan alın.
Mark L. Stone

3
ELI5'in hecelenmesi için ESL ne olacak?
mdewey

Yanıtlar:


15

İzin Vermek r kökeni ile mesafe olmak ve izin V0[p] birim hiper kürenin hacmi olmak pboyutları. Sonra yarıçapın bir hiper küresinde bulunan hacimr dır-dir

V[r]=V0[p]rp

İzin verirsek P=V[r]/V0[p] bu hiper kürede bulunan hacmin fraksiyonunu belirtmek ve R=rp, sonra

P[R]=R

Veri noktaları birim topu içinde eşit olarak dağıtılırsa, 0R1 Yukarıdaki formül, aşağıdakiler için kümülatif dağılım işlevidir (CDF). R. Bu, eşit bir olasılık yoğunluğuna eşdeğerdir.R birim aralığı boyunca, yani p[R]=P[R]=1. Bu yüzden, yorumlarda Mark Stone'un ima ettiği gibi,p eşdeğer bir 1D problemine boyutsal durum.

Şimdi tek bir noktamız varsa R, sonra bir CDF tanımı ile Pr[Rρ]=P[ρ] ve Pr[Rρ]=1P[ρ]. EğerRmin en küçük değer n Puanlar ve puanların hepsi bağımsızdır, daha sonra CDF

Pr[Rminρ]=Pr[Rρ]n=(1ρ)n
(bu tek değişkenli aşırı değer teorisinin standart bir sonucudur ).

Medyanın tanımı ile,

12=Pr[(Rmin)medR]=(1R)n
hangi olarak yeniden yazabiliriz
(1dp)n=12
istenen sonuca eşittir.

EDIT: " ELI5 " tarzı cevap, üç bölümden deneyin .

  1. Tek noktalı 1D durumda, mesafe eşit olarak dağıtılır [0,1], böylece medyan 12.

  2. 1D'de, asgari n puan ilk durumda ngücü.

  3. İçinde p boyutlar, mesafe r eşit olarak dağıtılmamıştır, ancak rp dır-dir.


1
Ha ha, 5 yaşında bir çocuğun p = 1 vakasına bakarak başlayabileceği yorumunu verdim. 4 yaşındaki bir çocuğun sadece p = 1 vakası ile değil, aynı zamanda n = 1 ile başlayabileceği bir yorum eklemeyi düşündüm.
Mark L. Stone

1
Soruyu cevapladığımda, @fcop tarafından şu açıklığa kavuşturulduktan sonra geldiğine dikkat edin: "N veri noktalarını başlangıç ​​noktasında ortalanmış bir p-boyutlu birim topuna eşit olarak dağıtılmış olarak düşünün. en yakın veri noktası ... "ile verilir. Yani bir topL2 norm pboyutsal uzay. Bundan sonra soru, farklı olan ve çok net olmayan orijinaline geri alındı. (Orijinal soru altındaki yorum zincirine bakın.)
GeoMatt22
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.