İnsanlar neden pürüzsüz verileri sever?


10

Gauss Süreci Regresyonu için Kareli Üstel çekirdek (SE) kullanacağım. Bu çekirdeğin avantajları: 1) basit: sadece 3 hiperparametre; 2) pürüzsüz: bu çekirdek Gauss'tur.

İnsanlar neden 'pürüzsüzlüğü' çok seviyor? Gauss çekirdeğinin sınırsız biçimde ayırt edilebilir olduğunu biliyorum, ama bu çok önemli mi? (SE çekirdeğinin bu kadar popüler olmasının başka nedenleri varsa lütfen bize bildirin.)

Not: Gerçek dünyada (gürültüsüz) çoğu sinyalin pürüzsüz olduğu söylendi , bu yüzden onları modellemek için pürüzsüz çekirdekler kullanmak mantıklı. Herkes bu kavramı anlamama yardımcı olabilir mi?


4
İnsanların pürüzsüzlüğü neden sevdiğinin psikolojik sorusunu mu, pürüzsüz işlevlerin neden istatistiksel olarak daha iyi olduğunu gösteren istatistiksel soruyu mu soruyorsunuz?
John

@John Yorumunuz için teşekkür ederiz. Gönderinizdeki ikinci soruya atıfta bulundum ve buna ek olarak, gerçek dünyadaki çoğu sinyalin neden pürüzsüz olduğunu doğrulamak istiyorum
kakanana

Yanıtlar:


15

" Natura non facit saltus " felsefede eski bir prensiptir. Ayrıca güzellik ve uyum da bu prensiplerdir. İstatistikler üzerinde etkisi olan bir başka felsefi ilke de nitel düşünmedir: Geleneksel olarak etki boyutlarında düşünmüyoruz, ancak bir etkinin var olup olmadığını düşünüyoruz. Bu hipotez testine izin verdi. Tahmin ediciler, doğa algınız için çok hassastır. Olduğu gibi al.

İstatistikler insan algısına hizmet etmelidir. Böylece süreksizlik noktaları beğenilmez. Biri hemen sorardı: Neden tam da bu bir süreksizlik? Özellikle yoğunluk tahmininde, bu süreksizlik noktaları çoğunlukla gerçek verilerin asimptotik olmayan doğasından kaynaklanmaktadır. Ancak belirli sonlu örneğiniz hakkında değil, altta yatan doğal gerçek hakkında bilgi edinmek istemezsiniz. Eğer varsa inanmak bu doğa atlamak değil, o zaman tahmincileri pürüzsüz gerekmez.

Sıkı matematiksel bir bakış açısından, bunun pek bir nedeni yoktur. Ayrıca, Leibniz ve Newton'un doğal fenomenlerinin pürüzsüz olmadığı bilindiğinden. Çalıştığınız doğal bilim insanıyla konuşun. Pürüzsüzlük / süreksizlik görüşüne meydan okuyun ve ardından ikiniz de anlayışınız için en faydalı olmaya karar verdiğiniz şeyi yapın.


2

Pratik meselelerin iki nedeni daha var. Birincisi, analitik fonksiyonların matematiksel olarak çalışılması çok daha kolaydır ve bu nedenle algoritmalarınız hakkında teoremleri kanıtlar ve daha güçlü bir temel sağlar.

İkincisi duyarlılıktır. Bir makine öğreniciniz olduğunu varsayalımM çıktısı süreksizliği olan x=x0. O zaman çok farklı sonuçlar elde edersiniz.x0-ε ve x0+ε, ama sorun değil çünkü süreksiz hale getirdik. Şimdi, modelinizi biraz farklı verilerle eğitirseniz (M~), rastgele gürültünün biraz farklı olduğu yerlerde, süreksizlik artık x~0, muhtemelen çok yakınx0, ancak tam olarak değil ve şimdi, ε, x0+ε için çok farklı bir değere sahip M ve için M~.


1

Soruna bağlı olarak birçok motivasyon var. Ancak fikir aynıdır: daha iyi bir çözüm elde etmek ve karmaşıklıkla başa çıkmak için bazı problemler hakkında önceden bilgi edinme. Bunu koymanın daha bir yolu: model seçimi. Burada model seçimine güzel bir örnek .

Derinlemesine ilgili başka bir fikir, veri örneklerinin benzerlik ölçüsünü bulmaktır (bu fikirle ilgili farklı terimler vardır: topografik eşlemeler, mesafe metriği, manifold öğrenme, ...).

Şimdi pratik bir örneği ele alalım: optik karakter tanıma. Bir karakterin görüntüsünü alırsanız, sınıflandırıcının değişmezliklerle baş etmesini beklersiniz: görüntüyü döndürür, yerinden oynatır veya ölçeklendirirseniz, onu algılayabilmelidir. Ayrıca, girdiye bir miktar değişiklik uygularsanız, her iki örnek de (orijinal ve değiştirilenler çok benzer) olduğundan, sınıflandırıcınızın yanıtının / davranışının da biraz değişmesini beklersiniz. Bu, düzgünlüğün uygulanmasının devreye girdiği yerdir.

Bu fikirle ilgili çok sayıda makale var, ancak bu (desen tanımada dönüşüm değişmezliği, teğet uzaklık ve teğet yayılım, Simard ve ark.) Bu fikirleri ayrıntılı olarak göstermektedir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.