Test edilmesi zor “maksimum” dağıtım özellikleri var mı?


13

Bir dağıtım özelliği P için bir dağıtım testi algoritması ([n] üzerindeki tüm dağıtımların sadece bir alt kümesidir), bazı dağıtım D'ye göre örneklere erişime izin verilir ve veya olmadığına (whp) karar vermek gerekir. ( burada genellikle mesafesidir). Karmaşıklığın en yaygın ölçüsü, algoritma tarafından kullanılan örnek sayısıdır.d ( D , P ) > ϵ d 1DPd(D,P)>ϵd1

Şimdi, bir nesneye sorgu erişimine sahip olduğunuz standart özellik testinde, sorgu sorgulamasında doğrusal bir alt sınır, açık bir şekilde mümkün olan en güçlü alt sınırdır, çünkü sorgu tüm nesneyi ortaya çıkaracaktır. Dağıtım testi için de durum böyle mi?n

Anladığım kadarıyla, dağılımların özelliklerini test etmek için "önemsiz" üst sınır --- Chernoff sınırları ile, bu yakın bir dağıtım D 'yazmak "için yeterli D mesafesinde, ve sonra D'ye yakın P'de olan herhangi bir dağılım olup olmadığını kontrol edebiliriz (bu sonsuz zaman alabilir, ancak bu örnek karmaşıklığı ile ilgisizdir).1O(n2logn)1

  • Tüm dağıtım özellikleri için daha iyi bir "önemsiz" test var mı?
  • Örnek alt sınırlarının doğrusaldan daha güçlü olduğunu bildiğimiz herhangi bir dağılım özelliği var mı?

karmaşıklık sınıfı ayrımlarını kanıtlamaya benziyor ve bilinen bazı açık sorunlara yakın olabileceği gibi ...?
vzn

Sadece oldukça emin sınırı elde nasıl değilim ... Bu gördüğümüz , ancak not aslında (boyut etki üzerinde dağılımlarını öğrenme TV / kadar) mesafesi olasılığıyla aslında örnekleri ile yapılabilir (ve bu sıkı). Yani yakınlık parametresinin sabit olmayan değerlere bakarak sürece , olsun herhangi bir umut yoktur ... alt sınırları, n 1 ε 2 / 3 O ( n / ε 2 ) ε co ( n )O(n2logn)n1ε2/3O(n/ε2)εω(n)
Clement C.

Yanıtlar:


5

Bu gönderiyi ortaya çıkardığım için üzgünüm - oldukça eski, ama cevap vermiş olmanın o kadar da kötü bir fikir olmadığını düşündüm.

İlk olarak, Chernoff'unuzu biraz garip parametrelerle ayarlamışsınız gibi görünüyor. Önerilen "öğrenerek test etme" yaklaşımınızı gerçekleştirmek için, toplam varyasyon mesafesindeki (veya isterseniz bir faktör 2'ye kadar olan dağılımı kadar öğrenmeniz yeterli olacaktır. . ( öğrenilen hipotezinizden en olan özelliğine sahip herhangi bir dağıtım olup olmadığını "çevrimdışı" olarak kontrol etmeden önce ). Bu naif olarak bir big'e yol açarε1 pPnεε2pPns O(n,günlüknε2p^nεO(nO(nlognε2)bu yaklaşım için örnek karmaşıklığı üst sınırı; ancak, (toplam varyasyon mesafesindeki) boyutuna kadar bir alan üzerinde rastgele bir dağılım öğrenmenin sadece ile yapılabileceği bilinmektedir (ve "folklor") örnekler (ve bu sıkı).nεO(nε2)

Taban çizgisi aslında olmalıdır Dolayısıyla , lineer zaten olan . Şimdi, bir sonraki soru sorabilir - test için (örneğin, sabit ) etki alanı boyutunda doğrusal bir bağımlılık gerektiren "doğal" özellikler var mı?nεnO(nε2)nεn

Cevap (bildiğim kadarıyla) "tam değil, yakın." Yani, dağılımların (veya eşdeğer olarak, toleranslı özellik testlerinin) özelliklerinin tahmin edilmesine yönelik önemli bir çalışma çizgisini takiben, Valiant ve Valiant'ın sonuçları (STOCS'11, FOCS'11 ve diğerleri), oldukça çelişmiş mülkün " - tekdüze "örnek karmaşıklığına sahip .İçeride ISTV melerin RWMAIWi'nin ε ( n1/10Θε(nlogn)

(Mülkün sadece hoşgörülü bir test sorusu almanın ve geçici bir mülkün testi olarak yeniden etiketlemesinin bir yolu olduğu için biraz "hile" olduğuna dikkat edin ).

kkk=n/10Ω(nlogn)n100

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.