Artan olmayanlar için tahmininde alt sınır


11

Aşağıdaki test sorunu için daha düşük sınırlar biliniyorsa ( bu diğer soru ile ilgili) bilmek istiyorum : bir negatif olmayan numaralar dizisine sorgu erişimi verilir ve , veya . ε ( 0 , 1 ) n k = 1 a k = 1 n k = 1 a k1 - εana1ε(0,1)k=1nak=1k=1nak1ε

Kaç sorgular (aramaları) olasılık en azından birlikte, iki durum arasında ayırt etmek için (adaptif) randomize algoritması için yeterli ve gerekli olan ?2/3

Toplamı tahmin etme ile ilgili problem için logaritmik ( cinsinden ) bir üst sınır ve deterministik algoritmalar için bu problem üzerinde kabaca eşleşen bir alt sınır veren bir önceki yazı buldum ; ancak düşündüğüm belirli sorun için bir sonuç bulamadık (özellikle rastgele algoritmalar).n


Düzenleme: Aşağıdaki cevabı takiben, daha net olmalıydı sanırım: yukarıda (ve özellikle alt sınır için asimptotik), sonsuzluğa gidiyor gibi görülen "ana" miktar, ise (keyfi küçük) sabit.εnε


Sanırım . k=1nak1ε
RB

Gerçekten - düzeltildi.
Clement C.

Eh, sipariş olmadan bağımlılık gerekli olurdu, (örnekleme ile veya örnekleme olmadan) hesaba katıyorum. "Kötü" bir örnek (diziler çifti), örneğin gibi bir (keyfi, rastgele) hariç , tüm 'e eşit olduğu bir ya (birinci sırada) ve (ikinci sırada ) eşittir . sorguları olmadan , iki dizi ayrı ayrı söylenemez ...a k 1 - εnak jajε0Ω(n)1εn1jajε0Ω(n)
Clement C.

Sorgu modelinin sorgusu için seçmenize izin verdiğini varsayıyorum , bu doğru mu? a kkak
kodlu

Evet ("ifşa etmek" istediğiniz noktayı seçebilirsiniz).
Clement C.

Yanıtlar:


5

İşte gösterebileceğim alt sınırlar. Sabit bir için sağ alt sınırın olduğuna inanıyorum, ancak doğal olarak yanlış olabilirim.Ê ( log n )ϵΩ(logn)

(Sadece rahatlık için) azalan bir sıra kullanacağım. Temel mekanizma diziyi bloklarına ayırmaktır . Gelen inci blok var olacak elemanlar (örneğin, ).i n i i n i = nLiniini=n

Aşağıda, algoritmanın , parametresi için başarılı olmasını istiyoruz .δ > 01δδ>0

İlk alt sınır: .Ω(1ϵlog1δ)

inci blokunun , böylece elemanlar . Bu tüm unsurların değeri için inci blok , burada aşağıdakilerden biri olan bir değişkendir ya da . Açıkçası, bu dizinin toplam toplamı Her bir olasılığını olarak ve olarak düşünün . Tahmin etmek için , biz güvenilir bir şekilde tahmin ihtiyaçn i = 2 i - 1 L = lg n i ( 1 + X i ) / ( 2 n i L ) X i 0 1 α = L i = 1 1 + X iini=2i1L=lgni(1+Xi)/(2niL)Xi01X,ip10app=1-4sp=1

α=i=1L1+Xi2niL=12+12L(i=1LXi).
Xiβ10αβ. Parçacık halinde, ve tabanını ayırt edebilmek istiyoruz .β=14ϵβ=1

Şimdi, örnekleme hayal bu rastgele değişkenlerin ve izin örneklenmiş değişkenler. Ayarlar ( tamamlayıcı değişkenlerin toplamını aldığımızı unutmayın ), , ve Chernoff eşitsizliği bize , ise ve başarısız olma olasılığının Bu miktarı daha küçük yapmak için ihtiyacımız varZ 1 , , Z m Y = m i = 1 ( 1 - X i ) μ = E [ Y ] = ( 1 - β ) m β = 1 - 4 ϵ μ = 4 ϵ m P [ Y 2 ϵ m ] = P [ Y ( 1 -mZ1,,ZmY=i=1m(1Xi)μ=E[Y]=(1β)mβ=14ϵμ=4ϵmδ m 2

P[Y2ϵm]=P[Y(11/2)μ]exp(μ(1/2)2/2)=exp(ϵm/2).
δm2ϵln1δ .

Anahtar gözlem, Chernoff eşitsizliğinin sıkı olduğu (birisinin dikkatli olması gerekir, çünkü tüm parametreler için doğru değildir, ancak bu durumda doğrudur), bu yüzden bundan daha iyisini yapamazsınız (sabitlere kadar).

İkinci alt sınır: .Ω(logn/loglogn)

Set olduğu inci blok boyutu , blokların sayısıdır. İçinde bir öğe, inci blok değerine sahiptir . Yani dizideki değerlerin toplamı .n i = L i L = Θ ( log n / log log n ) i α i = ( 1 / L ) / n i 1ini=LiL=Θ(logn/loglogn)iαi=(1/L)/ni1

Şimdi, keyfi bir blok almak söylemek karar verebilir biri inci ve olma bloğunda tüm değerleri ayarlamak (yerine ). Bu artışlar katkısı blok inci için , ve (neredeyse) sekans toplam kütlesini artırmak .α j - 1 = L α j α j j 1 / L 1 2jαj1=Lαjαjj1/L12

Şimdi, gayri resmi olarak, herhangi bir rastgele algoritmanın blokların her birindeki değeri kontrol etmesi gerekir. Bu haliyle , dizinin en azından değerlerini okumalıdır .L

Yukarıdaki argümanı daha resmi hale getirmek için, 1/2 olasılığı ile , girdi olarak orijinal kütle dizisini verin (buna orijinal girdi olarak adlandırıyoruz). Aksi takdirde, artırılmış değerlere (değiştirilmiş giriş) sahip olan bloğu rastgele seçin. Rastgele algoritma, örneğin girişlerinden daha az okursa, değiştirilmiş bir girişi tespit etme olasılığı (kabaca) olabilir. Bu nedenle, girişlerinden daha az okursa bu algoritmanın başarısız olma olasılığı en az 1 L / 8 1 / 8 L / 8 ( 1 - p ) ( 7 / 8 ) > 7 / 16 > 1 / , 3.p=1/21L/81/8L/8

(1p)(7/8)>7/16>1/3.

PS Bence parametreler hakkında daha dikkatli olmak, ilk alt sınır .Ω(1/ϵ2)


Bunun için teşekkür ederim! İlk, lb (daha özel olarak olası ikinci dereceden iyileşme) ile ilgili küçük bir sorum var . Burada tek taraflı vaat problemimiz olduğu için, algoritma ilgili herhangi bir kanıt veren herhangi bir değeri "görür görmez" , : doesn'ın daha doğru bir tahminine gerek kalmadan sonuçlanabileceğini ima eder Bu, bu yapı için en uygun olduğu anlamına gelmez , çünkü temel olarak tüm 1 olmasını veya en azından bir bekler misiniz? β < 1 β 1 / ϵ X i ϵΩ(1/ϵ)β<1β1/ϵXiϵ
Clement C.

Evet. Eğer ralli sadece 1 ve 1-epsilon arasında ayrım yapmak istiyorsanız, o zaman elbette alt sınırı geliştiremezsiniz ... Ben diğer aralıkları ayırt etmeye çalışmayı düşünüyordum ... s
Sariel Har-Peled

4

Alt sınır

İki vakayı ayırt etmek için en az sorgusu gereklidir.Ω(1/ϵ)

ile verilen dizisini , olacak şekilde seçerek . Özellikle, . ϵ , 2 ϵ , 3 ϵ , 4 ϵ , n a 1 + + a n = 1 n 1 / a1,,anϵ,2ϵ,3ϵ,4ϵ,na1++an=1n1/2ϵ

Şimdi çıkararak yukarıdaki dizinin tek bir öğesini değiştirerek yeni bir dizisi oluşturun . Diğer bir deyişle, , vb. Ancak . olduğuna dikkat edin . ε bir ' 1 = bir 1 a ' 2 = bir 2 a ' i = bir ı - ε bir ' 1 + + bir ' n = 1 - εa1,,anϵa1=a1a2=a2ai=aiϵa1++an=1ϵ

ile arasında ayrım yapmak için kaç prob ? Sadece tek bir elementte ( element) farklılık gösterirler , bu yüzden sabit bir ayırt etme olasılığı elde etmek için probları gerekir. Şimdi ; problarının gerekli olduğunu görüyoruz .a 1 , , a n i Ω ( n ) n 1 / a1,,ana1,,aniΩ(n) Ω(1/n1/2ϵΩ(1/ϵ)

Üst sınır

Sanırım sorgularını kullanarak iki durumu ayırt edebilirsiniz . Bunun en uygun olup olmadığını bilmiyorum.O(lg(n/ϵ)[lgn+1/ϵ2])

İşte böyle. aralığını şu şekilde bölümlere :[0,1]

[0,1]=[0,0.25ϵ/n](0.25ϵ/n,0.5ϵ/n](0.5ϵ/n,ϵ/n](ϵ/n,2ϵ/n](2ϵ/n,4ϵ/n](,1].

Bu bir bölümdür, bu nedenle her değeri yukarıdaki aralıklardan birine düşmelidir. değerlerini hangi aralıkta bulunduklarına göre bölümlere . Her değeri bu aralıklardan tam olarak birine düşer ve belirli bir aralığa düşen değerlerin tümü sıralı sıralamanızda art arda görünür. Bu nedenle, herhangi bir aralık için , biz indeksleri bulabilirsiniz , öyle ki ikili arama özelliğini kullanarak. Bu, ikili aramalarını gerektirir. Bunu yaptığımızı varsayalım.a i a i [ , u ] i , j a i , , a j[ , u ] O ( lg ( n / ϵ ) )aiaiai[,u]i,jai,,aj[,u]O(lg(n/ϵ))

Şimdi, her aralıktaki değerlerin toplamını tahmin edeceğiz. İlk aralık diğerlerinden ayrı olarak ele alınacaktır:

  • İlk aralık , bu aralıktaki değerlerin toplamını ile arasında bir yere ; burada , bu aralığa düşen değerlerin sayısıdır . Yana , yapışmış olan bu mutlak hata en olacak .0 m × 0.25 ϵ / n m m n 0.25 ϵ[0,0.25ϵ/n)0m×0.25ϵ/nmmn0.25ϵ

  • Her bir aralık için, rasgele prob kullanarak bu aralıktaki değerlerin toplamını göreli hata bağlayabiliriz. (Buradaki anahtar, bu aralıktaki tüm değerlerin bilinen bir alt sınırı olması ve alt sınırın en fazla .) seçeceğiz .O ( 1 / δ 2 ) 2 × δ = 0,25 ϵδO(1/δ2)2×δ=0.25ϵ

İlk aralık herkes için tahminlerin toplamındaki hata en fazla . İlk aralık için tahmindeki hata en fazla . Bu nedenle, tüm bu tahminlerin toplamındaki toplam hata , bu da toplam ile toplam arasında ayrım yapmak için yeterlidir .0.25 ϵ 0.5 ϵ 1 1 - ϵ0.25ϵ0.25ϵ0.5ϵ11ϵ


Teşekkürler - bu ilginç görünüyor (anlayabildiğim kadarıyla, yukarıda bağlantılı kağıt / tartışmada kullanılanla aynı yaklaşım değil) ve yazdıklarınıza daha derin bir göz atacağım. Ancak, bir üst sınır yerine bir alt sınır arıyorum - yani, kaç sorgu gerekli .
Clement C.

(Zaman geçtikçe, cevaba "ödül" veriyorum, yine de - orada bir yerde varsa, daha düşük bir sınır için bir referans arıyorum.)
Clement C.

2
@ClementC., İsteğinize göre bir alt sınır ekledim.
DW

Teşekkür ederim (her ne kadar, mülk testindeki her zamanki odaklamaya göre, sonsuza kadar birincil miktar olarak kabul ettim , keyfi olarak küçük bir sabit olsa da: soruyu bu açık hale getirmek için düzenledim). εnε
Clement C.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.