Kelimeleri rastgele DFA'larla ayırma


15

DFA'lar hakkında listelenen ilginç açık sorunlardan biri DFA'lar hakkında açık sorun var mı? uzunluğundaki iki dizeyi ayırmak için gereken bir DFA boyutudur . Rastgele bir DFA'nın verilen (rasgele olmayan) dizeleri ayırma yeteneği hakkında herhangi bir sonuç olup olmadığını merak ediyorum.n

Açıkça yeterli sayıda duruma sahip rastgele bir DFA, yüksek olasılıkla dizeleri ayırır. Özellikle, , O ( n ) durumları olan rastgele bir DFA'nın, u ve v'nin farklı olduğu ilk yere ulaştıktan sonra aynı duruma tekrar gelmesi ve böylece u ve v'yi ayırması olası değildir .u,vΣnO(n)uvuv

Daha iyisini yapabilir miyiz? İdeal olarak, en küçük nedir st o rastgele DFA ile f ( n ) uzunluğunun devletlerin ayırır dizeleri n pozitif olasılığı (veya belki de olasılık 1 / 2 )? Kısa bir arama, rastgele DFA'ların özellikleri üzerinde pek çok sonuç vermedi; tüm bulabildiğim http://arxiv.org/abs/1311.6830 idi .f(n)f(n)n1/2


Pozitif olasılık, sadece açık sorunun yeniden ifade edilmesi göz önüne alındığında, özellikle yararlı bir koşul değildir. Yüksek olasılık hala ilginç olabilir.
Geoffrey Irving

1
"Ayırır" ne demektir? Birini kabul eder ve diğerini reddeder? Eğer öyleyse, durumlarının yeterli olduğu açık mı? O(n)
usul

Evet, ayırmak demek tam olarak kabul etmek demektir. Ve haklısın: en önemsiz ayrılma argümanı aslında durumlarını gerektirir ( yukarıda yazdıklarım yanlıştır), ancak daha azı yetmezse şaşırırdım. O(n2)
Geoffrey Irving

1
Sınırların kelimelerin ne kadar farklı olduğuna bağlı olmasını beklemez miydiniz? Tek bir harfle farklılık gösteren kelimelerin rastgele ayrımcılık yapmak daha zor olacağı anlaşılıyor, çünkü bu bir geçişte ayrımcılık yapmanız gerekiyor ve çok farklı kelimeler daha kolay olurdu. [Genelleştirmek için, en uzun ortak öneki unutabilirsiniz (bundan rastgele bir duruma ulaşırsınız); farklı harfler sizi aynı duruma veya farklı durumlara gönderir; devletler farklıysa, yeniden senkronizasyon proba bakmanız ve senkronize halde kalmanız gerekir (kelimelere tekrar bağlı olarak başlar) ...]
a3nm

Evet, açık sorun gibi, ayrımcılık yapmak için mümkün olan en zor kelimelerle ilgileniyorum. Sadece birkaç yerde farklılık gösteren kelimeler zaten durumlarıyla ayrılabilir , bu yüzden zor durumda olmaları olası değildir. O(logn)
Geoffrey Irving

Yanıtlar:


2

[Düzenle: bu cevap çalışmıyor, yorumlara bakın.]

Bu sadece gayri resmi bir fikir ve yardımcı olup olmadığını bilmiyorum, ancak yorum olarak verilmesi çok uzun. Ayrıca, rastgele DFA'lara hiç aşina değilim, bu yüzden belki de olasılıklar hakkında nasıl mantık yürütmeniz gerektiğine dair yanlış bir sezgim var, ama umarım bu tamamen değersiz değildir.

Sınırlarınızın ve v'nin ne kadar farklı olduğuna bağlı olduğunu varsayacağım ; eğer bunu yapmazlarsa, en kötü durumun sadece ilk karakterleri ile farklı olan dizeler olduğu açıktır (bir X konumu pozisyonunda farklı olan dizeler, bir dizi Y X pozisyonunda farklı olan dizelerden ayrı olarak söylenme şansına sahiptir. , Söyleyebilirim ve farkı olabildiğince erken koymak size yeniden senkronize etme fırsatı verir).uvXYX

Ayrıca kelimelerin ayırt edilme olasılığına, yani farklı durumlara ulaşma olasılığına da bakacağım. Sanırım rastgele DFA'larınızın son durumları nasıl tahsis ettiğine bağlı olarak kabul veya reddedilmek için adapte olmanız gerekir. Her durumun nihai olma olasılığı 1/2 ise, o zaman dizeler aynı duruma geldiğinde ayırt edilmezler ve farklı durumlara ulaştıklarında ayırt edilme olasılıkları 1/2 olur.

Şimdi w kelimesini ele alacağımw elde ve v aşağıdaki gibidir: a i = 1 ise u i = V i ve w i = 0 , aksi. Ben w ve u ve v hakkında düşünülmesi gereken tek ilginç şey olduğunu düşünüyorum .uvwi=1ui=viwi=0wuv

Şimdi tanımlama, uzunluğunun önekleri okuduktan sonra aynı halde olduğu ihtimali i arasında u ve v , ve q, ( i ) = 1 - p ( i ) biz değildir olasılığını.p(i)iuvq(i)=1p(i)

Biz var zaman W i + 1 olduğunu 1 . Sezgisel olarak, aşağıdaki durumlarda i + 1 / n okuduktan sonra aynı durumdayızp(i+1)=p(i)+q(i)/nwi+11i+1 harflerini okuduktan sonra aynı durumdayız ya okuduktan sonra aynı durumdayken ya da iki farklı (rastgele) durumdayken, rastgele durumlara iki geçiş yaptık ve aynı olmak. Benzer şekilde, p ( i + 1 ) = 1 varip(i+1)=1/n olduğunu 0 : İki rastgele durumları, içinden ait bir madde çekmektedir.wi+10

Bundan okuduktan sonra aynı durumda olma olasılığını hesaplayabileceğini düşünüyorum ve v'yi.uv


Ne yazık ki, u ve v'nin tek ilginç özelliği olduğu açıktır . Bu görmenin en kolay yolu herhangi aşikar olmayan ayırt sıfırdan farklı bir olasılık trivially olmasıdır w danwuvw ; aslında n'den bağımsız olarak sadece iki devlet yeterlidir. Bununla birlikte, ele alındığı gibiarxiv.org/pdf/1103.4513.pdf, kelime vardır u , v uzunluğunun n st bir O ( log n )0nnu,vno(logn) durumu DFA birbirinden ayırt edebilir. Bu, p ( i ) için formüllerinizle çelişmektedir.p(i).
Geoffrey Irving

1
Açıklığa kavuşturmak için, DFA geçişleri dize dizininin rastgele bir işlevi olsaydı formülleriniz doğru olurdu; endeksten bağımsız oldukları için olasılıklar oldukça karmaşık bir şekilde ilişkilidir.
Geoffrey Irving

Korkarım karşı örneğini alamadım. Bir yoktur prba ayırt, iki devlet ile, 0 n>00n ve , OK'yi ; ve belki de n uzunluğunda o ( log n ) durumlarıyla ayrı olarak söylenemeyen kelimeler vardır . Ancak, w'nin tek önemli şey olduğu iddiamla veya p ( i ) için formüllerimle nasıl çelişiyor?w0nno(logn)wp(i)? Korelasyonlara gelince, bahsettiğiniz türden bir yakalama olabilir, ancak neden tam olarak başarısız olduğunu anlamıyorum. Aynı durumdan iki kez geçerseniz, bir korelasyon vardır, ancak bunun ortalama olarak belirli bir yönde etkileyeceğini düşünmek için bir neden var mı?
a3nm

Eğer , u ve v pozitif olasılık ile ayırt edilir. Bununla birlikte, yeterince büyük n ve az sayıda durum için, bazı u ve v p ( i ) ( 1 - 1 / n ) + 1 için p ( n ) = 1 olduğunu biliyoruz.p(n)<1uvnp(n)=1uv . Senin formülleri ima yana ki eğer sonra p ( i + 1 ) = p ( i ) + ( 1 - pp(i)<1 , formülünüz belirli u ve v'nin ayırt edilmesinin imkansız olduğugerçeğini yakalamıyor. p(i+1)=p(i)+(1p(i))/n=p(i)(11/n)+1/n<1uv
Geoffrey Irving

Ah ... doğru, anlıyorum. Hiçbir küçük DFA iki kelimeyi ayırt edemezse, rastgele bir DFA da bunları ayırt edemez. Aslında benim yaklaşımımda bir sorun var, olasılığı sonunda sıfıra düşmeli, bu korelasyonlar nedeniyle, öyle görünüyor. Yanlış cevap verdiğim için üzgünüm. q(i)
a3nm
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.