Dilbilgisinin kesin olduğunu nasıl kanıtlayabilirim?

25

Benim sorunum bir gramerin net olmadığını nasıl kanıtlayabilirim? Aşağıdaki gramer bilgisine sahibim:

S \to s t a t e m e n t ∣ if e x p r e s s i o n then S ∣ if e x p r e s s i o n then S else S

$S → statement ∣ \mbox{if } expression \mbox{ then } S ∣ \mbox{if } expression \mbox{ then } S \mbox{ else } S$

ve bunu net olmayan bir gramer için yapın, bunun doğru olduğunu düşünüyorum:

$S → S_1 ∣ S_2$
$S_1 → \mbox{if } expression \mbox{ then } S ∣ \mbox{if } expression \mbox{ then } S_2 \mbox{ else } S_1$
$S_2 → \mbox{if } expression \mbox{ then } S_2 \mbox{ else } S_2 ∣ statement$

Belirsiz bir gramerin her dönem için bir ayrıştırma ağacına sahip olduğunu biliyorum.

— user1594
kaynak

20

En az bir dilbilgisi dili için netliğini kanıtlamanın bir yolu vardır . İki adımdan oluşur: $G = (N,T,\delta,S)$ $L$

Kanıtlamak . $L \subseteq \mathcal{L}(G)$
Kanıtlamak. $[z^n]S_G(z) = |L_n|$

İlk adım oldukça açık: Gramerin istediğiniz kelimeleri (en azından) ürettiğini, bunun doğruluğunu gösterir.

İkinci adım, uzunluklu kelimeler için çok sayıda sözdizimi ağacına sahip olduğunu , nin uzunluklu kelimeleri - 1 ile olduğunu gösterir. Chomsky ve Schützenberger [1] 'e geri dönen yapı işlevini kullanır , yani $G$ $n$ $L$ $n$ $G$

$\qquad \displaystyle S_G(z) = \sum_{n=0}^\infty t_nz^n$

ile sözdizimi ağaç sayısı uzunluğu kelimeleri alır . Tabii kiBunun çalışması için. $t_n = [z^n]S_G(z)$ $G$ $n$ $|L_n|$

Güzel bir şey olduğunu için kapalı bir form bulma rağmen, bağlamdan-bağımsız diller için elde etmek kolay (genellikle) olan zor olabilir. Transform uç-olmayan bir tane değişken ile bir işlev denklem sisteme: $S_G$ $t_n$ $G$

$\qquad \displaystyle \left[ A(z) = \sum\limits_{(A, a_0 \dots a_k) \in \delta} \ \prod\limits_{i=0}^{k} \ \tau(a_i)\ : A \in N \right] \text{ with } \tau(a) = \begin{cases} a(z) &, a \in N \\ z &, a \in T \\ \end{cases}.$

Bu göz korkutucu görünebilir, ancak örnekte açıkça görüleceği üzere yalnızca sözdizimsel bir dönüşümdür. Fikri oluşturulan uç semboller üs sayılır olmasıdır ve sistem aynı biçime sahiptir, çünkü , olarak toplam olarak genellikle meydana gelir terminalleri ile üretilebilir . Detaylar için Kuich [2] 'e bakınız. $z$ $G$ $z^n$ $n$ $G$

Bu denklem sisteminin çözümü (bilgisayar cebiri!), ; şimdi "sadece" katsayıyı çekmelisiniz (kapalı, genel biçimde). TCS Kısa Notlar ve bilgisayar cebir genellikle bunu yapabilirsiniz. $S(z) = S_G(z)$

Örnek

Basit dilbilgisi kurallarını düşünün $G$

$\qquad \displaystyle S \to aSa \mid bSb \mid \varepsilon$ .

(adım 1, indüksiyonla ispat) olduğu açıktır . Var uzunluğunun palindrom ise da olduğu, , aksi. $\mathcal{L}(G) = \{ww^R \mid w \in \{a,b\}^*\}$ $2^{\frac{n}{2}}$ $n$ $n$ $0$

Denklem sisteminin verimini ayarlama

$\qquad \displaystyle S(z) = 2z^2S(z) + 1$

kimin çözümü

$\qquad \displaystyle S_G(z) = \frac{1}{1-2z^2}$ .

katsayıları palindromların sayıları ile çakışır , bu nedenle belirsizdir. $S_G$ $G$

Bağlamsız Dillerin Cebirsel Teorisi, Chomsky, Schützenberger (1963)
Bağlamsız dillerin entropisi hakkında Kuich (1970)

— Raphael
kaynak

3

@Raphael’in bildiği gibi, belirsizlik kesin değildir, bu nedenle adımlarınızdan en az biri mekanize edilemez. Hangileri hakkında fikrin var mı? için kapalı bir form musunuz?

t_{n}

$t_n$

— Martin Berger

2

Derecesi çok yüksekse denklem sistemi algoritmik olarak çözülemeyebilir ve kesin katsayıları üreteç fonksiyonlarından çıkarmak (çok) zor olabilir. Not diyelim ki, küçük dereceden denklem sistemlerine Chomsky Normal Form açar - - "uygulama" olarak, olsa da, bir çoğu kez küçük "derecesi" nin grammars ile ilgilenen ve en azından almak için yöntem vardır için -asymptotics katsayıları; bu belirsizliği sağlamak için yeterli olabilir. kanıtlamak için, katsayıları çekmeden göstermenin yeterli olduğunu unutmayın; Bu kimliği kanıtlamak zor olsa da.

\sim

$\sim$

S_{L} (z) = S_{G} (z)

$S_L(z) = S_G(z)$

— Raphael

@Raphael teşekkür ederim. Örneğin Chomsky normal formunu kullansa bile, kararsızlığın nasıl ortaya çıktığını ayrıntılı olarak ortaya çıkaran herhangi bir metni biliyor musunuz? (Kuich'i alamam.)

— Martin Berger

@MartinBerger Yapılacaklar listesine sadece yorumunuzu yeniden keşfettim; uzun süre sessizlik için üzgünüm (Sanırım) genel olarak hesaplanamayan üç adım vardır: 1) belirleyin . 2) Hesapla. 3) belirleyin . Özellikle, 2) için kullanılacak gösterimi nedir?

S_{G}

$S_G$

| L_{n} |

$|L_n|$

[z^{n}] S_{g} (z)

$[z^n]S_g(z)$

L

$L$

— Raphael

nin temsili neden bir problem? Örneğin derleyiciler için CFG'leri temsil etmenin çoklu yollarından herhangi birini kullanabiliriz. Belki nasıl temsil ?

L

$L$

L_{n}

$L_n$

— Martin Berger

6

Bu iyi bir soru, ancak bazı Google çalışanları size belirsizliğe karar vermek için genel bir yöntem olmadığını söylerdi , bu yüzden sorunuzu daha belirgin hale getirmeniz gerekiyor.

— reinierpost
kaynak

2

OP, algoritmalar değil, prova teknikleri ister.

— Raphael

Ben de öyle düşünüyorum; soruda söz edilebilir.

— reinierpost

1

Google hakikat meselesi değildir, çünkü bilgili demokratik değildir ve Google sonuçlarıdır. Bu durumda Google’a güvenmem, çünkü insanlar kopyaladıklarının doğruluğunu kontrol etmeden sıklıkla birbirlerini kopyalarlar. Bir kanıt göstermeden, yanlış olabilirler.

— SasQ

5

@SasQ: Kelimemi tam anlamıyla okudun. Google’ın bana verdiği şey şeyleri açıklayan atiküllerin URL’leri.

— reinierpost

4

Bazı gramerler için, indüksiyonla (kelime uzunluğunun üzerinde) ispat mümkündür.

Örneğin göz önünde dilbilgisi üzerinde , aşağıdaki kurallara göre verilen: $G$ $\Sigma = \{a,b\}$

$\qquad \displaystyle S \to aSa \mid bSb \mid \varepsilon$

in bütün kelimeleri - sadece - yalnızca bir tane sol türetme var. $\leq 1$ $L(G)$ $\varepsilon$

Bazı için nin bütün kelimelerinin sadece bir tane sol türetme olduğunu varsayın . $\leq n$ $n \in \mathbb{N}$

Şimdi bazı için rasgele düşünün . Açıkçası, . Eğer , her sol türetme ilk kural olması gerektiğini biliyoruz ; eğer , . Bu tüm davaları kapsar. İndüksiyon hipotezi ile için tam olarak bir tane sol türev olduğunu biliyoruz . Kombinasyonda, için de tam bir sol türev olduğu sonucuna vardık . $w = w_1 w' w_n \in L(G) \cap \Sigma^n$ $n > 0$ $w_1 \in \Sigma$ $w_1 = a$ $S \to aSa$ $w_1 = b$ $S \to bSb$ $w'$ $w$

Bu zorlaşırsa

birden fazla terminal yok,
dilbilgisi doğrusal değildir ve / veya
gramer özyinelemelidir.

Tüm dilbilgisi formlarına (dilbilgisi verimsiz terminalleri yoksa) ve "terminal" olmayan terminallere yönelik iddiayı güçlendirmeye yardımcı olabilir.

Ben düşünüyorum Greibach Normal forma dönüştürme güzel sol özyineleme özen edebilir ilk bu adımı uygulayarak için, (me) belirsizliği korur.

Anahtar, en azından bir türev adımını düzelten (en azından) her kelimenin bir özelliğini tanımlamaktır . Gerisi indüktif olarak takip eder.

— Raphael
kaynak

3

Temel olarak, bu bir çocuk üretimi sorunu. İlk ifadeyle başlayın ve çocuklarını yaratın .... Özyinelemeli bir şekilde (DFS) yapmaya devam edin ve epeyce bir yinelemeden sonra, aynı genişletilmiş ifadeyi iki farklı çocuktan üretip üretemediğinizi görün. Bunu yapabiliyorsanız, belirsizdir. Ancak bu algoritmanın çalışma zamanını belirlemenin bir yolu yoktur. Belki de 30 seviye çocuk ürettikten sonra güvenli olduğunu varsayalım :) (Tabii 31'inci bomba olabilir)

— Karthik Kumar Viswanathan
kaynak

1

OP, algoritmalar değil, prova teknikleri ister.

— Raphael

2

Bu bir gramerin belirsiz olup olmadığını kanıtlamanın bir yolu olamaz. Nitekim, bu bombalamanın gerçekleştiği zaman kararsızdır.

— Sнаđошƒаӽ