Chomsky-hiyerarşi modası geçmiş mi?


45

Chomsky (–Schützenberger) hiyerarşisi, teorik bilgisayar bilimi ders kitaplarında kullanılmaktadır, ancak açıkça, karmaşıklık Hayvanat Bahçesi Diyagramının tamamıyla karşılaştırıldığında, sadece resmi dillerin (REG, CFL, CSL, RE) çok küçük bir kısmını kapsamaktadır . Hiyerarşi artık mevcut araştırmalarda herhangi bir rol oynuyor mu? Chomsky'ye cstheory.stackexchange'te sadece küçük referanslar buldum ve Karmaşıklık Hayvanat Bahçesi'nde Chomsky ve Schützenberger isimlerinden hiç bahsedilmedi.

Mevcut araştırma diğer açıklama araçlarına değil, resmi gramerlere mi odaklanmış? Farklı ifadelere sahip biçimsel dilleri tanımlamak için pratik yöntemler arıyordum ve her ikisi de klasik Chomsky dilleri arasında yer alan, bağlam duyarlı dili (GCSL) ve gözle görülür şekilde aşağı iten dilleri (VPL) büyütmek üzerine tökezledi. Chomsky hiyerarşisi onları içerecek şekilde güncellenmemeli mi? Yoksa, bütün karmaşıklık sınıflarından belirli bir hiyerarşi seçmenin faydası yok mu? Yalnızca Chomsky hiyerarşisinin boşluklarına sığabilecek dilleri seçmeye çalıştım, anladığım kadarıyla:

REG (= Chomsky 3) ⊊ VPL ⊊ DCFL ⊊ CFL (= Chomsky 2) ⊊ GCSL ⊊ CSL (= Chomsky 1) ⊊ R ⊊ RE

Doğal dilin işlenmesi ile ilgili pratik anlamlılık gösterse de, "içeriğe duyarlı diller" ve "dizine alınmış diller" in (CFL ve CSL arasında bir yerde) nerede olduğunu hala anlamadım. teorik araştırmada ;-). Ek olarak, ünlü P ve NP sınıflarıyla olan ilişkiyi göstermek için GCSL ⊊ P ⊂ NP ⊂ PSPACE ve CSL ⊊ PSPACE ⊊ R’den bahsedebilirsiniz.

GCSL ve VPL'de buldum:

VPL, DCLF, GCSL ve indeksli gramerler ile ilgili pratik uygulamalarda işaretçilerle tercih edilen resmi gramerler hakkında daha yeni bir ders kitabı öğrenirseniz de mutlu olurum.


7
Küçük bir nokta: Karmaşıklık Hayvanat Bahçesinde Chomsky ve Schützenberger adlarının eksikliğini “Chomsky hiyerarşisinin modası geçmiş olduğunu” kanıt olarak görmüyorum. Chomsky hiyerarşisi biçimsel dil teorisinde bir kavramdır. Karmaşıklık Hayvanat Bahçesi, bağlamsal olmayan diller gibi biçimsel dil teorisinde bazı kavramlar içermesine rağmen, öncelikle karmaşıklık teorisi ile ilgili bir web sitesidir. Bunlar birbirleriyle ilişkili ancak farklı alanlardır. Resmi dil teorisindeki bir ders kitabında bahsedilmediyse modası geçmiş olurdu, ama durumun böyle olup olmadığını bilmiyorum.
Tsuyoshi Ito

7
İyi nokta, Tsuyoshi. Açıkçası, iyi teorik temelleri olan (araştırma makalelerine referanslar!) Ve pratik kaynakları olan bir “Formal Diller Hayvanat Bahçesi” görmek istiyorum. Örneğin, Backus-Naur-Form'un düzinelerce sözdizimi varyantı ve Düzenli İfadeler varyantları vardır (bazıları düzenli değildir). Basit Chomsky-hiyerarşisinin yanında biçimsel dillerde mevcut araştırma durumunun net bir resmini elde etmekte zorlandım.
Jakob

Ayrıca yıldızsız dilleri de normal dillerin altına kesinlikle ekleyebilirsiniz. Normal gibiler ama Kleene yıldızı olmadan. İyi bilinen. İyi davranmış.
wren romano,

Bazı cevapların bana gösterdiği gibi, La Chomsky resmi gramerleri, kendi dillerini tanımlamak için kendi sınırlarına ulaşan tarihi bir yöntemdir. Ben hala karmaşıklık teorisine odaklanmayan, ancak diğer tüm referanslar için teşekkürler! Mgalle'in cevabını kabul edeceğim çünkü şu ana kadar en az ünü var.
Jakob

2
Bilgisayar bilimlerinde bilgisayar dili tasarımı, yazılım tasarımı ve programlaması, bağlamsız gramer ve diller ile düzenli ifadeler ve diller temel çalışma ekipmanıdır ve her zamanki gibi önemlidir. Ancak, keyfi dilbilgileri, LBA'lar ve içeriğe duyarlı diller için ise çok az uygulama gördüm ya da hiç görmedim.
reinierpost

Yanıtlar:


20

Doğal Dil İşleme topluluğunda gördüğümden, Chomsky'nin resmi gramerleri artık pek kullanılmıyor. Onlar da (Chomsky Hiyerarşisinin model dili için eski olduğunu düşünüyorlar.

Onun yerine geçen, Yeniden Yazma Kuralı (Lars algoritması), bağımlılık modelleri (Dan Klein), Ağaç Değiştirme Dilbilgisi (DOP modeli), İkili Özellik Dilbilgisi (Alex Clark) gibi şeylerdir.


Cevabımı tekrar okuduğumda, istediğimden daha olumsuz geliyor. RL ve CFL hiçbir zaman doğal dilin gerçekçi modelleri olmamalıydı ve "yeni" modellerin çoğu aslında onlardan ilham aldı.
mgalle,

RL'nin bir doğal dil modeli olarak değil, bazı sistem davranışlarının bir modeli olarak tasarlandığını sanıyordum. [Kleene'nin orijinal metni ya resmi dil terminolojisini kullanmaz.]
DG_

26

Kısacası: evet.

Daha özel olarak: Chomsky, diller, gramerler ve otomatlar ile ilgili bir hiyerarşiyi resmileştiren ilk kişilerden biriydi. Bu içgörü hala çok ilgilidir ve otomat teorisi ile ilgili tüm giriş derslerinde öğretilir. Ancak, belirli bir hiyerarşi Chomsky geldi ve artık hiyerarşi unsurlarının isimleri artık önemli değil. O zamandan beri Chomsky'nin hiyerarşisi arasında, üstünde ya da altında olan sayısız formaliteyi icat ettik. Ve Chomsky'nin kullandığı isimler özellikle ilginç değil, yani ilginç bir karmaşıklık ölçütüne dayanmıyorlar, sadece rakamlar. Bağlam duyarlı diller hafifçe Type-1.5 veya Type-1.7 veya Type-1.3 olmalı mı? Kimin umrunda. "Hafif bağlam duyarlı" çok daha bilgilendirici bir isim.

Karmaşıklık Hayvanat Bahçesi biraz farklıdır çünkü her türlü koşullu denklik ve benzerleriyle doludur. Otomat teorisi için daha modern bir hiyerarşi, lineer olmaz (örneğin, CFG ile PEG'i karşılaştırır) ama yine de iyi bilinen bir topolojiye sahip olacaktır. Modern otomata teorisi hakkında bir perspektif elde etmek için, çözümleyici birleştirme kitaplıkları ve birleştirme ve yazma teorisi ile ilgili bazı şeylere bakmalısınız.


4
Daha iyi isimler bulduk, evet. Bu, sonuçların modası geçmiş olduğu anlamına gelmez.
Raphael

4
@Raphael: Modası geçmişlik isimler yüzünden değil, Chomsky'nin tanıttığı özel hiyerarşinin artık kullanılmaması nedeniyle. Chomsky hiyerarşisi tarafından açıklanan eklemeler (a) hala doğru ve (b) herhangi bir modern hiyerarşideki eklemeler arasında; ancak Chomsky hiyerarşisi gibi , iyi bilinen yüksek noktalardan bazılarını vurmak olur korkunç alakalı hariç değildi olduğunu. İnsanlar artık Chomsky hiyerarşisi hakkında araştırma yapmıyor, başka bir yerde araştırma yapıyorlar. İsimleri / yapıları için sebepleri olan polinom kulesi gibi değil.
wren romano,

26

Eğer şey TCS modası geçmiş, bu 1956 içinde açıklanması / kabul ilginç oldu karmaşıklık sınıfların minik alt kümesi bu içerme hiyerarşisi şöyledir.

Huzur içinde yat, Chomsky Hiyerarşisi, ve lisans teorisi müfredatıyla uğraşmayacaksın.


12
Juris Hartmanis'in bir zamanlar bağırdığı gibi: "Peki Chomsky sınıfları? Chomsky sınıfları bir surattır!"
Ryan Williams

1
Ryan: Ayrıca Juris'in CH'ye "suistimal" dediğini hatırlıyorum! Cevabımı yazarken, yorumunun kamuya duyurulmasını isteyip istemediğini tartışıyordum. Ama onu benden daha iyi tanıyorsun ... :-D
Scott Aaronson 19:10

Bu yorum aynı zamanda bazı teorik bilgisayar bilimleri ve matematikçilerin dilbilim ve diğer "zayıf" bilimlere aşağılayıcı bakış açısıyla en azından ufak bir motive edilebilir: xkcd.com/435 . Ama bugün Chomsky hiyerarşisi modern karmaşıklık teorisine bakış açısını gizliyor, bu yüzden sorumu cevaplıyor. Yine de, pratik uygulamalar için resmi dillere ve gramerlere daha fazla ilgi duyuyorsanız, lisans teorisi müfredatına başlamak için güncellenmiş bir yerine koymanız güzel olacaktır.
Jakob

1
Chomsky Hiyerarşisi, "karmaşıklık teorisi" terimini kullandığınızda genellikle belirtilen hesaplama karmaşıklığını değil, açıklamanın karmaşıklığına göre sıralanan dil sınıflarını listeler. Açıkçası, onlar birbiriyle ilişkili. Her neyse, hala bir (kaba) hiyerarşinin Chomsky Hiyerarşisinden gelmeden pek anlaşılmayan daha rafine sınıfları nasıl gizleyebildiğini göremiyorum . Onlar giriş kapısı!
Raphael

20

Chomsky'nin Hiyerarşisini "modern" isimlerle (örn. REG, LIN, CFL, CSL, RE., DFA / NFA, PDA, LBA, TM) düşünürseniz, derim ki: Hayır, güncel değil!

Sebep 0 : Tanım ve sonuçlarının yeni bilgilere aykırı olmadığı anlamında hala doğru .

Sebep 1 : Bu sınıflar / hesaplama modelleri, hala ilk öğrettiğinizlerdir - çünkü basit ve iyi çalışılmışlardır. Önce DFA / DPDA'yı kapsayan LR otomatını bir lisans seviyesine öğretmeyi deneyin.

Sebep 2 : Sınıflar hala yeni icatlar için ilk / en temel kriterlerdir (Tabii ki, dedi ki: CFG'den daha çok, CSG'den daha az). Bu, kısmen ilk önce öğretildikleri için değil, aynı zamanda basit ve iyi çalışılmış oldukları için olabilir .

Anti-Nedeni 3 : Yeni sınıflar / modeller bulunduğundan sonuçlar tükenmiyor . Araştırma alanında aktif olarak kullanılmamasına rağmen, değerlerini alanın temelleri olarak tutarlar.


10
“Matematik yaşlanmaz , klasikleşir .” (Maalesef bu teklifin kime ait olduğunu bilmiyorum.)
Heinrich Apfelmus 19:10

"DPDA" yerine "NPDA" demek istemiyor musunuz? Bağlam içermeyen bazı diller yalnızca klasik olmayan aşağı açılır otomatlar tarafından tanınır.
Zsbán Ambrus

@ ZsbánAmbrus Oldukça doğru; Sadece "PDA" yazmalıydım. Teşekkürler!
Raphael,

Son sebep hiç inandırıcı değil (Sanırım bunun nedeni anti sebep değil mi?). Bol miktarda sonuç modası geçmiş durumda çünkü konuya farklı bir yaklaşımla uyuluyor ya da bazen önemsizleştiriliyorlar. Ben buradaki davayı söylemiyorum, sadece belirtilen sebep pek de söylemedi. Ayrıca, gramer niteliğinde bir nitpick: "outdate" bir fiil değildir.
Sasho Nikolov

11

Bunun hesaplama modeline bağlı olduğunu düşünüyorum. Sonlu / pushdown / etc. Bir hesaplama modeli olarak otomata, daha sonra Chomsky hiyerarşisi önem kazanır (örneğin Sipser'in kitabına bakınız). Diğer taraftan, Turing hesaplama modelinde çok az rol oynamaktadır.

Aşağıdaki çizim yardımcı olabilir:

Düzenleme: Biçimsel diller, bilgisayar dilleri (Java gibi) ve derleyiciler gibi doğal dil işleme (NLP) tasarımında önemli bir rol oynamaktadır.


Üzgünüm András, yorumunu anlayamıyorum. OP, Chomsky hiyerarşisinin eski olup olmadığını sordu. Akıl yürütme, onu karmaşıklık hayvanat bahçesinde vs. görmemesiydi. Otomata'yı bir bilgisayar modeli olarak görürse, Chomsky hiyerarşisinin konuyla ilgili olduğunu söyledim. Ek olarak, bu hiyerarşi sınıflarının derleyici tasarımı ve NLP algoritmaları için önemli olduğunu belirtmiştim. IMHO, bu tamamen soru ile ilgilidir.
MS Dousti

2
Chomsky hiyerarşisinin gerçekten modası geçmiş olmadığından emin olun, çoğu teorik bilgisayar bilimi, biçimsel diller, derleyici tasarımı vb. Girişlerinde bulunur. Fakat bunun yanında söyleyecek yeni bir şey yok gibi görünüyor. REG ile CFL arasındaki ve CFL arasındaki teşekkür dillerinin de önemli olabileceğini düşünüyorum. Bu dillerle hiyerarşiyi genişletmek kötü bir fikir mi? Çünkü Chomsky hiyerarşisi güncel araştırmalar için önemli olmadığı için "modası geçmiş" kokusuna sahip mi?
Jakob

Bunun kötü bir fikir olduğunu düşünmüyorum, ancak yeni uzantı için uygun bir uygulama bulmalı.
MS Dousti
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.