«parsing» etiketlenmiş sorular

Yapısal, normalleştirilmiş bir formata dönüştürmek için yapılandırılmış verilerin analizi (un).

5
Csv biçimi bir normal ifade ile tanımlanabilir mi?
Bir meslektaşım ve ben son zamanlarda saf bir normal ifadenin csv formatını tam olarak kapsülleyebildiğini tartıştık, böylece tüm dosyaları herhangi bir kaçış karakteri, alıntı karakteri ve ayırıcı karakterle ayrıştırabilsin. Normal ifadenin, oluşturulduktan sonra bu karakterleri değiştirmesi gerekmez, ancak başka bir kenar durumunda başarısız olmamalıdır. Bunun sadece bir belirteç için imkansız …

5
Ayrıştırma ve lexing geçişleri ayrıştırıcı birleştiricilerle iyi bir uygulama mıdır?
Ayrıştırıcı birleştiricileri kullanmaya başladığımda ilk tepkim ayrıştırma ve lexing arasında yapay bir ayrım gibi hissettiren bir kurtuluş hissiydi. Birdenbire her şey sadece ayrışıyordu! Ancak, yakın zamanda codereview.stackexchange adresinde bu gönderiyle karşılaştım ve birinin bu ayrımı eski haline getirdiğini gösterdim. İlk başta bunun çok aptalca olduğunu düşündüm, ancak daha sonra Parsec'te …

2
Derleyiciler daha hızlı derleme süreleri için çoklu iş parçacığı kullanıyor mu?
Derleyicilerimin kursunu doğru hatırlarsam, tipik derleyici aşağıdaki basitleştirilmiş taslağa sahiptir: Sözlüksel analizör kaynak kodu karakter karakter tarar (veya bazı tarama işlevlerini çağırır) Giriş karakterleri dizisi, geçerlilik için sözlüklerin sözlüğüne göre kontrol edilir Sözlük geçerliyse, karşılık geldiği belirteç olarak sınıflandırılır Ayrıştırıcı, belirteç kombinasyonunun sözdizimini doğrular; belirteç . Teorik olarak kaynak kodunu …

3
Strateji kalıbını kullanarak Java'da genel dosya ayrıştırıcı tasarımı
Modüllerden birinin sorumluluğunun XML dosyalarını ayrıştırmak ve gerekli içeriği bir veritabanına dökmek olduğu bir ürün üzerinde çalışıyorum. Mevcut gereksinim yalnızca XML dosyalarını ayrıştırmak olsa da, ayrıştırma modülümü gelecekte her türlü dosyayı destekleyebileceğim şekilde tasarlamak istiyorum. Bu yaklaşımın nedeni, bu ürünü belirli bir müşteri için inşa etmemiz, ancak yakın gelecekte diğer …
14 java  design  parsing  xml 

5
Bir lexer için jetonlarla geliyor
Oluşturduğum bir biçimlendirme dili için bir ayrıştırıcı yazıyorum (python ile yazma, ancak bu gerçekten bu soru ile ilgili değil - aslında bu kötü bir fikir gibi görünüyorsa, daha iyi bir yol için bir öneri isterim) . Burada ayrıştırıcılar hakkında okuyorum: http://www.ferg.org/parsing/index.html ve doğru anlarsam içeriği jetonlara bölen lexer'ı yazmaya çalışıyorum. …
14 python  parsing  lexer 

2
Ayrıştırma Ağaçları ve Soyut Sözdizimi Ağaçları arasındaki farkı açıklamak için en basit örnek nedir?
Anladığım kadarıyla, ayrıştırıcı bir ayrıştırma ağacı oluşturur ve daha sonra onu atar. Ancak, derleyicinin sözde kullandığı soyut bir sözdizimi ağacını da açabilir. Ayrıştırma ağacının ve soyut sözdizimi ağacının ayrıştırma aşamasında oluşturulduğu izlenimi altındayım. O zaman birisi bunların neden farklı olduğunu açıklayabilir mi?
14 parsing  trees 

5
csv ayrıştırıcı için birim testleri
Bir csv ayrıştırıcısını birim test etmek için hangi testleri kullanmalıyım? C # basit bir csv ayrıştırıcı var ve ben tüm ortak (ve nadir) kenar durumlarda iyi birim testi kapsama sahip olduğundan emin olmak istiyorum. Olası sorunları ve sınır vakalarını tanımlamak için hangi testleri kullanmalıyım?
14 testing  parsing 

2
Tarayıcısız ayrıştırma “Başka Sorunları Çözme” ile ne ilgisi var?
Sarkan başka problem hakkındaki Wikipedia makalesinden bu cümleyi anlamıyorum : [Sarkan Başka problem] derleyici yapımında, özellikle de tarayıcısız ayrıştırmada ortaya çıkan bir sorundur. Birisi bana tarayıcısız ayrıştırma tekniklerinin bu sorunu nasıl daha da kötüleştirebileceğini açıklayabilir mi? Bana öyle geliyor ki problem dilbilgisi ile ilgili - belirsiz olduğu için - ayrıştırma …

5
Şirketimin gizli araştırma kodundan açık kaynak kodlu sürümler çıkarmayı en iyi nasıl yapabilirim?
Şirketim (onlara Acme Technology diyelim) başlangıçta Acme Labs araştırma grubundan gelen, birkaç yıl boyunca bir geliştirme grubunda inkübe edilen ve daha yakın zamanda bir avuç müşteriye sağlanan yaklaşık bin kaynak dosyadan oluşan bir kütüphaneye sahip ifşa. Acme, kodun belki de% 75'ini açık kaynak topluluğuna bırakmaya hazırlanıyor. Diğer% 25 daha sonra …

6
İnsan tarafından okunabilir en basit yapılandırma dosyası biçimi nedir? [kapalı]
Kapalı . Bu soru görüş temelli . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Bu yayını düzenleyerek gerçekler ve alıntılarla yanıtlanabilmesi için soruyu güncelleyin . 5 yıl önce kapalı . Geçerli yapılandırma dosyası aşağıdaki gibidir: mainwindow.title = 'test' mainwindow.position.x = 100 mainwindow.position.y = 200 mainwindow.button.label = 'apply' …

3
HL7 mesajlarıyla çalışırken hangi sorunlar ortaya çıkar?
Sağlık işletmeleri için bir ürünü test ediyorum ve HL7 mesajları ile çalışıyoruz. İnsanların HL7 ile ilgili sorunlar hakkında başka bir soru üzerinde inlediğini gördüm, ancak ayrıntılardan bahsetmedim. Birisi bana özellikle hangi konuları veya sorun sınıflarını aramamız gerektiğine dair bazı fikirler verebilir mi? Ayrıştırma için bazı iyi kullanılmış kütüphaneler kullanıyoruz. Bunlarla …
13 testing  parsing  hl7 

2
Kalıcı doğal dil işleme ayrıştırılmış verileri
Son zamanlarda Stanford'un CoreNLP'sini kullanarak doğal dil işleme (NLP) ile denemeye başladım ve NLP ayrıştırılmış verileri bir metin madenciliği uygulaması gibi bir şey için depolamanın standart yollarının neler olduğunu merak ediyorum? İlginç olabileceğini düşündüğüm bir yol, çocukları bir bitişik liste olarak saklamak ve özyinelemeli sorguları iyi kullanmaktır (Postgres bunu destekliyor …

3
Ayrıştırıcı için bir gramer nasıl belirtmeliyim?
Uzun yıllardır program yapıyorum, ancak beni hala uzun süren bir görev, bir ayrıştırıcı için bir dilbilgisi belirtmektir ve bu aşırı çabadan sonra bile, bulduğum dilbilgisinin iyi olduğundan emin değilim ( makul herhangi bir "iyi" ölçüsü ile). Bir dilbilgisi belirtme sürecini otomatikleştirmek için bir algoritma olmasını beklemiyorum, ancak umarım mevcut yaklaşımımın …

2
Layman'ın terimleriyle, özyineleme nedir?
Code.google.com adresindeki bir sayfaya göre , "sol özyineleme" şu şekilde tanımlanır: Sol özyineleme, yalnızca kendisini içeren bir cümle formu ürettiğinde, üretim kuralının solunda kendisinin yeni bir kopyasının göründüğü yinelemeli nonterminal anlamına gelir. Wikipedia iki farklı tanım sunar: Bağlamdan bağımsız dilbilgisi açısından, r'nin herhangi bir prodüksiyonunda ('alternatifler') herhangi birindeki en soldaki …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.