«string-matching» etiketlenmiş sorular

Dize eşleştirme, bir dizenin ("desen", "iğne") diğerinde ("metin", "samanlık") oluşumlarını bulma sorunudur.





22
Değişken uzunluklu dizeler için daha iyi bir benzerlik sıralama algoritması
Genellikle önerilenlerden (levenshtein mesafe, soundex, vb.) Değişken uzunluk dizeleri daha iyi sonuçlar veren bir dize benzerlik algoritması arıyorum. Örneğin, A dizesi verildiğinde: "Robert", Sonra B dizesi: "Amy Robertson" daha iyi bir eşleşme olurdu Dize C: "Richard" Ayrıca, tercihen, bu algoritma dil bilimi içermemelidir (ayrıca İngilizce dışındaki dillerde de kullanılabilir).

2
Python'da yüksek performanslı bulanık dize karşılaştırması, Levenshtein veya difflib [kapalı] kullanın
Kapalı . Bu soru fikir temelli . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek mi istiyorsunuz? Bu gönderiyi düzenleyerek gerçekler ve alıntılarla cevaplanabilmesi için soruyu güncelleyin . 4 yıl önce kapalı . Bu soruyu geliştirin Her bir kelimeyi 900.000 kelimelik tıbbi sözlüğe karşı kontrol ettiğim klinik mesaj normalleştirme (yazım …



11
Mantıklı Javascript bulanık arama
Bir diziyi filtrelemek için bulanık arama JavaScript kitaplığı arıyorum. Fuzzyset.js ve fuse.js kullanmayı denedim , ancak sonuçlar korkunç (bağlantılı sayfalarda deneyebileceğiniz demolar var). Levenshtein mesafesi hakkında biraz okuma yaptıktan sonra, kullanıcıların yazarken ne aradıklarına dair zayıf bir yaklaşım olarak bana çarpıcı geliyor. Bilmeyenler için, sistem iki dizeyi eşleştirmek için kaç …

15
Geçerli bir yılı test etmek için Normal İfade Eşlemesi
Bir değer verildiğinde, geçerli bir yıl olup olmadığını kontrol etmek için doğrulamak istiyorum. Ölçütlerim, değerin 4karakterli bir tam sayı olması gerektiği yerde basittir . Bunun en iyi çözüm olmadığını biliyorum çünkü yıllar öncesine 1000izin vermeyecek ve yıllara da izin verecek 5000. Bu kriter mevcut senaryom için yeterlidir. Ortaya çıkardığım şey …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.