Binlerce dizgi listem var ve her listenin yaklaşık 10 dizesi var. Belirli bir listedeki dizelerin çoğu çok benzerdir, ancak bazı dizeler diğerleriyle tamamen ilgisizdir ve bazı dizeler alakasız kelimeler içerir. Kanonik bir ipin gürültülü varyasyonları olarak düşünülebilir. Her liste bu standart dizeye dönüştürecek bir algoritma veya kütüphane arıyorum.
İşte böyle bir liste.
- Yıldız Savaşları: Bölüm IV Yeni Bir Umut | StarWars.com
- Yıldız Savaşları Bölüm IV - Yeni Bir Umut (1977)
- Yıldız Savaşları: Bölüm IV - Yeni Bir Umut - Çürük Domates
- Star Wars: Episode IV - A New Hope Online Ücretsiz İzle
- Yıldız Savaşları (1977) - En Büyük Filmler
- [REC] 4 afiş dıştan takma motorla ölüm vaat ediyor - SciFiNow
Bu liste için, normal ifadeyle eşleşen herhangi bir dize ^Star Wars:? Episode IV (- )?A New Hope$
kabul edilebilir.
Andrew Ng'in Coursera'daki Machine Learning kursuna baktım, ancak benzer bir sorun bulamadım.