Python re'de, rakamsaldan büyük harfli alfa'ya yayılabilir. Yani..
import re
test = "01234ABCDEFGHIJKabcdefghijk01234abcdefghijkABCDEFGHIJK"
re.compile(r'[0-f]+').findall(test) # Bad: matches all uppercase alpha chars
## ['01234ABCDEFGHIJKabcdef', '01234abcdef', 'ABCDEFGHIJK']
re.compile(r'[0-F]+').findall(test) # Partial: does not match lowercase hex chars
## ['01234ABCDEF', '01234', 'ABCDEF']
re.compile(r'[0-F]+', re.I).findall(test) # Good
## ['01234ABCDEF', 'abcdef', '01234abcdef', 'ABCDEF']
re.compile(r'[0-f]+', re.I).findall(test) # Good
## ['01234ABCDEF', 'abcdef', '01234abcdef', 'ABCDEF']
re.compile(r'[0-Fa-f]+').findall(test) # Good (with uppercase-only magic)
## ['01234ABCDEF', 'abcdef', '01234abcdef', 'ABCDEF']
re.compile(r'[0-9a-fA-F]+').findall(test) # Good (with no magic)
## ['01234ABCDEF', 'abcdef', '01234abcdef', 'ABCDEF']
Bu en basit Python UUID normal ifadesini yapar:
re_uuid = re.compile("[0-F]{8}-([0-F]{4}-){3}[0-F]{12}", re.I)
Bunların performansını karşılaştırmak için timeit kullanmak için okuyucuya bir egzersiz olarak bırakacağım.
Zevk almak. Pythonic ™ 'i saklayın!
NOT: Bu açıklıklar da eşleşecektir :;<=>?@'
, size yanlış pozitifler verebileceğinden şüpheleniyorsanız, kısayolu almayın. (Bunu yorumlarda belirttiğiniz için Oliver Aubert'e teşekkür ederiz.)