Unicode'da belki 50 boşluk var
\ U0009 \ u000A- \ u000D \ u0020 \ u0085 \ u00A0 \ u1680 \ u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ U3000] [\ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u00A0 \ u1680 \ u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ U3000
ve 6 satır sonu
sadece CRLF, LF, CR değil, aynı zamanda NEL (U + 0085), PS (U + 2029) ve LS (U + 2028).
Belki boşlukların ve PS'nin ("Paragraf ayırıcı") çoğunu anlayabilirdim, ancak "Sonraki Satır" ve "Satır ayırıcı" ne işe yarar?
Her şey, herkesin kendi alanlarını istediği ve liderlere her biri bir satır sonu verilen çok büyük bir komite tarafından icat edilmiş gibi görünüyor. Ama cidden, programlama diliniz desteklemediğinde (veya örneğin Java'nın yaptığı gibi yanlış olduğunda) bununla nasıl başa çıkıyorsunuz?
Pattern.compile2010
geçen yıl tanımına göre çalışan normal ifadeleri döndüren bir yöntem oluşturmakta serbesttirler . Ayrıca Pattern.compileLatestUTS
, anlamın yeni spesifikasyona göre değişeceğini açıkça belirten bir yöntem oluşturmakta serbesttirler .