Bunu kullanmayı denedim ama işe yaramadı-
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
Bunu kullanmayı denedim ama işe yaramadı-
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
Yanıtlar:
Kullanın [^A-Za-z0-9]
.
Not: alan tipik olarak alfasayısal kabul edilmediğinden kaldırıldı.
Deneyin
return value.replaceAll("[^A-Za-z0-9]", "");
veya
return value.replaceAll("[\\W]|_", "");
return value.replaceAll("\\W", "");
[^a-zA-Z]
AZ / az karakter aralığında kendiliğinden olmayan karakterlerin yerini alacağının farkında olmalısınız . Bu é
, ß
vb. Gibi özel karakterlerin veya kiril karakterlerinin kaldırılacağı anlamına gelir .
Bu karakterlerin değiştirilmesi istenmiyorsa, bunun yerine önceden tanımlanmış karakter sınıflarını kullanın:
str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");
PS: \p{Alnum}
bu etkiyi elde etmez, aynı şekilde davranır [A-Za-z0-9]
.
[^\\p{IsAlphabetic}\\p{IsDigit}]
iyi çalışıyor.
{IsDigit}
benim için {Digit}
çalışmıyor ve bunu Android'de deniyorum. Ve Android UNICODE_CHARACTER_CLASS
varsayılan olarak açıktır. Açıklık için teşekkürler.
Dosya adları oluşturmak için bu yöntemi yaptım:
public static String safeChar(String input)
{
char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
char[] charArray = input.toString().toCharArray();
StringBuilder result = new StringBuilder();
for (char c : charArray)
{
for (char a : allowed)
{
if(c==a) result.append(a);
}
}
return result.toString();
}
value.replaceAll("[^A-Za-z0-9]", "")
[^abc]
Bir düzeltme işareti^
köşeli parantez içindeki ilk karakter olarak göründüğünde, deseni reddeder. Bu desen, a veya b veya c dışında herhangi bir karakterle eşleşir.
Anahtar kelimeye iki işlev olarak bakmak:
[(Pattern)] = match(Pattern)
[^(Pattern)] = notMatch(Pattern)
Üstelik bir kalıpla ilgili olarak:
A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=9 = all characters included from 0 to 9
Bu nedenle, desende yer almayan tüm karakterlerin yerine geçecektir
Ascii karakter kümesine ait olmayan alfasayısal karakterlere de izin vermek istiyorsanız, örneğin alman umlaut'ları gibi, aşağıdaki çözümü kullanmayı düşünebilirsiniz:
String value = "your value";
// this could be placed as a static final constant, so the compiling is only done once
Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);
value = pattern.matcher(value).replaceAll("");
UNICODE_CHARACTER_CLASS bayrağını kullanmanın performans cezasına neden olabileceğini lütfen unutmayın (bu bayrağın javadocuna bakın)
Basit yöntem:
public boolean isBlank(String value) {
return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}
public String normalizeOnlyLettersNumbers(String str) {
if (!isBlank(str)) {
return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
} else {
return "";
}
}
public static void main(String[] args) {
String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";
System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));
}
çıktı: ChlamydiasppIgGIgMIgAAbs8006
Github: https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java
Guava en CharMatcher özlü çözüm sağlar:
output = CharMatcher.javaLetterOrDigit().retainFrom(input);