Birçoğumuz kullanıcı girişi, arama sorguları ve giriş metninin potansiyel olarak küfür veya istenmeyen dil içerebileceği durumlarla ilgilenmemiz gerekir. Çoğu zaman bunun filtrelenmesi gerekir.
Çeşitli dillerde ve lehçelerde yeminli kelimelerin iyi bir listesini nerede bulabilirim?
İyi listeler içeren kaynaklar için kullanılabilir API'lar var mı? Ya da belki bazı parametrelerle "evet bu temiz" veya "hayır bu kirli" diyen bir API?
$$, azz veya a55 gibi sistemi kandırmaya çalışan insanları yakalamak için iyi yöntemler nelerdir?
PHP için çözüm sunarsanız bonus puanları. :)
Düzenleme: Programlı sorundan kaçının diyen yanıtlara yanıt:
Örneğin, bir kullanıcı hassas bir topluluk havuzuna eklenen resimleri bulmak için genel resim aramasını kullanabildiğinde bu tür bir filtre için bir yer olduğunu düşünüyorum. Eğer "penis" arayabilirlerse, büyük olasılıkla pek çok resim alacaklardır, evet. Bunun resimlerini istemiyorsak, kelimenin bir arama terimi olarak önlenmesi, kabul edilebilir bir yöntem olmasa da, iyi bir bekçi. Kelime listesini ilk etapta almak asıl soru.
Bu yüzden gerçekten tek bir token kirli olup olmadığını anlamak için bir yol söz ve sonra sadece izin vermeyin. Tamamen komik "uzun boyunlu zürafa" referansı gibi bir duyguyu engellemekten rahatsız olmazdım. Orada yapabileceğiniz hiçbir şey yok. :)