Son zamanlarda bu alanda dört kitap okudum:
Feldman, R. ve James Sanger, J. (2006). Metin Madenciliği El Kitabı: Yapılandırılmamış Verilerin Analizinde İleri Yaklaşımlar. Cambridge Üniversitesi Yayınları.
Bu, pratik örnekler, yazılım ve uygulamalı metin madenciliği üzerine odaklanmaktadır. Metin madenciliğinin pratik kullanımına ilişkin çok sayıda örnek verir. Metin madenciliği araçlarının ticari uygulamaları hakkında bilgi edinmek isterseniz ilgi çekici olabilir.
Srivastava, AN ve Sahami, M. (2009). Metin Madenciliği: Sınıflandırma, Kümeleme ve Uygulamalar. Chapman ve Salon / CRC.
Farklı metin madenciliği araçlarının kullanım örnekleri olarak kullanılan bir dizi araştırma makalesidir. Giriş sınavı için çok fazla odaklanmıştır.
Weiss, SM, Indurkhya, N., Zhang, T. ve Damerau, F. (2005). Metin Madenciliği: Yapılandırılmamış Bilgilerin Analizinde Tahmin Yöntemleri.
Springer.
Bazı genel sorunları tanımlayan çok tanıtıcı bir metin.
Manning, C. (1999). İstatistiksel Doğal Dil İşlemenin Temelleri. MIT tuşuna basın.
Bu konuda zaten okuduğum en iyi kitap. İyi yazılmıştır, açıktır, teoriye derinlemesine girer, ancak uygulama dostu bir şekilde. Genel tanıtım ile başlar, ancak en sık kullanılan yöntem ve algoritmaların bazılarını gözden geçirir. Sadece tek bir kitap seçmek zorunda kalırsanız, bunu tavsiye ederim.
Doğal dil işleme ve metin madenciliği üzerine R ( tm kütüphanesi) veya Python ( nltk kütüphanesi) kullanmaya odaklanan birden fazla kitap da kolayca bulabilirsiniz .