Metin madenciliği ile ilgili iyi kitaplar mı?


11

Merhaba Metin madenciliği ve sınıflandırma konusunda bazı vaka çalışmaları ile iyi kitaplar olup olmadığını bilmek istedim ?. Eğer olmasaydı halka açık bazı makaleler / dergiler yapardı. Örneklerini R ile daha iyi gösterirlerse. Adım adım el kitabı aramıyorum, ancak çeşitli problem sınıflarına çeşitli metin madenciliği yaklaşımlarının artılarını ve eksilerini gösteren bir şey.

Yanıtlar:


5

Check out http://lintool.github.com/MapReduceAlgorithms/MapReduce-book-final.pdf MapReduce ile Veri Yoğun Metin İşleme - bu kitap oldukça akademik ama kapaklarını yaygın olarak kullanılan bir metin işleme tekniklerinin sayısı ve nasıl parrallised edilebilir harita kullanarak büyük veri kümesi üzerinde azaltmak.

www.rtexttools.com Bu, metin analitiğine çok çeşitli sınıflandırma algoritmaları (bazı topluluk yöntemleri dahil) uygulamanıza yardımcı olan mükemmel bir R paketidir. ve


4
Bu yanıtı bağımsız yapmak için her bağlantının kısa bir özetini sunabilir misiniz?
chl

4

Son zamanlarda bu alanda dört kitap okudum:

Feldman, R. ve James Sanger, J. (2006). Metin Madenciliği El Kitabı: Yapılandırılmamış Verilerin Analizinde İleri Yaklaşımlar. Cambridge Üniversitesi Yayınları.

Bu, pratik örnekler, yazılım ve uygulamalı metin madenciliği üzerine odaklanmaktadır. Metin madenciliğinin pratik kullanımına ilişkin çok sayıda örnek verir. Metin madenciliği araçlarının ticari uygulamaları hakkında bilgi edinmek isterseniz ilgi çekici olabilir.

Srivastava, AN ve Sahami, M. (2009). Metin Madenciliği: Sınıflandırma, Kümeleme ve Uygulamalar. Chapman ve Salon / CRC.

Farklı metin madenciliği araçlarının kullanım örnekleri olarak kullanılan bir dizi araştırma makalesidir. Giriş sınavı için çok fazla odaklanmıştır.

Weiss, SM, Indurkhya, N., Zhang, T. ve Damerau, F. (2005). Metin Madenciliği: Yapılandırılmamış Bilgilerin Analizinde Tahmin Yöntemleri. Springer.

Bazı genel sorunları tanımlayan çok tanıtıcı bir metin.

Manning, C. (1999). İstatistiksel Doğal Dil İşlemenin Temelleri. MIT tuşuna basın.

Bu konuda zaten okuduğum en iyi kitap. İyi yazılmıştır, açıktır, teoriye derinlemesine girer, ancak uygulama dostu bir şekilde. Genel tanıtım ile başlar, ancak en sık kullanılan yöntem ve algoritmaların bazılarını gözden geçirir. Sadece tek bir kitap seçmek zorunda kalırsanız, bunu tavsiye ederim.

Doğal dil işleme ve metin madenciliği üzerine R ( tm kütüphanesi) veya Python ( nltk kütüphanesi) kullanmaya odaklanan birden fazla kitap da kolayca bulabilirsiniz .


2

Bu, tam olarak aradığınız şey için uygun olmayabilir, ancak Jeffrey Friedl'in Düzenli İfadelere hakim olma, metni ayrıştırmak için düzenli ifadelerin nasıl kullanılacağını öğrenmek için harika bir kaynaktır. Modelleme tekniklerini tartışmaz, ancak düzenli ifadeler uygulamaktan kaynaklanan sayılarla donanmış olarak, çeşitli standart modelleme yaklaşımları uygulayabilirsiniz.


2

Fikirler için defalarca geri döndüğüm bir kitap Metin Madenciliği: Tahmin Yöntemleri ... Sholom Weiss. Metin madenciliği farklı şeyler denemekle ilgili olduğu için yararlı bulduğum problemlere yaklaşmak için birçok fikre sahiptir - Global vs Yerel sözlük, saklanacak özellik sayısı, vb. Bu kitabı iyi bir fikir üreticisi olarak görüyorum. Ayrıca vaka çalışmaları vardır.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.