NLP'de sınıflandırma sürecinde Parse ağaçlarından genellikle hangi özellikler kullanılır?


13

Farklı ayrıştırma ağacı yapılarını araştırıyorum. Yaygın olarak bilinen iki ayrıştırma ağacı yapısı şunlardır: a) Kuruma dayalı ayrıştırma ağacı ve b) Bağımlılığa dayalı ayrıştırma ağacı yapıları.

Stanford NLP paketini kullanarak her iki tür ayrıştırma ağacı yapısını oluşturmak için kullanabilirsiniz. Ancak, sınıflandırma görevim için bu ağaç yapılarını nasıl kullanacağımdan emin değilim.

Örneğin, duygu analizi yapmak ve metni pozitif ve negatif sınıflara ayırmak istiyorsam, sınıflandırma görevim için ayrıştırma ağacı yapılarından hangi özellikleri türetebilirim?

Yanıtlar:


9

Bir ayrıştırma ağacı kullanarak cümlenizi parçalara ayırırsınız. Duygu analizi örneğinde, her bir parçaya pozitif / negatif bir duygu atamak için bu parçaları kullanabileceğinizi ve ardından bu parçaların kümülatif etkisini alacağınızı varsayalım.

duyarlılık analizi

Bu görüntü daha fazla anlamanıza yardımcı olacaktır. İlk yarının olumsuz bir duyarlılığı vardır (esas olarak "kuru" kelimesi nedeniyle), ancak "ama" kelimesi ve "zevk" kelimesinin kullanımı nedeniyle, olumsuz duyarlılık olumlu bir duyarlılığa dönüşür.

Bunları kullanmaya gelince , cümledeki sözcüklerin tek tek bir kelime vektörü temsilini oluşturabilir ve üst düğümlerin yerine nöronları kullanabilirsiniz. Her nöron ağırlıklar yoluyla başka bir nörona bağlanmalıdır. Tüm yaprak düğümleri cümlenin kelimelerinin kelime vektörü temsilleri olacaktır. Üst ebeveyn nöron (bu durumda üst mavi + sembolü) cümleye göre pozitif / negatif bir duygu üretmelidir. Bu ağaç yapısı denetimli bir şekilde eğitilebilir.

Daha fazla bilgi edinmek için bu makaleyi okuyun .

Fotoğrafçı: cs224.stanford.edu


1

Bağımlılıkların duygu sınıflandırıcısının doğruluğunu iyileştirmek için kullanılabileceğini düşünüyorum. Aşağıdaki örnekleri düşünün:

E1: Bill bir bilim adamı değil

ve "bilim insanı" jetonunun belirli bir alanda olumlu bir duyarlılığa sahip olduğunu varsayalım.

Neg bağımlılığını bilerek (bilim insanı değil) yukarıdaki örnekte olumsuz bir duygu olduğunu görebiliriz. Bu bağımlılığı bilmeden muhtemelen cümleyi pozitif olarak sınıflandırırdık.

Sınıflandırıcıların doğruluğunu arttırmak için muhtemelen aynı şekilde başka bağımlılık türleri de kullanılabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.