Atomik olmayan verileri tahmin için bir özellik olarak kullanmak istiyorum. Bu özelliklere sahip bir Tablom olduğunu varsayalım:
- Column 1: Categorical - House
- Column 2: Numerical - 23.22
- Column 3: A Vector - [ 12, 22, 32 ]
- Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [ Boolean, Categorical ] ]
- Column 5: A List [ 122, Boolean ]
Örneğin Sütun 2'yi tahmin etmek / sınıflandırmak istiyorum.
Sorulara, "Foo Nerede Doğdu?" Gibi her türlü soruya otomatik olarak yanıt verecek bir şey yapıyorum. ...
Önce bir arama motoruna bir sorgu yapmak, sonra sonuç olarak bazı metin verileri almak, sonra tüm ayrıştırma şeyler (etiketleme, stemming, ayrıştırma, bölme ...)
İlk yaklaşımım bir tablo, her satırda bir metin satırı ve "İlk Kelime", "İlk Kelimenin Etiketi", "Parçalar", vb.
Fakat bu yaklaşımla cümleler arasındaki ilişkileri kaçırıyorum.
Ağaç yapılarının (veya vektörlerin) içine bakan ve ilişkileri yapan ve tahmin / sınıflandırma için uygun olan her şeyi elde eden bir algoritma olup olmadığını bilmek istiyorum. Bunu yapmak zorunda olduğum bir algoritma yerine bunu yapan bir kütüphane hakkında bilmek istiyorum.