Sinir ağı ile denemeye başlamak istedim ve bir oyuncak problemi olarak birini sohbet etmek için eğitmek istedim, yani cleverbot gibi bir sohbet botu uygulamak istedim. Zekice değil.
Bazı belgelere baktım ve genel görevler hakkında çok sayıda öğretici buldum, ancak bu konuda çok az şey buldum. Bulduğum kişi, uygulama hakkında bilgi vermeden sonuçları ortaya çıkardı. Yapanlar, oldukça sığ mı (seq2seq'deki tensorflow dokümantasyon sayfasında imho yok).
Şimdi, prensibi az çok anladığımı hissediyorum ama emin değilim ve nasıl başlayacağımdan bile emin değilim. Böylece sorunu nasıl çözeceğimi açıklayacağım ve bu çözüm hakkında bir geri bildirim almak istiyorum, nerede olduğumu söylüyorum ve muhtemelen süreç hakkında ayrıntılı açıklamalar ve pratik bilgilerle herhangi bir bağlantım var.
Görev için kullanacağım veri seti tüm facebook ve whatsapp sohbet geçmişimin dökümü. Ne kadar büyük olacağını bilmiyorum ama muhtemelen yeterince büyük değil. Hedef dil ingilizce değil, bu yüzden anlamlı konuşma örneklerini nerede hızlı bir şekilde toplayacağımı bilmiyorum.
Her cümlenin içinden bir düşünce vektörü oluşturacağım. Hala nasıl olduğunu bilmiyorum; Deeplearning4j web sitesinde word2vec için güzel bir örnek buldum, ancak cümle için hiçbiri. Kelime vektörlerinin nasıl oluşturulduğunu ve nedenini anladım, ancak cümle vektörleri için kapsamlı bir açıklama bulamadım.
Düşünce vektörlerini girdi ve çıktı olarak kullanarak sinir ağını eğiteceğim. Kaç katmanı olması gerektiğini ve hangilerinin lstm katmanları olduğunu bilmiyorum.
Sonra bir düşünce vektörünü bir cümle oluşturan bir karakter dizisine dönüştürebilen başka bir sinir ağı olmalıdır. Ben farklı cümle uzunlukları telafi etmek için dolgu kullanmanız gerektiğini okudum, ama karakterleri (kod noktaları yeterli mi) kodlamak için özledim.