Sohbet botu eğitmek için en yeni yöntemler nelerdir?


11

Metin girişi kullanan, birkaç kategoriyi ezberleyen ve buna göre soruları cevaplayan bir bot eğitmek istiyorum. Sürüm 2.0'a ek olarak, botun ses girişlerini de cevaplamasını istiyorum. Aynı şey için mevcut olan en yeni makine öğrenimi / AI algoritmaları hangileri? Lütfen bana haber ver.


dinamik bellek-sinir ağlarını kontrol
riemann77

Symantic-math eşleştirmeyi kullanmayı düşünün .
Sergei

Yanıtlar:



0

Botunuz birkaç kategoriyi "hatırlıyor" ve ardından soruları cevaplıyorsa, mevcut senaryoda oldukça işe yaramaz. çünkü bu durumda farklı bir veri kümesinde (test seti) çok kötü performans gösterir. istatistik terminolojisinde buna "aşırı sığdırma" denir. ve soru cevaplamaya gelince, "son teknoloji" algoritmaları tanımlamak için bir kural yoktur. Bununla birlikte, babi veya benzer veri kümelerinde dinamik olarak çalışan dinamik bellek ağları veya seQ2seQ modellerinde iyi performans gösteren birkaç modeli kontrol edebilirsiniz. Bu alan hakkında temel bir fikir edinmek için, temel makine öğrenimi dil öğrenmeyi ve daha sonra bazı ileri-doğal dil işleme kursuna geçmenizi öneririm (stanford cs224n sunar).


0

AbuShawar ve Atwell Eyaleti:

Chatbot, kullanıcılarla doğal dili kullanarak sırayla etkileşim kuran bir sohbet aracısıdır. Sözlü veya yazılı iletişim kullanılarak farklı sohbet botları veya insan-bilgisayar diyalog sistemleri geliştirilmiştir ve dilsel araştırma, dil eğitimi, müşteri hizmetleri, web sitesi yardımı ve eğlence gibi farklı alanlarda uygulanmıştır.

Onlarınki ve diğer bildiriler bu yazıdan itibaren chatbot eğitimine çağdaş yaklaşımlardan bazılarını aktarmaktadır.

Doğal Diyalog Corpora'dan Chatbot Eğitim Verilerinin Otomatik Çıkarılması , Bayan AbuShawar, Eric Atwell, 2016

Bununla birlikte, çoğu sohbet botu, dosyalarında manuel olarak bulunan bilgiyle ve yazılı veya konuşulan belirli bir doğal dille sınırlıdır. Bu makale, makine tarafından okunabilir bir metni (corpus) belirli bir chatbot biçimine dönüştürmek için geliştirdiğimiz programı sunar; Farklı corpora kullanıldı: İngiliz Ulusal Corpus (BNC) gibi diyalog corpora; ayetin ve takip eden ayetin dönüş olduğu monolog bir yapı olan İslam Kur'an'ın kutsal kitabı; ve soruların ve cevapların bir çift dönüş olduğu SSS. Bu otomasyon sürecinin temel amacı, corpus'a göre farklı dilleri konuşan farklı chatbot prototipleri üretebilmektir.

Parametrelendirilmiş Yardımcı Takviye Öğrenme , Bağlam-Belirsizlik-Duyarlı Chatbot Eylem Seçimi , Chuandong Yin, Rui Zhang, Jianzhong Qi, Yu Sun ve Tenglun Tan, 2018

Bağlam belirsizliğini bilen bir sohbet botu ve sohbet botunu eğitmek için bir takviye öğrenme (RL) modeli öneriyoruz. Önerilen modele Parametreli Yardımcı Asenkron Avantaj Aktör Kritiği (PA4C) adı verilmiştir. Bir konuşma bağlamında kullanıcıların ifade güveninin belirsizliğini simüle etmek için bir kullanıcı simülatörü kullanıyoruz. Naif kural tabanlı yaklaşımlarla karşılaştırıldığında, PA4C modeli ile eğitilmiş sohbet botumuz el yapımı eylem seçimini önler ve kullanıcı söyleme varyansı için daha sağlamdır. PA4C modeli, büyük bir eylem alanı ve sıfır ödül durumlarının sorunlarını ele alan chatbot eğitimi için eylem parametreleme ve yardımcı görevlere sahip geleneksel RL modellerini optimize eder. PA4C modelini, takvim etkinliği oluşturma görevleri için bir chatbot eğitimi üzerinde değerlendiriyoruz.

Chatbot Etkileşimini Kullanarak Denetimli Öğrenme Sistemi Eğitimi , Amerika Birleşik Devletleri Patent Başvurusu Yayını 0034828 A1, International Business Machines Corporation, Armonk, NY, ABD, 2019

Veri noktasının parametrelerini belirlemek için bir veri noktasının alınmasını ve analiz edilmesini, veri noktasının analizine dayalı bir uyarı bileti oluşturmayı, bir sohbet botu aracılığıyla, uyarı biletinde yer alan en azından bazı bilgileri biriyle iletişim kurmayı içeren, bilgisayar tarafından uygulanan bir yöntem. veya daha fazla kullanıcı ve sohbet noktası aracılığıyla veri noktasını oluşturan bir cihazın davranışına göre uyarı biletiyle sonuçlanan veri noktasını kategorilere ayırma. Jonathan A. Cagadas, Alexander D. Lewitt, Simon D. Mikulcik, Karan Shukla, Leigh A. Williamson

Küçük Diyalog Corpus , Jintae Kim, Hyeon-Gu Lee, Harksoo Kim, Yeonsoo Lee, Young-Gil Kim, 2016 ile Generatif Chatbot Uygulamak İçin İki Adımlı Eğitim ve Karışık Kodlama-Kod Çözme

Sıralı sıralı ağlara dayanan üretken sohbet botu modelleri, eğitim verisi olarak büyük bir diyalog kuruluşu kullanıldığında doğal konuşma etkileşimleri oluşturabilir. Bununla birlikte, İngilizce ve Çince gibi birkaç dil dışında, büyük bir diyalog topluluğu toplamak hala zor. Bu sorunu çözmek için, kod çözme / kod çözme birimleri olarak bir kelime ve hece karışımı kullanarak bir chatbot modeli öneriyoruz. Ek olarak, büyük bir diyalog olmayan korpus kullanarak ön eğitim ve küçük bir diyalog corpus kullanarak yeniden eğitim içeren iki aşamalı bir eğitim yöntemi öneriyoruz. Deneylerimizde, karışım birimlerinin kelime-dışı (OOV) problemlerini azaltmaya yardımcı olduğu gösterilmiştir. Ayrıca, iki adımlı eğitim yöntemi, sohbet botu küçük bir diyalog kurumu kullanılarak eğitildiğinde yanıtlardaki dilbilgisel ve anlamsal hataları azaltmada etkili oldu (533,

Cümle Gömmelerine Dayalı Hedef Odaklı Chatbot Eğitimi için Alt Modülden Esinlenen Veri Seçimi , Mladen Dimovski, Claudiu Musat, Vladimir Ilievski, Andreea Hossmann, Michael Baeriswyl, 2018

Hedefe yönelik sohbet botları veya kişisel asistanlar gibi konuşulan dil anlama (SLU) sistemleri, amacı belirlemek ve girdi olarak aldıkları kullanıcı sorgularından ilgili bilgileri çıkarmak için bir başlangıç ​​doğal dil anlama (NLU) modülüne güvenir. SLU sistemleri genellikle kullanıcıların nispeten dar alanlardaki sorunları çözmelerine yardımcı olur ve çok sayıda alan içi eğitim verisi gerektirir. Bu, başarılı sistemlerin geliştirilmesini engelleyen önemli veri kullanılabilirliği sorunlarına yol açar. Bu sorunu hafifletmek için, düşük veri rejiminde daha az etiketli cümleyle, dolayısıyla daha küçük etiketleme maliyetleriyle eğitim almamızı sağlayan bir veri seçimi tekniği öneriyoruz. Alt modellerden esinlenen bir veri sıralama fonksiyonu, oran-ceza marjinal kazancı, yalnızca metin yerleştirme alanından çıkarılan bilgilere dayalı olarak etiketlenecek veri noktalarını seçmek için. Gömme alanındaki mesafelerin, veri seçimi için kullanılabilecek uygun bir bilgi kaynağı olduğunu gösteriyoruz. Metodumuz bilinen iki aktif öğrenme tekniğinden daha iyi performans gösterir ve NLU ünitesinin düşük maliyetli eğitimini sağlar. Ayrıca, önerilen seçim tekniğimizin, modelin seçim adımları arasında yeniden eğitilmesi gerekmediği için zaman açısından da verimli hale getirilmesi gerekmektedir.


-1

LSTM veya GRU ile Tekrarlayan Sinir Ağları ile bellek hücreleri ve Word2vec gibi kelime düğünleri olarak çalışabilirsiniz. Işın arama ve Dikkat modelleri, daha fazla sağlamlık ve daha az yanlılık için RNN'lerle de kullanılabilir. Ancak bunların çıktıları, ancak bu alandaki araştırmaların hala sıcak ve çözülecek çok fazla olması nedeniyle bir dereceye kadar takdir edilebilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.