Online Sequence-to-Sequence Active Learning for Open-Domain Dialogue Generation

Модель

Что?
Обучение разговорного бота с помощью человека посередине
Формализация
Модель состоит из однослойного seq2seq решения на LSTM

Обучение

Процедура
Сначала учат на корпусе диалогов из фильмов, затем дообучивают на корпусе из чатов.
Затем подключается человек.
На каждом шаге сеть генерирует пять возможных ответов. Человек выбирает из предложенных вариантов, либо предлагает свой ответ.
One-shot learning делается через очень высокий learning rate
   Login to remove ads X
Feedback | How-To