Online Sequence-to-Sequence Active Learning for Open-Domain Dialogue Generation

Что?

Обучение разговорного бота с помощью человека посередине

Формализация

Модель состоит из однослойного seq2seq решения на LSTM

Процедура

Сначала учат на корпусе диалогов из фильмов, затем дообучивают на корпусе из чатов.

Затем подключается человек.

На каждом шаге сеть генерирует пять возможных ответов. Человек выбирает из предложенных вариантов, либо предлагает свой ответ.

One-shot learning делается через очень высокий learning rate