Сначала учат на корпусе диалогов из фильмов, затем дообучивают на корпусе из чатов.
Затем подключается человек.
На каждом шаге сеть генерирует пять возможных ответов. Человек выбирает из предложенных вариантов, либо предлагает свой ответ.
One-shot learning делается через очень высокий learning rate