В рамках тестирования алгоритма, который помогает группировать посты «ВКонтакте» в ленте пользователей по схожим темам, разработчики соцсети создали бота, который отвечает на сообщения видероликами с фразами телеведущего Сергея Дружко.
Как рассказал в разговоре с TJ сотрудник «ВКонтакте» Павел Калайдин, для машинного анализа текста используется так называемые векторы —массивы чисел, передающие семантический смысл слов и предложений.
Каждому слову находится соответствующий вектор (в нашем случае 300-мерный). Как это происходит: берётся много текстов, на основе которых мы обучаем простую нейронную сеть, которая по слову предсказывает соседние слова.
С весов получившейся нейронной сети для каждого слова берём тот самый вектор. Этот процесс изобрели в Google несколько лет назад.
Векторы обладают прикольными свойствами: например? вектор «англия» плюс вектор «париж» минус вектор «франция» равняется вектору «лондон».
Павел Калайдин, разработчик «ВКонтакте»
По словам Калайдина, эта технология, например, позволяет узнавать, что пользователи пишут по какой-то одной теме и группировать схожие посты и поднять выше в ленте как наиболее важные.
Векторы также подаются на вход основной модели генерации ленты (что, например, позволяет определить, интересуется ли пользователь новостями в принципе).
Павел Калайдин, разработчик «ВКонтакте»
В качестве демонстрации работы этого алгоритма сотрудники «ВКонтакте» создали бота, который отвечает на сообщения пользователей с помощью коротких роликов с участием телеведущего Сергея Дружко, ставшего популярным мемом.
TJ протестировал работу бота, и чаще всего он действительно давал релевантные и даже комичные ответы. Например, на вопрос «Путин уйдёт?» машина выдала ролик с ведущим, покидающим страну.
Если же бота обвинить в глупости, то он тут же поставит мнение своего собеседника под сомнение.
В то же время зачастую бот просто дублирует по смыслу вопросы, которые ему задают, так что его можно использовать как инструмент для подбора роликов с Дружко. Например на вопрос «Что происходит?» он выдаёт ролик с фразой «Как и почему это произошло?»
—
Твитнуть
Поделиться
Поделиться
Нашли опечатку? Выделите фрагмент и отправьте нажатием Ctrl+Enter.