ИИ-боты Alibaba и Microsoft превзошли человеческий уровень понимания текста
Впервые.
ИИ-программы Alibaba Group и Microsoft Research Asia набрали 82,44 и 82,65 балла в тесте на понимание прочитанного текста Stanford Question Answering Dataset. Тест состоит из более чем 100 тысяч вопросов о содержании 500+ статей на Википедии. Лучший человеческий результат составляет 82.304 балла.
В отличие от успехов в логических играх, понимание текста даётся машинам куда сложнее, чем людям. Алгоритм впервые обошёл человека по данному показателю.
Научный руководитель отдела по обработке естественного языка исследовательской группы Alibaba Си Луо (Si Luo) рассказал, что программы с новым уровнем понимания текста смогут точно отвечать на текстовые запросы типа «Откуда берётся снег?».
«Мы уверены, что такие технологии постепенно можно будет использовать в разнообразных сценариях: от обслуживания клиентов до образования, от онлайн-поддержки до телемедицины. Что, в свою очередь освободит колоссальные чеолвеческие ресурсы».
Исследователь также отметил, что пока система лучше справляется с вопросами, которые подразумевают однозначные ответы. Если текст слишком абстрактный, содержит ошибки или алгоритм не может обратиться к готовым ответам, бот не всегда понимает написанное.
Команда Си тесно сотрудничает с разработчиками Ali Xiaomi — чат-бота службы поддержки производителя смартфонов. Программа распознаёт вопросы клиентов и подбирает наиболее релевантные ответы из подготовленных документов.
Подумываете о создании собственного бота? Вот интересный кейс о том, как ребята своими силами создали чат-бота по имени Ольга Владимировна за 15 дней и 57 тысяч рублей.
Хотите подсказать новость или поделиться экспертным мнением? Пишите: news@cossa.ru
Успейте купить корпоративный пакет COSSA-2025 со скидкой!
Cossa анонсирует главный рекламный формат на весь 2025 год: сразу 8 различных опций.
Пакет идеально подходит для онлайн-сервисов, стартапов, интернет-компаний и digital-агентств.
Успейте приобрести пакет до повышения цены!