Нейросеть ВКонтакте умеет создавать новостные заголовки на русском и английском языках
Отличный инструмент для умного сокращения постов в ленте пользователя или автоматического создания новостных дайджестов.
Команда прикладных исследований ВКонтакте создала нейросеть для генерации новостных заголовков на русском и английском языках, использовав для обучения статьи агентства «РИА Новости» и издания The New York Times. Модель обрабатывает текст и формулирует заголовок из фрагментов слов, подставляя правильные падежи и склонения так, чтобы в итоге получилось связное предложение.
Результат работы ИИ оценивали по тому, насколько автоматический заголовок соответствовал оригинальному, написанному человеком. В некоторых случаях нейросеть разработчиков ВКонтакте показала себя лучше, чем другие существующие подходы. Однако с помощью стандартных метрик сложно оценивать случаи, когда автоматические и оригинальные заголовки совершенно различны, при этом смысл новости правильно передаёт и тот, и другой. Чтобы проверить качество работы модели в таких ситуациях, разработчики провели отдельное исследование, в котором показывали добровольцам новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% — даже лучше.
Даниил Гаврилов Разработчик-исследователь ВКонтакте |
«Исследование с добровольцами показало, что заголовки, созданные нейросетью, пока не всегда получаются такими же качественными, как написанные человеком. Однако мы не перестаём улучшать модель — и непременно добьёмся равных результатов. Наша и другие разработки помогут быстро выделять главную мысль из длинных текстов — это действительно полезно, ведь информации вокруг нас уже много и становится только больше. Использоваться технология может для самых разных задач, связанных с удобством потребления контента — например, ВКонтакте её потенциально можно применить для умного сокращения постов в ленте пользователя или для создания новостных дайджестов».
IT-конференция МТС True Tech Day 17 мая
Что будет:
- 5 тематических треков: Main, Development, AI/ML, Cloud, Science;
- 50 спикеров с докладами про архитектуру, облачные платформы, NLP4Code, вероятностное программирование, безопасность контейнеров и другое;
- 10 часов нетворкинга;
- Цифровые зоны и digital-интеграции;
- А ещё вечеринка со звездой.