Искусственный интеллект самостоятельно обучит себя новым языкам. Читайте на Cossa.ru

01 декабря 2017, 12:10

Искусственный интеллект самостоятельно обучит себя новым языкам

  • Не нужны материалы для переводов.
  • Система работает без вмешательства человека.

Исследователи из Facebook и Университета Страны Басков представили новый метод машинного перевода, согласно которому ИИ может обучиться переводу без наличия уже переведённой базы текстов. Более того, система переводит без постоянного контроля со стороны людей.

«Представьте, что вы даёте человеку множество китайских и арабских книг — ни одна из них не дублирует содержание другой, — и человек должен научиться переводить с китайского языка на арабский. Это кажется невозможным, верно? Но мы показали, что компьютеру это под силу», — говорит учёный из Университета Страны Басков Микель Артекс (Mikel Artetxe).

ИИ ищет сочетания слов, которые часто употребляются вместе, независимо от языка. К примеру, «стол» и «стул». Выделяя и сравнивая подобные сочетания, система постепенно учится определять связь между различными терминами. При этом процесс протекает без участия человека. Таким образом, компьютеры со временем овладевают переводом целых предложений.

Другая система, созданная исследователем из Facebook Гийомом Лампле (Guillaume Lample), сочетает в себе сразу два процесса. Сначала искусственный интеллект переводит предложение с одного языка на другой «как получится», а затем снова переводит его на язык оригинала. Обычно при таком подходе первое предложение и то, что получилось после, не совпадают. Система ищет свои ошибки и перенастраивает протоколы.

Второй этап — «устранение шумов». Процесс проходит примерно так же, однако здесь из предложения убираются какие-то слова или добавляются новые. Так ИИ корректирует перевод в зависимости от употребления отдельных слов. Постепенно система начинает понимать, как нужно правильно говорить на том или ином языке.

Оба исследования ещё ждут оценок экспертов, но уже показали многообещающие результаты на этапе раннего тестирования. При переводе 30 миллионов предложений с английского на французский системы набрали по 15 баллов. Google Переводчик получил 40 баллов, а профессиональные переводчики — 50. Конечно, ИИ пока отстаёт от профессионального перевода человеком, однако он уже серьёзно продвинулся по сравнению с обычным дословным переводом.

Автор иконки на тизере: Claudiu Antohi, Noun Project

IT-конференция МТС True Tech Day 17 мая

Что будет:

  • 5 тематических треков: Main, Development, AI/ML, Cloud, Science;
  • 50 спикеров с докладами про архитектуру, облачные платформы, NLP4Code, вероятностное программирование, безопасность контейнеров и другое;
  • 10 часов нетворкинга;
  • Цифровые зоны и digital-интеграции;
  • А ещё вечеринка со звездой.
Все спикеры и темы уже на сайте. Регистрируйся на True Tech Day. Участие бесплатное.


Реклама. ПАО «МТС». ИНН 7740000076. ОГРН 1027700149124

Телеграм Коссы — здесь самый быстрый диджитал и самые честные обсуждения: @cossaru

📬 Письма Коссы — рассылка о маркетинге и бизнесе в интернете. Раз в неделю, без инфошума: cossa.pulse.is

✉️✨
Письма Коссы — лаконичная рассылка для тех, кто ценит своё время: cossa.pulse.is

Вход на cossa.ru

Уже есть аккаунт?
Авторизуйся через VK:
Vkontakte
Не забудьте написать email на странице своего профиля для управления рассылкой