Google DeepMind разработал самообучаемый алгоритм для игры в го
«Самый совершенный игрок в го».
Подразделение Google DeepMind представило AlphaGo Zero — новую версию алгоритма для игры в го. Искусственный интеллект является самообучаемым: он не анализирует партии, сыгранные человеком.
В AlphaGo Zero заложили лишь правила игры в го. Алгоритм формирует стратегию выигрыша, моделируя игры с самим собой. Удачные варианты ходов сохраняются в алгоритме.
Спустя три дня самообучения AlphaGo Zero смог победить версию AlphaGo, которая в своё время обыграла лучшего в мире игрока в го. После 40 дней ИИ в 90% случаев выигрывал у более совершенной версии оригинального AlphaGo, обучающегося на основе сыгранных человеком партий.
В DeepMind отметили, что избавили алгоритм от ограничений человеческого разума. Ведущий программист AlphaGo Zero Дэвид Сильвер (David Silver) рассказал, что во время самообучения ИИ сначала имитировал поведение начинающего, а после и опытного игрока в го. В конце концов AlphaGo Zero стал совершать ходы, которые нетипичны даже для профессиональных игроков. По мнению программистов DeepMind, они создали самого совершенного игрока в го.
Ранее Google запустил игру Teachable Machine для обучения нейросетей.
Читать по теме:
Хотите подсказать новость или поделиться экспертным мнением? Пишите: news@cossa.ru
Автор иконки на тизере: Duygu Ozkan, Noun Project