1. MN NEWS
  2. Экономика
  3. DeepMind научила ИИ играть в «Стратего» на уровне с людьми

MN NEWSЭкономикаDeepMind научила ИИ играть в «Стратего» на уровне с людьми

DeepMind научила ИИ играть в «Стратего» на уровне с людьми

Экономика02.12.2022 в 13:42ПрослушатьОстановить

DeepMind научила ИИ играть в «Стратего» на уровне с людьмиDeepMind научила ИИ играть в «Стратего» на уровне с людьмиИсследователи из лаборатории DeepMind создали ИИ-агента DeepNash, способного играть в «Стратего» на «человеческом экспертном уровне». Об этом пишет Gizmodo.DeepNash научился играть, проведя множество партий про...

Исследователи из лаборатории DeepMind создали ИИ-агента DeepNash, способного играть в «Стратего» на «человеческом экспертном уровне». Об этом пишет Gizmodo.

DeepNash научился играть, проведя множество партий против самого себя. В процессе он смог принимать сложные решения и рассматривать компромиссы «необычными» способами, недоступными прежним системам искусственного интеллекта.

Исследователи заявили, что сочетание в «Стратего» долгосрочного принятия решений и притока несовершенной информации делает ее уникальным испытательным полигоном для ИИ.

В игре обычно участвуют два человека. Она включает в себя как стратегию, так и элементы обмана. У каждого игрока есть состоящие из частей «армии», каждая из которых имеет свою ценность. Победа достигается путем захвата вражеского флага или отсутствия ходов противника.

Наличие фигур с разными значениями приводит к чрезвычайно большому количеству вариантов шагов и результатов. Исследователи говорят, что в «Стратего» гораздо больше «возможных состояний», чем в техасском холдеме или го.

Для победы DeepNash смешал как долгосрочную стратегию, так и краткосрочное принятие решений вроде блефа и риска. Как правило, прошлые алгоритмы не умели делать этого одновременно.

«DeepNash смог найти нетривиальный компромисс между информацией и материалом, блефовать и рисковать, когда это необходимо», — рассказали исследователи.

Вероятно, создатели DeepNash вдохновлялись американским математиком Джоном Нэшем, предложившем равновесие Нэша. В теории игр так называется совокупность действий для двух и более игроков, согласно которым участники теряют стимул менять стратегию, если этого не делают соперники.

DeepNash пытается найти равновесие Нэша в «Стратего», используя комбинацию самостоятельной игры и обучения с подкреплением под названием R-NaD. Используя как этот алгоритм, так и архитектуру глубокой нейронной сети, исследователи смогли создать модель, побеждающую даже в «чрезвычайно сложных ситуациях».

Разработчики протестировали DeepNash, сравнив его с другими ботами и «лучшими игроками» на онлайн-платформе Gravon. ИИ-агент побеждал виртуальных противников в 97% случаев. Коэффициент выигрыша против людей составил 84%.

В результате ИИ вошел в тройку лучших игроков как в текущем году, так и в таблице лидеров за все время.

«Насколько нам известно, это первый раз, когда алгоритм ИИ смог научиться играть в “Стратего” на уровне человека-эксперта», — заявили исследователи.

Напомним, в ноябре DeepMind создала искусственный интеллект, который естественным образом взаимодействует с человеком и учится у него.

В том же месяце Meta создала ИИ-агента, играющего в «Дипломатию» на уровне с людьми.

Источник: ForkLog

Поделиться

Читайте также:

SoFi-платформа Subsocial запустила «авторский стейкинг»

Экономика27.10.2023 в 11:56Читать новость

В чем разница между Web3 и Web 3.0? Ликбез от Владимира Менаскопа

Экономика03.10.2023 в 19:14Читать новость

Story Protocol привлекла $54 млн на упрощение верификации интеллектуальных прав

Экономика06.09.2023 в 14:14Читать новость

Crossover и CBOE разработают решение для клиринга криптовалют

Экономика03.08.2023 в 16:56Читать новость

DeFi-проект Parrot предложил погасить токены PRT с потерей ~90% вложений

Экономика23.07.2023 в 16:00Читать новость

OpenSea запретила продавать NFT на основе стейкингового Ethereum

Экономика20.07.2023 в 11:14Читать новость

Что такое биткоин-пазлы?

Экономика13.07.2023 в 11:14Читать новость

В Matrixport назначили нового главу американского подразделения

Экономика10.07.2023 в 13:14Читать новость

ДАО и право: юристы — об опыте децентрализации

Экономика30.06.2023 в 17:14Читать новость

Основатель Frax поддержал более «агрессивный» выкуп токенов проекта

Экономика19.06.2023 в 16:42Читать новость

TaxBit сократила персонал на 40%

Экономика12.06.2023 в 12:28Читать новость

Stripe, Ripple, Blockchain.com и OpenSea вошли в топ-10 финтех-компаний Forbes

Экономика07.06.2023 в 12:14Читать новость

Росбанк запустил пилотные трансграничные платежи в криптовалюте

Экономика02.06.2023 в 10:56Читать новость

В Multichain потеряли связь с главой проекта

Экономика01.06.2023 в 13:14Читать новость

Журналисты CNET основали профсоюз для борьбы с ИИ-авторами

Экономика17.05.2023 в 15:56Читать новость

Puma выпустит кроссовки в комплекте с NFT

Экономика26.04.2023 в 20:00Читать новость

Fortune представил рейтинг 40 лучших криптокомпаний

Экономика11.04.2023 в 17:14Читать новость

СМИ: китайские ИИ-компании обходят экспортный контроль с помощью облака
СМИ: китайские ИИ-компании обходят экспортный контроль с помощью облака

Экономика10.03.2023 в 14:00Читать новость

Blockchain.com закроет подразделение по управлению активами
Blockchain.com закроет подразделение по управлению активами

Экономика10.03.2023 в 13:42Читать новость

Meta создаст децентрализованного конкурента Twitter
Meta создаст децентрализованного конкурента Twitter

Экономика10.03.2023 в 13:42Читать новость