1. MN NEWS
  2. Экономика
  3. ИИ от Meta превзошел людей в классической настольной игре

MN NEWSЭкономикаИИ от Meta превзошел людей в классической настольной игре

ИИ от Meta превзошел людей в классической настольной игре

Экономика23.11.2022 в 14:28ПрослушатьОстановить

ИИ от Meta превзошел людей в классической настольной игреИИ от Meta превзошел людей в классической настольной игреИсследователи компании Meta представили алгоритм искусственного интеллекта Cicero, который играет в настольную стратегию «Дипломатия» на уровне с людьми. Об этом пишет The Register.«Дипломатию» разработали в 19...

Исследователи компании Meta представили алгоритм искусственного интеллекта Cicero, который играет в настольную стратегию «Дипломатия» на уровне с людьми. Об этом пишет The Register.

«Дипломатию» разработали в 1953 году. Игра фокусируется на общении и переговорах между участниками. Каждый из них выполняет роль одного из семи европейских государств начала XX века.

По сути, Cicero — это чат-бот, который ведет переговоры с другими участниками для совершения эффективных ходов. Алгоритм основан на языковой модели, подобной BART, с 2,7 млрд параметров.

Его предварительно обучили на текстах из интернета, а также набора данных из более чем 40 000 партий в «Дипломатию», сыгранных онлайн. Датасет содержал более 12 млн сообщений, которыми обменивались люди в процессе игры.

Вывод диалога ИИ-агента привязан к его модулю стратегического мышления. С его помощью Cicero создает «намерения», представляющие возможный набор ходов различных игроков.

«Модуль стратегического мышления предсказывает политику других игроков [вероятные действия] для текущего хода на основе состояния доски и общего диалога, а затем выбирает для себя политику на текущий ход», — рассказали исследователи.

В отличие от ИИ-агентов для шахмат, исследователи применили контролируемое обучение, используя данные прошлых партий. Однако сам по себе подход создавал доверчивую модель, которой легко могли манипулировать недобросовестные игроки, заявили исследователи.

Для предотвращения подобных ситуаций разработчики подключили к Cicero алгоритм итеративного планирования piKL. С его помощью ИИ-агент уточняет первоначальный прогноз политики другого игрока и запланированных ходов на основе диалога между ботом и людьми. Алгоритм пытается улучшить ожидаемые наборы действий участников, оценивая различные варианты, которые дадут лучшие результаты.

В течение двух месяцев исследователи протестировали Cicero в 40 анонимных партиях в «Дипломатию». По результатам испытаний ИИ-агент вошел в 10% лучших участников, сыгравших более одного раза. В рейтинге пользователей, сыгравших пять и более партий, алгоритм занял второе место.

Во всех 40 играх средний результат Cicero составил 25,8%, что более чем в два раза превышает средний показатель (12,4%) среди 82 его противников.

Чемпион мира по «Дипломатии» Эндрю Грофф высоко оценил бесстрастный подход алгоритма к игре.

«Многие люди смягчат свой подход или начнут мстить, но Cicero никогда этого не делает. Он просто проигрывает ситуацию так, как он ее видит. Поэтому он безжалостен в реализации своей стратегии, но не безжалостен в том смысле, который раздражает других игроков», — сказал он.

По словам разработчиков, Cicero все еще допускает некоторые ошибки. Однако они ожидают, что их исследования окажутся полезными для других приложений вроде чат-ботов для длительных бесед или создания реалистичных персонажей видеоигр.

Также Meta выпустила исходный код Cicero для того, чтобы любой желающий мог внести вклад в его развитие.

Напомним, в ноябре техгигант отключил «ИИ для науки» спустя три дня после запуска. Алгоритм обвинили в генерировании фейков и дезинформации.

Источник: ForkLog

Поделиться

Читайте также:

Bloomberg: V Ventures предложила «спасти» Zipmex
Bloomberg: V Ventures предложила «спасти» Zipmex

ЭкономикаВчера в 19:56Читать новость

Трейдер указал на дно рынка и рост цены биткоина
Трейдер указал на дно рынка и рост цены биткоина

ЭкономикаВчера в 19:28Читать новость

Galaxy Digital купила кастодиана GK8 у Celsius Network
Galaxy Digital купила кастодиана GK8 у Celsius Network

ЭкономикаВчера в 18:14Читать новость

Минюст США призвал изучить потенциальное мошенничество в деле FTX
Минюст США призвал изучить потенциальное мошенничество в деле FTX

ЭкономикаВчера в 17:56Читать новость

Разработчики Ethereum прекратят поддержку тестнета Ropsten
Разработчики Ethereum прекратят поддержку тестнета Ropsten

ЭкономикаВчера в 16:56Читать новость

В Tether назвали «лицемерием» статью WSJ о росте выдачи кредитов в USDT
В Tether назвали «лицемерием» статью WSJ о росте выдачи кредитов в USDT

ЭкономикаВчера в 16:14Читать новость

BitMEX реализовала решение по подтверждению обязательств
BitMEX реализовала решение по подтверждению обязательств

ЭкономикаВчера в 15:42Читать новость

DeepMind научила ИИ играть в «Стратего» на уровне с людьми
DeepMind научила ИИ играть в «Стратего» на уровне с людьми

ЭкономикаВчера в 13:42Читать новость

Биржа Trader Joe интегрировала Arbitrum
Биржа Trader Joe интегрировала Arbitrum

ЭкономикаВчера в 13:14Читать новость

«Лайтхаус» провел первую сделку с ЦФА в иностранной валюте

ЭкономикаВчера в 13:00Читать новость

В Сенате США обсудили пробелы в полномочиях CFTC на фоне краха FTX
В Сенате США обсудили пробелы в полномочиях CFTC на фоне краха FTX

ЭкономикаВчера в 12:42Читать новость

Ориентированный на кибербезопасность Cyvers привлек $8 млн
Ориентированный на кибербезопасность Cyvers привлек $8 млн

ЭкономикаВчера в 12:28Читать новость

Украинский регулятор биткоин-рынка объявил о сотрудничестве с аудиторами Ernst&Young
Украинский регулятор биткоин-рынка объявил о сотрудничестве с аудиторами Ernst&Young

ЭкономикаВчера в 12:00Читать новость

DeFi-протокол Ankr подвергся взлому. Цена aBNBc рухнула до нуля
DeFi-протокол Ankr подвергся взлому. Цена aBNBc рухнула до нуля

ЭкономикаВчера в 11:14Читать новость

Отчет: число мошеннических видео для трейдеров на YouTube выросло на 500%
Отчет: число мошеннических видео для трейдеров на YouTube выросло на 500%

ЭкономикаВчера в 10:56Читать новость

Майк Новограц назвал «бредом» заявления Сэма Бэнкмана-Фрида
Майк Новограц назвал «бредом» заявления Сэма Бэнкмана-Фрида

ЭкономикаВчера в 10:28Читать новость

FT X Japan представит план возврата клиентских средств
FT X Japan представит план возврата клиентских средств

ЭкономикаВчера в 10:14Читать новость

Disney создала ИИ-инструмент для омоложения актеров
Disney создала ИИ-инструмент для омоложения актеров

Экономика01.12.2022 в 19:42Читать новость

Timex выпустит лимитированную коллекцию часов в партнерстве с Bored Ape Yacht Club
Timex выпустит лимитированную коллекцию часов в партнерстве с Bored Ape Yacht Club

Экономика01.12.2022 в 19:42Читать новость

Команда платформы Web3-разработчиков Fleek привлекла $25 млн
Команда платформы Web3-разработчиков Fleek привлекла $25 млн

Экономика01.12.2022 в 19:14Читать новость