Российская команда победила в чемпионате по стратегическому мышлению для ИИ-агентов на NeurIPS 2025

9 декабря 2025

Российская команда победила в чемпионате по стратегическому мышлению для ИИ-агентов на NeurIPS 2025

9 декабря 2025

Сотрудники Университета Иннополис, Института AIRI и стартапа Coframe разработали фреймворк для обучения агентов в различных средах для распределённых систем. Их решение стало лучшим из 944 в треке Generalization соревнования MindGames Arena.

Участвующие в конкурсе команды учёных и созданные ими системы искусственного интеллекта соревновались в трёх играх. В первой — системы ИИ угадывали слова и располагали их на особом поле, во второй — распределяли «войска» по нескольким полям сражений, а в третьей — решали «дилемму заключённого на троих», пытались строить альянсы и распознавать обман со стороны других ИИ-игроков.

В состав российской команды вошли Алексей Коршук (Coframe, Университет Иннополис), Александр Буянтуев (Университет Иннополис) и Илья Макаров (Институт AIRI, ИСП РАН, Университет Иннополис). Они предложили модель RL с отложенным присвоением наград и их семантическим распределением в конце эпизода. Для качественного обучения эксперты внедрили равномерное семплирование по ролям, curriculum learning против оппонентов разного уровня и адаптированный под мультишаговые игры метод RLOO с группировкой шагов.

Модель исследователей заняла первое место в двух категориях: для компактных открытых моделей и в абсолютном зачёте без ограничений. В открытой категории решение команды обошло такие модели как GPT-5, Gemini 2.5 Pro и Grok 4, подтвердив эффективность предложенного подхода.

Источник: habr.com/ru/companies/airi/articles/974806/ 


Конкурс MindGames Arena проводился в рамках NeurIPS — ведущей ежегодной международной конференции по развитию ИИ. Он направлен на развитие и оценку социально-стратегических навыков у ИИ-агентов на базе больших языковых моделей, в том числе умения кооперироваться, предугадывать намерения окружающих, планировать многоходовые действия и распознавать обман.