29 ноября 2024
29 ноября 2024
Научные сотрудники из Исследовательского центра в сфере искусственного интеллекта российского ИТ-вуза, лаборатории исследований искусственного интеллекта T-Bank AI Research и Института AIRI при участии студентов из МФТИ и Сколтеха создали виртуальную среду для исследований и разработки алгоритмов в области контекстного обучения с подкреплением — XLand-MiniGrid. Научная статья о создании среды принята на международную конференцию NeurIPS 2024 в Канаде.
Контекстное обучение с подкреплением (In-Context RL) — новое направление в области искусственного интеллекта, где модели быстро адаптируются к новым задачам, используя подсказки и контекст, а не требуют длительного обучения с нуля. Это позволяет ИИ эффективно взаимодействовать с окружающей средой и дообучаться в процессе. In-Context RL особенно полезен в персонализированных рекомендациях, управлении роботами и автономными транспортными средствами, где требуется мгновенная адаптация к новым условиям.
По словам исследователей, ранее они сталкивались с ограничениями в существующих средах для контекстного обучения с подкреплением. Корпоративные среды крупных компаний, например Google DeepMind, закрыты для внешних пользователей и используются только для внутренних задач. Публично доступные инструменты в основном предлагают однотипные и лёгкие задачи для обучения, что затрудняет разработку и тестирование сложных алгоритмов.
XLand-MiniGrid находится в открытом доступе и позволяет менять условия обучения прямо в процессе работы. Это упрощает моделирование множества вариативных задач разного уровня сложности, помогает создавать более надежные и адаптивные модели искусственного интеллекта. Среда создана на базе JAX — технологии для разработки высокопроизводительных программ. XLand-MiniGrid выполняет миллиарды операций в секунду. Эксперименты в XLand-MiniGrid уже провели в Google DeepMind, Калифорнийском университете в Беркли и Оксфордском университете.
Вячеслав Синий, исследователь научной группы AI Alignment, лаборатория исследований искусственного интеллекта T-Bank AI Research: «Мы пришли в область контекстного обучения с подкреплением, когда она ещё зарождалась, и поэтому не нашли ни одного подходящего инструмента для оценки новых идей. Стало понятно, что это проблема для многих специалистов, а значит должна быть решена одной из первых. Поэтому появился Xland-Minigrid. Наша работа сразу привлекла внимание других исследователей в области, и уже сейчас появляются статьи, где авторы используют среду для проверки своих методов».
Владислав Куренков, руководитель группы «Адаптивные агенты» Института AIRI, главный аналитик данных Лаборатории искусственного интеллекта в медицине Университета Иннополис: «XLand-MiniGrid предоставляет возможности для создания обширных датасетов, благодаря разнообразию задач и широкому набору действий. В рамках этой среды собрано 100 миллиардов примеров поведения ИИ, охватывающих 30 тысяч различных задач. Это позволяет использовать готовые датасеты для обучения моделей, исключая необходимость начинать процесс обучения с нуля, что способствует прогрессу в области In-Context RL, одновременно сокращая затраты и оптимизируя ресурсы, необходимые для проведения исследований».
24 февраля 2025
Университет Иннополис продолжает серию историй о талантливых обучающихся. Аспирантка Замира Холматова совмещает работу в Передовой инженерной школе с написанием кандидатской диссертации и исследованиями в области программной инженерии. Она рассказала, почему решила заниматься наукой и чем игра на фортепиано, спорт и рисование полезны для исследователя.
25 февраля 2025
Мероприятие для обсуждения трендов в торговле пройдёт 2—5 июня в московском Центре международной торговли. На форуме состоятся пленарные заседания, экспертные сессии, конференции, презентации и круглые столы об инновациях в работе торговых сетей, маркетинге, fashion- и банковском ритейле, е-commerce, HoReCa, логистике, ESG, коммерческой недвижимости, международных рынках и HR. Также участников ждут экспозона новинок отрасли, Retail Week Awards, антиконтрафакт и турнир по мини-футболу. Регистрация открыта до 2 июня.
17 февраля 2025
22—29 марта Центр довузовской подготовки российского ИТ-вуза проведёт очные курсы по изучению языков программирования Python и C++, 3D-моделированию и олимпиадному программированию. Также в программе — квесты, квизы, игры и спортивные мероприятия. По итогам обучения участники получат сертификаты. Регистрация открыта до 17 марта, количество мест ограничено.