Ученые MIT представили технологию для самообучающегося искусственного интеллекта

94124file.webp



Исследователи из Массачусетского технологического института (MIT) разработали новую технологию, которая позволяет большим языковым моделям не просто использовать данные, а активно адаптироваться и учиться на их основе непосредственно в процессе работы. Этот подход открывает новые перспективы для развития искусственного интеллекта.

Новая система получила название «SEAL» (Self-Adapting Language Models — Самоадаптирующиеся языковые модели). В отличие от традиционных методов, таких как дообучение на заранее собранных наборах данных, «SEAL» позволяет модели самостоятельно генерировать примеры и инструкции для обновления своих внутренних параметров. Иными словами, модель не просто подстраивается под новые задачи, а способна сохранять полученные знания, изменяя собственную внутреннюю структуру.

В основе работы «SEAL» лежит обучение с подкреплением. Модель учится создавать так называемые «саморедактирования» — текстовые инструкции, которые направляют ее при изменении внутренних параметров. Этот процесс можно сравнить с написанием собственного учебника: вместо простого чтения данных модель преобразует информацию в формат, оптимизированный для эффективного усвоения. Архитектуру системы можно разделить на два модуля: один выступает в роли «учителя», генерируя инструкции, а второй — в роли «ученика», обновляя себя на их основе.

Эффективность новой технологии была проверена в ходе двух типов испытаний: интеграция новых знаний и обучение на основе небольшого количества примеров. В первом случае перед моделью стояла задача запомнить факты из текста и ответить на вопросы, не имея доступа к исходному материалу. Система «SEAL» продемонстрировала точность ответов в 47%, что превзошло результаты, полученные при аналогичных попытках с использованием более мощной модели GPT-4.1.

Во втором испытании модель решала задачи на абстрактное мышление из набора Abstraction and Reasoning Corpus (ARC). Здесь ИИ должен был не только найти правильные ответы, но и разработать собственную стратегию обучения. С использованием «SEAL» точность достигла 72,5%, что в четыре раза превысило показатели без обучения с подкреплением, в то время как стандартные методы не дали значимых результатов.

По мнению исследователей, одной из главных проблем для дальнейшего развития ИИ может стать нехватка качественных данных для обучения. Технология «SEAL» предлагает частичное решение, позволяя моделям самостоятельно генерировать полезные обучающие сигналы. Например, система сможет, прочитав научную статью, создать сотни пояснений и выводов для более глубокого понимания темы.

В то же время у метода есть и ограничения. Частые обновления могут привести к так называемому «катастрофическому забыванию» — потере ранее усвоенных знаний. Для решения этой проблемы ученые предлагают гибридный подход, при котором ключевые знания интегрируются через «SEAL», а фактическая или часто меняющаяся информация хранится во внешней памяти. Кроме того, редактирование параметров модели в реальном времени пока технически невозможно, поэтому предлагается использовать циклы отложенного обучения, когда модель собирает данные в течение дня и обновляется через определенные промежутки времени.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *