ИИ учится видеть мир, как люди, понимая связи между объектами

Новая модель машинного обучения, разрабатываемая инженерами МТИ, поможет роботам выполнять многоступенчатые задачи.

Благодаря новой модели глубинного обучения ИИ воспринимает неочевидные связи между объектами в конкретной ситуации. Сперва модель понимает каждую отдельную связь, а потом составляет из них общую картину. В частности, это помогает ИИ генерировать более точные изображения из текстовых описаний.

Этот подход поможет в ситуациях, когда роботам поручают сложные многоступенчатые задачи: размещение вещей на складских площадках или при сборке техники. Без понимания связей инструкция «подними коробку справа от шкафа и положи его на полку сверху» вынудила бы робота растеряться. А еще такой подход приближает будущее, где роботы смогут обучаться, взаимодействуя со средой. Совсем как люди.

«Когда я смотрю на стол, я не могу определить координаты объекта. Наш мозг работает по-другому: мы понимаем ситуацию исходя из связей между объектами. Думаем, что научив этому ИИ, мы дадим ему возможность более эффективно оперировать средой», — говорит Юлин Ду, аспирант Лаборатории искусственного интеллекта МТИ.

Модель работает и наоборот: она учится создавать текстовое описание объектов на изображении. А еще — редактировать изображение, чтобы расположить вещи так, как сказано в изменившемся описании.

Исследователи сравнивали свою модель с другими методами глубинного обучения, где ИИ ставили задачу сгенерировать изображение по описанию. Во всех случаях их вариант превосходил ожидания. Для подтверждения наблюдений работу модели оценивали и люди: их спросили, насколько созданное изображение соответствует описанию. В самых сложных примерах, где было три связи между объектами, 91% участников подтвердил, что новая модель показала лучший результат. «Интересно, что мы можем повышать сложность, увеличивая количество связей, но наша модель все равно справляется. А другие — нет», — добавляет Ду.

Слева — текстовое описание, представленное модели; по центру — результат генерации других ИИ; справа — результат новой модели

Инженеры опробовали и иные подходы, показывая модели сцены, которые она не видела до этого, предлагая разные описания одной модели, и она все равно справлялась с тестированием. Но инженеры осторожны в прогнозах: пока они планируют проверить свою модель на объектах реального мира, где много визуального шума, а объекты заслоняют друг друга.


Читать далее

Посмотрите, как выглядит Сатурн с Луны. Фото сделал орбитальный аппарат НАСА

Исследователи «прочитали» мысли медузы

Школьница нашла клад бронзового века: 65 артефактов датируются 1 300 годом до н.э.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Найден способ сверхскоростной передачи тепла для быстрого охлаждения электроники
Наука
Условия жизни лошадей в Средневековом Новгороде восстановили по зубам
Наука
Под видом модов для Minecraft и других игр в Telegram распространяют вирусы
Новости
ИИ от создателей TikTok потеснил GPT-4o в рейтинге генераторов изображений
Новости
В России нашли минерал, который поможет изучить ядро Земли и космические тела
Космос
Анализ метеорита поставил под сомнение гипотезу о происхождении воды на Земле
Космос
«Яндекс» научил поиск решать задачи по алгебре для старшеклассников
Новости
Найдена недостающая часть Вселенной: где она скрывалась
Космос
VR в строительстве: как избежать ошибок на сотни миллионов
Мнения
44 планеты, похожие на Землю, нашли в Млечном Пути
Космос
Тайну космоса, которой больше 60 лет, наконец-то раскрыли
Космос
В «дубайском» шоколаде нашли опасные для жизни вещества
Наука
Хакеры атаковали пять оборонных предприятий России
Новости
Как ИИ повышает эффективность и снижает риски обогатительных предприятий
Мнения
«Джеймс Уэбб» изучил загадочные кольца погибшей звезды
Космос
Открыт прием заявок на ежегодную премию Digital Leaders 2025
Новости
GigaChat научился искать информацию в сети: Сбер обновил ИИ-помощника
Новости
Созданы очки с искусственным интеллектом для незрячих людей
Новости
Минобрнауки продолжит программу кешбэка для инвесторов университетских стартапов
Новости
OpenAI представила GPT-4.1: модель с улучшенными возможностями для программистов
Новости