ИИ учится видеть мир, как люди, понимая связи между объектами

Новая модель машинного обучения, разрабатываемая инженерами МТИ, поможет роботам выполнять многоступенчатые задачи.

Благодаря новой модели глубинного обучения ИИ воспринимает неочевидные связи между объектами в конкретной ситуации. Сперва модель понимает каждую отдельную связь, а потом составляет из них общую картину. В частности, это помогает ИИ генерировать более точные изображения из текстовых описаний.

Этот подход поможет в ситуациях, когда роботам поручают сложные многоступенчатые задачи: размещение вещей на складских площадках или при сборке техники. Без понимания связей инструкция «подними коробку справа от шкафа и положи его на полку сверху» вынудила бы робота растеряться. А еще такой подход приближает будущее, где роботы смогут обучаться, взаимодействуя со средой. Совсем как люди.

«Когда я смотрю на стол, я не могу определить координаты объекта. Наш мозг работает по-другому: мы понимаем ситуацию исходя из связей между объектами. Думаем, что научив этому ИИ, мы дадим ему возможность более эффективно оперировать средой», — говорит Юлин Ду, аспирант Лаборатории искусственного интеллекта МТИ.

Модель работает и наоборот: она учится создавать текстовое описание объектов на изображении. А еще — редактировать изображение, чтобы расположить вещи так, как сказано в изменившемся описании.

Исследователи сравнивали свою модель с другими методами глубинного обучения, где ИИ ставили задачу сгенерировать изображение по описанию. Во всех случаях их вариант превосходил ожидания. Для подтверждения наблюдений работу модели оценивали и люди: их спросили, насколько созданное изображение соответствует описанию. В самых сложных примерах, где было три связи между объектами, 91% участников подтвердил, что новая модель показала лучший результат. «Интересно, что мы можем повышать сложность, увеличивая количество связей, но наша модель все равно справляется. А другие — нет», — добавляет Ду.

Слева — текстовое описание, представленное модели; по центру — результат генерации других ИИ; справа — результат новой модели

Инженеры опробовали и иные подходы, показывая модели сцены, которые она не видела до этого, предлагая разные описания одной модели, и она все равно справлялась с тестированием. Но инженеры осторожны в прогнозах: пока они планируют проверить свою модель на объектах реального мира, где много визуального шума, а объекты заслоняют друг друга.


Читать далее

Посмотрите, как выглядит Сатурн с Луны. Фото сделал орбитальный аппарат НАСА

Исследователи «прочитали» мысли медузы

Школьница нашла клад бронзового века: 65 артефактов датируются 1 300 годом до н.э.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Boston Dynamics усовершенствовала систему восприятия гуманоидного робота Atlas
Новости
Наклейка на лоб анализирует мозговые волны и предсказывает переутомление
Наука
Посмотрите на робота-трансформера, который меняет форму прямо в полете
Новости
Китай отправил миссию за образцами горных пород с квазиспутника Земли
Космос
ИИ научился предсказывать успеваемость студентов по данным профиля в VK
Новости
Странная звезда Млечного Пути пульсирует каждые 44 минуты и это не объяснить
Космос
Этот OLED-экран сам издает звук: каждый пиксель работает как динамик
Новости
Посмотрите, как на Солнце идет дождь: астрономы увидели это впервые
Космос
Одно из главных доказательств Большого взрыва поставили под сомнение 
Космос
Университетский техпред — новый элемент высшего образования: студенты становятся предпринимателями
Наука
Илон Маск намекнул, почему ушел из администрации Трампа на самом деле
Новости
Илон Маск и Павел Дуров публично спорят из-за соглашения между Telegram и Grok
Новости
В мозге нашли нервные клетки, которые регулируют набор веса
Наука
Электросамолеты смогут летать дальше: MIT представил мощные топливные элементы
Наука
Anthropic открыла доступ к поиску для пользователей чат-бота с ИИ Claude
Новости
Противораковые препараты на треть увеличили срок жизни мышей
Наука
В Китае придумали, как решить проблему опасных вибраций в маглеве
Новости
Роботизированные комплексы для обучения студентов внедрят в российские вузы
Иннополис
Дуров договорился с xAI Маска продвигать ИИ Grok в Telegram
Новости
Камни для крокодилов и контроль качества альтушек: четвертый «ТехПредКлуб» прошел в Томске
Новости