Российская модель ИИ восстановит рецепт блюда по фотографии и решит пример на доске

Исходный код российской мультимодальной модели искусственного интеллекта опубликован в открытом доступе. О разработке «Хайтеку» рассказала пресс-служба Института искусственного интеллекта AIRI.

Институт искусственного интеллекта AIRI представил открытую версию модели OmniFusion – OmniFusion 1.1. Мультимодальная языковая модель способна поддерживать визуальный диалог, отвечать на вопросы пользователей по картинкам и поддерживает русский язык. Исходный код, включая веса модели и скрипты для обучения, опубликованы в репозитории GitHub.

OmniFusion распознает и описывает изображения. Например, с ее помощью можно объяснить, что изображено на снимке, узнать рецепт для приготовления блюда по фотографии ингредиентов, проанализировать карту помещения или узнать, как собрать устройство по фото отдельных его частей.

Модель также умеет распознавать текст и решать задачи. Например, с её помощью можно решить логические задачи, написанный на доске математический пример или распознать формулу, а также получить их представления в формате LaTeX.

Примеры диалогов с OmniFusion. Изображение: Научно-исследовательский Институт искусственного интеллекта AIRI

Спектр возможностей широкий, заявляют разработчики: модель уже может проанализировать медицинское изображение и указать на нем какую-то проблему. Правда, чтобы ставить диагнозы, OmniFusion необходимо дополнительно обучать на профильных датасетах с привлечением экспертов из медицины.

OmniFusion — это первая в России мультимодальная модель. Среди зарубежных аналогов на рынке представлены, например, LLaVA, Gemini, GPT4-Vision, а также китайские модели Qwen, DeepSeek и LVIS. Часть из них относится к числу проприетарного ПО, то есть находится в закрытом доступе.

Публикуя открытый исходный код OmniFusion, включая веса модели и скрипты для обучения, мы стремимся внести вклад в сообщество исследователей искусственного интеллекта и поспособствовать дальнейшему развитию мультимодальных архитектур, созданию новых приложений на их основе.

Иван Оселедец, доктор физико-математических наук, Профессор РАН, генеральный директор Института AIRI

Читать далее:

Посмотрите, каким было солнечное затмение из космоса

Посмотрите, что подводный робот нашел на дне Байкала

Ученые поняли, почему «Вояджер-1» отправлял ерунду почти пять месяцев

На обложке: Изображение от fullvector на Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Эту звезду искали 40 лет: она состоит из очень необычной материи
Новости
Найдена связь между взрывом сверхновой и эволюции жизни на Земле
Новости
«Случайность маловероятна»: в Балтике поврежден интернет-кабель
Новости
SpaceX запустит телескоп для защиты Земли: как он будет работать
Новости
Ученые создают датчики, похожие на усики комаров, для обнаружения землетрясений
Наука
ИИ диагностирует диабет, ВИЧ и COVID по одному образцу крови
Наука
Китайские генетики создали «рис для укрепления здоровья сердечной системы»
Наука
Тяжелое генетическое заболевание вылечили до рождения в утробе матери
Наука
Высокоскоростная съемка показала, что происходит с каплей при падении в бассейн
Наука
В России создали ИИ-платформу для ускоренной разработки лекарств
Иннополис
Физики побили рекорд Китая по удержанию плазмы в искусственном Солнце
Наука
Мертвая галактика посылает мощные радиовсплески: ученые не могут это объяснить  
Космос
«Невозможная» пара звезд-вампиров странно ведет себя в космосе
Космос
В iPhone 16e стоят чипы, которые оказались недостаточно хороши для iPhone 16
Новости
Выяснилось, как темная тема на сайтах влияет на гаджеты
Новости
Ученые впервые создали «пластичный» инопланетный лед
Наука
В каких странах больше боятся замены людей на ИИ, показало исследование
Наука
Мини-землетрясения под ледяным щитом Гренландии могут изменить уровень моря
Наука
Посмотрите, как Blue Ghost летит над обратной стороной Луны
Космос
Польский стартап представил робота с искусственными мышцами и костями
Новости