Российская модель ИИ восстановит рецепт блюда по фотографии и решит пример на доске

Исходный код российской мультимодальной модели искусственного интеллекта опубликован в открытом доступе. О разработке «Хайтеку» рассказала пресс-служба Института искусственного интеллекта AIRI.

Институт искусственного интеллекта AIRI представил открытую версию модели OmniFusion – OmniFusion 1.1. Мультимодальная языковая модель способна поддерживать визуальный диалог, отвечать на вопросы пользователей по картинкам и поддерживает русский язык. Исходный код, включая веса модели и скрипты для обучения, опубликованы в репозитории GitHub.

OmniFusion распознает и описывает изображения. Например, с ее помощью можно объяснить, что изображено на снимке, узнать рецепт для приготовления блюда по фотографии ингредиентов, проанализировать карту помещения или узнать, как собрать устройство по фото отдельных его частей.

Модель также умеет распознавать текст и решать задачи. Например, с её помощью можно решить логические задачи, написанный на доске математический пример или распознать формулу, а также получить их представления в формате LaTeX.

Примеры диалогов с OmniFusion. Изображение: Научно-исследовательский Институт искусственного интеллекта AIRI

Спектр возможностей широкий, заявляют разработчики: модель уже может проанализировать медицинское изображение и указать на нем какую-то проблему. Правда, чтобы ставить диагнозы, OmniFusion необходимо дополнительно обучать на профильных датасетах с привлечением экспертов из медицины.

OmniFusion — это первая в России мультимодальная модель. Среди зарубежных аналогов на рынке представлены, например, LLaVA, Gemini, GPT4-Vision, а также китайские модели Qwen, DeepSeek и LVIS. Часть из них относится к числу проприетарного ПО, то есть находится в закрытом доступе.

Публикуя открытый исходный код OmniFusion, включая веса модели и скрипты для обучения, мы стремимся внести вклад в сообщество исследователей искусственного интеллекта и поспособствовать дальнейшему развитию мультимодальных архитектур, созданию новых приложений на их основе.

Иван Оселедец, доктор физико-математических наук, Профессор РАН, генеральный директор Института AIRI

Читать далее:

Посмотрите, каким было солнечное затмение из космоса

Посмотрите, что подводный робот нашел на дне Байкала

Ученые поняли, почему «Вояджер-1» отправлял ерунду почти пять месяцев

На обложке: Изображение от fullvector на Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Магнитная загадка Нептуна и Урана решена: что узнали ученые
Космос
Самые мощные космические лучи в истории ударили по Земле
Космос
На астероиде Рюгу нашли бактерии, но не те, что ожидали ученые
Космос
Доллар выше 100: когда вырастут цены на бытовую технику и iPhone
Новости
Запуск цифрового рубля под угрозой срыва: в чем проблема
Новости
Российские авто защитят от киберугроз: в «ГЛОНАСС» стартует пилотный проект  
Новости
Археологи нашли «старейшее огнестрельное оружие в США»: это испанская пушка
Наука
Найдено гигантское месторождение золота: запасы оценивают в 83 млрд долларов
Новости
СМИ: Amazon создал собственный ИИ для обработки видео
Новости
Анализ фекалий динозавров помог разгадать эволюционную загадку
Наука
Нано-динозавр из ДНК: ученые создали микророботов с помощью ДНК-оригами
Новости
Инженеры связали антенну мобильной связи, которую можно носить как свитер
Новости
Крупнейшие российские банки готовы строить собственные дата-центры
Новости
Скрытые подземные туннели времен Холодной войны нашли ученые НАСА
Наука
Хакеры, связанные с Россией, массово атаковали пользователей из США: как им это удалось
Новости
Суперкомпьютер создал крупнейшую в истории цифровую модель Вселенной  
Космос
Raspberry Pi представила одноплатный компьютер Compute Module 5
Новости
В России ужесточили наказание за незаконное обращение с персональными данными  
Новости
Нерегулярный сон увеличивает шансы на сердечный приступ на четверть
Наука
«Уэбб» рассмотрел скрытые детали галактики Сомбреро
Космос