Российская модель ИИ восстановит рецепт блюда по фотографии и решит пример на доске

Исходный код российской мультимодальной модели искусственного интеллекта опубликован в открытом доступе. О разработке «Хайтеку» рассказала пресс-служба Института искусственного интеллекта AIRI.

Институт искусственного интеллекта AIRI представил открытую версию модели OmniFusion – OmniFusion 1.1. Мультимодальная языковая модель способна поддерживать визуальный диалог, отвечать на вопросы пользователей по картинкам и поддерживает русский язык. Исходный код, включая веса модели и скрипты для обучения, опубликованы в репозитории GitHub.

OmniFusion распознает и описывает изображения. Например, с ее помощью можно объяснить, что изображено на снимке, узнать рецепт для приготовления блюда по фотографии ингредиентов, проанализировать карту помещения или узнать, как собрать устройство по фото отдельных его частей.

Модель также умеет распознавать текст и решать задачи. Например, с её помощью можно решить логические задачи, написанный на доске математический пример или распознать формулу, а также получить их представления в формате LaTeX.

Примеры диалогов с OmniFusion. Изображение: Научно-исследовательский Институт искусственного интеллекта AIRI

Спектр возможностей широкий, заявляют разработчики: модель уже может проанализировать медицинское изображение и указать на нем какую-то проблему. Правда, чтобы ставить диагнозы, OmniFusion необходимо дополнительно обучать на профильных датасетах с привлечением экспертов из медицины.

OmniFusion — это первая в России мультимодальная модель. Среди зарубежных аналогов на рынке представлены, например, LLaVA, Gemini, GPT4-Vision, а также китайские модели Qwen, DeepSeek и LVIS. Часть из них относится к числу проприетарного ПО, то есть находится в закрытом доступе.

Публикуя открытый исходный код OmniFusion, включая веса модели и скрипты для обучения, мы стремимся внести вклад в сообщество исследователей искусственного интеллекта и поспособствовать дальнейшему развитию мультимодальных архитектур, созданию новых приложений на их основе.

Иван Оселедец, доктор физико-математических наук, Профессор РАН, генеральный директор Института AIRI

Читать далее:

Посмотрите, каким было солнечное затмение из космоса

Посмотрите, что подводный робот нашел на дне Байкала

Ученые поняли, почему «Вояджер-1» отправлял ерунду почти пять месяцев

На обложке: Изображение от fullvector на Freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Стартовал прием заявок на студкемп Яндекса по математике в ИИ
Новости
Супер-ИИ для учебы и поддержки, нейросеть для творчества, поиск по видео и мощный процессор — главное с Google I/O
Кейсы
По соседству с нашей галактикой нашли три старейшие звезды: откуда они появились
Космос
Посмотрите на астероид, который пролетел очень близко к Земле
Космос
Рядом с нами нашли планету размером с Землю: год там длится 17 часов
Космос
Загадочную аномалию нашли у пирамид Гизы: ученые не знают, что это
Наука
Минздрав уточнил информацию о «запрещенных» для водителей препаратах
Наука
Второй суперкомпьютер преодолел экзофлопсный барьер
Новости
Вулканический пепел предложили использовать для хранения солнечной энергии
Наука
Квадрокоптер установил мировой рекорд: он разогнался до 480 км/ч
Новости
Созданы умные контактные линзы для взаимодействия с компьютером
Новости
На Солнце произошла самая мощная вспышка почти за 20 лет
Космос
Google дополнит привычный поиск в сети ответами искусственного интеллекта
Новости
Посмотрите на огромную плотину из космоса
Космос
Свидания будут назначать ИИ-свахи: функцию уже тестируют
Новости
Обновленная GPT4o: чем она отличается от остальных, какие функции и как работает
Кейсы
В MIT дали ИИ возможность «думать, как люди»
Новости
Ученые опровергли главный миф о Бетховене
Новости
На ЦИПР Tech Week пройдет нижегородская часть молодежного дня киберфестиваля PHDays
Новости
Посмотрите на недорогого, но удивительно гибкого гуманоидного робота
Новости