Нейросеть научилась искать объекты на изображении по голосовому описанию

Исследователи из Массачусетского технического университета (MIT) создали алгоритм, способный распознать объекты на изображении на основе их простого речевого описания без дополнительных пояснений. Об этом пишет Engadget.

Существующие системы распознавания речи требуют множество аннотаций и транскрипций для эффективного выполнения задач. Разработанная инженерами из MIT система работает проще — например, ей достаточно сказать «синяя рубашка», и ИИ найдет объект на изображении.

Система состоит из двух нейросетей — первая делит изображение на сетку из маленьких ячеек, а вторая разделяет звуковую спектрограмму на короткие отрезки по одной-две секунды. Затем ИИ проверяет, насколько точно аудиодорожка соответствует изображению в сетке.

Ученые полагают, что разработка может использоваться для создания переводчиков, способных распознать язык и подобрать подходящий перевод с точностью до 100%.

Искусственный интеллект от MIT по речи поймет, есть ли у человека депрессия

Ранее инженеры из Лаборатории компьютерных наук Массачусетского технологического института создали искусственный интеллект, способный определить структуру и назначение объекта, с которым алгоритм никогда раньше не сталкивался. Разработка позволит сделать роботов действительно эффективными помощниками на производстве и дома.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Почему постройки Древнего Рима стоят уже 2000 лет, а современные здания трескаются через 100
Наука
Неизвестную форму материи нашли в далекой галактике
Космос
Мошенники начали использовать данные с сайтов судов: как работает обманная схема
Новости
Минкульт назвал причину удаления «Гарри Поттера» из онлайн-кинотеатров после пропаганды чайлдфри
Новости
Первый в России дронопорт заработал на бывшем военном аэродроме
Новости
Робот-медбрат Nurabot начал работать в больнице Тайваня
Новости
Свадьба в один клик: омские студенты создают платформу для молодоженов
Новости
Микрочастицы доставляют две дозы вакцины в нужный срок после одного укола
Наука
Химики МГУ расшифровали спектры космической органики с помощью ИИ
Космос
В Windows внедряют универсальный стандарт для работы с ИИ
Новости
ChatGPT переубеждал людей в дебатах, когда знал, с кем общается
Новости
Микроводоросли очищают сточные воды от остатков антибиотиков
Наука
Странная «мода» обезьян похищать чужих детенышей попала на видео
Наука
China Telecom заявила о создании «невзламываемой» системы квантовой криптографии
Новости
Тайна кладбища динозавров: палеонтологи предполагают древнюю катастрофу
Наука
Неизвестный штамм микробов нашли на китайской космической станции
Космос
Российские физики разгадали тайну зарождения молнии
Наука
«Облако Судного дня» пронеслось над США: что это было
Наука
Посмотрите на Марс перед рассветом: почему это очень редкий пейзаж
Космос
Этот робот собирает кубик Рубика быстрее, чем моргает человек
Новости