YandexGPT научат распознавать текст с изображений, аудио и видео

Нейросеть YandexGPT планируют обучить распознаванию и переводу текста с изображений, аудио- и видеофайлов. Об этом сообщают «Ведомости», ссылаясь на описание вакансии AI-тренера, опубликованное на сайте «Яндекса».

Источник, близкий к компании, сообщил, что «Яндекс» планирует нанять около десяти таких специалистов.

Согласно описанию вакансии, AI-тренеры будут обучать нейросеть, создавая эталонные примеры и оценивая качество перевода. Им предстоит научить YandexGPT распознавать и переводить текст с изображений и видео.

В начале 2023 года «Яндекс» уже объявлял набор AI-тренеров для обучения моделей YandexGPT. Тогда искали специалистов, которые работают с русскоязычными текстами. Сейчас компании нужны эксперты, разбирающиеся в узкоспециализированных тематиках — от физики до юриспруденции, чтобы углубить знания модели, сообщил представитель «Яндекса».

Гендиректор Dbrain и автор Telegram-канала AI Happens Алексей Хахунов отметил, что в машинном обучении главное — чистота и качество данных. По его словам, для обучения современных моделей нужны два типа специалистов: нейролингвисты, которые знают, как работают нейросети и создают алгоритмы, и специалисты, владеющие несколькими языками, чтобы формировать переводческие пары. Важно не делать дословный перевод, а собирать семантически близкие варианты. «Фразы могут звучать по-разному на разных языках, и переводчику важно опираться на глубокое понимание языка, а не на дословный перевод», — пояснил эксперт.

Эксперт Андрей Комиссаров из Альянса искусственного интеллекта согласился с этим мнением. Он отметил, что многие нейросети делают дословный перевод и не учитывают тонкости языка. «Здесь речь идет о дообучении модели, и для этого нужно языковое чутье», — добавил он.

По словам Комиссарова, успехи нейросетей в переводе зависят от языка. С английским машинный перевод справляется неплохо, а вот с китайским перевод превращает текст в «бессвязный набор слов», заключил он.

Читать далее:

«Ртутная бомба» несется реками Арктики и угрожает миллионам людей

Редкое событие: скоро в небе будет видно «двойное» суперлуние

Нейросеть для создания видео теперь бесплатная: на что она способна

Обложка: Kandinsky by Sber AI

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Сверхзвуковой самолет побил рекорд: всего 3,5 часа полета из Лондона в Нью-Йорк
Новости
Где все инопланетяне: парадокс Ферми получил новое объяснение
Космос
Посмотрите, как выглядела Дева Мария до рождения Иисуса: портрет не похож на все известные
Новости
Apple готовит очень спорный iPhone 17 – СМИ
Новости
Neuralink создает роборуку: ей можно управлять силой мысли
Новости
Посмотрите на взрыв ракеты-носителя Epsilon S во время испытаний в Японии
Космос
Астрофизики обнаружили электроны космических лучей с рекордной энергией
Космос
Российские ученые улучшили переработку углекислого газа с помощью меди
Наука
Обнаружены нейроны, регулирующие сексуальное поведение самок млекопитающих
Наука
Систему управления кибербезопасностью для бизнеса разработали в Университете Иннополис
Иннополис
В работе сервисов Microsoft произошел глобальный сбой
Новости
11 000 россиян проверили научную грамотность на акции «Открытая лабораторная»
Наука
Музыкальный ИИ Nvidia «генерирует звуки, которых никто не слышал»
Новости
У летучих мышей нашли генетический «план Б» для адаптации к потере слуха
Наука
Найден способ помочь ИИ справляться со сложными задачами
Новости
В России создали безопасную систему для доставки ДНК-вакцин в клетки
Наука
Найден «рыбный завод», построенный предшественниками майя 4000 лет назад
Наука
Обзор TECNO Megabook S1: легкий металл
Технологии
Вспышки света из черных дыр озадачили астрономов
Космос
Интерпретируемость ИИ: как модели принимают решения
Мнения