YandexGPT научат распознавать текст с изображений, аудио и видео

Нейросеть YandexGPT планируют обучить распознаванию и переводу текста с изображений, аудио- и видеофайлов. Об этом сообщают «Ведомости», ссылаясь на описание вакансии AI-тренера, опубликованное на сайте «Яндекса».

Источник, близкий к компании, сообщил, что «Яндекс» планирует нанять около десяти таких специалистов.

Согласно описанию вакансии, AI-тренеры будут обучать нейросеть, создавая эталонные примеры и оценивая качество перевода. Им предстоит научить YandexGPT распознавать и переводить текст с изображений и видео.

В начале 2023 года «Яндекс» уже объявлял набор AI-тренеров для обучения моделей YandexGPT. Тогда искали специалистов, которые работают с русскоязычными текстами. Сейчас компании нужны эксперты, разбирающиеся в узкоспециализированных тематиках — от физики до юриспруденции, чтобы углубить знания модели, сообщил представитель «Яндекса».

Гендиректор Dbrain и автор Telegram-канала AI Happens Алексей Хахунов отметил, что в машинном обучении главное — чистота и качество данных. По его словам, для обучения современных моделей нужны два типа специалистов: нейролингвисты, которые знают, как работают нейросети и создают алгоритмы, и специалисты, владеющие несколькими языками, чтобы формировать переводческие пары. Важно не делать дословный перевод, а собирать семантически близкие варианты. «Фразы могут звучать по-разному на разных языках, и переводчику важно опираться на глубокое понимание языка, а не на дословный перевод», — пояснил эксперт.

Эксперт Андрей Комиссаров из Альянса искусственного интеллекта согласился с этим мнением. Он отметил, что многие нейросети делают дословный перевод и не учитывают тонкости языка. «Здесь речь идет о дообучении модели, и для этого нужно языковое чутье», — добавил он.

По словам Комиссарова, успехи нейросетей в переводе зависят от языка. С английским машинный перевод справляется неплохо, а вот с китайским перевод превращает текст в «бессвязный набор слов», заключил он.

Читать далее:

«Ртутная бомба» несется реками Арктики и угрожает миллионам людей

Редкое событие: скоро в небе будет видно «двойное» суперлуние

Нейросеть для создания видео теперь бесплатная: на что она способна

Обложка: Kandinsky by Sber AI

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости
Компания Цукерберга использовала уязвимость подростков для рекламы
Новости