YandexGPT научат распознавать текст с изображений, аудио и видео

Нейросеть YandexGPT планируют обучить распознаванию и переводу текста с изображений, аудио- и видеофайлов. Об этом сообщают «Ведомости», ссылаясь на описание вакансии AI-тренера, опубликованное на сайте «Яндекса».

Источник, близкий к компании, сообщил, что «Яндекс» планирует нанять около десяти таких специалистов.

Согласно описанию вакансии, AI-тренеры будут обучать нейросеть, создавая эталонные примеры и оценивая качество перевода. Им предстоит научить YandexGPT распознавать и переводить текст с изображений и видео.

В начале 2023 года «Яндекс» уже объявлял набор AI-тренеров для обучения моделей YandexGPT. Тогда искали специалистов, которые работают с русскоязычными текстами. Сейчас компании нужны эксперты, разбирающиеся в узкоспециализированных тематиках — от физики до юриспруденции, чтобы углубить знания модели, сообщил представитель «Яндекса».

Гендиректор Dbrain и автор Telegram-канала AI Happens Алексей Хахунов отметил, что в машинном обучении главное — чистота и качество данных. По его словам, для обучения современных моделей нужны два типа специалистов: нейролингвисты, которые знают, как работают нейросети и создают алгоритмы, и специалисты, владеющие несколькими языками, чтобы формировать переводческие пары. Важно не делать дословный перевод, а собирать семантически близкие варианты. «Фразы могут звучать по-разному на разных языках, и переводчику важно опираться на глубокое понимание языка, а не на дословный перевод», — пояснил эксперт.

Эксперт Андрей Комиссаров из Альянса искусственного интеллекта согласился с этим мнением. Он отметил, что многие нейросети делают дословный перевод и не учитывают тонкости языка. «Здесь речь идет о дообучении модели, и для этого нужно языковое чутье», — добавил он.

По словам Комиссарова, успехи нейросетей в переводе зависят от языка. С английским машинный перевод справляется неплохо, а вот с китайским перевод превращает текст в «бессвязный набор слов», заключил он.

Читать далее:

«Ртутная бомба» несется реками Арктики и угрожает миллионам людей

Редкое событие: скоро в небе будет видно «двойное» суперлуние

Нейросеть для создания видео теперь бесплатная: на что она способна

Обложка: Kandinsky by Sber AI

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Появился прототип твердотельного литиевого аккумулятора с высокой плотностью энергии
Новости
Странную асимметрию Марса наконец-то объяснили
Космос
Как работает наша Вселенная: новые данные о W-бозоне с коллайдера
Наука
Геном человека записали на «вечный» кристалл: он выдержит миллиарды лет
Наука
Оказалось, наша реальность — лишь один из миров квантовой мультивселенной
Космос
Киберучения для сотрудников ЦБ стран БРИКС прошли в Университете Иннополис
Иннополис
Найдены гигантские джеты черных дыр: они противоречат представлениям физиков
Космос
Токсичное стекло уничтожило 99% клеток рака костей
Наука
Посмотрите на слияние двух галактик на новом снимке «Уэбба»
Космос
Российские студенты использовали ИИ для упрощения государственных закупок
Новости
Посмотрите на самый активный вулкан Солнечной системы: он на луне Юпитера
Космос
Гравитационную линзу рекордной силы обнаружили ученые
Космос
Посмотрите на рассвет над Андами: эти фото сделали из космоса
Космос
«Осколок инопланетного корабля» проверили в США: что выяснили ученые
Космос
В России разработали первый детектор для синхротрона СКИФ
Новости
Суперкомпьютер на основе NVIDIA и AMD запустили в работу: его мощность достигнет 500 Пфлопс
Новости
Китай научился засекать стелс-дроны с помощью спутников Starlink
Наука
Поведение ChatGPT вызвало тревогу у пользователей: что происходит
Новости
Темную материю предложили искать, наблюдая за колебаниями Марса
Космос
Суд ЕС отменил антимонопольный штраф в 1,5 млрд евро, наложенный на Google
Новости