YandexGPT научат распознавать текст с изображений, аудио и видео

Нейросеть YandexGPT планируют обучить распознаванию и переводу текста с изображений, аудио- и видеофайлов. Об этом сообщают «Ведомости», ссылаясь на описание вакансии AI-тренера, опубликованное на сайте «Яндекса».

Источник, близкий к компании, сообщил, что «Яндекс» планирует нанять около десяти таких специалистов.

Согласно описанию вакансии, AI-тренеры будут обучать нейросеть, создавая эталонные примеры и оценивая качество перевода. Им предстоит научить YandexGPT распознавать и переводить текст с изображений и видео.

В начале 2023 года «Яндекс» уже объявлял набор AI-тренеров для обучения моделей YandexGPT. Тогда искали специалистов, которые работают с русскоязычными текстами. Сейчас компании нужны эксперты, разбирающиеся в узкоспециализированных тематиках — от физики до юриспруденции, чтобы углубить знания модели, сообщил представитель «Яндекса».

Гендиректор Dbrain и автор Telegram-канала AI Happens Алексей Хахунов отметил, что в машинном обучении главное — чистота и качество данных. По его словам, для обучения современных моделей нужны два типа специалистов: нейролингвисты, которые знают, как работают нейросети и создают алгоритмы, и специалисты, владеющие несколькими языками, чтобы формировать переводческие пары. Важно не делать дословный перевод, а собирать семантически близкие варианты. «Фразы могут звучать по-разному на разных языках, и переводчику важно опираться на глубокое понимание языка, а не на дословный перевод», — пояснил эксперт.

Эксперт Андрей Комиссаров из Альянса искусственного интеллекта согласился с этим мнением. Он отметил, что многие нейросети делают дословный перевод и не учитывают тонкости языка. «Здесь речь идет о дообучении модели, и для этого нужно языковое чутье», — добавил он.

По словам Комиссарова, успехи нейросетей в переводе зависят от языка. С английским машинный перевод справляется неплохо, а вот с китайским перевод превращает текст в «бессвязный набор слов», заключил он.

Читать далее:

«Ртутная бомба» несется реками Арктики и угрожает миллионам людей

Редкое событие: скоро в небе будет видно «двойное» суперлуние

Нейросеть для создания видео теперь бесплатная: на что она способна

Обложка: Kandinsky by Sber AI

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Больше миллиона Гбит в секунду: японцы побили рекорд скорости передачи данных по оптоволокну
Новости
Хаос во благо: физики создали новый инструмент для квантового мира
Наука
Hugging Face выпустила недорогих человекоподобных роботов с открытым кодом
Новости
Китайский аккумулятор для электромобиля выдержал наезд 36-тонного танка
Новости
Воспитанники детских домов изучат основы работы с нейросетями
Новости
Четвероногий робот из Цюриха научился играть в бадминтон с людьми
Новости
В MIT раскрыли механизм набора веса из-за жирной пищи и как обратить его вспять
Наука
60 000 лет рядом: ученые выяснили, кто стал первым паразитом человека
Наука
Ректора Университета Иннополис избрали членом-корреспондентом РАН
Иннополис
В Корее робопса научили паркуру и бегу по стенам: посмотрите, что он может
Новости
Древний череп «человека-муравья» нашли в Аргентине
Наука
На селфи марсохода попал неожиданный объект: его заметили не сразу
Космос
Посмотрите на двух морских коньков, которых застукали за «поцелуем» в океане
Наука
Почти 10 000 роутеров Asus тайно заразили: как проверить свой и защититься
Новости
Ракета будет доставлять товары с AliExpress за час по всему миру: ее испытали в Китае
Новости
В России пригрозили «душить» иностранные сервисы: кто в опасности
Новости
Boston Dynamics усовершенствовала систему восприятия гуманоидного робота Atlas
Новости
Наклейка на лоб анализирует мозговые волны и предсказывает переутомление
Наука
Посмотрите на робота-трансформера, который меняет форму прямо в полете
Новости
Китай отправил миссию за образцами горных пород с квазиспутника Земли
Космос