Нейросеть YandexGPT планируют обучить распознаванию и переводу текста с изображений, аудио- и видеофайлов. Об этом сообщают «Ведомости», ссылаясь на описание вакансии AI-тренера, опубликованное на сайте «Яндекса».
Источник, близкий к компании, сообщил, что «Яндекс» планирует нанять около десяти таких специалистов.
Согласно описанию вакансии, AI-тренеры будут обучать нейросеть, создавая эталонные примеры и оценивая качество перевода. Им предстоит научить YandexGPT распознавать и переводить текст с изображений и видео.
В начале 2023 года «Яндекс» уже объявлял набор AI-тренеров для обучения моделей YandexGPT. Тогда искали специалистов, которые работают с русскоязычными текстами. Сейчас компании нужны эксперты, разбирающиеся в узкоспециализированных тематиках — от физики до юриспруденции, чтобы углубить знания модели, сообщил представитель «Яндекса».
Гендиректор Dbrain и автор Telegram-канала AI Happens Алексей Хахунов отметил, что в машинном обучении главное — чистота и качество данных. По его словам, для обучения современных моделей нужны два типа специалистов: нейролингвисты, которые знают, как работают нейросети и создают алгоритмы, и специалисты, владеющие несколькими языками, чтобы формировать переводческие пары. Важно не делать дословный перевод, а собирать семантически близкие варианты. «Фразы могут звучать по-разному на разных языках, и переводчику важно опираться на глубокое понимание языка, а не на дословный перевод», — пояснил эксперт.
Эксперт Андрей Комиссаров из Альянса искусственного интеллекта согласился с этим мнением. Он отметил, что многие нейросети делают дословный перевод и не учитывают тонкости языка. «Здесь речь идет о дообучении модели, и для этого нужно языковое чутье», — добавил он.
По словам Комиссарова, успехи нейросетей в переводе зависят от языка. С английским машинный перевод справляется неплохо, а вот с китайским перевод превращает текст в «бессвязный набор слов», заключил он.
Читать далее:
«Ртутная бомба» несется реками Арктики и угрожает миллионам людей
Редкое событие: скоро в небе будет видно «двойное» суперлуние
Нейросеть для создания видео теперь бесплатная: на что она способна
Обложка: Kandinsky by Sber AI