Британская робототехническая компания Engineered Arts продемонстрировала новые возможности гуманоидного робота Ameca. В видео на YouTube исследователь спрашивает устройство: «Я слышал, что вы можете говорить на многих языках, это правда?» Робот подтверждает это предположение и демонстрирует свои языковые способности.
Разработчики указывают в описании к видео, что для разговора и перевода в этой демонстрации Ameca использовала языковую модель GPT-3. Кроме того, роботу интегрировали модель машинного обучения DeepL для распознавания речи и генерации голоса.
Ранее Engineered Arts демонстрировал способность своего робота реалистично передавать различные эмоции: от удивления и недовольства до отвращения. Исследователи отмечают, что они пробовали использовать для обучения языкам две модели GPT-3 и GPT-4. При этом более поздняя модель привела к замедленному отклику, из-за которого реалистичность передачи выражений лица сократилась.
В настоящее время команда работает над демо-версией робота, которая будет использовать систему клонирования голоса от компании Eleven labs. Эта модель использует более сложную мимику благодаря дополнительной «генерации фонем» синхронизации губ. Ожидается, что модернизированная версия робота будет представлена в ближайшее время.
Читать далее:
Специальная диета запускает самоуничтожение раковых клеток мозга у мышей
Ученые расшифровали загадочную рукопись Птолемея. Он был скрыт под другим текстом