Новости 31 января 2021

В системы распознавания речи внедрят анализ языка жестов и невербальных техник

Далее

Жестикуляция влияет на восприятие человеком речи. Например, если сделать акцент руками во время произношения безударного слога, то слушатель воспримет этот слог как ударный. Подобные аспекты стоит учитывать во время разработки систем распознавания речи, считают ученые из Общества научных исследования им. Макса Планка. Результаты их исследований опубликованы в Mail Online.

Само исследование было посвящено восприятию людьми информации, которую произносят вслух, а также оценке влияния жестов. Добровольцам предложили проанализировать видеозаписи с выступлениями людей. Лица выступавших были скрыты, зато участники исследования могли видеть жесты ораторов. Большинство слушателей обратили внимание на жесты «ритма», которые люди часто используют для выделения важных мест в речи и смысловых единиц. Кроме того, респонденты заявили, что именно жесты помогли им сконцентрироваться на тех или иных местах выступления. И именно их они и запомнили лучше всего.

Кроме того, жесты влияли на распознавание слов. Например, участники воспринимали слог как ударный, если в этот момент выступающий делал акцент жестом. Если же говорящий произносил всего лишь набор букв, но опять же делал акцент, то участники исследования по-прежнему воспринимали это как слово с разной длинной гласных или ударением, в зависимости от жеста оратора.

«Люди слушают не только ушами, но и глазами. Эти результаты впервые показывают, что жесты влияют на то, какие звуки мы слышим». Исследователи считают, что эффект может быть более сильным в обычной жизни, когда речь, как правило, менее понятна, чем во время эксперимента в лаборатории. Так что в условиях шума жесты могут оказаться полезными».

Харт Рутгер Боскер, автор исследования из Общества научных исследования им. Макса Планка

Подобные исследования, по мнению ученых, усовершенствуют системы распознавания речи. Поскольку невербальные средства общения — мимика и жесты — влияют как на восприятие речи, так и на ее смысловую нагрузку. Технологиям следует не только научиться распознавать интонацию или темп речи, но и то, как говорящий предподносит информацию с помощью жестикуляции.


Читайте также:

Ученые вывели замену для теории относительности. В чем суть «теории всего»?

Аборты и наука: что будет с детьми, которых родят

Создана новая концепция ракетного двигателя на основе солнечных вспышек