Исследователи несколько лет пытались создать алгоритм, который будет с высокой точностью распознавать не горизонтально расположенные символы. Теперь инженеры из Amazon разработали TextTubes — это детектор искривленного текста.
Алгоритм считывает текст в два шага — сначала обнаруживает и определяет его последовательность, а затем распознает. Для первой задачи TextTubes локализует символы, потом, с помощью контекстных подсказок, определяет, как правильно его читать, а затем — расшифровывает содержание. Основная сложность — в деформации текста и произвольных шрифтах.
Исследователи оценили производительность TextTubes на CTW-1500 — наборе данных, состоящем из 1500 изображений, собранных из стоковых библиотек. На них есть более 10 тыс. текстов, содержащих, по крайней мере, одно слово, написанное не строго по горизонтали. Кроме того, массив содержал примерно 1255 учебных изображений и 300 тестовых изображений с одним или несколькими изогнутыми текстами. Ученые сообщили, что они достигли лучших результатов в отрасли — 83,65% удачных случаев распознавания.
Ранее компания Baidu представила ИИ, который распознает язык лучше среднего человека. Искусственный интеллект победил в чемпионате по понимаю языка GLUE (General Language Understanding Evaluation). Об этом пишет MIT Technology Review.