Алгоритмы приобретают все более изощренные навыки. Группа ученых из Университетского колледжа Лондона разработала систему “Мой текст в твоем почерке”. Программа анализирует почерк человека, а затем воспроизводит его с высокой точностью, причем это касается даже неразборчивого стиля письма.
Для проведения анализа и воспроизведения почерка алгоритму понадобится четыре листа А4, на которых будет написано хотя бы по одному абзацу от руки. Программа отсканирует текст и преобразует его в скелетную формулу — в ней будут рассмотрены отдельные буквы и их расположение в слове. Аналитику проводит компьютер при участии модератора.
Система рассматривает почерк во всех деталях: как буквы подсоединяются друг к другу, как обрываются. Также алгоритм обнаруживает так называемые связки — два разных символа, которые выступают частью одного слова, например, вертикальные и горизонтальные черточки в букве t. Кроме того, программа принимает к сведению расстояние между буквами, их высоту и расположение в строке.
Используя отсканированный материал, система воспроизводит почерк человека. При этом алгоритм учитывает, что люди могут по-разному писать одни и те же буквы в разных словах. Благодаря такой методике сымитированный компьютером почерк получается более живым и правдоподобным. На реалистичность воспроизведения влияет и специальный аналитический механизм, который оценивает текстуру письма, а именно, то, какой ручкой и чернилами написан текст.
Программу научили писать — и у нее хороший почерк
Идеи
Ученые решили проверить, насколько успешно алгоритм может подражать человеку. Для этого группу людей попросили определить, кто подписал конверты — человек или машина. Опрошенные делали неверный выбор в 40% случаев.
Как отмечает Engadget, различные программы могут конвертировать письменный текст в печатный, а некоторые шрифты успешно имитируют почерк человека. Так, Байесова программа обучения (БПО) может правдоподобно воспроизводить графемы разных систем письменности — от санскрита до языка онлайн-игры Dark Horizon, а также создавать собственные буквы по аналогии с буквами заданного алфавита. Однако пока ни один алгоритм не мог с такой точностью имитировать почерк человека с учетом всех особенностей.
Спектр применения этой технологии достаточно широк. Алгоритмом смогут пользоваться пожилые люди, которым трудно писать от руки. Также письменные тексты могут автоматически переводиться на другие языки, при этом стиль почерка сохранится (но только в случае сходства графем). Но не стоит исключать и другие сценарии применения — программу наверняка захотят использовать для подделки подписей и документов. Впрочем, ученые подчеркнули, что разработанная ими система позволяет анализировать письменный текст и определять, кем он написан — машиной или человеком. Эта функция пригодится органам правопорядка, считают исследователи.