Новости 14 декабря 2015

Программу научили писать — и у нее хороший почерк

Далее

Программа научилась писать буквы алфавитов на разных языках, в том числе и на вымышленном языке из мультсериала “Футурама”.

Машинное обучение, как ни странно, плохо поддается обучению. Чтобы программа освоила новое понятие, ей нужно «объяснить» его сотни или даже тысячи раз. Недавно была создана компьютерная модель, которая воспринимает непривычные концепции, ознакомившись лишь с одним примером. В этом она подражает человеку и его способности обучаться.

Несмотря на значительный прогресс ученых в сфере машинного обучения, люди по-прежнему усваивают новые концепции лучше, чем машины.

«Ребенку можно показать лошадь, школьный автобус и скейтборд, и он запомнит эти понятия с одного раза. Стандартным алгоритмам машинного обучения требуются десятки, сотни и даже тысячи примеров», — отмечает соавтор исследования Джошуа Тененбаум из Массачусетского технологического института.

Чтобы добиться скорости восприятия новых знаний, машинам предлагали запоминать простые визуальные образы — письменные буквы из алфавитов со всего мира. Обычно алгоритмы распознавания воспринимают символы как наборы пикселей или сумму характеристик. Новая модель воспринимает каждый символ как отдельную компьютерную программу. К примеру, программа для буквы А прорисовывает эту букву отдельными штрихами. При этом стиль написания может быть различным — так программа понимает, что есть несколько способов написания одной буквы.

На создание этого алгоритма ученых вдохновили обычные люди. Исследователи обратили внимание, что люди пишут новые буквы более старательно и внимательно и выделяют в одном символе несколько компонентов, вместо того, чтобы воспринимать букву как единое целое.

Модель также применяет свои прошлые знания для получения новых. К примеру, она использует знание латинского алфавита для изучения греческого. Алгоритм получил название Байесова программа обучения (БПО).

Эту модель ученые применили для изучения 1600 видов письменных букв в 50 системах письменности, включая санскрит, тибетский, гуджарати и глаголицу, а также вымышленные буквы из «Футурамы» и онлайн-игры Dark Horizon. Ученые провели своеобразный тест Тьюринга и обнаружили, что люди с трудом отличают «почерк» машины от почерка человека.

БПО неплохо справляется и с творческими заданиями. Когда ее попросили создать собственную букву по аналогии с буквами тибетского алфавита, она справилась с задачей не хуже человека.

Отчет об исследовании был опубликован в декабре в журнале Science. В перспективе новую модель можно применять для распознавания почерка, речи, жестов и объектов.