Существуют десятки тысяч различных узоров из жилок на листьях, и запомнить их все пока не удавалось никому. Обычно ботаники используют метод классификации вручную, который называется архитектура листа. Большая часть известных сегодня узоров на листьях занесена в многостраничный труд, созданный еще в 19 веке. Именно в нем ботаники ищут подходящий вариант — и на это может уйти два часа.
Чтобы помочь себе и своим коллегам Питер Вильф совместно с Томасом Серре, экспертом по компьютерным наукам из Браунского университета, разрабатывает алгоритм, который будет классифицировать листья за долю секунды.
В базе данных системы содержится уже 7597 изображений листьев, которые предварительно были выбелены и отсканированы таким образом, что на них видны все детали прожилок и узоров. Ученые не стали устранять мелкие несовершенства, например, следы от наскомых и разломы, так как эти детали могут многое сказать о происхождении растения.
Алгоритм составляет тепловую карту листа и выделяет красными точками отдельные элементы, которые могут указывать на какие-либо из 50 различных характеристик листьев. На основе этих данных система классифицирует семейство, к которому принадлежит растение.
Вильф также планирует обучить систему распознавать лиственные окаменелости, идентифицировать которые человеку еще сложнее. По мнению Вильфа, созданный им алгоритм и другие подобные программы не заменят ботаников, но зато подскажут им, куда именно нужно смотреть.