Кейсы 12 мая 2016

Создан гибрид краудсорсинга и машинного обучения

Далее

Профессор Университета Карнеги - Меллон разработал платформу краудсорсинга, которая сочетает лучшие качества машинного обучения с человеческим интеллектом, для того чтобы позволить отдельным группам сотрудников выполнять сложные когнитивные задачи без центрального организатора. Изобретение будет представлено на конференции Computer-Human Interaction в Чикаго.

Профессор Аникет Киттур создал два прототипа. Один из них, Акселератор знаний, помогает рассредоточенным группам выполнять синтез информации. Программа комбинирует материал из разных источников и создает статьи, которые могут давать ответы на часто задаваемые вопросы, к примеру: «Как вырастить больше помидоров?» или «Как справиться с засором?»

Суть программы заключается в создании системы, которая могла бы разделять задания на мелкие микроцели, каждая из которых оплачивается по $1 за 5-10 минут работы. Затем система комбинирует информацию таким образом, будто статья была написана одним автором. Исследование показало, что такой метод помогает создавать статьи более полезные, чем топ-5 результатов запросов в Google.

С помощью Акселератора знаний каждый сотрудник прикладывает небольшое усилие, чтобы синтезировать информацию для ответа на сложные вопросы, при отсутствии куратора или модератора.

Другая проблема, с которой работал Киттур и его команда, это кластеризация — вычленение тем или шаблонов из документов для организации информации, будь то поиск в интернете, научная статья или обзор товара.

Системы машинного обучения доказали свою пригодность для такого рода задач, но их неспособность понимать оттенки смыслов в схожих документах и темах означает, что люди все еще делают это лучше, но часто упускают из виду весь контекст.

«Ключевой аспект тут — создание большой картины, когда каждый человек в отдельности видит только маленький кусочек», — говорит Киттур.

Вторая разработка Киттура — Alloy (cплав) — сочетает человеческий интеллект с машинным обучением для ускорения кластеризации. На первом этапе сотрудники определяют значимые категории и приводят показательные примеры, которые машина использует для сбора большого объема тем или документов. На втором — люди просматривают собранный материал, который машина не смогла точно сопоставить, и выдают дополнительную информацию.

Этот подход дает лучшие результаты и за меньшие деньги, чем технология краудсорсинга. По словам ученого, ее можно адаптировать для других задач — например, разбиения на группы изображений или распознавания потокового видео, пишет Phys.org.