Исследователи объяснили, что машинное обучение требует множества примеров из данных. Например, чтобы создать модель ИИ, позволяющую распознать лошадь, ей необходимо проанализировать тысячи изображений лошадей. Это то, что делает технологию дорогой и отличающейся от обучения человека. Ребенку часто нужно увидеть всего несколько примеров предмета, или даже один, прежде чем он сможет распознавать его на протяжении всей своей жизни.
В новой работе предлагается, что модели ИИ тоже могут обучаться так — ученые назвали этот процесс «менее одного» — когда алгоритм распознает больше объектов, несмотря на то, что количество данных, на котором она обучалась, было небольшим.
Например, исследователи обучали ИИ распознаванию цифр, но загружали в модель не данные о каждой цифре, а делали это единой картинкой, учитывая, что у многих цифр есть схожие начертания. Это позволило им уменьшить количество данных с 60 тыс. снимков до 10.
Теперь исследователи работают над тем, чтобы найти другие способы проектирования небольших синтетических наборов данных, будь то ручное проектирование или с помощью другого алгоритма. Однако, несмотря на эти дополнительные исследовательские задачи, в статье представлены теоретические основы для дальнейшего обучения. «Наш вывод заключается в том, что вне зависимости от того, какие наборы данных у вас есть, вы, вероятно, сможете упаковать их для большей эффективности модели», — отметили ученые.
В будущем исследователи хотят обучать даже мощные модели на основе небольших массивов данных. При этом они составят четкие инструкции по упаковке данных, чтобы ими могли воспользоваться ученые даже с небольшим опытом.
Читать также
Раньше у Земли и Луны был общий магнитный щит. Это спасло планету от Солнца
В черных дырах могут быть вселенные. Рассказываем о новом открытии
На 3 день болезни большинство больных COVID-19 теряют обоняние и часто страдают насморком