Сейчас, чтобы заставить обученную модель ИИ забыть часть данных, часто требуется переобучить ее — удалить все данные, а потом записать их снова, убрав ненужные элементы. Этот процесс вычислений может занять до недели.
Ученые из Стэнфордского университета предложили способы более эффективного удаления записей из моделей ИИ. Исследователи уверены, что их подход сэкономит мегаватты энергии и позволит моделям работать быстрее.
Стэнфордские исследователи применили принцип алгоритма машинного обучения, который называется методом k-средних. Это позволяет ученым автоматически разбивать множество элементов на заранее известное число кластеров. Основная идея заключается в том, что на каждой итерации перевычисляется центр масс для каждого кластера, полученного на предыдущем шаге, затем векторы разбиваются на кластеры вновь в соответствии с тем, какой из новых центров оказался ближе по выбранной метрике.
Так ученые группировали наборы данных и протестировали их редактуру на шести наборах данных. Так они классифицировали цифры, написанные от руки, жесты рук и другую информацию. Они смогли удалить тысячу точек данных из каждого набора без потери данных.