Новости 18 июля 2020

Новый ИИ можно обучать даже на старом компьютере

Далее

Ученые из США представили чип, который может обеспечить большую вычислительную мощность для обучения ИИ. Пока он стоит несколько миллионов долларов, но в будущем станет дешевле и позволит независимым командам заниматься сложным обучением моделей.

Отчет OpenAI за 2018 год показал, что вычислительная мощность для обучения самых крупных моделей ИИ растет невероятно быстрыми темпами, удваиваясь каждые 3-4 месяца. Один из самых сложных методов обучения — это глубокое обучение, где ИИ учится на своих ошибках с помощью миллиона итераций во время симуляций. Таким образом, например, создатели видеоигр улучшают визуальное сопровождение.

Новое специализированное оборудование, Cerebras System’s Wafer Scale Engine, позволяет заменить множество мощных компьютеров и использовать один небольшой чип, который подходит для обучения ИИ. Однако пока его нельзя производить массово и исследователи отмечают, что он будет стоить несколько миллионов долларов.

«Это фантастическое достижение, которое позволит тысячам независимых исследователей достигать таких же мощных результатов, как и командам огромных корпораций. К тому же, вычислительные ресурсы, обычно нужные для проведения такого рода исследований, приводят к большому углеродному следу. Теперь нам удалось от него избавиться».

исследователи университета Южной Калифорнии

В этом методе агента ИИ помещают в симуляционную среду, которая обеспечивает вознаграждение за достижение определенных целей. Их модель использует в качестве обратной связи для дальнейшего обучения. Оно включает в себя три основных вычислительных задачи: моделирование среды и агента; принятие решения о том, что делать дальше на основе выученных правил и использование результатов этих действий для обновления своего поведения.

Это привело к значительному ускорению обучения по сравнению с другими подходами. Используя один компьютер, оснащенный 36-ядерным процессором, исследователи смогли обрабатывать примерно 140 тыс. кадров в секунду во время тренировок по видеоиграм Atari и Doom. В учебной 3D-среде DeepMind Lab они обеспечили тактовую частоту 40 тыс. кадров в секунду, что на 15% лучше обычного.


Читайте также:

Посмотрите на огромную «стену» из сотни тысяч галактик позади Млечного пути

Комета NEOWISE видна в России. Где ее увидеть, куда смотреть и как сделать фото

НАСА и ЕКА опубликовали самый детальный снимок Солнца