В качестве примера нейросеть обучалась на мульсериале «Флинстоуны». В текстовом сценарии были шаблонные образы: простая обстановка, небольшое количество персонажей и простые действия.
Прежде чем самостоятельно рисовать мультфильмы нейросеть изучила 25 тыс. кадров из «Флинстоунов». Инженеры в каждом кадре отмечали персонажей, фон, действия героев, а система подбирала тестовое описание для кадра.