Исследовательская группа из Яндекс Research и НИУ ВШЭ представила метод SwD (Scale-wise Distillation of Diffusion Models), который значительно ускоряет процесс генерации изображений в диффузионных моделях, при этом не ухудшая их визуальное качество. По словам разработчиков, традиционный процесс требует выполнения множества шагов с вычислениями на высоком разрешении, что замедляет генерацию. Метод SwD решает эту проблему, начиная с низкого разрешения и постепенно улучшая изображение по мере уменьшения шума.
Метод также включает дистилляцию уже обученных моделей, таких как FLUX и Stable Diffusion 3.5, где более простая модель-студент воспроизводит результаты сложной модели, сокращая количество шагов генерации с десятков до 4–6. Для обучения используется новая функция потерь — Maximum Mean Discrepancy (MMD), которая сравнивает внутренние представления изображений у модели-учителя и модели-студента. Это упрощает и ускоряет обучение, сокращая время одной итерации в 7 раз.
Благодаря SwD, изображения могут быть созданы за 0,3–0,4 секунды, при этом сохраняется их визуальное качество. Это делает современные диффузионные модели более быстрыми и экономичными, расширяя их возможности для практического использования. Статья о разработке была принята для представления на конференции ICLR 2026.