Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре.
lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.
Иронично, что LightTricks назвали свою fast/turbo модель — distill моделью, и мое пояснение стало не совсем корректным. Технически она, скорее всего, не сдистилированна даже, а просто обучена на меньшем количестве шагов. Но они вообще гении нейминга — дистил-лора им нужна для апскейла при использовании дев-модели, как надо, блядь, догадаться до такой хуйни, все же путаются.