Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 162 38 64
Локальной генерации ИИ-видео №6 /video/ Аноним 10/06/26 Срд 07:46:38 1628892 1
232212-LTX23000[...].mp4 6484Кб, 480x720, 00:00:21
480x720
FEASTlow.mp4 18327Кб, 1280x720, 00:01:09
1280x720
ComfyUI00004.mp4 686Кб, 672x928, 00:00:05
672x928
nava.mp4 6507Кб, 854x470, 00:00:48
854x470
Актуальные модели

1. Wan от Alibaba

https://huggingface.co/collections/Wan-AI/wan22

VACE модели:
https://github.com/ali-vilab/VACE
https://huggingface.co/Wan-AI/Wan2.1-VACE-14B
https://huggingface.co/Wan-AI/Wan2.1-VACE-1.3B

2. LTX-2.3 - делает локальную генерацию грейт агейн. Подходят лоры от 2.0

https://huggingface.co/Lightricks/LTX-2.3

Известные тюны:
Sulphur
Eros

3. Hunyuan от Tencent

https://huggingface.co/tencent/HunyuanVideo-1.5

4. Ovi

https://huggingface.co/chetwinlow1/Ovi

5. Starflow

https://huggingface.co/apple/starflow

6. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1

7. LongCat-Video

https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video
https://meituan-longcat.github.io/LongCat-Video/

8. MOVA

https://github.com/OpenMOSS/MOVA

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Hunyuan Video (осторожно, ссылки в туторе на предыдущую модель): https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/

Гайд для использования Wan 2.2

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan: https://github.com/kijai/ComfyUI-WanVideoWrapper

Где брать готовые LoRA
https://civitai.com/models

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Терминология моделей
prune — удаляем ненужные веса, уменьшаем размер
distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше
quant — уменьшаем точность весов, уменьшаем размер
scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше
merge — смешиваем несколько моделей или лор в одну, как краски на палитре.

lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.

Кейворды для дополнительных вещей: SVI, RuneXX, LTX Director.

Предыдущий тред
>>1599474 (OP)
Аноним 10/06/26 Срд 07:57:14 1628896 2
VID202606060952[...].mp4 3242Кб, 854x480, 00:00:13
854x480
Как думаете, какой моделью сделано? Реально ли повторить локально? Пускай даже и с качеством чуть похуже.
Аноним 10/06/26 Срд 16:06:50 1629127 3
153928LASTFRAME[...].mp4 6376Кб, 1280x960, 00:00:05
1280x960
155057LASTFRAME[...].mp4 6792Кб, 1280x960, 00:00:05
1280x960
155041LASTFRAME[...].mp4 6516Кб, 1280x960, 00:00:05
1280x960
Промтобоги есть в треде?
Никак не могу заставить паучару трахать бабу в рот кончиком откуда обычно паутина выходит, все перепробовал. Просто залезть и подергаться на ней оказалось легкотня.
Паучий appendage оно считает головой. Включим фантазию?
Аноним 10/06/26 Срд 16:42:21 1629153 4
>>1629127
Конечно, давай сфантазируем, что психиатр с тобой в одной комнате находится и готов тебе помочь.
Аноним 10/06/26 Срд 16:50:35 1629158 5
164312LASTFRAME[...].mp4 4744Кб, 1280x960, 00:00:05
1280x960
>>1629127
Вот также только блядь снизу
Аноним 10/06/26 Срд 17:02:59 1629162 6
>>1629127
Никто не делает промты тупо одним текстом, все разбивают на кейфреймы. А кейфрейм ты можешь контролнетом абсолютно как угодно подстроить.
Аноним 10/06/26 Срд 17:12:03 1629166 7
>>1629162
>контролнетом
Подробнее пожалуйста, что за инструмент?
Аноним 10/06/26 Срд 17:24:24 1629178 8
>>1629085 →
Да не гори жопой, ты спорол хуйню, ну со всеми бывает. Тут анонимно, о тебе уже все забыли.
Но ты смешно выперднул после переката, канеш.
Аноним 10/06/26 Срд 23:00:19 1629388 9
gvozdik.mp4 1780Кб, 480x848, 00:00:03
480x848
Почему ей хуй или яйцы дорисовывается? Я ж в пропты принудительно пишу penis, futa, futanari, labia, testicules, а в позитивы - pussy, vagina
На видриле еще не так плохо все, но почерневшая камелтое. Как аниме письку сделать? cleft of venus не работает.
Аноним 11/06/26 Чтв 02:11:48 1629512 10
>>1629127
Бля, чуть нахуй чаем не облился от смеха, паук похож на мою детскую игрушку.
Аноним 11/06/26 Чтв 08:16:26 1629580 11
>>1629388
> Почему ей хуй или яйцы дорисовывается? Я ж в пропты принудительно пишу penis, futa, futanari, labia, testicules, а в позитивы - pussy, vagina
Потому что лоры говна, гениталии считаются частью человека. Ну вот так натренили.
> На видриле еще не так плохо все, но почерневшая камелтое. Как аниме письку сделать? cleft of venus не работает.
Никак, все лоры что я на цивите смотрел - говно. На 1girl standing еще может что-то работает, но в динамике или при смешивании с лорами на еблю и т.д. - все проебывается
Аноним 11/06/26 Чтв 11:03:26 1629627 12
Аноним 11/06/26 Чтв 15:02:31 1629827 13
143245LASTFRAME[...].mp4 10808Кб, 1920x960, 00:00:08
1920x960
105503LASTFRAME[...].mp4 6529Кб, 1728x960, 00:00:05
1728x960
>>1629153
Пришли фотку, тебя тоже выебет кто нибудь красивый.
Аноним 11/06/26 Чтв 21:24:04 1630090 14
AnimateDiff0004[...].webm 3264Кб, 2224x1508, 00:00:04
2224x1508
Berniniworkflow.png 1953Кб, 4493x3137
4493x3137
Аноним 12/06/26 Птн 06:35:15 1630286 15
>>1630090
Очередная хуйня, генерящая в шакальном разрешении в 3 раза дольше базовой модели?
Аноним 12/06/26 Птн 17:37:05 1630572 16
Если я беру видюху на 16 гб вместо 8 гб, то у меня опера разгружается, да?
Аноним 12/06/26 Птн 18:23:30 1630606 17
Есть ли воркфлоу который повторяет технику beeble.ai? а именно дорисовывает все вокруг маски, без видимого бордера маски и с подгонкой по свету?
Аноним 12/06/26 Птн 21:56:07 1630707 18
>>1630572
Учитывая, что модели лежат в оперативе, откуда кидаются на видяху, по сути-то и нет.
Разве что делать purge vram после каждой генерации, тогда — да, во время генерации меньше оперативы будет задействовано.
Но в любом случае, лучше взять 16, если есть возможность. Даст больше контекста, и быстрее будет вае декодироваться.
Аноним 12/06/26 Птн 23:05:04 1630737 19
как избежать появления субтитров в лтх, кто шарит?
все перепробовал
Аноним 13/06/26 Суб 00:05:11 1630755 20
Wan00044-nmd.mp4 857Кб, 720x720, 00:00:05
720x720
barriss dinner [...].mp4 1899Кб, 720x1080
720x1080
>>1629627
Спасибо, благодарю! А не знаешь лоры на добротные мощные 2д камшоты? Чтоб прямо брызги летели и периодически, а не 1 раз и не просто текло как на 1. У меня прям рандом, много реролить и все равно не граммотно.
Аноним 13/06/26 Суб 01:49:27 1630801 21
>>1630755
>Чтоб прямо брызги летели и периодически
Это надо описывать типа multiple burst, erupts many times и тому подобным
И в негатив добавлять disappearing cum, disappearing fluid, missing sperm и тому подобное
Аноним 13/06/26 Суб 05:40:15 1630846 22
>>1630801
Не работает. Что реально работает это повернуть пикчу под удобюным углом. Ван почему-то предпочитает чтоб жидкости двигались сверзу вниз, основная концепция.
Аноним 13/06/26 Суб 13:28:16 1631075 23
Аноним 13/06/26 Суб 15:00:23 1631171 24
178135129131883[...].mp4 3855Кб, 1280x720, 00:00:10
1280x720
Аноним 13/06/26 Суб 16:27:49 1631268 25
Аноним 13/06/26 Суб 18:11:58 1631443 26
image 159Кб, 328x354
328x354
Я пришел к выводу, что формат тегов из СД не работает в Ване вообще. В сд по сути теги с данбуру через запятую, а в Ване надо художественный рассказ писать. Но как его писать, не обладаю литературным навыком и у кого есть на это время? Если подразумевается писать пасту нейронкой, то это где такую взять для нсфв? Локалку мне напряжно запускать, ибо Врам туда-сюда долго гоняется, мне надо рассказики на лету сочинять по ключевым словам.
Аноним 13/06/26 Суб 18:30:09 1631489 27
>>1631443
>Я пришел к выводу, что формат тегов из СД не работает в Ване вообще.
Ну ты и гений, долго думал? Счего ты вообще взял что он их должен понимать? Это фича двух с половиной моделей для генерации статичных избражений (люстра, анима и убогий нуб) потому что внезапно booru-подобные сайты это готовый размеченный датасет статичных избражений.
Аноним 13/06/26 Суб 19:19:35 1631578 28
>>1631489
Долго-долго, маленький, у меня технарский ум и это моя ловушка, что оказывается с машиной сюсюкать как с ребенком, наливая много воды, а не сухой промпт.
Аноним 13/06/26 Суб 19:20:58 1631580 29
Блять даже гптыня советует для Вана пропты так составлять:
A [subject], [action], camera [movement], [lighting], [style]
Пример:
A cute anime girl smiling, her hair gently moving in the wind,
camera slightly panning left, soft lighting, anime style, high detail
Негативы:
blurry, low quality, bad anatomy, distorted, flickering, jitter, artifacts (это минимум)
Аноним 13/06/26 Суб 23:33:26 1631893 30
>>1631578
У тебя явно не технарский ум.
Юзать теги в 2к26 для Вана, когда все технари прочли в момент выхода папиры как надо промптить и все.
Это было охуеть как давно.

А еще, технари берут примеры из папир, пихают в нейронку и просят сделать так же. Это работает примерно для всего и уже пару лет.

Еще, некоторые дообучают ллм для промптинга той или иной модели.

Ну я хз, я не умею на вашем, на гуманитарском, поэтому понятия не имею, понял ты меня или нет. Но я надеюсь ты понял и тебе эти базовые советы помогут.

Успехов!
Аноним 14/06/26 Вск 04:08:44 1632059 31
>>1631893
У меня явно технарский ум, я универ закончил с дипломом, а ты гуманиртарий.
Брать примеры из папир = куколдство. Надо самому уметь составлять в два клика ситуативно, а иначе будет не точно.
>Это работает примерно для всего и уже пару лет.
Я бы поспорил, что для всего и два года, но не вижу смысла бисер метать.
Удачи!
Аноним 14/06/26 Вск 09:55:08 1632148 32
>>1631578
>технарский ум
Давно ли тупое тыканье кнопочек называется технарский ум? Документацию перед работой с инструментом почитать слабо?
>>1632059
Твоя ловушка в том что ты универ закончил, а навыков судя по всему не получил.
Аноним 15/06/26 Пнд 12:30:57 1633073 33
image.png 315Кб, 760x425
760x425
Аноним 15/06/26 Пнд 15:06:01 1633228 34
В комфи как-то можно LTX-овский латент сохранить? Обычная SaveLatent нода шлет нахуй. Заебали блядские индусы и горе-вайбкодеры, которые не могут нормально менеджмент памяти организовать, из-за этого перед декодингом пару раз улетал в оом и терял, судя по превью, годные роллы.
Аноним 15/06/26 Пнд 15:30:57 1633243 35
>>1633228
А, бля, все, сам разобрался. Нужно SeparateAVLatent сначала, потом отдельно латенты на видео и аудио нормально SaveLatent'ом сохраняются.
Аноним 15/06/26 Пнд 20:06:33 1633486 36
>>1633228
так он сам сохраняется и так в темпе, или тебе для других целей? я как то парился тоже вопросами как ужаться в свои ram/vram теперь смело впихиваю ноды на очистку памяти после первого семплера, а потом и после второго на декодере, что позволило вместо 15 секунд уже минутные видосы пилить на том же железе в тех же разрешениях
Аноним 15/06/26 Пнд 21:16:31 1633537 37
>>1633486
> теперь смело впихиваю ноды на очистку памяти после первого семплера, а потом и после второго на декодере
Может я что-то делаю не так, но у меня эти ноды работают через раз. По идее, после апсэмплинга остается шаг декодера, и все, кроме VAE, должно при очистке пойти из памяти нахуй. А вот нихуя, после второго сэмплера висит 24 Гб, в память заваливается латент и привет оом. А в логах - ехидное -17 Мб после ноды очистки памяти, вот хуй разберешь, что он там "почистил". При этом T2V у меня нормально работает безо всех этих выебонов даже если лор вагон накидать, это в I2V у меня только такая поебень. Не знаю, почему так. Поэтому я просто пришел к тому, что основной воркфлоу заканчивается на сохранении латентов после второго сэмплера, а сам декодинг - вынес отдельно.
Аноним 15/06/26 Пнд 22:05:18 1633572 38
>>1633228
файл подкачки в 30гб и vae decode tiled решат твою пролему
Аноним 15/06/26 Пнд 22:32:15 1633615 39
>>1633572
Декод и так тайловый. А насчет подкачки - еще раз, в T2V такой проблемы нету, с хуя ли в I2V он должен внезапно решить проблему? Латенты-то на выходе перед декодом одинаковые.
Аноним 16/06/26 Втр 00:43:10 1633683 40
Как генерировать супер мега ахуенно пиздатые видео? У меня 5080 и 32 гб озу, готов выжать из них максимум и даже больше.
16/06/26 Втр 09:55:16 1633789 41
Какой максималльный размер достаточен для файла подкачки для пердежа Вана? Я не могу просто по-больше назначить, а то я принудил систему его форматировать при выключении, а то я страховщик и выключается комп 5 минут долго.
Аноним 16/06/26 Втр 17:05:30 1634060 42
130003UPIN00001.mp4 19445Кб, 1536x2304, 00:00:10
1536x2304
Аноним 16/06/26 Втр 21:00:48 1634198 43
Мне кажется или ван 2.1 был лучше чем 2.2?
Просто ощущение с потолка.
То ли лоры там лучше были, но реализм как бы сильнее ощущался
Аноним 16/06/26 Втр 21:10:58 1634208 44
изображение.png 168Кб, 1080x807
1080x807
Куминг завтра
Аноним 16/06/26 Втр 21:13:05 1634211 45
Аноним 16/06/26 Втр 21:19:06 1634215 46
image 141Кб, 577x532
577x532
>>1634208
КАЖДЫЙ ДЕНЬ СРОЧНО ЭКСЛЮЗИВЫ А КАК ЖИТЬ-ТО СРОЧНО СКАЧАТЬ УСТАНОВИТЬ ПИСИК ВЫУЧИТЬ ВСЕ СЕКРЕТЫ В РЕДДИТЕ РАССКАЗАТЬ ДИСЕРТАЦИЮ ЗАЩИТИТЬ СТАРОЕ СРАЗУ УДОЛИТЬ
Аноним 16/06/26 Втр 21:51:46 1634239 47
>>1634208
Это лора трейнер.
Я от них вообще ничего не жду, дохуя пафоса ноль дела, звук точно такой же хуевый, движения всё так же мыльные
Аноним 16/06/26 Втр 22:04:20 1634251 48
>>1634198
Пиздец ты шизло: реализмом занимаются ваще другие модели-апскейлеры, а основная фишка вана - что его можно тренить, и тренится он хорошо если в 480п.
Аноним 16/06/26 Втр 22:23:48 1634267 49
>>1634198
Хороших инструментов для него явно больше, но анимация у 2.2 явно лучше. За реализм не скажу, нахуй он вообще нужен? Порнухи мало чтоли наснимали? Обычная порнуха на голову выше всего, что может сгенерить любая нейросеть.
Аноним 17/06/26 Срд 02:16:25 1634370 50
Чето мне щас так смешно стало.
Была у нас страсть к локальному видео, реальный прогресс, будущее, а потом ван просто перестал быть локальным и всё сдохло моментально. И уже год прошёл а всё по прежнему. Ухахатывался пол часа наверное.
Вот SCAIL 2 вышел, а это сраный ван 2.1.
Аноним 17/06/26 Срд 02:17:52 1634372 51
>>1634267
Ну если лично с твоей еот порнухи не мало наснимали то везет тебе
Аноним 17/06/26 Срд 06:53:00 1634399 52
нет-дерьмо.mp4 1169Кб, 640x360, 00:00:10
640x360
>>1634370
>И уже год прошёл а всё по прежнему
Тем временем грок имеджин 1.5 на короткий промежуток времени показал возможности закрытых генераторов. Там довольно реалистичная порнуха получалась, с реалистичными звуками. Но пидерасты всё быстро прикрыли.
Аноним 17/06/26 Срд 09:35:15 1634424 53
Думал видео можете делать, где снимают знаменитостей молодых старых вместе и переходы почти без склейки. Навен это платно. Так встроенные со своими мозгами не могут. И карту не брал, а смысл. Все одна фигня не влезет никуда серверные модели.
Аноним 17/06/26 Срд 09:48:02 1634427 54
>>1634370
>Вот SCAIL 2 вышел
Нихуя себе, SCAIL 1 уже был пушкой, бегу пробовать
Аноним 17/06/26 Срд 11:17:21 1634490 55
104724LASTFRAME[...].mp4 8445Кб, 1296x720, 00:00:24
1296x720
Unity - Complet[...].mp4 5695Кб, 1440x960, 00:00:06
1440x960
>>1634267
> Обычная порнуха на голову выше всего
А я думал что смысл нейронок именно в необычной порнухе
Аноним 17/06/26 Срд 19:17:07 1634797 56
>>1631443
Вам бы покурить мануалы что ли для начала как это работает а не придумывать самостоятельно. Если совсем коротко, то происходит следующий процесс где по очереди работает сразу несколько моделей: Text Encoder-> Generator (чаще всего Diffusion model -> Decoder (Vae/Текст и тд). Текст который пишешь для генерации в позитив и негатив кодируется отдельно именно энкодером, в старой сдохле были совсем простые модели энкодеров типа CLIP, которые могли понимать примитивный текст и синтаксис там был в стиле 1girl, standing. Потом появились новые диффузии поддерживающие более жирные энкодеры t5 и тд, где уже можно было слегка развлекаться чат-гптшным синтаксисом. Сейчас в некоторых моделях и вовсе в качестве энкодеров поддерживаются LLM на основе квена, геммы и тд, в них синтаксис совершенно будет другим, чаще всего натуральным.
При этом диффузия понимает твой текстовый энкодер по разному, картиночные по своему, видеомодели по своему и тд, поэтому если ты в SD генерил что-то одно то во флаксе с другим энкодером будет синтаксис иной, а в ване или в лтх будет ещё более другой, где тот же самый пропмт для генераци двух тянок может значительно отличаться. Вот ближайший пример, для хромы например камеры пишутся в конце а персонажи в начале НО по очереди, для сдохли желательно все квалити таги выносить в начало и персонажей описывать в одной секции а не в разных, а для квен имиджа вообще без разницы. Для вана всё наоборот, шутинг камеры и позицию персонажа(жей) нужно описать именно в начале, а стиль в конце.
Аноним 17/06/26 Срд 19:38:04 1634819 57
>>1634797
Да заебался я кюрить мануалы, которые устаревают через полгода. У кого вообще есть на это время? Сами читайте всю дрисню, прыщебляди. А то что ты написал я итак знаю, но мне не удобно. Я б предпочел сцену задавать по тегам с данбуру и веса править, а не писать сочинения школьника каждый раз, это утомляет. Тут говорят мол вставляй копипастные предложения из гайдов, но это хуйня получатеся, с тем бы успехом можно было копипастить одно слово-тег, которое заменяет это предложение.
Аноним 17/06/26 Срд 21:21:53 1634891 58
>>1634797
Бред, вообще непричем энкодеры, причина только в том как обучалась нейросеть.
СД файнюны просто были залиты тегами как есть, потому что на бурах они были под картинками заботливо проставлены человеками. И поэтому теги работают охуенно там где они были в датасете.
Под видосами никаких тегов не было, их размечали обычным слопотекстом или нанятые индусы или ллмки, а на самом деле и то и то в шизоидных пайплайнтах, потому что нормальных ллмок которые понимают видосы нет.
>Вот ближайший пример, для хромы например камеры пишутся в конце а персонажи в начале НО по очереди, для сдохли желательно все квалити таги выносить в начало и персонажей описывать в одной секции а не в разных, а для квен имиджа вообще без разницы. Для вана всё наоборот, шутинг камеры и позицию персонажа(жей) нужно описать именно в начале, а стиль в конце.
Про это не спорю, но это зависит от того какого формата придерживались при сборке датасета.

>>1631443
>Если подразумевается писать пасту нейронкой, то это где такую взять для нсфв?
Да, именно это и подразумевается. Пойдет почти любая кроме гпт, по апи а не в чатике. Почти все напишут тебе нсфв с нормальным промтом, разница будет только в том насколько сочное нсфв, но для промта сочное наверное и не нужно. Тебе нужно просто один промт с описанием формата сделать, фиксированные фразы / примеры и потестить какая нейронка лучше результат даст. Хотя бы просто напизди нормальных промтов в примеры.
>>1634819
>Я б предпочел сцену задавать по тегам с данбуру
Пиши теги ллмке, она поймет и переделает по гайду в натуртекст.
Аноним 17/06/26 Срд 22:11:30 1634959 59
1781723387802.jpg 484Кб, 1080x2400
1080x2400
Дипсик 4 флеш замержат на днях
Аноним 17/06/26 Срд 22:14:13 1634963 60
178163511800506[...].mp4 9679Кб, 576x1024, 00:00:35
576x1024
178153150426014[...].mp4 6621Кб, 576x1024, 00:00:26
576x1024
как и где лучше генерировать подобное?
Аноним 18/06/26 Чтв 04:08:27 1635097 61
ltx00005.mp4 3949Кб, 1024x576, 00:00:10
1024x576
кто нибудь разобрался как распараллелить хенерацию одного видео на двух gpu? multiGpu не предлагать, он только vram распихивает.
Аноним 18/06/26 Чтв 09:23:03 1635180 62
>>1635097
Откуда такие шизы берутся? Что ты блять вычислять собрался, если веса в другом враме лежат? Каждая гпу вычисляет ровно то, что у нее в враме.
Аноним 18/06/26 Чтв 10:00:30 1635194 63
>>1634963
Выглядит как VEO3, так что увы, это не к локалкам.
Аноним 18/06/26 Чтв 14:21:39 1635335 64
>>1634797
>для хромы например
Можешт поделиться гайдом, просто что я читал там чтобы реалистичность поймать надо обязательно в начале ставить типа "натуралистическая фотография", "профессиональное фото" и т.д.

>>1634891
>нормальных ллмок которые понимают видосы нет
QwenVL
Аноним 19/06/26 Птн 13:54:34 1636037 65
>>1634797
Нихуя ты тред подорвал, конечно. =D

Литералли чуваки с ебалом «нет, это другое».

>>1635097
Погонял https://github.com/komikndr/raylight — получил -10%.
Может быть проблема в количестве линий (стандартная материнка x16+x4), но переставлять в другую лень.
Пробовал и флюкс, и лтх, везде одинаковое замедление.
Огорчение.

На шизов, которые не в курсе про tensor parallel не обращай внимания, они тут просто так сидят повысираться, вряд ли у них есть компы для генерации. Злятся, вот и матерятся.
Аноним 19/06/26 Птн 16:15:41 1636138 66
178187415894234[...].mp4 2861Кб, 1280x720, 00:00:10
1280x720
Аноним 20/06/26 Суб 10:30:11 1636628 67
а в чём второй видос из шапки сделан и чё там за апскейлер такой?
Аноним 20/06/26 Суб 11:49:49 1636658 68
Анончики, каким ии делаються видосы по 5+ минут которые я вижу в тик токе? Там типа пересказы дорам или аниме, и видосы до 30+ минут, как это делают раскажите плис. хочу пересказ книг которые прочитал сделать по тексту книги, что бв друзьям расказать типа краткий пересказ в формате видео от ии
Аноним 20/06/26 Суб 12:03:25 1636672 69
>>1636658
У меня пк 16 GB VRAM (RX9060XT) и 16 GB DDR3 или 4.... не помню, если это генерируют локально то через какую ии? и потянет ли мой пк
Аноним 20/06/26 Суб 12:28:00 1636699 70
https://civitai.red/models/2447875/ltx23-10eros

поюзал обнову, в анимации порно делает вроде заебись, голоса нормальные с эмоциями без помех и прочей хуйни

так же похоже он починил поломанные тайм марки
Аноним 20/06/26 Суб 13:12:47 1636722 71
>>1636672
Оперативы маловато, файл подкачки и диск будет умирать потихоньку.
Но купить ссд под файл подкачки все еще дешевле покупки оперативы, конечно.

Делается скорее облачными моделями за токены, но можно и LTX-2.3 генерить на отъебись.
Аноним 20/06/26 Суб 14:26:21 1636747 72
>>1634427
SCAIL 2 реально имбовая штука. Гораздо лучше чем Wan Animate в большинстве тестов.
Аноним 20/06/26 Суб 15:32:57 1636801 73
>>1636722
А какими такими облачными моделями? я в какой-то которую мне гугл гемини посоветовал загрузил 1 главу книги, оно мне выдало что видос будет 7 минут, и по цене - 70$, ну я так понимаю что это нихуя не норм цена, я вот готов за видос пол часа+ заплатить 10-20 баксов.
Что вообще по ценам в таком сегменте деГЕНЕРАЦИИ видео?
Аноним 20/06/26 Суб 17:18:26 1636882 74
>>1636658
Я бы взял чей-нибудь голос и сгенерил на его основе речь через Fish TTS. Потом отрывками секунд по 15 подавал бы на вход в LTX и генерил клипы с пары-тройки разных ракурсов для разнообразия. Конечно времени это займёт неебически много.
Аноним 20/06/26 Суб 18:26:50 1636933 75
image 440Кб, 600x675
600x675
ЧатГПТ говорит, что для вката в LTX-2.3 и WAN 2.2 сейчас оптимальнее всего взять б/у rtx 3090. Это реально так?
Аноним 20/06/26 Суб 18:58:41 1636940 76
Есть такие кто смог сделать генерацию на rx570 4GB или r9 390 8GB? Или вообще на процессоре?
Вон раньше facefusion тоже не поддерживалось на амд, потом хоп и заработало.
Аноним 20/06/26 Суб 19:11:29 1636946 77
>>1636037
>tensor parallel
А ещё llama.cpp например можно частично на CPU частично на GPU. Слои какие-то есть, но я не пробовал ещё, может дойду как-нибудь.
Аноним 20/06/26 Суб 21:42:18 1637012 78
Timeline 1g .mp4 11817Кб, 600x720, 00:00:45
600x720
Аноним 20/06/26 Суб 21:50:14 1637021 79
Wanimate00007.mp4 1250Кб, 1280x640, 00:00:03
1280x640
>>1637012
Больше всего в этом проекте понравилось делать переходы между отдельно сгенерированными сегментами. Это в давинчи одной кнопкой делается за 0 секунд.
Какие вопросы:
1) У нее поплыло ебало после всех этих 15 дегенераций. Как Wan все время напоминать как ее лицо выглядит? В каждом новом сегменте новая лора кста.
2) Можно ли в Wan несколько лор подключать сразу? Вот в этом видео их овер дохуя. Но это другой воркфлоу с заменой фона/персонажа.
3) С фоном то же самое, он деградирует с каждым новым запросом. Как и запросы, лол.
Аноним 20/06/26 Суб 22:03:25 1637027 80
>>1637012
>>1637021

Еще проблема. Моя баба никак не хотела избавляться от шмоток. Они остатками прилипали к рукам и в каждой следующей итерации превращались во всякое ненужное говно. У анонов >>1629388
>>1629127 все норм, как вы этого достигли?
Аноним 20/06/26 Суб 22:34:41 1637040 81
Аноним 20/06/26 Суб 22:50:22 1637055 82
>>1636933
3090 (потом 2х 3090, 4х 3090, 16х 3090) - это топ за свои деньги во всем, что с нейронками связано. Когда маркетолухи пытаются тебе впарить клешню на макпуке, они скромно умалчивают, что шарорам работает на порядки медленнее врама, а когда пытаются впарить нативный фп-х на 40-50хх - то скромно умалчивают, что за те же деньги ты можешь взять 2х врама на 3090.
Аноним 20/06/26 Суб 22:56:18 1637059 83
image.png 138Кб, 334x449
334x449
Аноним 20/06/26 Суб 23:48:00 1637092 84
>>1637059
А это хуй знает что такое. 4090 у нас переделывают под 48, и это прозрачная схема за соответствующий прайс, а тут единорог какой-то.
Аноним 21/06/26 Вск 00:31:06 1637132 85
Wan 2.2 появился летом 2025 года
LTX-2 был открыт в конце декабря 2025 года
LTX-2.3 вышел уже в феврале 2026 года

Получается открытые модели могут догнать сиденс 2 уже в конце 2026 или первой половине 2027 года 🤔
Аноним 21/06/26 Вск 01:17:38 1637157 86
>>1636801
Я фиг знает, онлайн не генерил.
Но звучит вполне возможно. Я про 7 минут и 70 баксов. =)
Пол часа за 20 ето кек.
Не, ну, может и есть такие.
Можно абьюзить бесплатные кредиты на сервисах разных.
Но ты пойми: ты не текст кидаешь и оно генерит. Ты составляешь промпты для 5 секундных отрывков, а потом сам их склеиваешь. Написать 250 промптов — тоже не самое простое.

Короче, если ты просто хочешь взять и чтобы оно само — то забей сразу, такого пока еще нет.
А если готов поработать — то локально, как будто, и проще будет. Все равно тебе придется очень много постигать всего.

>>1636882
2026 год, OmniVoice, в том числе gguf'ы есть.

>>1636933
Ну, 5070 будет чутка по-быстрее и новая за те же деньги. И холодная. И с новыми техами.
Но если захочешь LLM — резко обломишься по объему видеопамяти. Так что смотри сам, или 5070/5070 ti, но про LLM забываешь, или 3090, чуть медленнее и бу, зато универсал.

>>1636946
Это override tensor называется, да. Ну или --cpu-moe, если проще.

>>1637059
А это хуй знает что такое-2.

>>1637132
Сиденс пока и закрытые модели догнать не могут, а лтх по анимации и ван до сих пор не догнал, так что я бы растянул твою теорию. 2027 звучит реалистичнее, и то, скорее к концу года.
Аноним 21/06/26 Вск 03:32:07 1637202 87
Как думаете имеет ли смысл приобретения Радеон, например 7900 XTX 24? Оно по цене примерно как 5070ти 16, но больше ВРам для нейронок. Или это в любом случе адамуда ради амуды, то есть скам?Тротлит и программы запускаются, куды нет. Я знаю точно что модели оптимизируются для нвидии, а для амуды чтоб порой игру запустить нужны танцы с бубном. То есть херовая идея?
Аноним 21/06/26 Вск 03:58:11 1637218 88
>>1637012
Ты лучше svi pro изучи и не нужны будут никакие давинчи и ебало с фоном деградировать не будут.

>>1637021
>1
Самое идеальное решение - лора на персонажа, альтернативное svi, вторая альтернатива генерировать fflf и для каждой последующей генерации предварительно сгенерировать картинку
>2
Можно, а в некоторых случаях и нужно
>3
svi
>>1637027
Хороший, детальный промпт практически решит эту проблему и подбор подходящей генерации

>>1637157
>5070
>12 гнилобайт
>чутка по-быстрее
Ну да, если генерить ролики по 3 секунды

>>1637132
Получается что это влажные фантази.
Посл ван 2.2 вышел ван 2.5, а потом и 2.7 и они до сих пор закрытые. Хотя обещали 2.5 в открытый доступ выложить еще пол года назад.
Вангую что и ltx 2.5 будет с какими то подъёбами. И на этом закончится эпоха открытых моделей и всё что нам останется дрочить ван 2.2 до посинения.
Аноним 21/06/26 Вск 04:04:55 1637223 89
Сап, не знаюете парную модель, чтоб каждый файл не более 10 гигов весил, и2в? Потестить кое-что надо. Любую хоть сжатую, хоть не прон.
Аноним 21/06/26 Вск 09:40:12 1637307 90
>>1637202
Для видео - точно нет. Для всего остального что влазит в 1-2х 3090 - тоже нет.
Последний год амудя сильно стараются догнать по софту, и там вроде есть уже понт собирать риги на х8-16 для жирных текстовых, но для мелких объемов - все еще никакого.
Аноним 21/06/26 Вск 11:34:17 1637382 91
>>1637307
Ну как обычно амуде значит в своем стиле - ядер по-больше накинем, назовем модель ЭКСТРИИИN, разводочка на лоха.
Аноним 21/06/26 Вск 11:57:44 1637403 92
>>1637223
Есть вроде ван в ггуф формате. Поищи воркфлоу wan gguf workflow или с лтх то же самое - гуфы могут быть ужаты в адский анус как раз.
Аноним 21/06/26 Вск 13:03:40 1637439 93
>>1637403
Все что не ужато в анус не влезет в 16 гигов. Не гуф на наносеков рассчитан, я не верю что таких людей много. А оно вообще сильно на качестве чтоли сказывается? По-моему норм. Есть мини косяки, артефакты дальних деталей, но это ерунда.
Аноним 21/06/26 Вск 17:11:53 1637605 94
>>1637218
> Ну да, если генерить ролики по 3 секунды
Да не, разницы там нет.
Другое дело, что видео на 60 секунд вывалится за пределы видеопамяти и РЕЗКО станет люто медленной. А 3090 позволит в два раза больше впихнуть.

> Вангую что и ltx 2.5 будет с какими то подъёбами.
Ну давай бех подъебов? Пусть выйдет хотя бы как есть, с анимацией уровня Wan2.2, и уже хорошо. Не надо подъебов.

>>1637439
Бля, ты людей с 16 гигами оперативы наносеками считаешь? Сочувствую.
ИМХО, уже 64 гига ddr3 зеоном набрать можно, там что как будто и похуй.
Ну не хочешь bf16 гонять, чтобы в файл подкачки не выливалось, возьми q5, вроде норм ггуфы, деградация почти незаметна, судя по примерам.
А объем видеопамяти тебе только для контекста и нужна. Размер модели-то тут причем.
Аноним 21/06/26 Вск 19:33:20 1637684 95
035608LASTFRAME[...].mp4 6589Кб, 960x1088, 00:00:07
960x1088
>>1637027
> все норм, как вы этого достигли?
Если про раздевание, перетащи в свой комфи эти ролики, погляди промты, лоры. Достиг перебором.
ГЛАВНОЕ - если надо раздеть бабу, ставь длительность 5сек. Максимум 6сек. В данном случае как и в большинстве других после 5-6 секунд видео начинает возвращаться к исходному кадру и нифига она не разщденется.
Аноним 21/06/26 Вск 19:35:47 1637687 96
>>1637027
Ну и помимо раздевания можно попросить её параллельно раздеванию в течение тех же 5 сек присесть, прилечь на бок раздвинув ножки, привстать, выкинуть телефон и пр. Не стесняемся подробно прописывать свои желания.
Аноним 21/06/26 Вск 22:28:10 1637789 97
>>1637687
А пофиксить за меня прод можно?..
Аноним 21/06/26 Вск 23:32:08 1637864 98
>>1637605
Не с 16, а от 24. Глянь цены. Одна видюха будет стоить дороже, чем остальные детали вместе взятые плюс с моником и столом. Это как называется?
Аноним 21/06/26 Вск 23:51:32 1637888 99
>>1637218
>ltx 2.5 будет с какими то подъёбами
Может будет как с Ideogram 4. Полную модель не выложат. А публичную перекроют внутренней цензурой.
Аноним 22/06/26 Пнд 01:50:18 1637946 100
Всем советую комфи обновить, там 16 июня что-то по работе с памятью оптимизировали, перестало на каждый чих вылетать с ООМ.
Аноним 22/06/26 Пнд 07:21:34 1637984 101
>>1636699
у меня чет при любых вариациях i2v лица не сохраняет от слова совсем, да и промту следует так себе
Аноним 22/06/26 Пнд 08:58:12 1638006 102
>>1637984
это проблема LTX. Сам автор Эроса это написал. LTX более менее справляется с анимацией уже подготовленных картинок. Т.е. на них уже есть все что надо, осталось только анимацию прикрутить, в отличие от Вана, который в i2v может и консистентность персонажа поддерживать без лор, и промпту лучше следует.

Still best used to just animate sex images. Complex storytelling and prompts still requires additional guided frames and high effort, everyone knows LTX 2.3 is very clunky by now. Lighttricks seems to be 4 years behind everything, they just now decided to implement experts on the next version. I guess the totally true-proven method of autoregressive is too futuristic for them (literally the best method for video models - Seedance2, Grok, Kling).
Аноним 22/06/26 Пнд 09:39:59 1638027 103
>>1637984
я юзаю вф от автора эроса, там больше оптимизаций так сказать под модель и он специальные ноды пилил, в том числе на удержание еьала

но как сказал анон выше, лтх нормуль в анимации и звуке на уже готовое, если чтото по серьезнее, там надо уже заморачиваться больше чем на том же ване
Аноним 22/06/26 Пнд 10:04:02 1638042 104
>>1638006
>4 years behind
Как же долго ждать годноты...
Аноним 22/06/26 Пнд 11:42:11 1638091 105
>>1637864
Это называется ты дурачок.
Еще раз: объем видеопамяти не имеет отношения к размеру модели.
Хоть safetensors bf16 на 45 гигабайт, хоть gguf q2 на 8 гигов. Видеокарте пофигу.
Видяха с 6 гигами прекрасно запустить 45-гиговую модель, выгруженную в оперативу.

>>1637439
Я тебе на это намекаю.

Чтобы запустить не gguf, а safetensors bf16 миллиард гигабайт нужен:
P104-100 — 2к на авито.
xeon + ddr3 — 5к на озоне
ssd диск на смерть для файла подкачки, 5к на озоне

Если по твоему 12к рублей — это наносеки только себе могут позволить, то я прям хуй его знает.

Тут пол треда катают обычные bf16 и fp8, gguf — это для фанатов поизъебываться, или запустить ужатое на 16 гигах оперативы (!) и видяхе с 6 гигами видеопамяти.

Видяхи с 24 гигами впизду не сдались для запуска модели, для видеогенерации тебе нужен мощный чип у видяхи.
Будет честны, 5060 8 гиговая будет генерить быстрее 3060 12-гиговой.

НО! Есть разрешение видео и количество кадров, и вот они уже зависят от объема видеопамяти.
Если ты хочешь генерировать минуту бесшовного FullHD видео одним батчем — вот тогда тебе понадобится 3090 и ее 24 гига (а может и 5090 с 32 гигами, хз).

Надеюсь теперь понятно объяснил, почему генерить хот на ван, хоть на лтх можно на любой видяхе. Упор по видеопамяти идет в разрешение и длину видео, а не в размер модели.
Аноним 22/06/26 Пнд 11:53:16 1638097 106
>>1637789
Промт за тебя и за меня фиксит грок. Но с самостоятельными правками все равно лучше, не ленись уважаемый.
Аноним 22/06/26 Пнд 12:06:05 1638102 107
SLITHERlow.mp4 16817Кб, 1280x720, 00:01:41
1280x720
Традиционно закидываю очередной свой эдит в шакальном кач-ве.
В прошлый раз был Feast, теперь Slither.
Аноним 22/06/26 Пнд 12:18:00 1638111 108
>>1638102
Признавайся, на плесень под раковиной дрочишь по вечерам?
Аноним 22/06/26 Пнд 12:21:41 1638115 109
>>1638111
Если бы она была сисястым "кроненбергом"
Аноним 22/06/26 Пнд 13:00:11 1638151 110
>>1638097
Не, там прод, production server, типа шутка была, можно написать промпт, чтобы тянка на видео сделала за меня свою работу.
Че-т я не увидел, что слова похожие, сорян. =)
Аноним 22/06/26 Пнд 14:21:19 1638221 111
SnapTik.Net7650[...].mp4 2134Кб, 720x1280, 00:00:29
720x1280
Посоны, я залётный. Хочу генерить что-нибудь атмосферное со своим semi3d аниме-персонажем (для муз. проекта).
Получится ли норм генерить на RTX 5060 ti 16 gb VRAM, 32 GB RAM.
Пробовал недавно накатить неудачно WAN и что-то там ещё. Были конфликты с pytorch или что-то в этом роде. Хочу ещё раз попытаться.
Аноним 22/06/26 Пнд 14:43:48 1638236 112
>>1638221
Генерить можно, но нахуя? Единственный смысл юзать локальные модели - это если ты их собрался тренить, чего ты уже на таком не сможешь. А для общего использования облачные модели даже днищетира на голову выше локальных.
Аноним 22/06/26 Пнд 14:48:23 1638238 113
>>1638236
Всегда есть аренда гпу тащем-то.
Аноним 22/06/26 Пнд 14:54:09 1638244 114
>>1638236
Как/чем мне тогда генерить видео подобные? Без ебанутых лимитов/анальной цензуры
Аноним 22/06/26 Пнд 15:07:52 1638255 115
>>1638238
Аренда - это заебись когда ты уже точно знаешь что делаешь, и теперь тебе нужно только масштабировать. Но пока ты нихуя не знаешь, и тебе нужно каждый шаг проверять - ты охуеешь за это платить.

>>1638244
Это все равно что спросить "а как чинить машину". Есть дохуя моделей, и, либо ты не глядя бросаешь бабки в монитор, и все делаешь сидансом, либо нужно пробовать все, чтобы понять что под твои задачи выходит топ за свои деньги (либо ебешься сам в гараже, но для этого нужно норм оборудование купить, а не просто набор отверток).
Аноним 22/06/26 Пнд 15:10:26 1638256 116
>>1638255
Я про облачные модели.
Аноним 22/06/26 Пнд 17:41:12 1638321 117
>>1638236
> Единственный смысл юзать локальные модели - это если ты их собрался тренить
Ой иди нрахуй
>>1638221
>Получится ли норм генерить на RTX 5060 ti 16 gb VRAM, 32 GB RAM.
У меня 3060, я генерю все свободное рвемя

>>1638221
>Были конфликты с pytorch или что-то в этом роде. Хочу ещё раз попытаться.
Пробуй-пробуй-пробуй. У меня даже пикчи не генерились сначала. А вот когда попробовал Wan все пошло нормально.

>>1638102
А что именно ты тут нагенерил? Я не смотрел фильмы, в чем суть проекта?
Аноним 22/06/26 Пнд 17:42:44 1638323 118
Аноним 22/06/26 Пнд 18:13:29 1638339 119
>>1638321
>в чем суть проекта?
Добавить фактическое отображение ебли туда, где она лишь подразумевалась в фильме рейтинга 17+
Аноним 22/06/26 Пнд 20:55:28 1638462 120
Аноним 22/06/26 Пнд 20:59:23 1638463 121
>>1638339
Ты это, как-то помечай, какие моменты сгенерены, а какие из фильма. Интересно же.
Аноним 22/06/26 Пнд 22:11:45 1638531 122
Помогите, у меня видимо лапки: где-то недавно (чуть ли не пару дней назад всего) попалась инфа, что в комфи прикручивают (или пытаются?) паралельные вычисления на нескольких картах. Не старые ноды MultiGPU а что-то другое, с реальным распределением. Проебал, и не могу найти повторно. Не гуглится. Если кто видел - швырните ссылкой плиз, хочу нормально почитать что там химичат такое интересное...
Аноним 22/06/26 Пнд 22:42:51 1638554 123
>>1638531
И тебе сразу ответили, что ты ебаный шиз, а гпу физически не может вычислять то, что не лежит у нее во враме, хоть усрись.
Аноним 22/06/26 Пнд 23:16:31 1638568 124
>>1638554
Детектор чини. Я первый раз за месяц сюда написал.

>>1638554
>гпу физически не может вычислять то, что не лежит у нее во враме
Технологию Nvidia SLI и прочее разделение рендера кадров на разных GPU забыл уже? И то, что при 3D рендере единая картинка из кусков отреденереных на разных картах может собираться - тоже не в курсе? Принципиальная то возможность разделить работу по сборке видео явно есть, могли и сообразить как это применить к сеткам. Вот про это я и хотел перечитать, чтобы разобраться - правильно ли понял.
Так что агрессивный узколобый шиз тут как раз ты.
Аноним 22/06/26 Пнд 23:30:31 1638574 125
>>1638221
Придется файл подкачки докинуть. 64-96 гигов было бы получше, но 32 терпимо. А видяшка норм.

Можешь попробовать LTX-2.3 — semi3d у него кое-как получается. Без крутой анимации, как в WAN, зато можно звук подать на вход.

Советую попробовать https://github.com/WhatDreamsCost/WhatDreamsCost-ComfyUI — там нынче годная обнова с IC LoRA'ми. И даже без них, работает клево.
Сравнивал по скорости с обычным WF, если отключить taeltx (поставить в обход две ноды), то выходит ровно так же.

Для WAN тебе другие люди насоветуют вариантов.
Аноним 22/06/26 Пнд 23:33:10 1638576 126
>>1638531
https://github.com/komikndr/raylight

>>1638568
Не обижайся на бедного человека, он или болеет, или просто генерить не на чем. Пойми, у каждого свои проблемы.
К тому же, выше ему уже писали про tensor parallelism, который на llama.cpp прекрасно работает у всех.
Аноним 22/06/26 Пнд 23:42:00 1638580 127
>>1638576
Спасибо, это оно. Трудно гуглить, когда не знаешь как сформулировать, а на "Multi GPU" понятно что вылазит (старые ноды).
Аноним 22/06/26 Пнд 23:57:35 1638587 128
>>1638568
Так абсолютно любое мультигпу - это и есть блять распределенные вычисления, все что в врам попадает той же картой и вычисляется, по-другому физически никак. Нвлинк позволяет ускорить проброс между ними, но вычисляет по-прежнему каждая своя точно так же как через мать.
Аноним 23/06/26 Втр 01:10:21 1638601 129
>>1638587
А я, блин, где-то другое говорил в своем единственном посте? Это ты окрысился на слово "параллельные" как только его увидел.
Аноним 23/06/26 Втр 01:21:32 1638606 130
Аноним 23/06/26 Втр 02:34:01 1638623 131
>>1638091
Это называется ты узник ram. Очевидно что если модель влазиет в vram то она работает гораздо быстрее, без постоянной перекидки блоков туда-сюда.
>bf16
Ты совсем больной? Если хочешь получить качество - нужно увеличивать шаги и не использовать ускорялки, тогда будет видна разница. А под lihgtx в fp8 и bf16 разницы по качеству вообще не будет.
Аноним 23/06/26 Втр 02:37:25 1638625 132
>>1638102
Это шедевр! Пошел пересмотрел сцену из фильма и ужаснулся проделанной работе + еще и работа со звуком + монтаж с реальными сценами.
Ты по любому используешь fflf, подскажи в чем генерируешь кадры?
Аноним 23/06/26 Втр 04:03:37 1638634 133
>>1638625
> по любому используешь fflf
Не знаю что это. Все на wan 2.2, плюс пара кусочков в квене онлайн.
Звуки из самого фильма и пары видеоигр (даже не из порно лол). Брал удачные промежуточные кадры из разных генераций, использовал как обычный ворк так и FIRST2LAST, где заданы первый и последний фрейм, а нейронка заполняет середину.
И да, убил на это пару вечеров свободного времени как минимум, не считая тонны генераций параллельно работе.
Аноним 23/06/26 Втр 04:08:32 1638635 134
image.png 846Кб, 2209x1321
2209x1321
Ну а монтаж в обычной мовави. Даже не все ассеты использовал
Аноним 23/06/26 Втр 10:01:20 1638715 135
>>1638623
Бля, чел, ну ты совсем не шаришь, а хуиту написываешь.
Плиз, не позорься, почитай тред, поэкспериментируй, разберись.

> гораздо быстрее
На 10%, вау, охуеть выиграли.
При этом, 3090 при сравнении в лоб, все еще уступает 5070 по скорости. Да что ж физика так спорит с твоими фантазиями-то!

> Ты совсем больной?
Пчел, таблетки. Без обид, но реально ведь видеогенерациям уже до пизды месяцев, уже год генерируем. Все проверили, все сравнили, разница между bf16 и fp8 видна, тем более nvfp4 (ты в курсе, вообще, что сейчас на ней генерят часто?). Шумы на пальцах, зубах, волосах.
При этом, разница между dev и distill безусловно есть, качество анимаций, следование промпту, количество пальцев и общая анатомия, лел.
НО — это две разные разницы, независимые друг от друга.
Хули ты в глаза-то ебешься, Маня. =)

Просто давай начнем с фактов:
Объем видеопамяти для диффузионных моделей оказывает слабое влияние на скорость генерации.
3090 с 24 гигами уступает 4070 ti и 5070 в сравнении в лоб по скорости. Хотя должна их кратно обходить по твоей логике.
bf16, fp8, int8, nvfp4 генерирует видео разного качества и это отличимо на глаз. При этом, скорость так же растет (и благодаря размеру в т.ч., и благодаря поддержке технологий на соответствующих поколениях видеокарт).
Провести слепые тесты не так сложно: один вф, один сид, два видео, разные шумы.
dev и distill версии вносят огромный импакт в разницу по разнообразию (привет cfg), следованию промпта, качеству анимации и анатомии.

Все три факта верифицируемы, проверены много раз и в треде, и в чатах, и где угодно.
Ты сам можешь взять разные видяхи, разные кванты, сравнить результаты.
На кой хрен ты продолжаешь игнорировать реальность и убеждать, что если модель целиком не влазит во врам, то скорость катастрофически падает, я не пойму.

При этом, блин, мы ж вроде как не о вкусовщине говорим, никто на тебя не наезжает, никто не спорит какая модель хуже или лучше, просто чисто циферки обсуждаем, которые замеряны давно еще.

Вот честно, складывается такое ощущение, что ты когда-то купил 3090 бу, она у тя сгорела, и теперь ты жопой горишь на всех, кто смеет покупать 5070 за 48к рублей новую с магаза и генерит с той же скоростью.
Или, о анти-узник рам, просто не успел купить себе 128 оперативы, и теперь горишь на тех, у кого она есть.
Ну других причин я не вижу, чтобы так извиваться как уж на сковородке.
Вот рил звучит как обычная обидка.

Обида — деструктивное чувство. Успокаивайся и выздоравливай. =)
Аноним 23/06/26 Втр 10:50:03 1638743 136
>>1638634
>FIRST2LAST
Это как раз fflf - First Frame Last Frame

>квене онлайн
Он генерит nsfw контент??

>пару вечеров
Мне кажется там было гораздо больше. Я вот все пытался собрать большое видео и через пару вечеров забил в итоге, решил отложить в долгий ящик. Когда пытался хобы ты часть смонтировать и со звуком игрался. Сейчас жду ltx 2.5 чтобы попробовать заново собрать.

А у тебя талант.
Аноним 23/06/26 Втр 11:21:17 1638751 137
>>1638743
Ха, понятно. Ох уж эти сокращения.
Квен и грок конечно же уже ничего не генерят, но там сисек в кадре из фильма нет, а мужскую жопу в прыщах пропускает)) Ну и промт д быть "безопасный".
Благодарю за оценку. А лтх меня разочаровал, только для naughty talk подходит как будто бы.
Аноним 23/06/26 Втр 11:23:03 1638752 138
>>1638715
>При этом, 3090 при сравнении в лоб, все еще уступает 5070 по скорости.
Это что за сравнение, на какой модели? В 40хх+ есть нативная поддержка fp8, а 3090 вынуждена каждый раз разворачивать модель из fp8 в fp16, именно по этому страдает скорость. Также у новых чипов быстрее вычисления даже в fp16. Но это лишь верхушка айсберга. По факту ты собственноручно душишь свою карту загружая в неё неподъемные модели. Если загрузить в неё модель которае влезет в объём vram скорость будет в разы быстрее, в разы!

>разница между bf16 и fp8 видна
Кому видна, шизам? Я в треде сижу с выхода хуньюаня и никаких сравнений толковых не было. А когда сам сравнивал bf16 и fp8 - разница была не в качестве совсем, просто немного другая генерация того же качества.

>nvfp4 (ты в курсе, вообще, что сейчас на ней генерят часто?)
Разве что только счастливые обладатели 12Гб vram, это же по сути Q4.

>Объем видеопамяти для диффузионных моделей оказывает слабое влияние на скорость генерации.
Повторяй это хоть 100 раз. Факты от этого не поменяются. Ты просто упёрся рогом в это понятие и не выкупаешь базовой логики. Если модель помещается в vram то ей не надо использовать медленную оперативку, она отрабатывает в в быстрой vram и скорость генерации значительно возрастает.
Аноним 23/06/26 Втр 12:18:38 1638777 139
>>1638752
> Если загрузить в неё модель которае влезет в объём vram скорость будет в разы быстрее, в разы!

Слушай, есть очень простой способ.
--reservre-vram 12
Он сделает из 24-гиговой 3090 — 12-гиговую.
У меня 3090 нет (зассал брать бу-хи с авито), но если есть у тебя — проверь.
Будет ли в разы быстрее.

Когда я в свое время тестил, у меня получилось, что максимум прирост получается в 2 раза между «модель целиком в видеопамяти» и «модель целиком в оперативе».
А с учетом того, что в видеопамять кидается контекст первым делом, то модель всяко выпадает частично, и получить пресловутый х2 прирост (максимальный) практически невозможно (кроме случаев с 5090, ага).

Если есть 3090 — не поленись, затести. С 12 гигами (и посмотри в диспетчере или nvidia-smi, чтобы за пределы 12 гигов не вылезало) и с 24.

> Кому видна, шизам?
Обычным энтузиастам.

> Разве что только счастливые обладатели 12Гб vram, это же по сути Q4.
Промах, обладатели RTX 50xx, они поддерживают ускорение, там на 25%~40% быстрее получается. Весьма недурно ценою небольшой деградации. Хотя зависит от сцены, если куча мелких деталей — то каша, конечно, переходим на bf16.
(кстати, технически, нихуя это не Q4, там часть слоев в хитровыебанном fp8, по размеру и качеству между q6 и q8, можешь чекнуть, я сам офигел, когда узнал, что это не чистый fp4)

> Повторяй это хоть 100 раз. Факты от этого не поменяются. Ты просто упёрся рогом в это понятие и не выкупаешь базовой логики. Если модель помещается в vram то ей не надо использовать медленную оперативку, она отрабатывает в в быстрой vram и скорость генерации значительно возрастает.
Ты написал хороший текст — но про себя. Реально ведь уперся рогом, и игнорируешь реальность. =)

ИДИ МЕРЯЙ БЛЯДЬ =) Сам охуеешь, как внезапно, 46-гиговые модели в 24-гиговой 3090 не ускоряются В РАЗЫ.
Да и что ты вообще в 24 гига запихнешь-то? q4 ггуф тот же самый? Ну давай, покажи разницу на 24 и 12 гигов. Я искренне надеюсь и жду.

Логику я знаю. А еще мерял сам, и знаю математику. Ты дальше логики не ушел, на математику хуй забил, в детали работы диффузионок не вдавался.
В РАЗЫ.

Это авторегрессионки (типичные LLM) ускоряются в разы, реально в разы, а то и в десятки раз.
Но диффузия нахуй вообще иначе работает, блядь.

Забились? Моя ставка: целиком модель х2 ускоряется, но целиком ты 25 гигов не пихнешь (не q4 WAN же юзать), а еще на само видео много места отожрется (не 480х288 же генерить в 2026 году, когда можно 15-секундные фуллхд на 12 гигах), поэтому особо смысла в лишних 8-12 гигах именно для модели нет — они имеют смысл лишь для разрешения и времени генерируемого ролика.
Твоя ставка: в разы быстрее, в разы, т.е. минимум в 4 раза жду результат.

Я мог бы затестить на Tesla P40, но я заебусь ждать, у нее чип медленный. =)

Я думаю, это решит наш спор.

Если ты реально, запихнув модель целиком в видяху, получишь х4 относительно --reserve-vram 12 — я без вопросов признаю твою правоту. Ну, по факту же ты прав будешь, хули тут не признавать. =)
Аноним 23/06/26 Втр 15:38:07 1638916 140
>>1638715
А, не дочитал твой опус, а именно последний абзац с твоими проекциями.
Какая тут обида вообще может быть? Я просто излагаю факты. Я купил б/у 3090 полтора года назад и она у меня до сих пор работает. Если она сломается то я опять возьму б/у 3090, по тому что очевидно что лучше иметь больше vram чем +15% к скорости генерации. А покупать 5090 жаба душит, тем более по обновленному ценнику. Ладно бы если бы я хотя бы на этом деньги зарабатывал. Это дает доступ и к llm нормальным и к возможностью собирать воркфлоу из нескольких небольших моделей и постоянно держать их в vram. Преимуществ масса у большой vram. Контекст, который ты пытаешься игнорировать. Один раз сгенерив в HD уже не хочется генерить что то ниже по качеству.

Вот, попробуй запустить этот wf https://dropmefiles.com/T89QU на 12-16 гигабайтах, затестим сколько у тебя будет время генерации от и до. Но что то мне подсказывает что 5070 тут жидко пукнув обмякнет.

У меня 64Гб оперативы и этого достаточно при 24гб vram да и больше не влезет - все 4 слота забиты

Так что не проецируй свои обидки на меня.
Аноним 23/06/26 Втр 15:59:38 1638927 141
>>1638777
Идея хорошая, но у меня не работает --reservre-vram, все равно забивает 23.4 гигабайта.

>Промах
Нет, это как раз размен скорости на качество. Конечно это не чистый fp4, но близкий к нему. А чекать что там другие нагенерили и начеррипикали - такое себе развлечение. Когда обзаведусь 50хх серией - сам посмотрю.

>Да и что ты вообще в 24 гига запихнешь-то?
Если мы говорим про wan2.2 то там 1 модель весит 16 гигов + контекст, все это нормально размещается в 24 гигах. Потом 1 модель выгружается в рам и вторая загружается вместо неё. Таким образом мы получаем прирост скорости.
Аноним 23/06/26 Втр 22:09:07 1639198 142
>>1638916
> Так что не проецируй свои обидки на меня.
Было бы за что обижаться мне на тебя. =)

> лучше иметь больше vram чем +15% к скорости генерации.
Заметь — видеопамять никаких х4 к скорости не дает, вполне себе уступает. =D
Но в остальном-то никто не спорит — для LLM лучше, безусловно, и для контекста лучше больше памяти.

> Вот, попробуй запустить этот wf https://dropmefiles.com/T89QU на 12-16 гигабайтах, затестим сколько у тебя будет время генерации от и до. Но что то мне подсказывает что 5070 тут жидко пукнув обмякнет.
Еба-а-ать, а ничего поменьше нет?
И нахуя там дев-модель с дистилл-лорой, что дает дистилл-модель в 8 шагов? О_о Почему не сразу дистилл-модель? Дистилл модель это же литературно дев-модель с вмерженной дистилл-лорой.
Ради 0.9 веса для чего-то там (наверное апскейла), предположим.
Не-не, я оценил общее качество и подход с пошаговой генерацией сцен и сборкой в одной видео.
Но как-то слегонца пугающе, конечно.
Еще и куча нод надо доставить, кроп фейсы всякие.
И, к сожалению, у меня нет 5070, а 5070 ти я продал. У меня тока 5070 ти, такие сравнения совсем разбегутся по результату.

>>1638927
> Идея хорошая, но у меня не работает --reservre-vram, все равно забивает 23.4 гигабайта.
Блин, ну это жаль, конечно, получили бы лучшее сравнение.
А я с 16 гигами нихуя не намеряю норм, туда даже тот самый ван целиком не влезет.

> Если мы говорим про wan2.2
Ну, я бы предпочел LTX, Wan — это прям для максимальных ценителей подождать сто лет ради анимации лучше (и сохранения лица, ну вроде как, по словам фанатов).
К тому же, Wan нам уже вряд ли дадут, а на LTX-2.5 шансы еще есть.
Но это моя проблема, я считаю, что я предпочту.

Я ща посмотрю, заработает ли --reserve-vram у меня, может я смогу тот же nvfp4 прогнать.



Кстати! Я пока седня думал, мне вдруг дошло, что это еще зависит от PCIe версии и количества линий. На 4.0 x16 влияние оффлода будет гораздо ниже, чем на 3.0 x8 каком-нибудь.
Так что, на старичках ты будешь прав, там ускорение и в четыре раза может быть.
Аноним 23/06/26 Втр 22:25:27 1639218 143
>>1637864
>>1638623
>>1638752
>>1638916
>>1638927
А у меня сработало.
И знаешь что?
Ты ближе к правде!
Признаю, я был не прав!
Получается, хорошо оптимизировали за последние полгода модели для инференса.

Замер откровенно хуевый, но маемо шо маемо:

Модель нвфп4, 17 гигов.
640х480@121
16 гигов 5070 ti — 8,32 + 6,12 апскейл
4 гига 5070 ti — 30,64 + 14,91 апскейл
Итого х3,15 разница. В твою сторону ближе. =) Да и модель не целиком влазит, очевидно, разница будет близка к 4.

Тест очень грязный, но выебываться не буду — в натуре узник рам, получается.
Значит, надо копить на 5090 6000, ебал я таво рот нынешние цены на 5090, 6000 дешевле выйдет. И точно упираться не будем.

Все, признаю твою правоту. =)
Единственная причина брать 5070 — гарантия, получается. Было бы больше памяти — было бы быстрее.
Аноним 24/06/26 Срд 04:08:58 1639350 144
>>1639198
>Еба-а-ать
За то по сути готовый ролик с автоматически нагенеренными картиночками, на вход надо подать только персонажа в 2х проекциях и вид оружия.
Ну или запромптить другой ролик.

>>1639218
Я думал загрузить чем нибудь другим видеопамять, пробовал llm маленькой, но там в 12 не попадаю или больше или меньше.
Ну хорошо что у тебя получилось, тест конечно грязный, но суть ясна.

>причина брать 5070
Причин брать 5070 вообще нет) Тут или 5060ти на 16 гигов или 5070ти на 16 гигов. 5070 только для игор.
Аноним 24/06/26 Срд 07:50:20 1639388 145
>>1639218
А поробуй теперь с маленькой моделmю, чтоб с энкодером и все умещалось в твои 16 гигов Vs 4 гига Vs 8 гиов Vs 12 гигов Vs 14 гигов Vs 15 гигов, а я график нарисую. Мне интересно просто насколько скачок производительности от размера модели и если малось не влезает. Я б сам хотел, но у меня бомжатские 12 гигов, я не могу модели найти чтоб умещались.
Аноним 24/06/26 Срд 08:13:36 1639395 146
Кстати еще , как проверить на 100%, что все модели с прочими ништяками влезли в врам? Я в диспетчерез задач смотрю когда, то там всегда 100% нагрузка и скачки незначительные.
Аноним 24/06/26 Срд 13:34:22 1639599 147
Ответов нет, штош, я пришел к выводу что лучше не буду рисковать б/у 24 гига, лучше медленно на ужатых моделях, но надежно за ту же цену. 4090 не ти с авиты стоит примерно как 5070ти в днс. И все эти многоходовочки перекупщиков не для аутистов как я.
Аноним 24/06/26 Срд 15:23:35 1639678 148
Господа, хочу напомнить про существование 2080ti с 22 гигабайтами видеопамяти, сейчас на авито за них хотят примерно 33к за версию с турбинным охлаждением.
Суть токова, купил себе недавно такую, сравнил на на том же воркфлоу в ComfyUI с Wan 2.2 которые я гонял на своей предыдущей 3090 и получилось намного лучше чем я ожидал.

Стандартные восемь секунд видео с двумя дополнительными лорами и разрешением 512х512 моя 3090 успевала сгенерить за 80 секунд, то же самое на 2080ti 22GB генерировалось за 130, грубо говоря она всего в два раза медленнее, за треть стоимости.
Аноним 24/06/26 Срд 15:32:21 1639683 149
>>1639678
Вот это интересно.
Я могу в теории использовать её совместно с 3090 для расширения видеопамяти, или идея провальная и модели не умеют в две карты разных влезать?
Аноним 24/06/26 Срд 15:44:31 1639695 150
Аноним 24/06/26 Срд 15:47:40 1639697 151
>>1639695
Ну и ладно. Но как нищевариант предложу своему другу под кодинг 2080ti для ллм. Спасибо!
Аноним 24/06/26 Срд 15:49:07 1639699 152
>>1639683
>использовать её совместно с 3090 для расширения видеопамяти
Насколько я в курсе так это не работает.
Аноним 24/06/26 Срд 17:25:21 1639760 153
Я вам ща кое что открою удивительное - PerturbedAttentionGuidance которая в комфи есть по умолчанию. Время генерации становится выше почти в 2 раза, но моушен ебанёшся какой отличный.
Аноним 24/06/26 Срд 17:39:34 1639774 154
>>1639760
>PerturbedAttentionGuidance
Это чо хоть такое тоооо?
Аноним 24/06/26 Срд 17:45:13 1639778 155
>>1639599
4090 с авито стоит как 5080 с днс и не с проста.
А если разговор про 3090, то..... ох ебать она взлетела по цене, хотел себе вторую взять за 50к, а тут такое. Буквально пару месяцев назад валом было по 50-60к на авито
Аноним 24/06/26 Срд 17:45:43 1639780 156
>>1639760
>моушен
Если это так, то есть смысл только на high noise part юзать, быстрее генерить будет. Ну я не проверял, а ты примеров не скинул, так что
Аноним 24/06/26 Срд 17:45:51 1639781 157
Аноним 24/06/26 Срд 18:10:48 1639793 158
>>1639778
Ты правильно понял, я опечатался - 3090. То есть ты согласен, что лучше не жертвовать мощностью и гарантией в обмен что несжатые модели пихнуть можно?
Аноним 24/06/26 Срд 18:13:17 1639795 159
>>1639678
>чем я ожидал
А зачем ты карты попаешь не зная что оин делают наверняка? Богатый дохуя или это такая схема барыжничествав киберпаке будущем?
Аноним 24/06/26 Срд 20:25:36 1639870 160
>>1639388
Сорян, седня слишком много дел, если и успею, не раньше завтрашнего вечера.

>>1639395
Помню раньше у Киджая был удобный лог в консоли, который писал, сколько из модели в видяхе, а сколько офлод.
Но я подключаю щас абы как, не видел этого в консоли. Может лоадер нужно другой заюзать просто.

>>1639678
> 33к
> треть стоимости
Я не спец в 3090 на авито, но разве не 50-60?
Будто бы она вдвое медленнее за вдвое дешевле, не?

>>1639683
Выше я кидал на рэйлайт ссылку, у меня не вышло, может дело в узкой шине второй видяхи. Т.е., если материнка с бифуркацией на 4 псине или с двумя х16 полноценными слотами, то будет ок, но на дефолтной материнке ускорения не ускорилось. х)

В крайнем случае можешь дефолтный мультигпу юзать — текстовый энкодер на одну видяху, модель на другую.

>>1639778
Че, реально 90?
ЫЫЫ… Сочувствую.

>>1639793
Ну видишь как, 5070-то все равно не уступает 3090, а 5070 ти еще и быстрее.
Т.е., тебе шашечки или ехать?

Но смотри мой личный кейс:
Я такой сижу с двумя 5070 ти, на одной модель кручу, на другой ллм, чтобы промпты улучшать, радуюсь жизни.
Говорю, дай мне фуллхд видео на 20 секунд.
А на она мне на этапе апскейла «ебать, ООМ, памяти не хватило».
И модель к этому вообще отношения не имеет — видеопамяти не хватает для контекста (разрешение умножить на количество кадров). А если использовать Shared Memory, то время улетит в небеса, вместо 2 минут будешь 1 час ждать. Это не шутка, при выгрузке в оперативу контекста время катастрофически растет.
При этом, 3090 будет генерить медленнее (ну пусть будет даже 3 минуты против 2, да? Будем считать, что 5070 ти на 50% быстрее, хотя это не так, конечно=), зато у нее 24 гига, и фуллхд 20 секунд она сгенерит, просто за 5 минут, за 10. Но не за 1 час.

Это реальный момент, на который ты натыкаешься — хочешь сделать длинное и качественное видео ваншотом, а оно физически не лезет в видяху. Причем с 5070 ти это чуть менее заметно, все же лишние 4 гига есть, а вот с 12-гиговыми 4070 ти и 5070 это было заметно прям… прям было, правда.

Но тут опять же, ты можешь просто сделать две сцены, пролонгировать видео, дав на вход последние 16-25 кадров первого видео как начало второго, и склеить потом.

Зато 3090 позволит тебе запустить ллмку, квен и гемму сразу целиком не ебясь. А две 3090 — так вообще пушка.
Да, две 5070 ти тоже дают свои 32 гига для ллм и это приятно (Gemma-4-31B-QAT с 100 токенами в секунду, ммм…), но… но…

Короче, ты понял. Это не «лучше» или «хуже», это просто разные варианты.

3090 стоила 60к два года подряд. А я не купил ни одной.
Потому что я ссыкло, боюсь брать бу с авито доставкой. =) И все, никаких других причин, субъективно и ничего рационального. Поэтому, что брать тебе — это сугубо твой выбор.

>>1639795
Иногда ты просто сидишь-пердишь и думаешь «ебать я хочу попробовать эту карту!», а потому у тебя появляется возможность ее взять и ты ее берешь.

Я себе так всякой забавной хуиты напокупал. Не жалею, зато мечта маленькая сбылась, было кайфово.
Человек хотел 2080ti 22-гиговую — взял. Его право, хотя, ИМХО, она оверпрайс, все же. Ну я хз.
Аноним 24/06/26 Срд 20:26:03 1639873 161
>>1639778
>было по 50-60к на авито
Серьёзно? Опять я не во время решил залететь. Сейчас цены уже под сотку.
Аноним 24/06/26 Срд 20:35:20 1639884 162
>>1639870
Уступает и уступает. Она и дешевле. Ты вот сидишь с двумя 5070 ти, а у меня не одной, наносек анальнк, зп пол ляма, поэтому в лохито казино играешь и если кинут для тебя это мелочь, еще и поднасрался раздув цены как остальные паникеры, а я уволился недавно и для меня это бешенные деньги, поэтому тут без вариантов.
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов