Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 213 84 104
Локальной генерации ИИ-видео №3 ltx-2 /aivideo/ Аноним 13/01/26 Втр 15:17:44 1488357 1
17682492503591.mp4 2421Кб, 960x960, 00:00:09
960x960
17681347240110.mp4 950Кб, 480x480, 00:00:11
480x480
v shapku.mp4 2587Кб, 704x1024, 00:00:20
704x1024
sdf.mp4 849Кб, 320x512, 00:00:14
320x512
Актуальные модели

1. Wan от Alibaba

https://huggingface.co/collections/Wan-AI/wan22

VACE модели:
https://github.com/ali-vilab/VACE
https://huggingface.co/Wan-AI/Wan2.1-VACE-14B
https://huggingface.co/Wan-AI/Wan2.1-VACE-1.3B

2. Hunyuan от Tencent

https://huggingface.co/tencent/HunyuanVideo-1.5

3. Ovi

https://huggingface.co/chetwinlow1/Ovi

4. Starflow

https://huggingface.co/apple/starflow

5. LTX-2 - делает локальную генерацию грейт агейн.

https://huggingface.co/Lightricks/LTX-2

1. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1

2. LongCat-Video

https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video
https://meituan-longcat.github.io/LongCat-Video/

3. Wan 2.1

https://huggingface.co/collections/Wan-AI/wan21

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Hunyuan Video (осторожно, ссылки в туторе на предыдущую модель): https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/

Гайд для использования Wan 2.2

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan: https://github.com/kijai/ComfyUI-WanVideoWrapper

Где брать готовые LoRA
https://civitai.com/models

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Терминология моделей
prune — удаляем ненужные веса, уменьшаем размер
distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше
quant — уменьшаем точность весов, уменьшаем размер
scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше
merge — смешиваем несколько моделей или лор в одну, как краски на палитре.

lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.


Предыдущий тред
>>1439768 (OP)
Аноним 13/01/26 Втр 15:19:21 1488362 2
a vash.mp4 2115Кб, 960x1280, 00:00:12
960x1280
Перекатил как мог анончики, можете ругать.
Аноним 13/01/26 Втр 16:18:47 1488413 3
>>1488387 →
На что хуй быстрее, выше, сильнее встал — та и подходит.
Да, перебором, грузишь одну пару, смотришь на результат, грузишь другую, третью…
В итоге фаворитов прогоняешь еще по несколько раз, проверяешь, не показалось ли.
Аноним 13/01/26 Втр 18:22:29 1488505 4
000.mp4 3445Кб, 464x688, 00:00:06
464x688
0.jpg 335Кб, 784x1168
784x1168
000.jpg 278Кб, 784x1168
784x1168
Аноним 13/01/26 Втр 21:33:29 1488732 5
vid00017.webm 1050Кб, 752x1104, 00:00:05
752x1104
vid00018.webm 1641Кб, 752x1104, 00:00:06
752x1104
vid00011.webm 5043Кб, 720x1136, 00:00:06
720x1136
vid00039.webm 1572Кб, 784x1056, 00:00:04
784x1056
Аноним 13/01/26 Втр 22:14:14 1488758 6
image.png 63Кб, 433x272
433x272
Аноним 13/01/26 Втр 22:50:48 1488800 7
1000018574.mp4 9343Кб, 1280x720, 00:00:37
1280x720
Как же они рейджбейтят
Аноним 13/01/26 Втр 23:28:25 1488846 8
>>1488800
Бедные, прикиньте, сколько им пришлось сделать черрипиков, чтобы ван так хуево сгенерил. Небось и промптили, и шаги зануляли, и че тока не делали…
Надеюсь, их труды не пройдут напрасно, и Ван РЕЛИЗНУТ 2.5!!!
Пидры. =с Хде мой опенсорс.
Аноним 13/01/26 Втр 23:35:21 1488853 9
>>1488846
А смысл. У тебя никогда не хватит на него железа.
Аноним 14/01/26 Срд 01:32:59 1488921 10
>>1488853
"На днях на конференции представители Wan упомянули, что они не сделали Wan 2.5/2.6 открытым исходным кодом, потому что он слишком большой для сообщества. Судя по комментариям о проблемах с LTX, я думаю, они были правы. Ребята из Wan сказали, что, возможно, когда-нибудь выпустят более облегченную версию. "
Аноним 14/01/26 Срд 04:02:36 1488989 11
>>1488732
>2
Просьба поделиться промптом, как поворот на 360 запромптить. Или это лора?
DWA 14/01/26 Срд 05:08:32 1489005 12
Does anyone have recommendations for better prompt adherence? I've been using https://www.kling2-6.com to assist with my Kling 2.6 prompts, and the results are pretty stable. Worth a look for the toolset.
Аноним 14/01/26 Срд 05:34:41 1489012 13
image.png 39Кб, 1053x541
1053x541
В воркфлоу пакеты moondream. Не ставились пока не поменял уровень безопасности в комфи. Поменял, теперь просит авторизоваться в гитхабе. Че за прикол? С каких пор нужно зайти в гитхаб чтобы скачать пакеты?
Аноним 14/01/26 Срд 09:00:00 1489081 14
mocha00048.mp4 1509Кб, 800x592, 00:00:04
800x592
>>1488989
Все видеофайлы содержат workflow, там промпт. Просто перетащить в ComfyUI и всё будет.
Аноним 14/01/26 Срд 11:12:02 1489155 15
t2v-low00012.mp4 1225Кб, 480x640, 00:00:20
480x640
t2v-low00011.mp4 1280Кб, 480x640, 00:00:20
480x640
Неделя ещё не кончилась а, уже альфа писик вышел правда ноги поломали, лол.
Пизда WAN'у
Аноним 14/01/26 Срд 11:20:18 1489167 16
Сколько не пытаюсь на лтх2 сделать что-то нормальное, одна хуйня выходит. Либо просто картинка с зумом, либо очень слабое движение. Как бы я ни писал промпт, даже через флоренс описывал инпут имаджи, все равно хуйня какая-то. Промпт вообще нахуй идет, генерит вообще не то, что я прошу. Качество тоже по пизде. ЛТХ2 это наеб просто какой-то глобальный?
Аноним 14/01/26 Срд 11:55:33 1489223 17
>>1489155
Как можно так сильно обосраться с лорой на пизду?
В инете мало пёзд или что?
То же и с сиськами, какая то вялая хуета
Аноним 14/01/26 Срд 11:59:53 1489232 18
>>1489155
Заебиссь баляя, дрочим нахуй!!
Аноним 14/01/26 Срд 14:44:42 1489398 19
>>1488921
В сообществе и RTX Pro 6000 встречаются, так что они немного лукавят.
Я верю в Wan-2.6 с его персонами и временем инференса, но вот Wan-2.5 вполне возможно запустить люди могли.
Надо помнить, что ЛТХ-то сам по себе плохая модель от не самых умелых авторов. И размер — не показатель качества, в данном случае. Дома люди все равно генерят не 1920*1080 (хотя я вчера ради интереса на лтхе делал такой ролик, без апскейла, вышло неплохо).
Так что, они просто взвесили пользу от хайпа и заработок и решили, что на апи и подписках заработают больше, чем поднимут репутации.

>>1489167
Не настолько, что-то не так у тебя. Она в деталях следует промпту хуже вана, и знает меньше, но в общем понимает и делает, что от нее требуют. Выглядит как какой-то технический баг, по твоему описанию.
Аноним 14/01/26 Срд 14:49:10 1489400 20
020704LASTFRAME[...].mp4 5186Кб, 960x1280, 00:00:08
960x1280
Оцените ворк плиз.
А именно самое начало, где модели и клип лоадер.
Как к этому прикрутить новые nvfp4 модели и есть ли смысл 5070ti у меня ?
А если оставить как есть, стоит что-либо заменить? Вдруг я генерю на том что вообще плохо сочетается.
Аноним 14/01/26 Срд 15:08:13 1489419 21
>>1489400
Чрезмерно обслюнявил
Аноним 14/01/26 Срд 16:12:40 1489497 22
t2v-low00051.mp4 2356Кб, 640x480, 00:00:49
640x480
t2v-low00050.mp4 2540Кб, 640x480, 00:00:49
640x480
t2v-low00049.mp4 2047Кб, 640x480, 00:00:49
640x480
>>1489400 то самое видео с острова эпштейна?

БЛяТ! Почти ЦЕЛАЯ МИНУТЫ артхаусной ебанины! Промт по сути уже нахуй пошёл, но тем не менее. Летёха не хочет генерить клованов.
Аноним 14/01/26 Срд 16:31:18 1489520 23
>>1489400
Что за модель?
8 сек без звука и качество вроде не лтх хмм..
Аноним 14/01/26 Срд 16:42:25 1489522 24
t2v-hd00007.mp4 1529Кб, 1280x960, 00:00:04
1280x960
что то у меня закрадываются подозрения что датасет у LTX был какой то весьма специфический...
Аноним 14/01/26 Срд 16:48:52 1489527 25
изображение.png 74Кб, 829x578
829x578
Там оказывается Nvidia завезла в новый драйвер супер оптимизон, все ведь в курсе? У меня ltx и всякие квены/флаксы дали +30% к скорости, с сажей где то 40-50 вообще. Rtx 4070s.
Интересно как будет на wan, про него чет не писали, но т.к это касается fp8 в целом то и там наверно будет ускорение
Аноним 14/01/26 Срд 16:55:54 1489531 26
>>1489527
Нихера себе. Нужно просто драйвер обновить? Я думал, это перфоманс буст для куды 13+, которая только на Блэквелах (50хх)
Аноним 14/01/26 Срд 16:56:46 1489532 27
>>1489531
Нихуя, там для всех карт вообще подгон, даже для 3х серии. Почитай
Аноним 14/01/26 Срд 16:59:37 1489533 28
>>1489532
Так нужно только драйвер обновить или еще Комфи? У меня последний разваливается почти каждый раз когда я его апдейчу, приходится заново все собирать. Ради 30% перфоманса можно бы и да, конечно

Дай ссылочку что ли где почитать
Аноним 14/01/26 Срд 17:02:08 1489537 29
>>1489532
Это на винде тока походу
Аноним 14/01/26 Срд 17:04:30 1489542 30
Аноним 14/01/26 Срд 17:06:14 1489544 31
>>1489542
Я даже не в курсе, что такое драйвер студио... Буду пробовать сначала обновлять гейреди. Пошел читать, спасибо за благостные новости!
Аноним 14/01/26 Срд 18:24:22 1489661 32
Чет драйвер поставил и ничего не изменилось. Может еще какие танцы с бубном надо делать. У меня видюха 50 серии.
Аноним 14/01/26 Срд 18:32:28 1489666 33
изображение.png 23Кб, 958x162
958x162
>>1489661
Комфи обновлял? Прибавка сразу в глаза бросилась. LTX было 5-6 секунд за итерацию на дефолт воркфлоу, стало 3.4-3.7 ( с сажей). У меня если че винда и драйвер студио версия.

В Qwen edit 2511 генерация была раньше 30-35 секунд, сейчас делается за 19
Аноним 14/01/26 Срд 18:35:51 1489670 34
>>1489666
А еще у меня оперы забыл сказать 96 гигов, может у тебя на диск офлоадит, а тут как раз оптимизон на эти дела, Если на диск сбрасывает то понятно тогда почему не работает
Аноним 14/01/26 Срд 18:44:09 1489680 35
xbvGe4DN1o8.jpg 17Кб, 300x300
300x300
>>1489670
>у меня оперы забыл сказать 96 гигов
Ладно, тогда проехали.
Аноним 14/01/26 Срд 18:52:10 1489689 36
>>1489666
У меня Квен Едит на 4090 и 128рам работает 2 минуты. Не подскажешь почему у тебя так быстро? У меня правда ddr4, у тебя может ddr5? В оперативу выгружает что-то когда работает, да. Но мб какие флаги нужны, чтобы только туда? Юзаю fp8 квант
Аноним 14/01/26 Срд 18:55:55 1489696 37
>>1489689
Квен едит у меня с лайтинг лорой 4 step в cfg 1, а модель bf16 на 40 гигов. 2 минуты какая генерация, без лоры или с ней?
Аноним 14/01/26 Срд 19:22:56 1489733 38
изображение.png 20Кб, 965x141
965x141
Vae тоже быстрее распердоливаться стало в ltx
Аноним 14/01/26 Срд 19:28:11 1489742 39
>>1489497
>то самое видео с острова эпштейна?
Из фильма, там эта телка в конце еблась с мужиком и родила ребенка, так что норм
Аноним 14/01/26 Срд 19:30:02 1489745 40
>>1489520
Ну дык ваня 2.2 с апскейлом, 6й гуф
Аноним 14/01/26 Срд 19:36:07 1489757 41
Аноним 14/01/26 Срд 19:40:41 1489764 42
>>1489757
ускорялки и face lick с цивитая.

Алсо, что за ltx о котором все говорят? Замена ваньке? месяца 4 ворк и конфи не обновлял. С 5070ti есть смысл изучать вопрос?
Аноним 14/01/26 Срд 20:20:57 1489819 43
>>1489696
С лорой на свет. У тебя еще и bf16, ого. У тебя 5090 и ddr5 или почему такая разница?
Аноним 14/01/26 Срд 20:25:38 1489823 44
>>1489819
4070 и ddr4. 2 минтуты лайтинга это дохуя как бы для 4090. Че то не то со сборкой или окружением
Аноним 15/01/26 Чтв 01:38:55 1490035 45
Что-то у меня после обновления драйверов ускорения не получилось. =(
Но я обновил игровой.
Возможно реально нужен студио?

А может это все тут не причем?
Асинк энд пинд давно включили, пишут — возможно, я как раз видяху менял с 4070 ти на 5070 ти в декабре.
А нвфп4 ускорялся на глазах в комфи — от «медленнее фп8» до «чутка быстрее», но качество в лтх было говенным в фп4.

Короче, не до конца понял, когда будут ускорения…
Если кто убедится, что дело в студио драйверах— отпишитесь, плиз.
Аноним 15/01/26 Чтв 01:39:55 1490036 46
А че сору Наебнули чтоли? Попытался сейчас старый промт сгенерить и если раньше все диалоги умещались теперь либо молчат либо одну фразу успевают сказать.
Аноним 15/01/26 Чтв 01:48:17 1490038 47
А, все, fp4 норм работает (умеренно), но она есть только для dev-версии, и из-за cfg 4.0 работает все равно дольше, чем дистилка. fp4 не спасают.
Если бы дистил была, но то ли я дурак, то ли ее не выпустили. Там бы ускорение помогло бы.
Аноним 15/01/26 Чтв 09:08:22 1490159 48
>>1489398
Какое апи 2.5 когда у них самих уже есть лучший 2.6, не говоря уже о конкурентах?
Нет ни одной причины не дропать веса, но они выбирают быть пидорасами.
2.1-2.2 нам дали ибо они тестовые, как и 2.5 тест версии со звуком
Аноним 15/01/26 Чтв 11:49:39 1490282 49
>>1490159
Кстати вообще не понял этого мува. Ван тем и ценился, что не имел цензуры и был локальным. 2.6 я потестил, но это какая-то артефачная хуйня, которую на голову ебут и сора и вео и клинг и все остальные большие конкуренты. Какой смысл вообще покупать на это говно подписку теперь?
Аноним 15/01/26 Чтв 12:02:48 1490305 50
>>1490282
Лтх2 как бы тоже api и он хуже ван 2.2 2.1?, думай
Аноним 15/01/26 Чтв 12:55:48 1490354 51
>>1490305
Думаешь, на локалках ничего лучше 2.2 лучше не будет?
Аноним 15/01/26 Чтв 13:04:16 1490360 52
>>1490354
На данный момент ничего лучше 2.2 так не понимает промпт, консистентность и поддержку нсфв. Он даже лица воспроизводит почти точно, даже не зная персонажа и его мимику с эмоциями. LTX даже рядом не стоит с этими возможностями в ван. Если выпустят 2.5 это будет чудом конечно
Аноним 15/01/26 Чтв 13:10:55 1490371 53
>>1490360
Да если бы мельтешение пикселей можно было поправить -- вообще цены бы ему не было. А так постоянно апскейлить надо, иначе лицо разваливается, глаза, а если на одежде узор сложный -- вообще пизда.
Аноним 15/01/26 Чтв 13:45:45 1490396 54
TL;DR что сейчас ебет из видеогенерации на локалках? 4090 и 128 рама. LTX-2 мне нужен и все?
Аноним 15/01/26 Чтв 13:52:43 1490405 55
>>1490396
Зависит от задач. Если T2V, то лтх быстрее, сразу ролики по 20 сек можно делать, встроенный звук, можно больше нейрослопа нагенерить и засрать интернет. Лтх не знает про сисик и писик. I2V лучший пока что Ван 2.2 по качеству, следованию промпту, сохранению персонажа, но долгий.
Аноним 15/01/26 Чтв 14:15:44 1490426 56
Аноним 15/01/26 Чтв 18:32:22 1490585 57
Анонче, технический вопрос по Ван 2.2.
Есть ВФ, который я скидывал в прошлом треде, и который позволяет длинные видео.

https://civitai.com/models/1866565/wan22-continuous-generation-svi2-pro-or-gguf-or-32-phase-or-upscaleinterpolate-w-subgraphs-and-bus

Хай и лоу стадии проходят быстро для одного видео в 5 секунд (в районе пары минут на саму генерацию), но вот свич между хай и лоу моделями происходит долго. Получается так, что ждешь загрузку хай модели -> генерация хай части прошла (примерно минута) -> ждешь загрузку лоу модели -> генерация лоу части прошла (примерно минута) -> ждешь вае -> ласт фрейм пошел к следующему видео в цепочке.

Можно как-то ускорить свич между моделями? Может как-то генерить сначала весь хай нойз в цепочке, потом весь лоу нойз в цепочке, а потом объединять? Может есть какое решение.
Аноним 15/01/26 Чтв 19:02:41 1490613 58
Аноним 15/01/26 Чтв 19:33:08 1490633 59
>>1489522
Они взяли то что в общественной собственности.
Аноним 15/01/26 Чтв 21:12:43 1490720 60
>>1490396
Готов без звука и 16 фпс — Wan2.2 без конкуренции.

Хочешь 24 фпс с озвучкой сразу — LTX-2.

Все.

Я вот ща чекаю, что лтх может делать — иногда реально хорошие ролики и можно кидать в прод, но 1 из 5, у остальных какие-то косяки — то пальцы не туда, то промпту не следует.
Зато быстро.

Но если мне придется в ближайшее время делать анимацию — я ее буду делать в ване.
Аноним 15/01/26 Чтв 22:16:44 1490775 61
>>1490585
> свич между моделями долгий
Это гуф.
Надо качать fp8 от киджая
p8_e4m3fn.safetensors для 40+ серии видях
fp8_e5m2.safetensors для 30 серии
Аноним 15/01/26 Чтв 23:03:23 1490821 62
>>1490775
я на фп8 от Киджая, с сажей на борту. Все равно долго
Аноним 15/01/26 Чтв 23:33:19 1490850 63
Аноним 16/01/26 Птн 09:01:47 1491112 64
2.jpg 74Кб, 761x475
761x475
Аноны месяц где то не запускал генерацию, пришлось все переустановить и на старом воркфлоу где раньше все ставилось и работало без проблем через кустом нод инсталл, вот тут на скрине пропали лоры для загрузки, как пофиксить? Обновление и установка кустом нод не помогла.
Аноним 16/01/26 Птн 09:50:49 1491125 65
>>1490850
Заменил старый сэмплер на ltxvnormalizingsampler и мало того, что в i2v скорость генерации упала наверно раза в 2, так еще и качества не прибавилось. Все также артефакты лезут при движениях, пердолятся глаза, пальцы.
Аноним 16/01/26 Птн 10:09:00 1491129 66
Вчера попробовал q3 ltx + fp4 gemma, заняло 42 гига (из 32 на ноуте), но сгенерило норм. Деградация заметна была, но не совсем распидорасило.
Так-то, неплохой вариант для бомжей.
Но лучше иметь 64 гига, конечно.
Аноним 16/01/26 Птн 11:33:29 1491165 67
>>1491125
Надо заменить лишь на 1 проходе
Он не исправляет всю модель, лишь звук и хуевые цвета
Аноним 16/01/26 Птн 16:56:46 1491456 68
>>1491112
попробуй заново поставить ноду, если не поможет то переустанови rgthree - disable > uninstall > install
Аноним 16/01/26 Птн 16:58:28 1491458 69
что по скорости лтх2 по сравнению с ван22?
Аноним 16/01/26 Птн 17:03:14 1491463 70
>>1489764
Конечно стоит, он 960х1280 на 8 секунд + звук минут за 3-5 сгенерит смотря какие кванты/оперативка.
Аноним 16/01/26 Птн 17:12:28 1491470 71
>>1491458
Сильно быстрее, качество сильно хуже.
Аноним 16/01/26 Птн 17:38:41 1491510 72
Киджай закинул Latent Normalize Audio себе в ноды, теперь звук стал немного лучше, и правда.
Аноним 16/01/26 Птн 18:16:14 1491583 73
>>1491463
И как это? Другая модель? Или ЛТХ это вообще не в комфи а что-то стороннее?
Аноним 16/01/26 Птн 19:36:03 1491673 74
i2v-low00005.mp4 1445Кб, 480x800, 00:00:10
480x800
t2v-hd00001.mp4 4153Кб, 960x1600, 00:00:10
960x1600
Аноним 16/01/26 Птн 20:54:01 1491820 75
>>1491673
Но я не хочу собак ебать.. Ну ладно, придется походу
Аноним 16/01/26 Птн 20:58:37 1491825 76
202418LASTFRAME[...].mp4 5951Кб, 960x1280, 00:00:08
960x1280
>>1489400
Лучшее что убирает слоумо и луп из видео через промт это всё таки Грок. Пихайте свои промты в Грок и будет заебись.
Аноним 16/01/26 Птн 21:31:27 1491861 77
Челы, а есть тг боты чтобы отсосы там генерить? Впадлу самому локалку ставить
Аноним 16/01/26 Птн 23:59:03 1492026 78
Аноним 17/01/26 Суб 02:21:51 1492130 79
Аноны, в вашу тему можно вкатиться со следующим конфигом?

RTX 3060@12, p104@8, 42 RAM DDR4. Нюанс вот в чем: p104 сможет ли работать в связке с 3060? По опыту LLM — да, но зависит от бэка и прочего, так как это майнмнговая GTX 1070 и с некоторыми технологиями она может сделать хуже, где-то наоборот лучше.

Также прошу подсказать бэк + фронт и актуальные модели. Шапку читал, но если судить по своему опыту, там всегда престарелое говно, неточности и прочее, поэтому хочется просто взять то, что нужно для:

1. Модель для генерации максимально качественных видосов, чтоб прям УААЭЭХЩЩ.

2. Модель для генерации аниме-порно. Возможно, через img2video или что-то подобное.

Звук в видосах меня не интересует вообще.

Надеюсь, можно не использовать для генерации макаронного монстра.
Аноним 17/01/26 Суб 07:59:29 1492250 80
Тоже интересует производительность.
Когда последний раз интересовался темой - локалки генерили в 5 фпс и наматывали видеокарту часа два.
Что то изменилось с тех времен?
Аноним 17/01/26 Суб 12:17:34 1492370 81
>>1491583
Что как? Так же через комфи все генерится, 75% нод те же самые что и у вана. На циви уже все есть, форкфлоу, лоры, промпты.
Аноним 17/01/26 Суб 12:28:50 1492391 82
>>1492250
Ну на 5060ти ван 5б или лтх2 генерят 8 секундный видос в 1280х720 минут за 5, там еще от квантов/лор/количества и скорости оперативки зависит скорость генерации.
Аноним 17/01/26 Суб 12:36:39 1492400 83
>>1492391
Хуйня какая-то. У меня 5070ti и WAN 14B делает 8 секундный ролик такого же примерно качества секунд за 120-130 примерно, а глючная лтх2 вообще намертво систему зависает, а у тебя убогая 5б делает ПЯТЬ МИНУТ, учитывая еще что 5б в принципе ничего сделать не может нормальное, и при этом у тебя еще и эта уебищная лтх2 работает так же как уебищная 5б.

Какая-то хуйня.
Аноним 17/01/26 Суб 12:43:02 1492406 84
vid00002.webm 2419Кб, 752x1104, 00:00:05
752x1104
Аноним 17/01/26 Суб 13:13:23 1492444 85
>>1492400
Ну показывай свой форкфлоу, я хз как у тебя 24-50 Гб говно (или какой квант ты юзаешь) может работать быстрее чем 12 Гб ван 5б и тем более не запускаться резвый лтх2.

Алсо что по твоему 5б не может сделать из того что может 14б?
Аноним 17/01/26 Суб 14:05:07 1492520 86
>>1492130
О, это ты полгода назад в ллм-треде п104 по моим рекомендациям взял? :)

Смотри, ты можешь на отдельную видяху выгружать отдельную модель.
Например видео модель на 3060, а текстовый энкодер на п104.

Так что, имеет смысл!

Но это не даст тебе больше памяти для контекста (разрешение x количество кадров), и не даст серьезного буста по скорости. Лишь сэкономит память и время на загрузку моделей (с одной видяхой в начале из оперативы в видяху грузится одна модель (текстовый энкодер), потом отрабатывает и выгружается, и грузится основная модель, у тебя этих промежутков не будет).

Максимально качественные видосы — завези себе 96 оперативы хотя бы, чтобы не убивать диск. Это Wan2.2, но 16 фпс , 5-7 секунд и без звука.
Ущербные видосы — LTX-2, зато 24 фпс, 5-10-20-40… секунд и со звуком.

Аниме-порно залетает в обе модели, тащемта, img2video, да.

Можно не использовать комфи, но юзеры ван2гп постоянно ноют и агрятся, потому что у них никогда ничего не работают, они спрашивают как починить, а на них смотрят как на дебилов, которые жрут говно. Т.е., мы-то тоже на комфи жрем говно, но оно хотя бы не пахнет, а альтернативы попросту фонят радиацией и не работают постоянно.

Хотя, именно Wan2.2 там вроде работает норм.
Но я все же рекомендую постигать ComfyUI.

>>1492406
С таким разрешением, не удивительно.
Аноним 17/01/26 Суб 14:52:01 1492632 87
>>1492444
Самый базовый вф из шаблонов. Кванты, вроде как, не использую для вана, базовые модели стоят, которые комфи подгружает, хай и лоу по 15гб каждая которая.

95% видео что я делал на 5б выдавало мне какое-то всратое светопредставление и дерганную картинку, один раз только с лорой тверк получилось сделать, и то выглядит всрато. С 14б таких проблем не было никогда, он может не сделать то что просишь, но выглядеть это будет нормально хотя бы в любом случае.

Насчет лтх2 вашего я хз, я буквально вчера пробовал его запустить тоже через базовый вф с шаблоном комфи и при попытке генерации у меня все нахуй зависло намертво, что в принципе очевидно, модель весит 40гб, а у меня 16гб врам только и 32гб озу
Аноним 17/01/26 Суб 15:33:50 1492700 88
кто нибудь знает как справиться с дрифтингом в ван и2в при создании сегментов с использованием ласт фрейма (5+5+5...)?
на фиде имею два имг апскейлера, в принципе рабочая тема. но есть ли способ по лучше?
Аноним 17/01/26 Суб 16:08:58 1492750 89
Анон, пожалуйста, поделись секретами i2v для wan2.2

Я уже головой поехал просто. Как мне делать видео-кумы из портретных фото? Ну вот, условно говоря, есть картинка с персонажем портрет по грудь, я, например гипотетически, хочу что бы она потверкала там, или что бы на хуй села, чтоб сзади другая со страпоном подошла и вставила, ну ты понял. Но в итоге получается невразумительная хуйня. Если без спец лор делать то чаще всего она просто что-то говорит на камеру и мимикой играет, иногда делает фрикции, но картинка сама не меняется. Должен же быть какой-то способ адекватный
Аноним 17/01/26 Суб 16:35:42 1492797 90
Аноним 17/01/26 Суб 16:35:47 1492798 91
Аноним 17/01/26 Суб 17:01:15 1492837 92
>>1492797
Жопочтец, я про лоры тоже писал, это убогий костыль, а не способ. Если твоя пикча изначально не в той позе, в которую лора спосонба, то хуй она в нее встанет, а если делать через затемнение экрана то персонаж полностью меняется
Аноним 17/01/26 Суб 17:25:01 1492873 93
Аноним 17/01/26 Суб 18:42:56 1493015 94
>>1492750
Лоры + промпт
Если инпут имг просто фронт портрет без задницы, то для тверка, я думаю, нужно для начала описать движение камеры, например: camera zooming out, her ass visible и тп. Я обычно использую лору типа all in one как главную с большой силой (strength) плюс дополнительные в зависимости от того что хочу сгенерить.
Также использую связку euler + simple, в ней мне кажется больше вариативности.
Если у тебя на выходе байда, то проверь есть ли в wf лайт 4step лоры. На крайняк скинь wf сюда.
Аноним 17/01/26 Суб 18:44:41 1493018 95
>>1492873
Расскажи, пожалуйста, про эти про лоры, первый раз слышу. Зачем нужны, с чем едят, как подключают?
Аноним 17/01/26 Суб 19:09:33 1493044 96
>>1493018
Лоры помогают сохранять консистентность персонажа с твоей пикчи. Хорошо работает на длинных видео, когда даже не обязательно, чтоб был персонаж на ласт фрейме, чтобы воспроизвести его в следующем видео.
Подрубаются как обычные лоры с весом 1.
Аноним 17/01/26 Суб 20:00:41 1493094 97
Почему-то моя Rtx 5070 отлично показывает себя в играх, но в нейронках wan 2.1 шумит и умирает)
Аноним 17/01/26 Суб 21:16:33 1493187 98
>>1493094
А что тебя удивляет, генерация, особенно видео, это сильная стресс-нагрузка на карточку. У меня 5070ti в любой игре на любых настройках максимально тихая, а при генерации на ван2.2 взлетать в космос начинает пока генерирует
Аноним 17/01/26 Суб 22:14:05 1493224 99
>>1493094
> wan 2.1
Вы из середины 2к25 к нам?
Аноним 17/01/26 Суб 22:28:23 1493247 100
>>1493094
В смысле осложнённый ООМ или перегрев и бсод? Ну и да, >2.1
Аноним 18/01/26 Вск 03:26:16 1493514 101
>>1492520
Возможно, что по твоему совету, хотя кажется, я не отписывался о том, что купил. Ну если ты не из РФ, то, наверное, по твоему, так как ты цену называл на карту смешную, а в РФ она стоит дороже 20 долларов. Я благодаря этому совету наконец гемму поставил и с SWA смог нормально её юзать на 32к контексте с 9 тс. А вот на всякие глэмы памяти уже не хватило и сейчас не купить.

А что насчёт гайдов? В шапке инфы мало, в отличие от треда с рисованием. Хоть у меня есть опыт с рисовалками очень большой, с видео наверняка иначе. Никто не постил талмуд, в котором всё рассказывается? С другой стороны, у меня складывается такое впечатление, что с видео полегче будет, учитывая мои простые запросы, по крайней мере поначалу.

У меня ж почему такое отторжение к комфи: когда я генерировал картинки, у меня было особое колдунство виде генерации 2к картинок за ночь в 4к с промптом на 400 слов, где чётко размечены позы, наборы одежд, система рандома, фонов, ебанутые настройки типа расписания и вот это всего. Очень привык и никак не мог перенести эти же результаты в комфи, делать там так же, плевался и забросил через пару часов, а документация в комфи мне ничего толком не говорила. Плюс многие кнопки или функции были спрятаны. В итоге от картинок уже устал и просто забил.

Ну и хочется понять ещё насчёт моделей. Как я понимаю, нужно качать модели именно на цивитай (и, возможно, какие-то лоры), где уже из коробки есть половина нужных тегов для генерации? А то как же генерировать канни девочек из блю архива. Если там такого нет, я этого не переживу.

И что ты можешь посоветовать, зная мой сетап, в плане кванта и модели?

Впрочем, я тут ещё не все гайды всякие посмотрел.
Аноним 18/01/26 Вск 05:00:00 1493592 102
>>1493514
А, значит рил другой чел.

> А что насчёт гайдов?
Я давно не пишу.
В интернете, думаю, дофига, на самом деле, не знаю хороших. Меня просили видео записать, если запишу — скину.
Но я не подскажу.

Но в общем, можно начать с загрузки дефолтных воркфлоу, а потом заглядывать внутрь сабграфа по стрелочке справа вверху сабграфа, и там менять что-то.

> Как я понимаю, нужно качать модели именно на цивитай (и, возможно, какие-то лоры), где уже из коробки есть половина нужных тегов для генерации?
Забудь про теги, в 2к26 живем, описываешь все обычной речью (можно по-русски).
Основные модели берешь с Huggingface (комфи, киджай, оригинальные репозитарии — смотря какую модель предпочтешь), а лоры — с цивитаи, да.
НО! Ван и без лор хорош и бесцензурен, а лтх … ну там лор пока не так много.

Твои запросы решаются img2video, где ты генеришь первый кадр сам, а потом подставляешь в воркфлоу и вводишь промпт. Если все пойдет ок — картинка анимируется.

> И что ты можешь посоветовать, зная мой сетап, в плане кванта и модели?
42 GB DDR4? Ты верно написал?
Вообще, обе модели требуют в среднем 70-80, а лучше больше оперативы.
Все, что не поместится в оперативу — пойдет в файл подкачки. И частые генерации будут расходовать ресурс ссд.
Так что у тебя два пути: либо брать условный q3 GGUF квант (например тут: https://huggingface.co/vantagewithai/LTX-2-GGUF/tree/main/distilled) и fp4 gemma (https://huggingface.co/Comfy-Org/ltx-2/tree/main/split_files/text_encoders), это у меня на ноуте как раз влезло в 42 гига (правда там 32, и 10 вылилось в файл подкачки… но не будем о грустном!), либо выделять файлу подкачки 100 гигов и крутить нормальные полноценные модели (fp16 или fp8).
Ну, или докупить оператос, сам понимаешь.
Учти, это тебе не ллм, тут не память главное, а рассчеты, q3 GGUF не ускорит генерацию видео, а скорее даже замедлит чуть-чуть. Все только ради экономии объема делается.

Если Wan2.2 предпочтешь — то так же ищи на хаггингфейсе либо полные модели, либо ггуфы (например у https://huggingface.co/QuantStack/Wan2.2-T2V-A14B-GGUF но я их не использовал, еще популярные были https://huggingface.co/befox/WAN22.XX_Palingenesis-GGUF), помни: тебе нужна будет и HighNoise, и LowNoise модели.

Но надо сесть и разобраться.
В начале определись со свободным местом на диске, размером моделей, поставь комфи, https://github.com/city96/ComfyUI-GGUF по надобности, а потом уже ищи свое воркфлоу. Ну или мы подкинем.
Ах да, spatial-upscaler как будто и не всегда нужен, можно в обход кидать эту часть.

Это сложный путь, но он ведет к вайфу!
Аноним 18/01/26 Вск 05:01:29 1493594 103
>>1493514
Ой, и забыл добавить, в случае Wan2.2 тебе нужны i2v версии, ясное дело. У ЛТХ модель универсальная.
Аноним 18/01/26 Вск 14:14:03 1493964 104
123015LASTFRAME[...].mp4 7191Кб, 1920x960, 00:00:06
1920x960
132248LASTFRAME[...].mp4 6826Кб, 1920x960, 00:00:06
1920x960
>>1492370
А чето типа такого будет генерить или цензура?
Аноним 18/01/26 Вск 14:46:06 1494017 105
>>1493964
Нет. Там надо очень постараться, чтобы хотя бы стандартный писик в писик сделать нормального качества.
Аноним 18/01/26 Вск 16:46:49 1494161 106
>>1493964
Прикольно. Маэстро знает толк в извращениях.
Аноним 18/01/26 Вск 17:05:43 1494184 107
e17fe6448042b40[...].jpg 131Кб, 720x1235
720x1235
Господа, вопрос касательно лор, а в комфи есть какой-то функционал чтоб их как-то систематизировать понятнее? Очевидно что в папке loras я делаю подпапки, типа там это ван22 это зит это еще что-то, но в итоге когда в самом воркфлоу открываешь список лор, то приходится крутить очень долго мышкой чтоб найти нужный раздел, нет ли возможности как-то сделать чтоб если у меня стоит модель ван22 сейчас то он только эти лоры мне и показывал?

Есть ли возможность сделать картинку-превью для лоры, как это было когда-то в форже?

И главное - есть ли способ заставить как-то в промпт добавлять ключевики от лор автоматически? Дегенераты с civitai чаще всего придумывают уебанские ключи к лорам со спец символами, эту хуйню в голове невозможно держать, в форже опять-таки был такой функционал что при добавлении лоры в промпт автоматом ставились ключевики, которые ты сам добавлял, не верю что в таком навороченном комфи нет похожего функционала
Аноним 18/01/26 Вск 17:12:11 1494193 108
>>1493964
шо за модель? промпт?
Аноним 18/01/26 Вск 18:29:08 1494273 109
174623LASTFRAME[...].mp4 4628Кб, 1440x960, 00:00:08
1440x960
>>1494017
Ну значит усилий не стоит, эх...
Аноним 18/01/26 Вск 19:58:00 1494359 110
>>1494184
>то приходится крутить очень долго мышкой
Клавиатурой быстрее. У меня лоры от Вана лежат в папке "14B", если набрать в поиске, то только эти лоры и будет показывать. Кроме того, эта папка и так сортируется в верх списка, понятно почему.
В чужих воркфлоу самое продвинутое, что видел - это нода с большим списком лор, где нужную включаешь, когда надо.
форжеюзер-вкатился-в-лапшу-только-для-видео-не-эксперт-по-макаронам
Аноним 18/01/26 Вск 20:03:15 1494366 111
>>1494359
Я просто плюсану.
Power Lora Loader (rgthree), кажись.
Ну или в списке название папки вбивать, первые буквы.
Аноним 18/01/26 Вск 20:24:05 1494390 112
изображение.png 101Кб, 958x867
958x867
NATIVEVFI00061.mp4 3329Кб, 720x768, 00:00:35
720x768
Аноним 18/01/26 Вск 20:32:14 1494402 113
изображение.png 2276Кб, 1806x1276
1806x1276
>>1494390
Там с Lora-Manager будет специальная нода для лор, в нее можно будет лоры отправлять прям из менеджера этой кнопкой. Вообще загугли на ютубе видео, там очень много всякого полезного функционала.
Аноним 19/01/26 Пнд 00:47:40 1494707 114
image.png 127Кб, 899x272
899x272
Если вы хотите сделать липсинк (вместо генерации голоса самой моделью), используйте эти четыре ноды.
На входе, очевидно: аудио, audio vae, ширина и высота картинки (?), закидываем в аудио-латент перед генерацией (если апскейлите — наверное и туда тоже, хз, не помню как там чо).
Хотел сделать себе воркфлоу с липсинком, чтобы не париться потом, к счастью тут не сложно.

В итогое видео прокидывайте оригинальное аудио, потому что для липсинка приходится добавлять шума сверху, да.
Аноним 19/01/26 Пнд 01:41:27 1494739 115
LTX2.0i2v00011.mp4 2043Кб, 512x1344, 00:00:04
512x1344
Аноним 19/01/26 Пнд 01:47:37 1494746 116
Screenshot22.png 12Кб, 782x217
782x217
Анончики, помогите, в чем может быть ошибка? Я не понимаю. И дайте кто то хорошо собранное воркфлоу на лтх-2 пожалуйста, я уже заебался. ЧТо не настраиваю, то всё по пизде и какие то ошибки вылазят, хотя делаю вроде бы всё правильно по гайдам и туторам
Аноним 19/01/26 Пнд 01:51:14 1494750 117
>>1494746
Он же в шаблонах есть. Сколько видеопамяти?
Аноним 19/01/26 Пнд 01:52:52 1494755 118
>>1494750
тот что в шаблонах вылетает просто. сервер отваливается. 12 гб видео/32 гб оперативы
Аноним 19/01/26 Пнд 11:04:40 1495039 119
А где можно взять самый подробный гайд как и что работает
Установил, система норм, а что дальше делать - непонятно)

Rtx 5070
Аноним 19/01/26 Пнд 15:36:50 1495348 120
>>1493592
>HighNoise, и LowNoise модели
А что за прикол с двумя жирнющими моделями? Как-то неудобно свапать.
Мимо другой анон
Аноним 19/01/26 Пнд 16:39:21 1495424 121
162335LASTFRAME[...].mp4 9380Кб, 1920x960, 00:00:06
1920x960
Аноним 19/01/26 Пнд 16:40:54 1495428 122
image 127Кб, 331x363
331x363
Что за хуйня, ЛТХ сломался.
Аноним 19/01/26 Пнд 17:16:44 1495468 123
Аноним 19/01/26 Пнд 17:39:15 1495503 124
Анон, есть 5070ti и 32 гб рам. Хочу добить рам до 64 гб, юзаю ФП8 модели от Киджая. Насколько это сильно ускорит генерацию на ван 2.2? Подразумеваю генерацию от нажатия кнопки до получения результата стандартных 5 сек.
Аноним 19/01/26 Пнд 17:45:56 1495510 125
>>1494755
> сервер отваливается.
Файл подкачки увеличивай
Аноним 19/01/26 Пнд 18:11:21 1495560 126
>>1495348
Это MoE неожиданно, и оба эксперта работают, или как-то так. =D
В начале хайноиз пробегается половину шагов, потом лоуноиз. Каждая отвечает за свое.

>>1495428
У меня такое было, когда я на цифровом блоке в русской раскладке поставил запятую (а надо было точку=) и вес лоры вместо 0.5 стал 5.0.
Аноним 19/01/26 Пнд 18:51:20 1495646 127
А поделитесь пожалуйста ВФ, где все работает на картах с 8-12 гб памяти
Аноним 19/01/26 Пнд 21:43:16 1495869 128
image.png 712Кб, 2222x1209
2222x1209
В чем может быть проблема?
Очень быстро комп уходит в черный экран и шум вентиляторов на 100% при генерации

потребление мощности лимит ставил 90% для видео, перестал сразу уходить, но потом все равно уходит, может где-то разрешение на минимальное поставить для скорости, чтобы не успевал

Rtx 5070 12 gb
32 gb ram
Ryzen 5 600
Аноним 19/01/26 Пнд 21:46:06 1495871 129
>>1495869
>Очень быстро комп уходит в черный экран и шум вентиляторов на 100% при генерации
Очевидные проблемы с железом, в /hw/ за тестами.
Аноним 20/01/26 Втр 00:44:27 1496080 130
>>1495869
>Очень быстро комп уходит в черный экран и шум вентиляторов на 100% при генерации
Отвал видюхи, чекай кабель для начала
Аноним 20/01/26 Втр 07:49:36 1496249 131
>>1496080

кабель в норме, бенчмарки показывают тоже норм результат, какая-то хрень

в играх при нагрузке тоже все ок, на gtx 1080 такого не было
Аноним 20/01/26 Втр 07:56:04 1496250 132
5454456345454.jpg 370Кб, 1920x1080
1920x1080
>>1488357 (OP)
Я правильно понимаю что мне с моими комплектующими бессмысленно вкатываться в эту тему?
Аноним 20/01/26 Втр 11:14:09 1496343 133
>>1496250
Какой-нибудь порезанный WAN 2.1 480p будет работать, но результаты скорее всего тебя самого оттолкнут от дальнейшего погружения
Аноним 20/01/26 Втр 11:24:18 1496352 134
>>1495560
> вес лоры вместо 0.5 стал 5.0.
Так это я старый РАБОЧИЙ воркфлоу загрузил для тестов, пиздец.
Мог ли комфи сам по себе обновиться и что-то поломать?
Аноним 20/01/26 Втр 12:30:43 1496441 135
>>1496352
Ладно, оказалось косяк видеоВАЕ
Аноним 20/01/26 Втр 13:07:30 1496495 136
e
Аноним 20/01/26 Втр 15:19:54 1496646 137
ltx00012.mp4 1725Кб, 480x736, 00:00:07
480x736
ltx00013.mp4 1791Кб, 480x736, 00:00:07
480x736
ltx00014.mp4 1824Кб, 480x736, 00:00:07
480x736
ltx00015.mp4 1761Кб, 480x736, 00:00:07
480x736
Аноним 20/01/26 Втр 15:36:34 1496657 138
>>1496646
>Отзыв: V6 Делает женщину обнаженной, даже когда ее просят надеть одежду. ОНО создает киску и сосок одеждой поверх одежды, это очень смешно XD
Очень заебись, ага.
Как же хочется простой генератор всего без цензуры, со звуком, в 24фпс и в минуту. Разве я многое прошу?
Аноним 20/01/26 Втр 16:27:32 1496685 139
7
Аноним 20/01/26 Втр 16:29:53 1496687 140
>>1495869
Перегрев видюхи, у знакомого такое было. В СЦ сказали неисправность тремоинтерфейса. Точнее не знаю.
Аноним 20/01/26 Втр 17:35:09 1496758 141
>>1496687
>неисправность тремоинтерфейса
Термопаста сломалась.
Аноним 20/01/26 Втр 18:01:31 1496791 142
Умеет ли WAN мутировать одну картинку в другую? Например, есть два почти идентичных изображения с одним и тем же персонажем, но в разных нарядах, и нужно несколько кадров "превращения" первого наряда во второй. Похуй как он это сделает, глаавное чтобы выглядело динамично. Умеет такое?
Аноним 20/01/26 Втр 18:11:42 1496803 143
Аноним 20/01/26 Втр 18:18:34 1496811 144
wan00089.webm 964Кб, 640x960, 00:00:04
640x960
wan00087.webm 1181Кб, 640x960, 00:00:04
640x960
wan00298.mp4 665Кб, 640x976, 00:00:03
640x976
Аноним 20/01/26 Втр 18:24:18 1496819 145
>>1496803
>>1496811
Спасибо, видосы вообще заебок, как раз то, что нужно
Аноним 20/01/26 Втр 19:22:47 1496876 146
image 3082Кб, 1284x1706
1284x1706
ltx00033.mp4 1614Кб, 576x864, 00:00:10
NSFW Нажмите, чтобы открыть
576x864
ltx00034.mp4 2320Кб, 608x800, 00:00:10
NSFW Нажмите, чтобы открыть
608x800
>>1496657 зато работает "мгновенная смена кадра"
Аноним 20/01/26 Втр 19:43:07 1496901 147
ltx00037.mp4 4595Кб, 416x544, 00:00:39
416x544
ltx00036.mp4 3997Кб, 416x544, 00:00:39
416x544
эксперименты на длинну, воркфлоу взял у фрукта, чутка почистил его от ереси.

Промпт ниже, NSFW вариант слегка потряхивает певичку.
поп музыка, Женщина стоит возле микрофона, она поёт.
"Тридцать лет, как под наркозом, я работал говновозом
Не курьером, не таксистом, а весёлым говночистом.
Как шахтёр в говнозабое, бился сутки- через трое
В Городском Водоканале бился с тоннами фекалий.
Говновоз, говновоз, говновоз
Не очистить говна от колёс
Даже если солярой обдать
Запашок никуда не убрать
Говночист, говночист, говночист
Должен быть закалён и плечист
Говночист- ликвидатор говна
Нужен людям во все времена !"

железо: GPU24/3090+CPU128, рам улетал под крышечку.
Prompt executed in 245.44 seconds
Аноним 20/01/26 Втр 19:59:40 1496919 148
>>1496646

Опять локалка? А онлайн можно?
Аноним 20/01/26 Втр 20:13:35 1496931 149
>>1496919
Название треда видел?
Аноним 20/01/26 Втр 20:30:12 1496949 150
В wan нет nsfw цензуры?
Аноним 21/01/26 Срд 12:39:50 1497588 151
Аноним 21/01/26 Срд 12:59:33 1497619 152
омич.mp4 2080Кб, 1184x1184, 00:00:07
1184x1184
>>1497588 всё что не имеет звуковой дорожки стало резко не нужно.
Глянул по времени инференса на NVIDIA H100, что выложено на гитхабе. нахуй нахуй, даже на 3090 это будет мучительно долго. Кумюнити не будет за это браться.
Аноним 21/01/26 Срд 14:39:56 1497722 153
>>1497619
>всё что не имеет звуковой дорожки стало резко не нужно.
Лол, ван 2.2 без звука и всё ещё ебёт по качеству.
Аноним 21/01/26 Срд 20:59:12 1498280 154
>>1497588
Попробовал только что. Чё то генерит. На стадии декодинга латента оно жрет с загруженным только одним автоенкодером 20 ГБ и надежно вытекает из моих 8ГБ врам. ГПУ свайпает в память как не в себя, в результате процесс займет по-видимому пару часов. Каких-то таесд чтобы ускорить этот процесс в комплекте нет, тайловый декодинг тоже бесполезен потому что латент в любом случае весь в ОЗУ. То есть развлекуха только для успешных пацанов с 24 ГБ врама как минимум, только им нахрен не сдалась эта лайт модель. Для остальных может сгодиться как стресс-тест контроллера памяти видимокарты.
Аноним 22/01/26 Чтв 00:15:11 1498497 155
https://rentry.co/wan22-generach
Вот здесь взял
>I2V_lightx2v_torch_compile - для генерации видео из картинок

Вопрос, как туда и добавлять порнушную lora?
Например https://www.girlfriendly.ai/models/mdl-cbbwfs7STOcR/sex-smash-cut-wan-22
для генерации видео из картинок

Попробовал заменить имеющуюся в ноде WanVideo Lora Select. При генерации получается, что баба буквально в говне купается вместо нужного видео.

Может посоветуете альтернативные варианты? Ваши готовые воркфлоу?
Аноним 22/01/26 Чтв 08:27:56 1498679 156
Почему не делают отдельную нейрону на озвучку видео без звука. Выглядит идея хорошо- не надо просчитывать звук если видео говно. А потом можно что угодно приощзвучить с липсинком даже.
Аноним 22/01/26 Чтв 15:09:19 1498946 157
>>1496811
как такому научиться?
Аноним 22/01/26 Чтв 15:24:11 1498971 158
>>1496250
в ГГУФах будет работать.
Аноним 22/01/26 Чтв 20:03:29 1499420 159
vid00002.webm 1733Кб, 736x1072, 00:00:04
736x1072
crop.mp4 719Кб, 530x816, 00:00:04
530x816
>>1498946
Скопировать промпт
Аноним 22/01/26 Чтв 20:24:28 1499440 160
>>1499420
>>1496811
Дошли руки посмотреть встроенный ВФ и оказалось, что там не совсем то, что было в примере. Буду пытаться сделать через flf2v, ибо нужен конкретный "финальный результат", а не то, на что хватит воображения у нейросетки. Но, думаю, должна справиться, раз i2v трансформацию отрисовывать умеет. Всё равно спасибо.
Аноним 23/01/26 Птн 02:32:41 1499711 161
LTX200066-audio.mp4 5853Кб, 1920x960, 00:00:06
1920x960
LTX200048-audio.mp4 1016Кб, 640x992, 00:00:03
640x992
LTX200068-audio.mp4 1734Кб, 736x1088, 00:00:04
736x1088
Лтиксом можно озвучку к видосам делать.
Аноним 23/01/26 Птн 04:10:18 1499742 162
>>1499711
А как какать прикручивать звук к существующим видео?
Аноним 23/01/26 Птн 05:01:42 1499756 163
LTX200087-audio.mp4 3333Кб, 1440x960, 00:00:08
1440x960
LTX200017-audio.mp4 1016Кб, 640x992, 00:00:03
640x992
LTX200062-audio.mp4 5852Кб, 1920x960, 00:00:06
1920x960
LTX200063-audio.mp4 5850Кб, 1920x960, 00:00:06
1920x960
>>1499742
Вф в первом видосе.
Если оставлять пустым текстовый энкодер, то постоянно вставляет закадровый пиздёж или музло, как на 2,3 и 4 видосе.
Аноним 23/01/26 Птн 05:33:27 1499766 164
изображение.png 20Кб, 629x153
629x153
изображение.png 86Кб, 1602x280
1602x280
LTX200001-audio.mp4 5672Кб, 1920x960, 00:00:06
1920x960
>>1499756
Хули всё так сложно то?
Воркфлоу в видео не видится. Окей, вижу, в конце файла джейсон, копирую в текстовый файл и гружу отдельно, похуй.
Вижу, не хватает 9000 нод. Ставлю, похуй.
Вижу, что используются хуй проссышь какие модели. Ищу, вставляю. Охуеваю от того, что видео вае ищется в вае, а аудио вае ищется в чекаутах. Похуй.
Лень искать/качать этот ваш ггуф. Вставляю свою модель в FP8, похуй, прожевал.
Какие-то блядь патчи, сажаатеншены не найдены, вообще нихуя не понял, сижу с лицом чела из самолёта. Вырубаю, похуй, видимо не нужны.

И наконец, оно мне высрало видосик. На фоне звучат цикады. Ну в общем моё отношение к этому уже понятно.

Спасибо, Анон, теперь с этим можно работать.
Аноним 23/01/26 Птн 06:38:59 1499783 165
LTX200101-audio.mp4 2663Кб, 704x704, 00:00:14
704x704
Аноним 23/01/26 Птн 08:33:27 1499809 166
решил вкатиться в видеоген, скачал лтх, а там прон лор нет оказывается, мда, только с фурями
Аноним 23/01/26 Птн 10:02:42 1499851 167
>>1499809 ты долбоёб или читать не умешь? image2video и будет тебе щастье.
Аноним 23/01/26 Птн 10:14:56 1499856 168
>>1499851
Не будет, оно концепта порно не понимает. Ну разве что закинуть примерно все кадры видео. Но нахуя тогда лтх?
Аноним 23/01/26 Птн 11:06:22 1499895 169
>>1499856 нейронка вышла меньше месяца назад. Ван полгода дообучали на сисик и писиа млять. Куда торопишься?
Аноним 23/01/26 Птн 12:13:39 1499952 170
LTX2.0i2v00005.mp4 1602Кб, 704x1280, 00:00:04
704x1280
>>1499851
да я сделал, там какой-то кринге ебучий, промт брал как у фуриёба, менял его -всё бесполезно, девка грызёт надувной хуй и ещё рычит
Аноним 23/01/26 Птн 12:17:49 1499956 171
>>1499952
ладно, попробую его воркфлоу, мб получше выйдет
Аноним 23/01/26 Птн 16:20:34 1500133 172
>>1499809
Оно работает и с людьми, но лтикс слишком кал в i2v, ебальник плывет. Надо ждать обнов, там обещали пофиксить i2v, посмотрим
Аноним 23/01/26 Птн 16:31:36 1500147 173
image 18Кб, 425x359
425x359
Аноним 23/01/26 Птн 18:09:18 1500238 174
Аноним 23/01/26 Птн 19:26:35 1500287 175
image 1622Кб, 1248x1434
1248x1434
17691310697631.mp4 219Кб, 480x480, 00:00:05
480x480
Сап, почему хуй дрыгается? Это надо лору другую искать или в проптах что-то лучше написать?
У промтов в ване вообще можно веса задавать? А то несколько раз приходится теже самые пропты писать чтоб вес увеличить, а то оно игнорирует написанное.
Аноним 23/01/26 Птн 19:28:54 1500288 176
image 18Кб, 357x376
357x376
>>1500238
Да смотрел, "Once I removed the cv2 folder from my A1111" его давно снес, ноду обновлял.

Короче помогло вот это

cd path\to\ComfyUI_windows_portable\python_embeded
.\python.exe -m pip uninstall -y opencv-python opencv-python-headless opencv-contrib-python
.\python.exe -m pip install opencv-python

Щя надо ебаться как сажу атеншн поставить, пиздец, 2к26, а ВФ накатываются через жопьебрило
Аноним 23/01/26 Птн 20:26:13 1500351 177
image.png 38Кб, 590x370
590x370
LTX2.0i2v00001.mp4 2790Кб, 1280x704, 00:00:13
1280x704
Аноним 24/01/26 Суб 01:30:12 1500668 178
хочу попробовать ltx2, но надо обновить комфи

версия сейчас:
ComfyUI version: 0.3.76
ComfyUI frontend version: 1.32.10


но эти ебучие пидарасы перенесли менеджер нод в новых версиях
как правильно обновиться?
Аноним 24/01/26 Суб 01:33:03 1500670 179
Кум-братья, у вас есть список господ, гдевсе ссылки на лоры с любыми позами и действиями и промпты для них, а может даже видосики чтоб воркфлоу с них подрезать? В шапке не нашел. Мне как ирл, так и 2д надо бы, а на циве вручную чет лень лазить и настраивать. Ван 2.1
Аноним 24/01/26 Суб 03:02:50 1500709 180
>>1500670
>на циве вручную чет лень лазить и настраивать
Так и делаю, хожу с мешком и собираю оттуда все говно, в папки с разными моделями/ видами/действиями. А потом ложусь в ванну и обмазываюсь этими сокровищами
Аноним 24/01/26 Суб 03:27:07 1500721 181
>>1500709
На циве просто много чего еще нет, что приходится по другим сайтам помойкам шарить. Например для 2д и аниме крайне мало лор, а самому жарить охуеешь.
Аноним 24/01/26 Суб 03:57:35 1500728 182
>>1500287
Уменьши силу LOW лоры, должно помочь
Аноним 24/01/26 Суб 04:07:10 1500731 183
image 38Кб, 516x170
516x170
Привет, как мне перевод в таверне настроить, чтоб работало в обе стороны? Я хочу писать по-русски, чтоб это на английски переводло, мне бы по-английски печатало и перводило бы на русек. Если как пикрил настройку поставить, то персонажи охуевают что я с ними по-русски заговорил, то есть им мой ответ непонятный кидается.
Аноним 24/01/26 Суб 05:11:00 1500750 184
image 64Кб, 450x227
450x227
>>1500728
Да чет не помогло, тряска осталась. Вот пикрил я вес лоры уменьшил до 60% аж, может я не верно подключил блок или он другой должен быть?
Аноним 25/01/26 Вск 01:59:36 1501635 185
Вкрации самая пиздатая моделька какая? Чтоб как сора 2 только локально.
Аноним 25/01/26 Вск 02:17:14 1501646 186
>>1501635
Без звука по качеству картинки хорош Wan 2.2. Со звуком LTX-2, но качество хуже. По сути прямой аналог Sora2 локально это LTX-2.
Аноним 25/01/26 Вск 03:01:18 1501667 187
А что если в LTX-2 отключить этот ебанутый апскейл и генерить сразу в норм разрешении. Для чего его сделали вообще? По времени все равно так же наверное занимает, в чем смысл генерации low -> High-res, если всратую хуйню мыльную он не фиксит все равно?
Аноним 25/01/26 Вск 03:10:31 1501670 188
>>1501667
> А что если в LTX-2 отключить этот ебанутый апскейл и генерить сразу в норм разрешении. Для чего его сделали вообще? По времени все равно так же наверное занимает, в чем смысл генерации low -> High-res, если всратую хуйню мыльную он не фиксит все равно?
Смысл в том что модель тренилась под лоу рез, и если генерить сразу в хай резе то будет страдать моушен.
Для чего так сделали? Чтобы можно было фактически (с учетом их апскейла) быстро генерить длинные ролики в высоком разрешении.
Почему кал? Ну идея хорошая, а реализация хромает. Впрочем, первый лтикс был калом несусветным, а этот просто кал - чувствуется прогресс. Такими темпами глядишь лтикс 3.0 будет уже не калом, а 4.0 - конфеткой.
Аноним 25/01/26 Вск 03:28:59 1501677 189
>>1501670
>чтобы можно было фактически (с учетом их апскейла) быстро генерить длинные ролики в высоком разрешении.
На апскейл уходит столько же времени сколько было бы в нормальном разрешении генерации, хотя может у меня нищая затычка вместо видеокарты и в фулл врам все по другому. Но ван 2.2 делает по времени так же и лучше намного по качеству, ели не учитывать все эти липсинки и фпсы
Аноним 25/01/26 Вск 04:12:51 1501687 190
>>1501667
>Для чего его сделали вообще?
Потому что шарашка израильская, и у них задача не сделать нормальную модель а уесть ван 2.2 за счет помойных фокусов типа такого
Аноним 25/01/26 Вск 06:08:26 1501723 191
ltx-cunt00007.mp4 2511Кб, 480x480, 00:00:37
480x480
Короче, идите на хуй с вашим ваном. Просто на хуй мелкими шажками.
LTX-2 даёт то о чём мечтали - продолженное видео. Собрать минутный ролик - теперь совсем не проблема.
Из приличного только на эту демку время потратил.
Аноним 25/01/26 Вск 06:38:09 1501727 192
>>1501723
Зачем ты генерируешь говно без задач?
Аноним 25/01/26 Вск 11:03:11 1501797 193
>>1501723
Ток промпт не понимает без костыльных лор.
Аноним 25/01/26 Вск 16:44:16 1502117 194
>>1501723
ты сам то понял что сгенерил? нахуя оно такое нужно?
Аноним 25/01/26 Вск 23:47:55 1502487 195
Киньте по-братски хороший воркфлоу для LTX-2, чтоб на 3090 / 64 RAM завелось...
Аноним 25/01/26 Вск 23:50:29 1502491 196
Аноним 26/01/26 Пнд 00:05:30 1502499 197
Аноны пользуется если кто Stability Matrix, там можно Wan пользоваться? Менюшка для Wan есть, я скачал пару моделей но прога их просто не видит даже

Если никто не пользуется есть какие ещё варианты простые кроме Комфи, комфи для меня смертоубийство просто.
Аноним 26/01/26 Пнд 00:23:37 1502513 198
>>1502499
Никогда не пользовался, но знаю что есть Wan2GP. Но советую всё же осилить комфи, ничего там особенного нет: есть чекпоинт, есть вае, есть клип с промптами, есть латент, есть семплер. Семплер семплирует, декодишь получившийся латент с помощью вае и всё. Если это поймёшь, то во всём остальном легко разберёшься.
Аноним 26/01/26 Пнд 11:10:48 1502725 199
>>1501677
>Но ван 2.2
В котором вообще 2 больших модели, лол.
>>1501723
>LTX-2 даёт то о чём мечтали - продолженное видео.
Покажи воркфлоу, а то у меня не выходит.
Аноним 26/01/26 Пнд 14:05:27 1502897 200
Аноним 26/01/26 Пнд 14:40:55 1502920 201
Есть какой то универсальный (дрочный) гайд по image to video? Поставил comfyui и глаза разбежались.
Аноним 26/01/26 Пнд 18:30:25 1503224 202
>>1502920
Если не думать головой, а просто потыкать - вот:
https://huggingface.co/Phr00t/LTX2-Rapid-Merges
Скачиваешь JSON, кидаешь в папку с Workflow, пытаешься запустить. Докачиваешь сначала недостающие ноды (git clone https://github.com/Кек/Пук в папку custom_nodes), потом недостающие модели из этого же репозитория и интернета.
Все.

Комфи - уебанский говнокомбайн, но ничего лучше не придумали, увы.
Аноним 26/01/26 Пнд 19:22:19 1503272 203
>>1503224
Уебанский говнокомбайн это питон, его экосистема и мозг того, кто его придумал. А комфи охуенен и очень здорово абстрагирует процесс производства контента от этого ебучего зоопарка полоумных ебанатов.
Аноним 26/01/26 Пнд 19:33:41 1503279 204
>>1503272
На самом деле "зоопарк полоумных ебанатов" самим комфи и порожден. Сотни модулей, каждый из которых тянет десятки зависимостей, зачастую несовместимых между собой по версиям. Воркфлоу, тянущие модуль с тысячей операторов ради одного оператора "FloatToInt", как вот это >>1503224 вот.

Даже руками на питоне написать скрипт, загружающий и использующий необходимые модели, проще, чем в этой куче кала разбираться. И версии библиотек неожиданно оказываются совместимы, и всякая левая хуйня не нужна.
Аноним 26/01/26 Пнд 19:34:34 1503281 205
изображение.png 74Кб, 619x464
619x464
>>1502897
Пиздец конечно организация воркфлоу. Про подграфы челу явно не рассказывали.
Ладно, главная идея там это нода с маской, остальное наживное.
Аноним 26/01/26 Пнд 19:58:06 1503313 206
>>1503279
>На самом деле "зоопарк полоумных ебанатов" самим комфи и порожден.
Да нихуя, он был всегда, ещё до того, как появился комфи, просто в комфи столкнуться с ним проще, чем в других интерфейсах, которые все рабочие процессы скрывают в чёрную коробку. Но при этом он даёт практически такой же уровень гибкости, как и написаниие скриптов самому, при этом не опускаясь до нааписания скриптов и позволяя делать абстрагированные и переносимые решения, так что его недостатки простительны. Конечно можно было бы сделать, чтобы ради одной кастомной ноды не нужно было устанавливать весь пак, но у тех, кто плотно работает с нейросетями всё равно терабайтные SSD, можно пережить и без этогоо.
Аноним 30/01/26 Птн 11:18:05 1503886 207
slon00006.mp4 1699Кб, 448x352, 00:00:24
448x352
Всё, заебался. По серьёзному не вывозит, максимум на что хватает - 2-3 итерации продления всякой порнухи со вздохами. С диалогами жидкие обосратушки. Ну исходник так то тоже полное дно. Ждёмс ltx2++
Аноним 30/01/26 Птн 13:10:51 1504033 208
Аноним 30/01/26 Птн 13:33:04 1504055 209
>>1504033
> 32В
И нахуй оно нужно?
Аноним 30/01/26 Птн 14:03:38 1504098 210
>>1504033
блять, нахуй они этим говняком то срут? это же пиздец просто, даже тестить такое говно не имеет смысла.
Аноним 30/01/26 Птн 14:39:36 1504130 211
>>1504033 у пиздоглазых есть одно маленькое преимущество, они могу хуй класть на коперайты и аффторское право как гиганты вроде опенай. Середняк самостоятельный уже ебут, как udio например. из-за этого имеем LTX с индусски датасетом, блядь.
>>1504098 это не для вас молодой человек кожаный мешок, это для юрлиц которые могут позволить себе личный кусочек дата-центра. Для приватности и корпоративной тайны. Просто альтернатива - подарить свой анус билли гейтсу по подписке, люто бесит корпоратов.
Так что нам остаётся сидеть у консумерской параши и жрать что дают - LTX или подписка и танцы с цензурой, внезапными банами и мурриканской пропогандой.
Аноним 30/01/26 Птн 15:49:27 1504198 212
>>1504033
>>1504130
Посмотрел демки, это просто посмешище. Для 2к26. Я так понимаю никто кроме вана не может делать нормальные видео модели в попенсурсе до сих пор
Аноним 30/01/26 Птн 15:53:24 1504199 213
>>1504198
Так ван вообще модели не делает. Уже почти год прошёл с последней от них.
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов