Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре.
lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.
>>1488387 → На что хуй быстрее, выше, сильнее встал — та и подходит. Да, перебором, грузишь одну пару, смотришь на результат, грузишь другую, третью… В итоге фаворитов прогоняешь еще по несколько раз, проверяешь, не показалось ли.
>>1488800 Бедные, прикиньте, сколько им пришлось сделать черрипиков, чтобы ван так хуево сгенерил. Небось и промптили, и шаги зануляли, и че тока не делали… Надеюсь, их труды не пройдут напрасно, и Ван РЕЛИЗНУТ 2.5!!! Пидры. =с Хде мой опенсорс.
>>1488853 "На днях на конференции представители Wan упомянули, что они не сделали Wan 2.5/2.6 открытым исходным кодом, потому что он слишком большой для сообщества. Судя по комментариям о проблемах с LTX, я думаю, они были правы. Ребята из Wan сказали, что, возможно, когда-нибудь выпустят более облегченную версию. "
Does anyone have recommendations for better prompt adherence? I've been using https://www.kling2-6.com to assist with my Kling 2.6 prompts, and the results are pretty stable. Worth a look for the toolset.
В воркфлоу пакеты moondream. Не ставились пока не поменял уровень безопасности в комфи. Поменял, теперь просит авторизоваться в гитхабе. Че за прикол? С каких пор нужно зайти в гитхаб чтобы скачать пакеты?
Сколько не пытаюсь на лтх2 сделать что-то нормальное, одна хуйня выходит. Либо просто картинка с зумом, либо очень слабое движение. Как бы я ни писал промпт, даже через флоренс описывал инпут имаджи, все равно хуйня какая-то. Промпт вообще нахуй идет, генерит вообще не то, что я прошу. Качество тоже по пизде. ЛТХ2 это наеб просто какой-то глобальный?
>>1488921 В сообществе и RTX Pro 6000 встречаются, так что они немного лукавят. Я верю в Wan-2.6 с его персонами и временем инференса, но вот Wan-2.5 вполне возможно запустить люди могли. Надо помнить, что ЛТХ-то сам по себе плохая модель от не самых умелых авторов. И размер — не показатель качества, в данном случае. Дома люди все равно генерят не 1920*1080 (хотя я вчера ради интереса на лтхе делал такой ролик, без апскейла, вышло неплохо). Так что, они просто взвесили пользу от хайпа и заработок и решили, что на апи и подписках заработают больше, чем поднимут репутации.
>>1489167 Не настолько, что-то не так у тебя. Она в деталях следует промпту хуже вана, и знает меньше, но в общем понимает и делает, что от нее требуют. Выглядит как какой-то технический баг, по твоему описанию.
Оцените ворк плиз. А именно самое начало, где модели и клип лоадер. Как к этому прикрутить новые nvfp4 модели и есть ли смысл 5070ti у меня ? А если оставить как есть, стоит что-либо заменить? Вдруг я генерю на том что вообще плохо сочетается.
Там оказывается Nvidia завезла в новый драйвер супер оптимизон, все ведь в курсе? У меня ltx и всякие квены/флаксы дали +30% к скорости, с сажей где то 40-50 вообще. Rtx 4070s. Интересно как будет на wan, про него чет не писали, но т.к это касается fp8 в целом то и там наверно будет ускорение
>>1489532 Так нужно только драйвер обновить или еще Комфи? У меня последний разваливается почти каждый раз когда я его апдейчу, приходится заново все собирать. Ради 30% перфоманса можно бы и да, конечно
Драйвер студио я обновлял. Насчет гейреди обычного не в курсе. Комфи обновил без зависимостей, но насколько я понял, туда коммиты были уже как неделю добавлены с этими фишками
>>1489661 Комфи обновлял? Прибавка сразу в глаза бросилась. LTX было 5-6 секунд за итерацию на дефолт воркфлоу, стало 3.4-3.7 ( с сажей). У меня если че винда и драйвер студио версия.
В Qwen edit 2511 генерация была раньше 30-35 секунд, сейчас делается за 19
>>1489666 А еще у меня оперы забыл сказать 96 гигов, может у тебя на диск офлоадит, а тут как раз оптимизон на эти дела, Если на диск сбрасывает то понятно тогда почему не работает
>>1489666 У меня Квен Едит на 4090 и 128рам работает 2 минуты. Не подскажешь почему у тебя так быстро? У меня правда ddr4, у тебя может ddr5? В оперативу выгружает что-то когда работает, да. Но мб какие флаги нужны, чтобы только туда? Юзаю fp8 квант
Что-то у меня после обновления драйверов ускорения не получилось. =( Но я обновил игровой. Возможно реально нужен студио?
А может это все тут не причем? Асинк энд пинд давно включили, пишут — возможно, я как раз видяху менял с 4070 ти на 5070 ти в декабре. А нвфп4 ускорялся на глазах в комфи — от «медленнее фп8» до «чутка быстрее», но качество в лтх было говенным в фп4.
Короче, не до конца понял, когда будут ускорения… Если кто убедится, что дело в студио драйверах— отпишитесь, плиз.
А че сору Наебнули чтоли? Попытался сейчас старый промт сгенерить и если раньше все диалоги умещались теперь либо молчат либо одну фразу успевают сказать.
А, все, fp4 норм работает (умеренно), но она есть только для dev-версии, и из-за cfg 4.0 работает все равно дольше, чем дистилка. fp4 не спасают. Если бы дистил была, но то ли я дурак, то ли ее не выпустили. Там бы ускорение помогло бы.
>>1489398 Какое апи 2.5 когда у них самих уже есть лучший 2.6, не говоря уже о конкурентах? Нет ни одной причины не дропать веса, но они выбирают быть пидорасами. 2.1-2.2 нам дали ибо они тестовые, как и 2.5 тест версии со звуком
>>1490159 Кстати вообще не понял этого мува. Ван тем и ценился, что не имел цензуры и был локальным. 2.6 я потестил, но это какая-то артефачная хуйня, которую на голову ебут и сора и вео и клинг и все остальные большие конкуренты. Какой смысл вообще покупать на это говно подписку теперь?
>>1490354 На данный момент ничего лучше 2.2 так не понимает промпт, консистентность и поддержку нсфв. Он даже лица воспроизводит почти точно, даже не зная персонажа и его мимику с эмоциями. LTX даже рядом не стоит с этими возможностями в ван. Если выпустят 2.5 это будет чудом конечно
>>1490360 Да если бы мельтешение пикселей можно было поправить -- вообще цены бы ему не было. А так постоянно апскейлить надо, иначе лицо разваливается, глаза, а если на одежде узор сложный -- вообще пизда.
>>1490396 Зависит от задач. Если T2V, то лтх быстрее, сразу ролики по 20 сек можно делать, встроенный звук, можно больше нейрослопа нагенерить и засрать интернет. Лтх не знает про сисик и писик. I2V лучший пока что Ван 2.2 по качеству, следованию промпту, сохранению персонажа, но долгий.
Хай и лоу стадии проходят быстро для одного видео в 5 секунд (в районе пары минут на саму генерацию), но вот свич между хай и лоу моделями происходит долго. Получается так, что ждешь загрузку хай модели -> генерация хай части прошла (примерно минута) -> ждешь загрузку лоу модели -> генерация лоу части прошла (примерно минута) -> ждешь вае -> ласт фрейм пошел к следующему видео в цепочке.
Можно как-то ускорить свич между моделями? Может как-то генерить сначала весь хай нойз в цепочке, потом весь лоу нойз в цепочке, а потом объединять? Может есть какое решение.
>>1490396 Готов без звука и 16 фпс — Wan2.2 без конкуренции.
Хочешь 24 фпс с озвучкой сразу — LTX-2.
Все.
Я вот ща чекаю, что лтх может делать — иногда реально хорошие ролики и можно кидать в прод, но 1 из 5, у остальных какие-то косяки — то пальцы не туда, то промпту не следует. Зато быстро.
Но если мне придется в ближайшее время делать анимацию — я ее буду делать в ване.
Аноны месяц где то не запускал генерацию, пришлось все переустановить и на старом воркфлоу где раньше все ставилось и работало без проблем через кустом нод инсталл, вот тут на скрине пропали лоры для загрузки, как пофиксить? Обновление и установка кустом нод не помогла.
>>1490850 Заменил старый сэмплер на ltxvnormalizingsampler и мало того, что в i2v скорость генерации упала наверно раза в 2, так еще и качества не прибавилось. Все также артефакты лезут при движениях, пердолятся глаза, пальцы.
Вчера попробовал q3 ltx + fp4 gemma, заняло 42 гига (из 32 на ноуте), но сгенерило норм. Деградация заметна была, но не совсем распидорасило. Так-то, неплохой вариант для бомжей. Но лучше иметь 64 гига, конечно.
Аноны, в вашу тему можно вкатиться со следующим конфигом?
RTX 3060@12, p104@8, 42 RAM DDR4. Нюанс вот в чем: p104 сможет ли работать в связке с 3060? По опыту LLM — да, но зависит от бэка и прочего, так как это майнмнговая GTX 1070 и с некоторыми технологиями она может сделать хуже, где-то наоборот лучше.
Также прошу подсказать бэк + фронт и актуальные модели. Шапку читал, но если судить по своему опыту, там всегда престарелое говно, неточности и прочее, поэтому хочется просто взять то, что нужно для:
1. Модель для генерации максимально качественных видосов, чтоб прям УААЭЭХЩЩ.
2. Модель для генерации аниме-порно. Возможно, через img2video или что-то подобное.
Звук в видосах меня не интересует вообще.
Надеюсь, можно не использовать для генерации макаронного монстра.
Тоже интересует производительность. Когда последний раз интересовался темой - локалки генерили в 5 фпс и наматывали видеокарту часа два. Что то изменилось с тех времен?
>>1492250 Ну на 5060ти ван 5б или лтх2 генерят 8 секундный видос в 1280х720 минут за 5, там еще от квантов/лор/количества и скорости оперативки зависит скорость генерации.
>>1492391 Хуйня какая-то. У меня 5070ti и WAN 14B делает 8 секундный ролик такого же примерно качества секунд за 120-130 примерно, а глючная лтх2 вообще намертво систему зависает, а у тебя убогая 5б делает ПЯТЬ МИНУТ, учитывая еще что 5б в принципе ничего сделать не может нормальное, и при этом у тебя еще и эта уебищная лтх2 работает так же как уебищная 5б.
>>1492400 Ну показывай свой форкфлоу, я хз как у тебя 24-50 Гб говно (или какой квант ты юзаешь) может работать быстрее чем 12 Гб ван 5б и тем более не запускаться резвый лтх2.
Алсо что по твоему 5б не может сделать из того что может 14б?
>>1492130 О, это ты полгода назад в ллм-треде п104 по моим рекомендациям взял? :)
Смотри, ты можешь на отдельную видяху выгружать отдельную модель. Например видео модель на 3060, а текстовый энкодер на п104.
Так что, имеет смысл!
Но это не даст тебе больше памяти для контекста (разрешение x количество кадров), и не даст серьезного буста по скорости. Лишь сэкономит память и время на загрузку моделей (с одной видяхой в начале из оперативы в видяху грузится одна модель (текстовый энкодер), потом отрабатывает и выгружается, и грузится основная модель, у тебя этих промежутков не будет).
Максимально качественные видосы — завези себе 96 оперативы хотя бы, чтобы не убивать диск. Это Wan2.2, но 16 фпс , 5-7 секунд и без звука. Ущербные видосы — LTX-2, зато 24 фпс, 5-10-20-40… секунд и со звуком.
Аниме-порно залетает в обе модели, тащемта, img2video, да.
Можно не использовать комфи, но юзеры ван2гп постоянно ноют и агрятся, потому что у них никогда ничего не работают, они спрашивают как починить, а на них смотрят как на дебилов, которые жрут говно. Т.е., мы-то тоже на комфи жрем говно, но оно хотя бы не пахнет, а альтернативы попросту фонят радиацией и не работают постоянно.
Хотя, именно Wan2.2 там вроде работает норм. Но я все же рекомендую постигать ComfyUI.
>>1492444 Самый базовый вф из шаблонов. Кванты, вроде как, не использую для вана, базовые модели стоят, которые комфи подгружает, хай и лоу по 15гб каждая которая.
95% видео что я делал на 5б выдавало мне какое-то всратое светопредставление и дерганную картинку, один раз только с лорой тверк получилось сделать, и то выглядит всрато. С 14б таких проблем не было никогда, он может не сделать то что просишь, но выглядеть это будет нормально хотя бы в любом случае.
Насчет лтх2 вашего я хз, я буквально вчера пробовал его запустить тоже через базовый вф с шаблоном комфи и при попытке генерации у меня все нахуй зависло намертво, что в принципе очевидно, модель весит 40гб, а у меня 16гб врам только и 32гб озу
кто нибудь знает как справиться с дрифтингом в ван и2в при создании сегментов с использованием ласт фрейма (5+5+5...)? на фиде имею два имг апскейлера, в принципе рабочая тема. но есть ли способ по лучше?
Анон, пожалуйста, поделись секретами i2v для wan2.2
Я уже головой поехал просто. Как мне делать видео-кумы из портретных фото? Ну вот, условно говоря, есть картинка с персонажем портрет по грудь, я, например гипотетически, хочу что бы она потверкала там, или что бы на хуй села, чтоб сзади другая со страпоном подошла и вставила, ну ты понял. Но в итоге получается невразумительная хуйня. Если без спец лор делать то чаще всего она просто что-то говорит на камеру и мимикой играет, иногда делает фрикции, но картинка сама не меняется. Должен же быть какой-то способ адекватный
>>1492797 Жопочтец, я про лоры тоже писал, это убогий костыль, а не способ. Если твоя пикча изначально не в той позе, в которую лора спосонба, то хуй она в нее встанет, а если делать через затемнение экрана то персонаж полностью меняется
>>1492750 Лоры + промпт Если инпут имг просто фронт портрет без задницы, то для тверка, я думаю, нужно для начала описать движение камеры, например: camera zooming out, her ass visible и тп. Я обычно использую лору типа all in one как главную с большой силой (strength) плюс дополнительные в зависимости от того что хочу сгенерить. Также использую связку euler + simple, в ней мне кажется больше вариативности. Если у тебя на выходе байда, то проверь есть ли в wf лайт 4step лоры. На крайняк скинь wf сюда.
>>1493018 Лоры помогают сохранять консистентность персонажа с твоей пикчи. Хорошо работает на длинных видео, когда даже не обязательно, чтоб был персонаж на ласт фрейме, чтобы воспроизвести его в следующем видео. Подрубаются как обычные лоры с весом 1.
>>1493094 А что тебя удивляет, генерация, особенно видео, это сильная стресс-нагрузка на карточку. У меня 5070ti в любой игре на любых настройках максимально тихая, а при генерации на ван2.2 взлетать в космос начинает пока генерирует
>>1492520 Возможно, что по твоему совету, хотя кажется, я не отписывался о том, что купил. Ну если ты не из РФ, то, наверное, по твоему, так как ты цену называл на карту смешную, а в РФ она стоит дороже 20 долларов. Я благодаря этому совету наконец гемму поставил и с SWA смог нормально её юзать на 32к контексте с 9 тс. А вот на всякие глэмы памяти уже не хватило и сейчас не купить.
А что насчёт гайдов? В шапке инфы мало, в отличие от треда с рисованием. Хоть у меня есть опыт с рисовалками очень большой, с видео наверняка иначе. Никто не постил талмуд, в котором всё рассказывается? С другой стороны, у меня складывается такое впечатление, что с видео полегче будет, учитывая мои простые запросы, по крайней мере поначалу.
У меня ж почему такое отторжение к комфи: когда я генерировал картинки, у меня было особое колдунство виде генерации 2к картинок за ночь в 4к с промптом на 400 слов, где чётко размечены позы, наборы одежд, система рандома, фонов, ебанутые настройки типа расписания и вот это всего. Очень привык и никак не мог перенести эти же результаты в комфи, делать там так же, плевался и забросил через пару часов, а документация в комфи мне ничего толком не говорила. Плюс многие кнопки или функции были спрятаны. В итоге от картинок уже устал и просто забил.
Ну и хочется понять ещё насчёт моделей. Как я понимаю, нужно качать модели именно на цивитай (и, возможно, какие-то лоры), где уже из коробки есть половина нужных тегов для генерации? А то как же генерировать канни девочек из блю архива. Если там такого нет, я этого не переживу.
И что ты можешь посоветовать, зная мой сетап, в плане кванта и модели?
> А что насчёт гайдов? Я давно не пишу. В интернете, думаю, дофига, на самом деле, не знаю хороших. Меня просили видео записать, если запишу — скину. Но я не подскажу.
Но в общем, можно начать с загрузки дефолтных воркфлоу, а потом заглядывать внутрь сабграфа по стрелочке справа вверху сабграфа, и там менять что-то.
> Как я понимаю, нужно качать модели именно на цивитай (и, возможно, какие-то лоры), где уже из коробки есть половина нужных тегов для генерации? Забудь про теги, в 2к26 живем, описываешь все обычной речью (можно по-русски). Основные модели берешь с Huggingface (комфи, киджай, оригинальные репозитарии — смотря какую модель предпочтешь), а лоры — с цивитаи, да. НО! Ван и без лор хорош и бесцензурен, а лтх … ну там лор пока не так много.
Твои запросы решаются img2video, где ты генеришь первый кадр сам, а потом подставляешь в воркфлоу и вводишь промпт. Если все пойдет ок — картинка анимируется.
> И что ты можешь посоветовать, зная мой сетап, в плане кванта и модели? 42 GB DDR4? Ты верно написал? Вообще, обе модели требуют в среднем 70-80, а лучше больше оперативы. Все, что не поместится в оперативу — пойдет в файл подкачки. И частые генерации будут расходовать ресурс ссд. Так что у тебя два пути: либо брать условный q3 GGUF квант (например тут: https://huggingface.co/vantagewithai/LTX-2-GGUF/tree/main/distilled) и fp4 gemma (https://huggingface.co/Comfy-Org/ltx-2/tree/main/split_files/text_encoders), это у меня на ноуте как раз влезло в 42 гига (правда там 32, и 10 вылилось в файл подкачки… но не будем о грустном!), либо выделять файлу подкачки 100 гигов и крутить нормальные полноценные модели (fp16 или fp8). Ну, или докупить оператос, сам понимаешь. Учти, это тебе не ллм, тут не память главное, а рассчеты, q3 GGUF не ускорит генерацию видео, а скорее даже замедлит чуть-чуть. Все только ради экономии объема делается.
Но надо сесть и разобраться. В начале определись со свободным местом на диске, размером моделей, поставь комфи, https://github.com/city96/ComfyUI-GGUF по надобности, а потом уже ищи свое воркфлоу. Ну или мы подкинем. Ах да, spatial-upscaler как будто и не всегда нужен, можно в обход кидать эту часть.
Господа, вопрос касательно лор, а в комфи есть какой-то функционал чтоб их как-то систематизировать понятнее? Очевидно что в папке loras я делаю подпапки, типа там это ван22 это зит это еще что-то, но в итоге когда в самом воркфлоу открываешь список лор, то приходится крутить очень долго мышкой чтоб найти нужный раздел, нет ли возможности как-то сделать чтоб если у меня стоит модель ван22 сейчас то он только эти лоры мне и показывал?
Есть ли возможность сделать картинку-превью для лоры, как это было когда-то в форже?
И главное - есть ли способ заставить как-то в промпт добавлять ключевики от лор автоматически? Дегенераты с civitai чаще всего придумывают уебанские ключи к лорам со спец символами, эту хуйню в голове невозможно держать, в форже опять-таки был такой функционал что при добавлении лоры в промпт автоматом ставились ключевики, которые ты сам добавлял, не верю что в таком навороченном комфи нет похожего функционала
>>1494184 >то приходится крутить очень долго мышкой Клавиатурой быстрее. У меня лоры от Вана лежат в папке "14B", если набрать в поиске, то только эти лоры и будет показывать. Кроме того, эта папка и так сортируется в верх списка, понятно почему. В чужих воркфлоу самое продвинутое, что видел - это нода с большим списком лор, где нужную включаешь, когда надо. форжеюзер-вкатился-в-лапшу-только-для-видео-не-эксперт-по-макаронам
>>1494390 Там с Lora-Manager будет специальная нода для лор, в нее можно будет лоры отправлять прям из менеджера этой кнопкой. Вообще загугли на ютубе видео, там очень много всякого полезного функционала.
Если вы хотите сделать липсинк (вместо генерации голоса самой моделью), используйте эти четыре ноды. На входе, очевидно: аудио, audio vae, ширина и высота картинки (?), закидываем в аудио-латент перед генерацией (если апскейлите — наверное и туда тоже, хз, не помню как там чо). Хотел сделать себе воркфлоу с липсинком, чтобы не париться потом, к счастью тут не сложно.
В итогое видео прокидывайте оригинальное аудио, потому что для липсинка приходится добавлять шума сверху, да.
Анончики, помогите, в чем может быть ошибка? Я не понимаю. И дайте кто то хорошо собранное воркфлоу на лтх-2 пожалуйста, я уже заебался. ЧТо не настраиваю, то всё по пизде и какие то ошибки вылазят, хотя делаю вроде бы всё правильно по гайдам и туторам
Анон, есть 5070ti и 32 гб рам. Хочу добить рам до 64 гб, юзаю ФП8 модели от Киджая. Насколько это сильно ускорит генерацию на ван 2.2? Подразумеваю генерацию от нажатия кнопки до получения результата стандартных 5 сек.
>>1495348 Это MoE неожиданно, и оба эксперта работают, или как-то так. =D В начале хайноиз пробегается половину шагов, потом лоуноиз. Каждая отвечает за свое.
>>1495428 У меня такое было, когда я на цифровом блоке в русской раскладке поставил запятую (а надо было точку=) и вес лоры вместо 0.5 стал 5.0.
В чем может быть проблема? Очень быстро комп уходит в черный экран и шум вентиляторов на 100% при генерации
потребление мощности лимит ставил 90% для видео, перестал сразу уходить, но потом все равно уходит, может где-то разрешение на минимальное поставить для скорости, чтобы не успевал
>>1495560 > вес лоры вместо 0.5 стал 5.0. Так это я старый РАБОЧИЙ воркфлоу загрузил для тестов, пиздец. Мог ли комфи сам по себе обновиться и что-то поломать?
>>1496646 >Отзыв: V6 Делает женщину обнаженной, даже когда ее просят надеть одежду. ОНО создает киску и сосок одеждой поверх одежды, это очень смешно XD Очень заебись, ага. Как же хочется простой генератор всего без цензуры, со звуком, в 24фпс и в минуту. Разве я многое прошу?
Умеет ли WAN мутировать одну картинку в другую? Например, есть два почти идентичных изображения с одним и тем же персонажем, но в разных нарядах, и нужно несколько кадров "превращения" первого наряда во второй. Похуй как он это сделает, глаавное чтобы выглядело динамично. Умеет такое?
эксперименты на длинну, воркфлоу взял у фрукта, чутка почистил его от ереси.
Промпт ниже, NSFW вариант слегка потряхивает певичку. поп музыка, Женщина стоит возле микрофона, она поёт. "Тридцать лет, как под наркозом, я работал говновозом Не курьером, не таксистом, а весёлым говночистом. Как шахтёр в говнозабое, бился сутки- через трое В Городском Водоканале бился с тоннами фекалий. Говновоз, говновоз, говновоз Не очистить говна от колёс Даже если солярой обдать Запашок никуда не убрать Говночист, говночист, говночист Должен быть закалён и плечист Говночист- ликвидатор говна Нужен людям во все времена !" железо: GPU24/3090+CPU128, рам улетал под крышечку. Prompt executed in 245.44 seconds
>>1497588 всё что не имеет звуковой дорожки стало резко не нужно. Глянул по времени инференса на NVIDIA H100, что выложено на гитхабе. нахуй нахуй, даже на 3090 это будет мучительно долго. Кумюнити не будет за это браться.
>>1497588 Попробовал только что. Чё то генерит. На стадии декодинга латента оно жрет с загруженным только одним автоенкодером 20 ГБ и надежно вытекает из моих 8ГБ врам. ГПУ свайпает в память как не в себя, в результате процесс займет по-видимому пару часов. Каких-то таесд чтобы ускорить этот процесс в комплекте нет, тайловый декодинг тоже бесполезен потому что латент в любом случае весь в ОЗУ. То есть развлекуха только для успешных пацанов с 24 ГБ врама как минимум, только им нахрен не сдалась эта лайт модель. Для остальных может сгодиться как стресс-тест контроллера памяти видимокарты.
Почему не делают отдельную нейрону на озвучку видео без звука. Выглядит идея хорошо- не надо просчитывать звук если видео говно. А потом можно что угодно приощзвучить с липсинком даже.
>>1499420 >>1496811 Дошли руки посмотреть встроенный ВФ и оказалось, что там не совсем то, что было в примере. Буду пытаться сделать через flf2v, ибо нужен конкретный "финальный результат", а не то, на что хватит воображения у нейросетки. Но, думаю, должна справиться, раз i2v трансформацию отрисовывать умеет. Всё равно спасибо.
>>1499756 Хули всё так сложно то? Воркфлоу в видео не видится. Окей, вижу, в конце файла джейсон, копирую в текстовый файл и гружу отдельно, похуй. Вижу, не хватает 9000 нод. Ставлю, похуй. Вижу, что используются хуй проссышь какие модели. Ищу, вставляю. Охуеваю от того, что видео вае ищется в вае, а аудио вае ищется в чекаутах. Похуй. Лень искать/качать этот ваш ггуф. Вставляю свою модель в FP8, похуй, прожевал. Какие-то блядь патчи, сажаатеншены не найдены, вообще нихуя не понял, сижу с лицом чела из самолёта. Вырубаю, похуй, видимо не нужны.
И наконец, оно мне высрало видосик. На фоне звучат цикады. Ну в общем моё отношение к этому уже понятно.
Сап, почему хуй дрыгается? Это надо лору другую искать или в проптах что-то лучше написать? У промтов в ване вообще можно веса задавать? А то несколько раз приходится теже самые пропты писать чтоб вес увеличить, а то оно игнорирует написанное.
Кум-братья, у вас есть список господ, гдевсе ссылки на лоры с любыми позами и действиями и промпты для них, а может даже видосики чтоб воркфлоу с них подрезать? В шапке не нашел. Мне как ирл, так и 2д надо бы, а на циве вручную чет лень лазить и настраивать. Ван 2.1
>>1500670 >на циве вручную чет лень лазить и настраивать Так и делаю, хожу с мешком и собираю оттуда все говно, в папки с разными моделями/ видами/действиями. А потом ложусь в ванну и обмазываюсь этими сокровищами
>>1500709 На циве просто много чего еще нет, что приходится по другим сайтам помойкам шарить. Например для 2д и аниме крайне мало лор, а самому жарить охуеешь.
Привет, как мне перевод в таверне настроить, чтоб работало в обе стороны? Я хочу писать по-русски, чтоб это на английски переводло, мне бы по-английски печатало и перводило бы на русек. Если как пикрил настройку поставить, то персонажи охуевают что я с ними по-русски заговорил, то есть им мой ответ непонятный кидается.
А что если в LTX-2 отключить этот ебанутый апскейл и генерить сразу в норм разрешении. Для чего его сделали вообще? По времени все равно так же наверное занимает, в чем смысл генерации low -> High-res, если всратую хуйню мыльную он не фиксит все равно?
>>1501667 > А что если в LTX-2 отключить этот ебанутый апскейл и генерить сразу в норм разрешении. Для чего его сделали вообще? По времени все равно так же наверное занимает, в чем смысл генерации low -> High-res, если всратую хуйню мыльную он не фиксит все равно? Смысл в том что модель тренилась под лоу рез, и если генерить сразу в хай резе то будет страдать моушен. Для чего так сделали? Чтобы можно было фактически (с учетом их апскейла) быстро генерить длинные ролики в высоком разрешении. Почему кал? Ну идея хорошая, а реализация хромает. Впрочем, первый лтикс был калом несусветным, а этот просто кал - чувствуется прогресс. Такими темпами глядишь лтикс 3.0 будет уже не калом, а 4.0 - конфеткой.
>>1501670 >чтобы можно было фактически (с учетом их апскейла) быстро генерить длинные ролики в высоком разрешении. На апскейл уходит столько же времени сколько было бы в нормальном разрешении генерации, хотя может у меня нищая затычка вместо видеокарты и в фулл врам все по другому. Но ван 2.2 делает по времени так же и лучше намного по качеству, ели не учитывать все эти липсинки и фпсы
>>1501667 >Для чего его сделали вообще? Потому что шарашка израильская, и у них задача не сделать нормальную модель а уесть ван 2.2 за счет помойных фокусов типа такого
Короче, идите на хуй с вашим ваном. Просто на хуй мелкими шажками. LTX-2 даёт то о чём мечтали - продолженное видео. Собрать минутный ролик - теперь совсем не проблема. Из приличного только на эту демку время потратил.
>>1502499 Никогда не пользовался, но знаю что есть Wan2GP. Но советую всё же осилить комфи, ничего там особенного нет: есть чекпоинт, есть вае, есть клип с промптами, есть латент, есть семплер. Семплер семплирует, декодишь получившийся латент с помощью вае и всё. Если это поймёшь, то во всём остальном легко разберёшься.
>>1501677 >Но ван 2.2 В котором вообще 2 больших модели, лол. >>1501723 >LTX-2 даёт то о чём мечтали - продолженное видео. Покажи воркфлоу, а то у меня не выходит.
>>1502920 Если не думать головой, а просто потыкать - вот: https://huggingface.co/Phr00t/LTX2-Rapid-Merges Скачиваешь JSON, кидаешь в папку с Workflow, пытаешься запустить. Докачиваешь сначала недостающие ноды (git clone https://github.com/Кек/Пук в папку custom_nodes), потом недостающие модели из этого же репозитория и интернета. Все.
Комфи - уебанский говнокомбайн, но ничего лучше не придумали, увы.
>>1503224 Уебанский говнокомбайн это питон, его экосистема и мозг того, кто его придумал. А комфи охуенен и очень здорово абстрагирует процесс производства контента от этого ебучего зоопарка полоумных ебанатов.
>>1503272 На самом деле "зоопарк полоумных ебанатов" самим комфи и порожден. Сотни модулей, каждый из которых тянет десятки зависимостей, зачастую несовместимых между собой по версиям. Воркфлоу, тянущие модуль с тысячей операторов ради одного оператора "FloatToInt", как вот это >>1503224 вот.
Даже руками на питоне написать скрипт, загружающий и использующий необходимые модели, проще, чем в этой куче кала разбираться. И версии библиотек неожиданно оказываются совместимы, и всякая левая хуйня не нужна.
>>1503279 >На самом деле "зоопарк полоумных ебанатов" самим комфи и порожден. Да нихуя, он был всегда, ещё до того, как появился комфи, просто в комфи столкнуться с ним проще, чем в других интерфейсах, которые все рабочие процессы скрывают в чёрную коробку. Но при этом он даёт практически такой же уровень гибкости, как и написаниие скриптов самому, при этом не опускаясь до нааписания скриптов и позволяя делать абстрагированные и переносимые решения, так что его недостатки простительны. Конечно можно было бы сделать, чтобы ради одной кастомной ноды не нужно было устанавливать весь пак, но у тех, кто плотно работает с нейросетями всё равно терабайтные SSD, можно пережить и без этогоо.
Всё, заебался. По серьёзному не вывозит, максимум на что хватает - 2-3 итерации продления всякой порнухи со вздохами. С диалогами жидкие обосратушки. Ну исходник так то тоже полное дно. Ждёмс ltx2++
>>1504033 у пиздоглазых есть одно маленькое преимущество, они могу хуй класть на коперайты и аффторское право как гиганты вроде опенай. Середняк самостоятельный уже ебут, как udio например. из-за этого имеем LTX с индусски датасетом, блядь. >>1504098 это не для вас молодой человек кожаный мешок, это для юрлиц которые могут позволить себе личный кусочек дата-центра. Для приватности и корпоративной тайны. Просто альтернатива - подарить свой анус билли гейтсу по подписке, люто бесит корпоратов. Так что нам остаётся сидеть у консумерской параши и жрать что дают - LTX или подписка и танцы с цензурой, внезапными банами и мурриканской пропогандой.
>>1504033 >>1504130 Посмотрел демки, это просто посмешище. Для 2к26. Я так понимаю никто кроме вана не может делать нормальные видео модели в попенсурсе до сих пор