Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре.
lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.
Кейворды для дополнительных вещей: SVI, RuneXX, LTX Director.
Промтобоги есть в треде? Никак не могу заставить паучару трахать бабу в рот кончиком откуда обычно паутина выходит, все перепробовал. Просто залезть и подергаться на ней оказалось легкотня. Паучий appendage оно считает головой. Включим фантазию?
Почему ей хуй или яйцы дорисовывается? Я ж в пропты принудительно пишу penis, futa, futanari, labia, testicules, а в позитивы - pussy, vagina На видриле еще не так плохо все, но почерневшая камелтое. Как аниме письку сделать? cleft of venus не работает.
>>1629388 > Почему ей хуй или яйцы дорисовывается? Я ж в пропты принудительно пишу penis, futa, futanari, labia, testicules, а в позитивы - pussy, vagina Потому что лоры говна, гениталии считаются частью человека. Ну вот так натренили. > На видриле еще не так плохо все, но почерневшая камелтое. Как аниме письку сделать? cleft of venus не работает. Никак, все лоры что я на цивите смотрел - говно. На 1girl standing еще может что-то работает, но в динамике или при смешивании с лорами на еблю и т.д. - все проебывается
>>1630572 Учитывая, что модели лежат в оперативе, откуда кидаются на видяху, по сути-то и нет. Разве что делать purge vram после каждой генерации, тогда — да, во время генерации меньше оперативы будет задействовано. Но в любом случае, лучше взять 16, если есть возможность. Даст больше контекста, и быстрее будет вае декодироваться.
>>1629627 Спасибо, благодарю! А не знаешь лоры на добротные мощные 2д камшоты? Чтоб прямо брызги летели и периодически, а не 1 раз и не просто текло как на 1. У меня прям рандом, много реролить и все равно не граммотно.
>>1630755 >Чтоб прямо брызги летели и периодически Это надо описывать типа multiple burst, erupts many times и тому подобным И в негатив добавлять disappearing cum, disappearing fluid, missing sperm и тому подобное
>>1630801 Не работает. Что реально работает это повернуть пикчу под удобюным углом. Ван почему-то предпочитает чтоб жидкости двигались сверзу вниз, основная концепция.
Я пришел к выводу, что формат тегов из СД не работает в Ване вообще. В сд по сути теги с данбуру через запятую, а в Ване надо художественный рассказ писать. Но как его писать, не обладаю литературным навыком и у кого есть на это время? Если подразумевается писать пасту нейронкой, то это где такую взять для нсфв? Локалку мне напряжно запускать, ибо Врам туда-сюда долго гоняется, мне надо рассказики на лету сочинять по ключевым словам.
>>1631443 >Я пришел к выводу, что формат тегов из СД не работает в Ване вообще. Ну ты и гений, долго думал? Счего ты вообще взял что он их должен понимать? Это фича двух с половиной моделей для генерации статичных избражений (люстра, анима и убогий нуб) потому что внезапно booru-подобные сайты это готовый размеченный датасет статичных избражений.
>>1631489 Долго-долго, маленький, у меня технарский ум и это моя ловушка, что оказывается с машиной сюсюкать как с ребенком, наливая много воды, а не сухой промпт.
Блять даже гптыня советует для Вана пропты так составлять: A [subject], [action], camera [movement], [lighting], [style] Пример: A cute anime girl smiling, her hair gently moving in the wind, camera slightly panning left, soft lighting, anime style, high detail Негативы: blurry, low quality, bad anatomy, distorted, flickering, jitter, artifacts (это минимум)
>>1631578 У тебя явно не технарский ум. Юзать теги в 2к26 для Вана, когда все технари прочли в момент выхода папиры как надо промптить и все. Это было охуеть как давно.
А еще, технари берут примеры из папир, пихают в нейронку и просят сделать так же. Это работает примерно для всего и уже пару лет.
Еще, некоторые дообучают ллм для промптинга той или иной модели.
Ну я хз, я не умею на вашем, на гуманитарском, поэтому понятия не имею, понял ты меня или нет. Но я надеюсь ты понял и тебе эти базовые советы помогут.
>>1631893 У меня явно технарский ум, я универ закончил с дипломом, а ты гуманиртарий. Брать примеры из папир = куколдство. Надо самому уметь составлять в два клика ситуативно, а иначе будет не точно. >Это работает примерно для всего и уже пару лет. Я бы поспорил, что для всего и два года, но не вижу смысла бисер метать. Удачи!
>>1631578 >технарский ум Давно ли тупое тыканье кнопочек называется технарский ум? Документацию перед работой с инструментом почитать слабо? >>1632059 Твоя ловушка в том что ты универ закончил, а навыков судя по всему не получил.
В комфи как-то можно LTX-овский латент сохранить? Обычная SaveLatent нода шлет нахуй. Заебали блядские индусы и горе-вайбкодеры, которые не могут нормально менеджмент памяти организовать, из-за этого перед декодингом пару раз улетал в оом и терял, судя по превью, годные роллы.
>>1633228 так он сам сохраняется и так в темпе, или тебе для других целей? я как то парился тоже вопросами как ужаться в свои ram/vram теперь смело впихиваю ноды на очистку памяти после первого семплера, а потом и после второго на декодере, что позволило вместо 15 секунд уже минутные видосы пилить на том же железе в тех же разрешениях
>>1633486 > теперь смело впихиваю ноды на очистку памяти после первого семплера, а потом и после второго на декодере Может я что-то делаю не так, но у меня эти ноды работают через раз. По идее, после апсэмплинга остается шаг декодера, и все, кроме VAE, должно при очистке пойти из памяти нахуй. А вот нихуя, после второго сэмплера висит 24 Гб, в память заваливается латент и привет оом. А в логах - ехидное -17 Мб после ноды очистки памяти, вот хуй разберешь, что он там "почистил". При этом T2V у меня нормально работает безо всех этих выебонов даже если лор вагон накидать, это в I2V у меня только такая поебень. Не знаю, почему так. Поэтому я просто пришел к тому, что основной воркфлоу заканчивается на сохранении латентов после второго сэмплера, а сам декодинг - вынес отдельно.
>>1633572 Декод и так тайловый. А насчет подкачки - еще раз, в T2V такой проблемы нету, с хуя ли в I2V он должен внезапно решить проблему? Латенты-то на выходе перед декодом одинаковые.
Какой максималльный размер достаточен для файла подкачки для пердежа Вана? Я не могу просто по-больше назначить, а то я принудил систему его форматировать при выключении, а то я страховщик и выключается комп 5 минут долго.
>>1634208 КАЖДЫЙ ДЕНЬ СРОЧНО ЭКСЛЮЗИВЫ А КАК ЖИТЬ-ТО СРОЧНО СКАЧАТЬ УСТАНОВИТЬ ПИСИК ВЫУЧИТЬ ВСЕ СЕКРЕТЫ В РЕДДИТЕ РАССКАЗАТЬ ДИСЕРТАЦИЮ ЗАЩИТИТЬ СТАРОЕ СРАЗУ УДОЛИТЬ
>>1634198 Пиздец ты шизло: реализмом занимаются ваще другие модели-апскейлеры, а основная фишка вана - что его можно тренить, и тренится он хорошо если в 480п.
>>1634198 Хороших инструментов для него явно больше, но анимация у 2.2 явно лучше. За реализм не скажу, нахуй он вообще нужен? Порнухи мало чтоли наснимали? Обычная порнуха на голову выше всего, что может сгенерить любая нейросеть.
Чето мне щас так смешно стало. Была у нас страсть к локальному видео, реальный прогресс, будущее, а потом ван просто перестал быть локальным и всё сдохло моментально. И уже год прошёл а всё по прежнему. Ухахатывался пол часа наверное. Вот SCAIL 2 вышел, а это сраный ван 2.1.
>>1634370 >И уже год прошёл а всё по прежнему Тем временем грок имеджин 1.5 на короткий промежуток времени показал возможности закрытых генераторов. Там довольно реалистичная порнуха получалась, с реалистичными звуками. Но пидерасты всё быстро прикрыли.
Думал видео можете делать, где снимают знаменитостей молодых старых вместе и переходы почти без склейки. Навен это платно. Так встроенные со своими мозгами не могут. И карту не брал, а смысл. Все одна фигня не влезет никуда серверные модели.
>>1631443 Вам бы покурить мануалы что ли для начала как это работает а не придумывать самостоятельно. Если совсем коротко, то происходит следующий процесс где по очереди работает сразу несколько моделей: Text Encoder-> Generator (чаще всего Diffusion model -> Decoder (Vae/Текст и тд). Текст который пишешь для генерации в позитив и негатив кодируется отдельно именно энкодером, в старой сдохле были совсем простые модели энкодеров типа CLIP, которые могли понимать примитивный текст и синтаксис там был в стиле 1girl, standing. Потом появились новые диффузии поддерживающие более жирные энкодеры t5 и тд, где уже можно было слегка развлекаться чат-гптшным синтаксисом. Сейчас в некоторых моделях и вовсе в качестве энкодеров поддерживаются LLM на основе квена, геммы и тд, в них синтаксис совершенно будет другим, чаще всего натуральным. При этом диффузия понимает твой текстовый энкодер по разному, картиночные по своему, видеомодели по своему и тд, поэтому если ты в SD генерил что-то одно то во флаксе с другим энкодером будет синтаксис иной, а в ване или в лтх будет ещё более другой, где тот же самый пропмт для генераци двух тянок может значительно отличаться. Вот ближайший пример, для хромы например камеры пишутся в конце а персонажи в начале НО по очереди, для сдохли желательно все квалити таги выносить в начало и персонажей описывать в одной секции а не в разных, а для квен имиджа вообще без разницы. Для вана всё наоборот, шутинг камеры и позицию персонажа(жей) нужно описать именно в начале, а стиль в конце.
>>1634797 Да заебался я кюрить мануалы, которые устаревают через полгода. У кого вообще есть на это время? Сами читайте всю дрисню, прыщебляди. А то что ты написал я итак знаю, но мне не удобно. Я б предпочел сцену задавать по тегам с данбуру и веса править, а не писать сочинения школьника каждый раз, это утомляет. Тут говорят мол вставляй копипастные предложения из гайдов, но это хуйня получатеся, с тем бы успехом можно было копипастить одно слово-тег, которое заменяет это предложение.
>>1634797 Бред, вообще непричем энкодеры, причина только в том как обучалась нейросеть. СД файнюны просто были залиты тегами как есть, потому что на бурах они были под картинками заботливо проставлены человеками. И поэтому теги работают охуенно там где они были в датасете. Под видосами никаких тегов не было, их размечали обычным слопотекстом или нанятые индусы или ллмки, а на самом деле и то и то в шизоидных пайплайнтах, потому что нормальных ллмок которые понимают видосы нет. >Вот ближайший пример, для хромы например камеры пишутся в конце а персонажи в начале НО по очереди, для сдохли желательно все квалити таги выносить в начало и персонажей описывать в одной секции а не в разных, а для квен имиджа вообще без разницы. Для вана всё наоборот, шутинг камеры и позицию персонажа(жей) нужно описать именно в начале, а стиль в конце. Про это не спорю, но это зависит от того какого формата придерживались при сборке датасета.
>>1631443 >Если подразумевается писать пасту нейронкой, то это где такую взять для нсфв? Да, именно это и подразумевается. Пойдет почти любая кроме гпт, по апи а не в чатике. Почти все напишут тебе нсфв с нормальным промтом, разница будет только в том насколько сочное нсфв, но для промта сочное наверное и не нужно. Тебе нужно просто один промт с описанием формата сделать, фиксированные фразы / примеры и потестить какая нейронка лучше результат даст. Хотя бы просто напизди нормальных промтов в примеры. >>1634819 >Я б предпочел сцену задавать по тегам с данбуру Пиши теги ллмке, она поймет и переделает по гайду в натуртекст.
>>1635097 Откуда такие шизы берутся? Что ты блять вычислять собрался, если веса в другом враме лежат? Каждая гпу вычисляет ровно то, что у нее в враме.
>>1634797 >для хромы например Можешт поделиться гайдом, просто что я читал там чтобы реалистичность поймать надо обязательно в начале ставить типа "натуралистическая фотография", "профессиональное фото" и т.д.
>>1634891 >нормальных ллмок которые понимают видосы нет QwenVL
>>1635097 Погонял https://github.com/komikndr/raylight — получил -10%. Может быть проблема в количестве линий (стандартная материнка x16+x4), но переставлять в другую лень. Пробовал и флюкс, и лтх, везде одинаковое замедление. Огорчение.
На шизов, которые не в курсе про tensor parallel не обращай внимания, они тут просто так сидят повысираться, вряд ли у них есть компы для генерации. Злятся, вот и матерятся.
Анончики, каким ии делаються видосы по 5+ минут которые я вижу в тик токе? Там типа пересказы дорам или аниме, и видосы до 30+ минут, как это делают раскажите плис. хочу пересказ книг которые прочитал сделать по тексту книги, что бв друзьям расказать типа краткий пересказ в формате видео от ии
>>1636672 Оперативы маловато, файл подкачки и диск будет умирать потихоньку. Но купить ссд под файл подкачки все еще дешевле покупки оперативы, конечно.
Делается скорее облачными моделями за токены, но можно и LTX-2.3 генерить на отъебись.
>>1636722 А какими такими облачными моделями? я в какой-то которую мне гугл гемини посоветовал загрузил 1 главу книги, оно мне выдало что видос будет 7 минут, и по цене - 70$, ну я так понимаю что это нихуя не норм цена, я вот готов за видос пол часа+ заплатить 10-20 баксов. Что вообще по ценам в таком сегменте деГЕНЕРАЦИИ видео?
>>1636658 Я бы взял чей-нибудь голос и сгенерил на его основе речь через Fish TTS. Потом отрывками секунд по 15 подавал бы на вход в LTX и генерил клипы с пары-тройки разных ракурсов для разнообразия. Конечно времени это займёт неебически много.
Есть такие кто смог сделать генерацию на rx570 4GB или r9 390 8GB? Или вообще на процессоре? Вон раньше facefusion тоже не поддерживалось на амд, потом хоп и заработало.
>>1636037 >tensor parallel А ещё llama.cpp например можно частично на CPU частично на GPU. Слои какие-то есть, но я не пробовал ещё, может дойду как-нибудь.
>>1637012 Больше всего в этом проекте понравилось делать переходы между отдельно сгенерированными сегментами. Это в давинчи одной кнопкой делается за 0 секунд. Какие вопросы: 1) У нее поплыло ебало после всех этих 15 дегенераций. Как Wan все время напоминать как ее лицо выглядит? В каждом новом сегменте новая лора кста. 2) Можно ли в Wan несколько лор подключать сразу? Вот в этом видео их овер дохуя. Но это другой воркфлоу с заменой фона/персонажа. 3) С фоном то же самое, он деградирует с каждым новым запросом. Как и запросы, лол.
Еще проблема. Моя баба никак не хотела избавляться от шмоток. Они остатками прилипали к рукам и в каждой следующей итерации превращались во всякое ненужное говно. У анонов >>1629388 >>1629127 все норм, как вы этого достигли?
>>1636933 3090 (потом 2х 3090, 4х 3090, 16х 3090) - это топ за свои деньги во всем, что с нейронками связано. Когда маркетолухи пытаются тебе впарить клешню на макпуке, они скромно умалчивают, что шарорам работает на порядки медленнее врама, а когда пытаются впарить нативный фп-х на 40-50хх - то скромно умалчивают, что за те же деньги ты можешь взять 2х врама на 3090.
>>1636801 Я фиг знает, онлайн не генерил. Но звучит вполне возможно. Я про 7 минут и 70 баксов. =) Пол часа за 20 ето кек. Не, ну, может и есть такие. Можно абьюзить бесплатные кредиты на сервисах разных. Но ты пойми: ты не текст кидаешь и оно генерит. Ты составляешь промпты для 5 секундных отрывков, а потом сам их склеиваешь. Написать 250 промптов — тоже не самое простое.
Короче, если ты просто хочешь взять и чтобы оно само — то забей сразу, такого пока еще нет. А если готов поработать — то локально, как будто, и проще будет. Все равно тебе придется очень много постигать всего.
>>1636882 2026 год, OmniVoice, в том числе gguf'ы есть.
>>1636933 Ну, 5070 будет чутка по-быстрее и новая за те же деньги. И холодная. И с новыми техами. Но если захочешь LLM — резко обломишься по объему видеопамяти. Так что смотри сам, или 5070/5070 ti, но про LLM забываешь, или 3090, чуть медленнее и бу, зато универсал.
>>1636946 Это override tensor называется, да. Ну или --cpu-moe, если проще.
>>1637132 Сиденс пока и закрытые модели догнать не могут, а лтх по анимации и ван до сих пор не догнал, так что я бы растянул твою теорию. 2027 звучит реалистичнее, и то, скорее к концу года.
Как думаете имеет ли смысл приобретения Радеон, например 7900 XTX 24? Оно по цене примерно как 5070ти 16, но больше ВРам для нейронок. Или это в любом случе адамуда ради амуды, то есть скам?Тротлит и программы запускаются, куды нет. Я знаю точно что модели оптимизируются для нвидии, а для амуды чтоб порой игру запустить нужны танцы с бубном. То есть херовая идея?
>>1637012 Ты лучше svi pro изучи и не нужны будут никакие давинчи и ебало с фоном деградировать не будут.
>>1637021 >1 Самое идеальное решение - лора на персонажа, альтернативное svi, вторая альтернатива генерировать fflf и для каждой последующей генерации предварительно сгенерировать картинку >2 Можно, а в некоторых случаях и нужно >3 svi >>1637027 Хороший, детальный промпт практически решит эту проблему и подбор подходящей генерации
>>1637157 >5070 >12 гнилобайт >чутка по-быстрее Ну да, если генерить ролики по 3 секунды
>>1637132 Получается что это влажные фантази. Посл ван 2.2 вышел ван 2.5, а потом и 2.7 и они до сих пор закрытые. Хотя обещали 2.5 в открытый доступ выложить еще пол года назад. Вангую что и ltx 2.5 будет с какими то подъёбами. И на этом закончится эпоха открытых моделей и всё что нам останется дрочить ван 2.2 до посинения.
>>1637202 Для видео - точно нет. Для всего остального что влазит в 1-2х 3090 - тоже нет. Последний год амудя сильно стараются догнать по софту, и там вроде есть уже понт собирать риги на х8-16 для жирных текстовых, но для мелких объемов - все еще никакого.
>>1637403 Все что не ужато в анус не влезет в 16 гигов. Не гуф на наносеков рассчитан, я не верю что таких людей много. А оно вообще сильно на качестве чтоли сказывается? По-моему норм. Есть мини косяки, артефакты дальних деталей, но это ерунда.
>>1637218 > Ну да, если генерить ролики по 3 секунды Да не, разницы там нет. Другое дело, что видео на 60 секунд вывалится за пределы видеопамяти и РЕЗКО станет люто медленной. А 3090 позволит в два раза больше впихнуть.
> Вангую что и ltx 2.5 будет с какими то подъёбами. Ну давай бех подъебов? Пусть выйдет хотя бы как есть, с анимацией уровня Wan2.2, и уже хорошо. Не надо подъебов.
>>1637439 Бля, ты людей с 16 гигами оперативы наносеками считаешь? Сочувствую. ИМХО, уже 64 гига ddr3 зеоном набрать можно, там что как будто и похуй. Ну не хочешь bf16 гонять, чтобы в файл подкачки не выливалось, возьми q5, вроде норм ггуфы, деградация почти незаметна, судя по примерам. А объем видеопамяти тебе только для контекста и нужна. Размер модели-то тут причем.
>>1637027 > все норм, как вы этого достигли? Если про раздевание, перетащи в свой комфи эти ролики, погляди промты, лоры. Достиг перебором. ГЛАВНОЕ - если надо раздеть бабу, ставь длительность 5сек. Максимум 6сек. В данном случае как и в большинстве других после 5-6 секунд видео начинает возвращаться к исходному кадру и нифига она не разщденется.
>>1637027 Ну и помимо раздевания можно попросить её параллельно раздеванию в течение тех же 5 сек присесть, прилечь на бок раздвинув ножки, привстать, выкинуть телефон и пр. Не стесняемся подробно прописывать свои желания.
>>1637605 Не с 16, а от 24. Глянь цены. Одна видюха будет стоить дороже, чем остальные детали вместе взятые плюс с моником и столом. Это как называется?
>>1637984 это проблема LTX. Сам автор Эроса это написал. LTX более менее справляется с анимацией уже подготовленных картинок. Т.е. на них уже есть все что надо, осталось только анимацию прикрутить, в отличие от Вана, который в i2v может и консистентность персонажа поддерживать без лор, и промпту лучше следует.
Still best used to just animate sex images. Complex storytelling and prompts still requires additional guided frames and high effort, everyone knows LTX 2.3 is very clunky by now. Lighttricks seems to be 4 years behind everything, they just now decided to implement experts on the next version. I guess the totally true-proven method of autoregressive is too futuristic for them (literally the best method for video models - Seedance2, Grok, Kling).
>>1637864 Это называется ты дурачок. Еще раз: объем видеопамяти не имеет отношения к размеру модели. Хоть safetensors bf16 на 45 гигабайт, хоть gguf q2 на 8 гигов. Видеокарте пофигу. Видяха с 6 гигами прекрасно запустить 45-гиговую модель, выгруженную в оперативу.
Чтобы запустить не gguf, а safetensors bf16 миллиард гигабайт нужен: P104-100 — 2к на авито. xeon + ddr3 — 5к на озоне ssd диск на смерть для файла подкачки, 5к на озоне
Если по твоему 12к рублей — это наносеки только себе могут позволить, то я прям хуй его знает.
Тут пол треда катают обычные bf16 и fp8, gguf — это для фанатов поизъебываться, или запустить ужатое на 16 гигах оперативы (!) и видяхе с 6 гигами видеопамяти.
Видяхи с 24 гигами впизду не сдались для запуска модели, для видеогенерации тебе нужен мощный чип у видяхи. Будет честны, 5060 8 гиговая будет генерить быстрее 3060 12-гиговой.
НО! Есть разрешение видео и количество кадров, и вот они уже зависят от объема видеопамяти. Если ты хочешь генерировать минуту бесшовного FullHD видео одним батчем — вот тогда тебе понадобится 3090 и ее 24 гига (а может и 5090 с 32 гигами, хз).
Надеюсь теперь понятно объяснил, почему генерить хот на ван, хоть на лтх можно на любой видяхе. Упор по видеопамяти идет в разрешение и длину видео, а не в размер модели.
>>1638097 Не, там прод, production server, типа шутка была, можно написать промпт, чтобы тянка на видео сделала за меня свою работу. Че-т я не увидел, что слова похожие, сорян. =)
Посоны, я залётный. Хочу генерить что-нибудь атмосферное со своим semi3d аниме-персонажем (для муз. проекта). Получится ли норм генерить на RTX 5060 ti 16 gb VRAM, 32 GB RAM. Пробовал недавно накатить неудачно WAN и что-то там ещё. Были конфликты с pytorch или что-то в этом роде. Хочу ещё раз попытаться.
>>1638221 Генерить можно, но нахуя? Единственный смысл юзать локальные модели - это если ты их собрался тренить, чего ты уже на таком не сможешь. А для общего использования облачные модели даже днищетира на голову выше локальных.
>>1638238 Аренда - это заебись когда ты уже точно знаешь что делаешь, и теперь тебе нужно только масштабировать. Но пока ты нихуя не знаешь, и тебе нужно каждый шаг проверять - ты охуеешь за это платить.
>>1638244 Это все равно что спросить "а как чинить машину". Есть дохуя моделей, и, либо ты не глядя бросаешь бабки в монитор, и все делаешь сидансом, либо нужно пробовать все, чтобы понять что под твои задачи выходит топ за свои деньги (либо ебешься сам в гараже, но для этого нужно норм оборудование купить, а не просто набор отверток).
>>1638236 > Единственный смысл юзать локальные модели - это если ты их собрался тренить Ой иди нрахуй >>1638221 >Получится ли норм генерить на RTX 5060 ti 16 gb VRAM, 32 GB RAM. У меня 3060, я генерю все свободное рвемя
>>1638221 >Были конфликты с pytorch или что-то в этом роде. Хочу ещё раз попытаться. Пробуй-пробуй-пробуй. У меня даже пикчи не генерились сначала. А вот когда попробовал Wan все пошло нормально.
>>1638102 А что именно ты тут нагенерил? Я не смотрел фильмы, в чем суть проекта?
Помогите, у меня видимо лапки: где-то недавно (чуть ли не пару дней назад всего) попалась инфа, что в комфи прикручивают (или пытаются?) паралельные вычисления на нескольких картах. Не старые ноды MultiGPU а что-то другое, с реальным распределением. Проебал, и не могу найти повторно. Не гуглится. Если кто видел - швырните ссылкой плиз, хочу нормально почитать что там химичат такое интересное...
>>1638554 Детектор чини. Я первый раз за месяц сюда написал.
>>1638554 >гпу физически не может вычислять то, что не лежит у нее во враме Технологию Nvidia SLI и прочее разделение рендера кадров на разных GPU забыл уже? И то, что при 3D рендере единая картинка из кусков отреденереных на разных картах может собираться - тоже не в курсе? Принципиальная то возможность разделить работу по сборке видео явно есть, могли и сообразить как это применить к сеткам. Вот про это я и хотел перечитать, чтобы разобраться - правильно ли понял. Так что агрессивный узколобый шиз тут как раз ты.
>>1638221 Придется файл подкачки докинуть. 64-96 гигов было бы получше, но 32 терпимо. А видяшка норм.
Можешь попробовать LTX-2.3 — semi3d у него кое-как получается. Без крутой анимации, как в WAN, зато можно звук подать на вход.
Советую попробовать https://github.com/WhatDreamsCost/WhatDreamsCost-ComfyUI — там нынче годная обнова с IC LoRA'ми. И даже без них, работает клево. Сравнивал по скорости с обычным WF, если отключить taeltx (поставить в обход две ноды), то выходит ровно так же.
>>1638568 Не обижайся на бедного человека, он или болеет, или просто генерить не на чем. Пойми, у каждого свои проблемы. К тому же, выше ему уже писали про tensor parallelism, который на llama.cpp прекрасно работает у всех.
>>1638568 Так абсолютно любое мультигпу - это и есть блять распределенные вычисления, все что в врам попадает той же картой и вычисляется, по-другому физически никак. Нвлинк позволяет ускорить проброс между ними, но вычисляет по-прежнему каждая своя точно так же как через мать.
>>1638091 Это называется ты узник ram. Очевидно что если модель влазиет в vram то она работает гораздо быстрее, без постоянной перекидки блоков туда-сюда. >bf16 Ты совсем больной? Если хочешь получить качество - нужно увеличивать шаги и не использовать ускорялки, тогда будет видна разница. А под lihgtx в fp8 и bf16 разницы по качеству вообще не будет.
>>1638102 Это шедевр! Пошел пересмотрел сцену из фильма и ужаснулся проделанной работе + еще и работа со звуком + монтаж с реальными сценами. Ты по любому используешь fflf, подскажи в чем генерируешь кадры?
>>1638625 > по любому используешь fflf Не знаю что это. Все на wan 2.2, плюс пара кусочков в квене онлайн. Звуки из самого фильма и пары видеоигр (даже не из порно лол). Брал удачные промежуточные кадры из разных генераций, использовал как обычный ворк так и FIRST2LAST, где заданы первый и последний фрейм, а нейронка заполняет середину. И да, убил на это пару вечеров свободного времени как минимум, не считая тонны генераций параллельно работе.
>>1638623 Бля, чел, ну ты совсем не шаришь, а хуиту написываешь. Плиз, не позорься, почитай тред, поэкспериментируй, разберись.
> гораздо быстрее На 10%, вау, охуеть выиграли. При этом, 3090 при сравнении в лоб, все еще уступает 5070 по скорости. Да что ж физика так спорит с твоими фантазиями-то!
> Ты совсем больной? Пчел, таблетки. Без обид, но реально ведь видеогенерациям уже до пизды месяцев, уже год генерируем. Все проверили, все сравнили, разница между bf16 и fp8 видна, тем более nvfp4 (ты в курсе, вообще, что сейчас на ней генерят часто?). Шумы на пальцах, зубах, волосах. При этом, разница между dev и distill безусловно есть, качество анимаций, следование промпту, количество пальцев и общая анатомия, лел. НО — это две разные разницы, независимые друг от друга. Хули ты в глаза-то ебешься, Маня. =)
Просто давай начнем с фактов: Объем видеопамяти для диффузионных моделей оказывает слабое влияние на скорость генерации. 3090 с 24 гигами уступает 4070 ti и 5070 в сравнении в лоб по скорости. Хотя должна их кратно обходить по твоей логике. bf16, fp8, int8, nvfp4 генерирует видео разного качества и это отличимо на глаз. При этом, скорость так же растет (и благодаря размеру в т.ч., и благодаря поддержке технологий на соответствующих поколениях видеокарт). Провести слепые тесты не так сложно: один вф, один сид, два видео, разные шумы. dev и distill версии вносят огромный импакт в разницу по разнообразию (привет cfg), следованию промпта, качеству анимации и анатомии.
Все три факта верифицируемы, проверены много раз и в треде, и в чатах, и где угодно. Ты сам можешь взять разные видяхи, разные кванты, сравнить результаты. На кой хрен ты продолжаешь игнорировать реальность и убеждать, что если модель целиком не влазит во врам, то скорость катастрофически падает, я не пойму.
При этом, блин, мы ж вроде как не о вкусовщине говорим, никто на тебя не наезжает, никто не спорит какая модель хуже или лучше, просто чисто циферки обсуждаем, которые замеряны давно еще.
Вот честно, складывается такое ощущение, что ты когда-то купил 3090 бу, она у тя сгорела, и теперь ты жопой горишь на всех, кто смеет покупать 5070 за 48к рублей новую с магаза и генерит с той же скоростью. Или, о анти-узник рам, просто не успел купить себе 128 оперативы, и теперь горишь на тех, у кого она есть. Ну других причин я не вижу, чтобы так извиваться как уж на сковородке. Вот рил звучит как обычная обидка.
Обида — деструктивное чувство. Успокаивайся и выздоравливай. =)
>>1638634 >FIRST2LAST Это как раз fflf - First Frame Last Frame
>квене онлайн Он генерит nsfw контент??
>пару вечеров Мне кажется там было гораздо больше. Я вот все пытался собрать большое видео и через пару вечеров забил в итоге, решил отложить в долгий ящик. Когда пытался хобы ты часть смонтировать и со звуком игрался. Сейчас жду ltx 2.5 чтобы попробовать заново собрать.
>>1638743 Ха, понятно. Ох уж эти сокращения. Квен и грок конечно же уже ничего не генерят, но там сисек в кадре из фильма нет, а мужскую жопу в прыщах пропускает)) Ну и промт д быть "безопасный". Благодарю за оценку. А лтх меня разочаровал, только для naughty talk подходит как будто бы.
>>1638715 >При этом, 3090 при сравнении в лоб, все еще уступает 5070 по скорости. Это что за сравнение, на какой модели? В 40хх+ есть нативная поддержка fp8, а 3090 вынуждена каждый раз разворачивать модель из fp8 в fp16, именно по этому страдает скорость. Также у новых чипов быстрее вычисления даже в fp16. Но это лишь верхушка айсберга. По факту ты собственноручно душишь свою карту загружая в неё неподъемные модели. Если загрузить в неё модель которае влезет в объём vram скорость будет в разы быстрее, в разы!
>разница между bf16 и fp8 видна Кому видна, шизам? Я в треде сижу с выхода хуньюаня и никаких сравнений толковых не было. А когда сам сравнивал bf16 и fp8 - разница была не в качестве совсем, просто немного другая генерация того же качества.
>nvfp4 (ты в курсе, вообще, что сейчас на ней генерят часто?) Разве что только счастливые обладатели 12Гб vram, это же по сути Q4.
>Объем видеопамяти для диффузионных моделей оказывает слабое влияние на скорость генерации. Повторяй это хоть 100 раз. Факты от этого не поменяются. Ты просто упёрся рогом в это понятие и не выкупаешь базовой логики. Если модель помещается в vram то ей не надо использовать медленную оперативку, она отрабатывает в в быстрой vram и скорость генерации значительно возрастает.
>>1638752 > Если загрузить в неё модель которае влезет в объём vram скорость будет в разы быстрее, в разы!
Слушай, есть очень простой способ. --reservre-vram 12 Он сделает из 24-гиговой 3090 — 12-гиговую. У меня 3090 нет (зассал брать бу-хи с авито), но если есть у тебя — проверь. Будет ли в разы быстрее.
Когда я в свое время тестил, у меня получилось, что максимум прирост получается в 2 раза между «модель целиком в видеопамяти» и «модель целиком в оперативе». А с учетом того, что в видеопамять кидается контекст первым делом, то модель всяко выпадает частично, и получить пресловутый х2 прирост (максимальный) практически невозможно (кроме случаев с 5090, ага).
Если есть 3090 — не поленись, затести. С 12 гигами (и посмотри в диспетчере или nvidia-smi, чтобы за пределы 12 гигов не вылезало) и с 24.
> Кому видна, шизам? Обычным энтузиастам.
> Разве что только счастливые обладатели 12Гб vram, это же по сути Q4. Промах, обладатели RTX 50xx, они поддерживают ускорение, там на 25%~40% быстрее получается. Весьма недурно ценою небольшой деградации. Хотя зависит от сцены, если куча мелких деталей — то каша, конечно, переходим на bf16. (кстати, технически, нихуя это не Q4, там часть слоев в хитровыебанном fp8, по размеру и качеству между q6 и q8, можешь чекнуть, я сам офигел, когда узнал, что это не чистый fp4)
> Повторяй это хоть 100 раз. Факты от этого не поменяются. Ты просто упёрся рогом в это понятие и не выкупаешь базовой логики. Если модель помещается в vram то ей не надо использовать медленную оперативку, она отрабатывает в в быстрой vram и скорость генерации значительно возрастает. Ты написал хороший текст — но про себя. Реально ведь уперся рогом, и игнорируешь реальность. =)
ИДИ МЕРЯЙ БЛЯДЬ =) Сам охуеешь, как внезапно, 46-гиговые модели в 24-гиговой 3090 не ускоряются В РАЗЫ. Да и что ты вообще в 24 гига запихнешь-то? q4 ггуф тот же самый? Ну давай, покажи разницу на 24 и 12 гигов. Я искренне надеюсь и жду.
Логику я знаю. А еще мерял сам, и знаю математику. Ты дальше логики не ушел, на математику хуй забил, в детали работы диффузионок не вдавался. В РАЗЫ.
Это авторегрессионки (типичные LLM) ускоряются в разы, реально в разы, а то и в десятки раз. Но диффузия нахуй вообще иначе работает, блядь.
Забились? Моя ставка: целиком модель х2 ускоряется, но целиком ты 25 гигов не пихнешь (не q4 WAN же юзать), а еще на само видео много места отожрется (не 480х288 же генерить в 2026 году, когда можно 15-секундные фуллхд на 12 гигах), поэтому особо смысла в лишних 8-12 гигах именно для модели нет — они имеют смысл лишь для разрешения и времени генерируемого ролика. Твоя ставка: в разы быстрее, в разы, т.е. минимум в 4 раза жду результат.
Я мог бы затестить на Tesla P40, но я заебусь ждать, у нее чип медленный. =)
Я думаю, это решит наш спор.
Если ты реально, запихнув модель целиком в видяху, получишь х4 относительно --reserve-vram 12 — я без вопросов признаю твою правоту. Ну, по факту же ты прав будешь, хули тут не признавать. =)
>>1638715 А, не дочитал твой опус, а именно последний абзац с твоими проекциями. Какая тут обида вообще может быть? Я просто излагаю факты. Я купил б/у 3090 полтора года назад и она у меня до сих пор работает. Если она сломается то я опять возьму б/у 3090, по тому что очевидно что лучше иметь больше vram чем +15% к скорости генерации. А покупать 5090 жаба душит, тем более по обновленному ценнику. Ладно бы если бы я хотя бы на этом деньги зарабатывал. Это дает доступ и к llm нормальным и к возможностью собирать воркфлоу из нескольких небольших моделей и постоянно держать их в vram. Преимуществ масса у большой vram. Контекст, который ты пытаешься игнорировать. Один раз сгенерив в HD уже не хочется генерить что то ниже по качеству.
Вот, попробуй запустить этот wf https://dropmefiles.com/T89QU на 12-16 гигабайтах, затестим сколько у тебя будет время генерации от и до. Но что то мне подсказывает что 5070 тут жидко пукнув обмякнет.
У меня 64Гб оперативы и этого достаточно при 24гб vram да и больше не влезет - все 4 слота забиты
>>1638777 Идея хорошая, но у меня не работает --reservre-vram, все равно забивает 23.4 гигабайта.
>Промах Нет, это как раз размен скорости на качество. Конечно это не чистый fp4, но близкий к нему. А чекать что там другие нагенерили и начеррипикали - такое себе развлечение. Когда обзаведусь 50хх серией - сам посмотрю.
>Да и что ты вообще в 24 гига запихнешь-то? Если мы говорим про wan2.2 то там 1 модель весит 16 гигов + контекст, все это нормально размещается в 24 гигах. Потом 1 модель выгружается в рам и вторая загружается вместо неё. Таким образом мы получаем прирост скорости.
>>1638916 > Так что не проецируй свои обидки на меня. Было бы за что обижаться мне на тебя. =)
> лучше иметь больше vram чем +15% к скорости генерации. Заметь — видеопамять никаких х4 к скорости не дает, вполне себе уступает. =D Но в остальном-то никто не спорит — для LLM лучше, безусловно, и для контекста лучше больше памяти.
> Вот, попробуй запустить этот wf https://dropmefiles.com/T89QU на 12-16 гигабайтах, затестим сколько у тебя будет время генерации от и до. Но что то мне подсказывает что 5070 тут жидко пукнув обмякнет. Еба-а-ать, а ничего поменьше нет? И нахуя там дев-модель с дистилл-лорой, что дает дистилл-модель в 8 шагов? О_о Почему не сразу дистилл-модель? Дистилл модель это же литературно дев-модель с вмерженной дистилл-лорой. Ради 0.9 веса для чего-то там (наверное апскейла), предположим. Не-не, я оценил общее качество и подход с пошаговой генерацией сцен и сборкой в одной видео. Но как-то слегонца пугающе, конечно. Еще и куча нод надо доставить, кроп фейсы всякие. И, к сожалению, у меня нет 5070, а 5070 ти я продал. У меня тока 5070 ти, такие сравнения совсем разбегутся по результату.
>>1638927 > Идея хорошая, но у меня не работает --reservre-vram, все равно забивает 23.4 гигабайта. Блин, ну это жаль, конечно, получили бы лучшее сравнение. А я с 16 гигами нихуя не намеряю норм, туда даже тот самый ван целиком не влезет.
> Если мы говорим про wan2.2 Ну, я бы предпочел LTX, Wan — это прям для максимальных ценителей подождать сто лет ради анимации лучше (и сохранения лица, ну вроде как, по словам фанатов). К тому же, Wan нам уже вряд ли дадут, а на LTX-2.5 шансы еще есть. Но это моя проблема, я считаю, что я предпочту.
Я ща посмотрю, заработает ли --reserve-vram у меня, может я смогу тот же nvfp4 прогнать.
Кстати! Я пока седня думал, мне вдруг дошло, что это еще зависит от PCIe версии и количества линий. На 4.0 x16 влияние оффлода будет гораздо ниже, чем на 3.0 x8 каком-нибудь. Так что, на старичках ты будешь прав, там ускорение и в четыре раза может быть.
>>1637864 >>1638623 >>1638752 >>1638916 >>1638927 А у меня сработало. И знаешь что? Ты ближе к правде! Признаю, я был не прав! Получается, хорошо оптимизировали за последние полгода модели для инференса.
Замер откровенно хуевый, но маемо шо маемо:
Модель нвфп4, 17 гигов. 640х480@121 16 гигов 5070 ti — 8,32 + 6,12 апскейл 4 гига 5070 ti — 30,64 + 14,91 апскейл Итого х3,15 разница. В твою сторону ближе. =) Да и модель не целиком влазит, очевидно, разница будет близка к 4.
Тест очень грязный, но выебываться не буду — в натуре узник рам, получается. Значит, надо копить на 5090 6000, ебал я таво рот нынешние цены на 5090, 6000 дешевле выйдет. И точно упираться не будем.
Все, признаю твою правоту. =) Единственная причина брать 5070 — гарантия, получается. Было бы больше памяти — было бы быстрее.
>>1639198 >Еба-а-ать За то по сути готовый ролик с автоматически нагенеренными картиночками, на вход надо подать только персонажа в 2х проекциях и вид оружия. Ну или запромптить другой ролик.
>>1639218 Я думал загрузить чем нибудь другим видеопамять, пробовал llm маленькой, но там в 12 не попадаю или больше или меньше. Ну хорошо что у тебя получилось, тест конечно грязный, но суть ясна.
>причина брать 5070 Причин брать 5070 вообще нет) Тут или 5060ти на 16 гигов или 5070ти на 16 гигов. 5070 только для игор.
>>1639218 А поробуй теперь с маленькой моделmю, чтоб с энкодером и все умещалось в твои 16 гигов Vs 4 гига Vs 8 гиов Vs 12 гигов Vs 14 гигов Vs 15 гигов, а я график нарисую. Мне интересно просто насколько скачок производительности от размера модели и если малось не влезает. Я б сам хотел, но у меня бомжатские 12 гигов, я не могу модели найти чтоб умещались.
Кстати еще , как проверить на 100%, что все модели с прочими ништяками влезли в врам? Я в диспетчерез задач смотрю когда, то там всегда 100% нагрузка и скачки незначительные.
Ответов нет, штош, я пришел к выводу что лучше не буду рисковать б/у 24 гига, лучше медленно на ужатых моделях, но надежно за ту же цену. 4090 не ти с авиты стоит примерно как 5070ти в днс. И все эти многоходовочки перекупщиков не для аутистов как я.
Господа, хочу напомнить про существование 2080ti с 22 гигабайтами видеопамяти, сейчас на авито за них хотят примерно 33к за версию с турбинным охлаждением. Суть токова, купил себе недавно такую, сравнил на на том же воркфлоу в ComfyUI с Wan 2.2 которые я гонял на своей предыдущей 3090 и получилось намного лучше чем я ожидал.
Стандартные восемь секунд видео с двумя дополнительными лорами и разрешением 512х512 моя 3090 успевала сгенерить за 80 секунд, то же самое на 2080ti 22GB генерировалось за 130, грубо говоря она всего в два раза медленнее, за треть стоимости.
>>1639678 Вот это интересно. Я могу в теории использовать её совместно с 3090 для расширения видеопамяти, или идея провальная и модели не умеют в две карты разных влезать?
Я вам ща кое что открою удивительное - PerturbedAttentionGuidance которая в комфи есть по умолчанию. Время генерации становится выше почти в 2 раза, но моушен ебанёшся какой отличный.
>>1639599 4090 с авито стоит как 5080 с днс и не с проста. А если разговор про 3090, то..... ох ебать она взлетела по цене, хотел себе вторую взять за 50к, а тут такое. Буквально пару месяцев назад валом было по 50-60к на авито
>>1639760 >моушен Если это так, то есть смысл только на high noise part юзать, быстрее генерить будет. Ну я не проверял, а ты примеров не скинул, так что
>>1639778 Ты правильно понял, я опечатался - 3090. То есть ты согласен, что лучше не жертвовать мощностью и гарантией в обмен что несжатые модели пихнуть можно?
>>1639388 Сорян, седня слишком много дел, если и успею, не раньше завтрашнего вечера.
>>1639395 Помню раньше у Киджая был удобный лог в консоли, который писал, сколько из модели в видяхе, а сколько офлод. Но я подключаю щас абы как, не видел этого в консоли. Может лоадер нужно другой заюзать просто.
>>1639678 > 33к > треть стоимости Я не спец в 3090 на авито, но разве не 50-60? Будто бы она вдвое медленнее за вдвое дешевле, не?
>>1639683 Выше я кидал на рэйлайт ссылку, у меня не вышло, может дело в узкой шине второй видяхи. Т.е., если материнка с бифуркацией на 4 псине или с двумя х16 полноценными слотами, то будет ок, но на дефолтной материнке ускорения не ускорилось. х)
В крайнем случае можешь дефолтный мультигпу юзать — текстовый энкодер на одну видяху, модель на другую.
>>1639793 Ну видишь как, 5070-то все равно не уступает 3090, а 5070 ти еще и быстрее. Т.е., тебе шашечки или ехать?
Но смотри мой личный кейс: Я такой сижу с двумя 5070 ти, на одной модель кручу, на другой ллм, чтобы промпты улучшать, радуюсь жизни. Говорю, дай мне фуллхд видео на 20 секунд. А на она мне на этапе апскейла «ебать, ООМ, памяти не хватило». И модель к этому вообще отношения не имеет — видеопамяти не хватает для контекста (разрешение умножить на количество кадров). А если использовать Shared Memory, то время улетит в небеса, вместо 2 минут будешь 1 час ждать. Это не шутка, при выгрузке в оперативу контекста время катастрофически растет. При этом, 3090 будет генерить медленнее (ну пусть будет даже 3 минуты против 2, да? Будем считать, что 5070 ти на 50% быстрее, хотя это не так, конечно=), зато у нее 24 гига, и фуллхд 20 секунд она сгенерит, просто за 5 минут, за 10. Но не за 1 час.
Это реальный момент, на который ты натыкаешься — хочешь сделать длинное и качественное видео ваншотом, а оно физически не лезет в видяху. Причем с 5070 ти это чуть менее заметно, все же лишние 4 гига есть, а вот с 12-гиговыми 4070 ти и 5070 это было заметно прям… прям было, правда.
Но тут опять же, ты можешь просто сделать две сцены, пролонгировать видео, дав на вход последние 16-25 кадров первого видео как начало второго, и склеить потом.
Зато 3090 позволит тебе запустить ллмку, квен и гемму сразу целиком не ебясь. А две 3090 — так вообще пушка. Да, две 5070 ти тоже дают свои 32 гига для ллм и это приятно (Gemma-4-31B-QAT с 100 токенами в секунду, ммм…), но… но…
Короче, ты понял. Это не «лучше» или «хуже», это просто разные варианты.
3090 стоила 60к два года подряд. А я не купил ни одной. Потому что я ссыкло, боюсь брать бу с авито доставкой. =) И все, никаких других причин, субъективно и ничего рационального. Поэтому, что брать тебе — это сугубо твой выбор.
>>1639795 Иногда ты просто сидишь-пердишь и думаешь «ебать я хочу попробовать эту карту!», а потому у тебя появляется возможность ее взять и ты ее берешь.
Я себе так всякой забавной хуиты напокупал. Не жалею, зато мечта маленькая сбылась, было кайфово. Человек хотел 2080ti 22-гиговую — взял. Его право, хотя, ИМХО, она оверпрайс, все же. Ну я хз.
>>1639870 Уступает и уступает. Она и дешевле. Ты вот сидишь с двумя 5070 ти, а у меня не одной, наносек анальнк, зп пол ляма, поэтому в лохито казино играешь и если кинут для тебя это мелочь, еще и поднасрался раздув цены как остальные паникеры, а я уволился недавно и для меня это бешенные деньги, поэтому тут без вариантов.