Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
Вопрос на миллион, на чем щас генерить реалистичные изображения? Ван все еще топ? По квену у меня с лайтнинг лорой генерится хуйня анимешная, без нее лучше, но ждать очень долго. Edit 2509 у меня нормально не завелся, но там допускаю что будет лучше если просто накидать картинок, что б он из них сделал как надо.
>>1386160 Ты ваношизик что ли? В нём никогда не было реалистика, он так же как Квен даже лес сгенерить не может. А у Флюкса есть SRPO, лучше него реалистика пока нигде нет.
>>1386171 Погуглил этот SRPO еще раз, на реддите засрали, мол пердолит флуксовскими артефактами, разве что как рефайнер для квена подходит. Как же у меня горит от всей этой говногенерации, 2 года прошло после sd15, а нормальное в 1 клик так и не изобрели ничего. Каждую неделю какие-то сорта говна выпускают
Дайте пожалуйста гайд как на гугл коллабе запустить, это я вроде смог, но криво и как лору натренировать Есть свежие? Главная проблема с ngrok делал по какому-то гайду с ютюба и из-за него все время отваливалось Может кто-то работает с коллабом? Помоги с рабочими нотебуками и настройкой правильной
>>1386147 Самый простой реализм на ван. Дольше на квен. СРПО не пробовал, не думаю, что там что-то хорошее, потому что на первых двух нужны лоры, чтобы получился хороший реализм.
челы 1 вопрос как на qwen edit 2509 фиксануть пластиковую кожу попробовал самсунг лору, выглядит чуть лучше прогонять через другие модели для рефайна не интересует жопный подбородок для привлечения внимания
>>1386522 Неужели. Рад. Примеры прямиком из 1.5 и это дичайший черипик от автора, с апскейлами, инпейнтами и всей хуйнёй. Пикчи в галерее вообще разъёбные. Происходит что-то печальное, эпичное. Хрому хоть защищают, никто даже не осмеливается писать про мешанину на средних деталях, их сразу минусуют. Пониавтора же все хуесосят вопреки безумной активности. >>1386525 >Downloads (expect in about a week or so)
>>1386582 Потому что пони 7 такое же поломанное говно, как и люминиа. Ещё и вае говно. У хромы те же проблемы с нестабильностью, но хоть не так плохо из-за нормального вае. Никто не умеет готовить DiT и флоуматч. У Квена мыло и ничем не фиксится, ван тоже в стиле рендеров делает всё. Все производные Флюкса страдают от нестабильности и каши. Даже если берём корпов, типа дали/жпт, то там специфичный стиль рендеров с перешарпом. Полторашные генерации до сих пор могут по реалистичности никидать хуёв современным моделям, пикрил мои полторашные генерации начала 2023 на автоматике.
>>1386582 > Хрому хоть защищают Ну это воистину культ, который раз в столетие возникает. Тут нужен особый реформат нейронов, чтобы при виде кронненбергов с пеной у рта доказывать, что там всё идеально. Автору пони о таких последователях даже не мечтать. > Пикчи в галерее вообще разъёбные. Не такие уж разъебаные. Как минимум половина вполне сопоставима результатам на базе шестой пони. Другая половина уровня хромы.
> expect in about a week or so А что там по ресурсам? Много жрет? Ускорялки есть на аурафлоу?
>>1386635 Ты даже на цивит не заходишь? OpenAI хуйня, Higgsfield и Imagen хорошо делают фото без проблем с анатомией. Первая полторашка хорошая, если ничего кроме стоячей бабы не нужно. >У Квена мыло и ничем не фиксится Лоры >ван тоже в стиле рендеров делает всё Руки, ну или хотя бы лоры >>1386650 >при виде кронненбергов Руки чуть прямей пружин и хотя бы две извилины >>1386677 Там ЧЕШУЯ уже, какое мыло
>>1386752 > Руки чуть прямей пружин и хотя бы две извилины Не понял. Прямые руки позволяют не замечать кронненбергов? Ты это имел ввиду? Две извилины - это допустимый максимум для фанатов хромы?
>>1387015 >без картинок с примерами Не обижайся на него. Он профессионал 40+. У него и gpu то нет вообще. Он чисто умозрительно генерирует. Здесь же теоретиков в треде 90%
>>1387571 >мам, я троллю! Да никто и не сомневался, что ты попусту срешь в треде, а твои мудрые советы и пояснения это хуйня полная, ни на чем не основанная.
Можно ли на 12VRAM/32RAM натренить Flux/Chroma и сколько это займёт времени примерно? Пробовал через kohya_ss 1 шаг 280секунд где-то занимает при 768х768
>>1387511 Имадженировал картинку на хроме, лучшая фотка в треде естественно. >>1387742 Что было 10 тредов назад? Мем про 40+ тут с первых тредов, как и мнительный бомж-теоретик.
>>1389048 >Какие лоры кидаешь? Попробуй Lenovo, у меня не меняет лицо Вот я и использую Lenovo и Instareal от того же автора. Может объяснил криво, детали портятся не лица, а окружения. Т.е. если активированы только эти 2 лоры, то картинка реалистичная, если добавляю с нужным лицом, то окружение размытое.
>С lighting используешь? Да, подумал что 8 шагов с 3 лорами + lighting мало, поэтому добавил, вроде стало лучше но не настолько хорошо как с 2 лорами
>>1389831 >>1388804 > нпц ебало момент Да что это значит-то блядь? Это мем из какого-то соседнего треда или просто галлюцинация типа >>1386033 или еще чего? Нихуя не понятно, но очень интересно.
>>1390115 Даже без этих условий >>1390111 Wan 2.1 1.3B нихуя не требует, сможешь без проблем генерить хоть 720p. А на 14B с выгрузкой (как и все) тоже (возможно) сможешь неплохие видео делать, если достаточно рам или хотя бы файл подкачки под сотню гб и терпения.
Пиздец они там ебанулись. Сначала у них вообще нихуя комфи воркфлоу не читались и они скрыли мою бабу, сидящую анусом на кактусе со здоровенным белли балджем с комментарием "докажи, что не реальное фото нахуй", которая два года там спокойно висела. Теперь тупо не дают пнг загрузить и триггеряться на жипег с одетыми взрослыми женщинами, потому что воркфлоу с доказательствами генерации нет в комплекте.
Здарова. Я нуб, вчера скачал comfyui, нихуя не получается, выходит какая-то хуйня нездоровая по 10 минут генерится. Где можно посмотреть примеры workflow типа первого пика тут: >>1385838
Я пробовал inpaint с маской, надо было удалить с картинки лишнюю деталь - вообще полная хуйня выходила. Как люди делают, чтобы нормально получалось, где бы посмотреть примеры?
>>1390341 Покури видеогайды поэтапные. А вообще можешь не ебаться и просто установить Автоматиковские форки, Forge или reForge. На них легче вкат оформлять. Stability Matrix чекни, там без лишней мозгоебли можно установить разные форки в 1 клик
На одном сиде внезапно получилась годнота, но нужно немного фиксануть лицо. На каломатике можно было дополнительный сид подкрутить, есть что-то подобное в комфи? т.е. что бы совсем немного вариации добавить
>>1390296 image saver используй для сохранения в отдельную папочку, он без воркфло сохраняет но с читаемой цивитом метадатой которую можно и фильтровать автоматически от неудобных тегов, типа лолита фэшн.
>>1391617 Ебанутый? Ещё на ранних версиях Хромы генерило лучший реализм на локалках, пока не вышли српо и лоры на квен, и возможно, krea, если хорошо запромптить. Это тебе не файнтюнчик, обученный на миллионе фотографий пизды. Чтобы получить нужный стиль и качество фото, придётся перепробовать много токенов и значений CFG.
Какой лучший способ ускорить Хрому? Флеш пережаривает, в турбо какой то шум и качество говна, может есть где то воркфлоу оптимальный? Неужели ждать по 1-2 минуте с cfg=3
>>1391818 > Чтобы получить нужный стиль и качество фото, придётся перепробовать много токенов и значений CFG. Ну это как раз понятно. Ты уже месяц пытаешься нароллить пов бабу сидящую на верхом на вьюере, хуй снаружи, живот обкончаный, она наклоняется вперед. Непонятно только то, почему ты считаешь необходимость роллить больше месяца чем-то хорошим, а не наоборот.
>>1391868 >ты пытаешься >ты считаешь На таблетки перестало хватать? Судя по шизоидному ответу, тебе нихуя не понятно, модель создана для файнтюнов, обучена и генерит абсолютно любой стиль, без перевеса в качественное фото или красивый арт, и разумеется, она не прочитает твои мысли и не сгенерит тот тип фотографии, что нужен тебе.
>>1391923 > генерит абсолютно любой стиль, без перевеса в качественное фото или красивый арт эти качественные фото и арт сейчас с тобой в одном файле подкачки?
Ребяты, давно не следил, что у вас там... Хочу вкатиться и генерить фотки голых баб. Краем уха слышал, что новые версии sd с этим плохо с этим. Внесите ясность Что делать? Какую нейронку ставить ?
>>1392131 Если видеокарта 8 Гб SDXL - то можешь юзать BigLust - вполне себе гибкая модель. Если видео больше 8 Гб, то можешь Хрому попробовать, там тоже параметры под гибкие руки хорошо подстраиваются, можно получить нужный тебе результат
>>1393313 >DMD, кста кал, который режет вариативность Ебана. Когда я сюда когда-то писал, что у квена(?) нет вариативности. Тупо одно и тоже выдаёт с разными сидами, что именно ответил этот тред? Это блять, не баг, а фича. Типа так и задумано! Двойные стандарты, как обычно.
>>1393327 > Двойные стандарты, как обычно. Это отсутствующие стандарты, а не двойные. И это не тред тебе ответил, а один шиз. Там уже ничего человеческого не осталось в нем, полностью слился с нейронками. Поглощены миллионы страниц теории и рекламных видео от разработчиков. Он точно знает, что то что вышло больше года назад - кал, и так же точно знает, что если модель создана для файнтюнов, то она генерит абсолютно любой стиль, без перевеса в качественное фото или красивый арт, даже проверять не нужно. Одну и ту же пластинку еще с SD2.0 крутит - новое лучше старого в любых ситуациях.
>>1393700 метохуй, если бы ты хоть чего-то знал в этой жизни, то ты бы не обобщал/отождествлял отдельные мнения неизвестного количества анонов до единого "мнения треда"
>>1393822 Токсик-серун создал амтосферу, в которой ноль желания что-то постить, любая картинка используется только как повод доебаться, а чего ради мне тут жопу свою выставлять для пинков, я не ебанутый.
>>1385807 (OP) Попробовал хрому, 60 секунд на картинку 1024х1024 с 16 степсами что-то какой-то пиздос. Это нормально? Обычная NooBAI аналогичное выдает за 5 секунд где-то. 5070 видяха.
>>1394056 хрома долгая, да. даже дольше генерит чем флюкс на котором она основана, в чем-то автор проебался при тренировке мб. если ты не генеришь какие-то совсем дефолтные аниме пикчи, то оно того стоит, натуральный промпт в котором можно расписать все детали от и до жестко подсаживает. но я хз стоит ли ее прям рекомендовать для нон-реализма, в моих руках работает пока нестабильно.
>>1394068 Посоветуй чекпоинт, ибо все sdxl производные заебали. >>1394064 Ты не понял суть. Повторю: Нуб генерит за 5 секунд, а эта хуйня в 10 раз дольше.
>>1394127 а кроме хромы по сути нету нихуя за пределами sdxl. потому что даже эксельку натренировать это нужны бабки и труд, а на моделях покруче там пиздец суммы ебанутые. слышал что квен вроде неплохо в аниме умеет из коробки, сам не пробовал.
>>1394545 в итоге не как получится юзать это с моим объёмом? А загружать в оперативку или в pagefile? Просто я думал для меня с таким железом в ван вообще вход закрыт, а оказывается можно было. Подумал может такая же хитрость с Flux.
Как же я угорел по генерации, но уже несколько недель пердолюсь, а нихуя не нравится. Артефактов дохуя, приходится ебаться по 2 дня с 1 картинкой, хотя реализм на ване с лорами мое почтение
>>1394901 для стилей требования к датасету другие датасет должен быть большой, 40-100 пикч навскидку, может прокатить и меньшее количество, он должен быть хорошо запромпчен чтобы единственной неизвестной переменной на пикче для модели оставался сам стиль, вот это самое главное. еще могут быть настройки которые лучше подходят именно для тренировки стиля, за них не шарю.
>>1394769 В итоге, сегодня целый день ебался, и за день 2 пикчи прям топовые сгенерил. Осталось еще с апскейлерами заморочиться, и будет топчик. Пишут supir или через флакс щас самый топ.
>>1395545 Сажа ускоряет, а нунчака ускоряет. Пынямаешь? Первое хуй знает как это делает, инструкции видеокарте как-то иначе отсылает, а второе идёт вместе с переделанной сжатой моделью с меньшей точностью и кодом для её запуска. Этот svdquant меньше занимает гпу, да ещё и намного быстрей работает.
>>1395639 >Первое хуй знает как это делает, инструкции видеокарте как-то иначе отсылает Не инструкции. Если грубо обобщить, сажа - разновидность кеша. Более оптимизированного, но не такого универсального, потому не везде от нее выигрыш. Но где есть - там есть. А вот qwen-edit от нее ломается, скажем.
Как то странно qwen image edit работает, иногда переносит лицо, а иногда рисует похожее. Промты типо оставить как есть, не трогать лицо вообще игнорируются. С первого пика пробую.
>>1385807 (OP) Аноны, подскажите, есть вариант генерировать персонажей своих без лор? Заливаю фото/рисунок своего перса, и генерируют разные пикчи с один и тем же персом? Пробовал генерацию из картинок делать, но чет хуйня вышла.
>>1396025 Если анально огороженные онлайн-модели, то Seedream 4 и Nano Banana. Если запускаемые локально, то Qwen Image Edit 2509 и Flux Kontext Dev, в этом случае грофон будет поплоше. Есть много других вариантов (XVerse, UMO, DreamOmni2 и тому подобное), но в целом все это не стоит возни, на мой взгляд.
Господа, помогите. Решил попробовать NetaYumev35_pretrained_all_in_one. Использую пример воркфлоу от разработчика, комфи ни на что не жалуется. Но при попытка генерации только это: [ComfyUI-Manager] All startup tasks have been completed. got prompt model weight dtype torch.bfloat16, manual cast: None model_type FLOW Using pytorch attention in VAE Using pytorch attention in VAE VAE load device: cuda:0, offload device: cpu, dtype: torch.bfloat16
C:\ComfyUI_portable>pause Для продолжения нажмите любую клавишу . . .
Я не пойму в чем проблема. На этапе загрузки чекпоинта вылетает. Видеопамяти 16Гб, оперативки 64Гб.
Какая модель лучше всего фон удаляет? Вот тут - https://stabledifffusion.com/tools/ai-background-remover какая используется? Мне нужно удалить фон у 30 где-то фоток, поэтому нужна локальная модель, чтобы сразу стопку загрузить.
Блять мне flux ЦП рисует, я пишу в промте: a beautiful young girl with heterochromia of the eyes is completely naked, covering her nipples and large breasts with her hand in black panties, high black leather boots and fishnet stockings, standing near a billiard table in a bar, high resolution, cinematic matte color grading, fine art photography style Мне выдаёт вообще девочку
>>1396889 А янг герл это по-твоему что? Герл это само по себе девочка, а тебе надо чтоб она вообще янг была, хули ты ждешь. Надо вуман писать вообще. Готовься к киче теперь, данные полюбас уже отправлены куда надо.
Ребятки, подскажите ноду которая на вход принимает имя файла, а на выходе - метадату в string. Я нашёл только LoadImageExtended из Chibi-Nodes, но я хз как ему на вход имя файла подсунуть.
>>1396959 Спасибо большое. Только тут та же беда, что и с LoadImageExtended. Я не понимаю как строку example.png подать на вход этой ноды, там какой-то спецовый объект надо.
>>1397200 Чел, там средства разбора уровень понимания промта - ну совсем разные по возможностям. Хуйню ты сам выдал, когда начал с практикой от SDXL к FLUX подходить. Просто забудь все что про промпты SDXL знал, начинай заново. Скармливать промпт как для SDXL флуксу - это солярку в спорткар заливать...
Аноны, прошу совета. Хочу вкатиться в контролнет через комфи с моделью SDXL. Где можно хороший и простой воркфлоу подсмотреть? Или кто может поделиться?
>>1397306 перестаньте блять для каждой отдельной функции просить какой-то ВОРКФЛОУ БЛЯТЬ, все что тебе нужно это добавить две дефолтные ноды и понимание как их использовать, за этим пиздуй на ютуб
>>1397400 Дык речь не о том, чего вообще SDXL может или не может. Речь о том, что один и тот же, совсем одинаковый промт будет по разному разобран и понят флуксом и sdxl. А как конкретно - это уже конкретика, извиняюсь за тавтологию. Просто не надейтесь, что будет одинаковый результат. :)
>>1397489 Если она у тебя сферическая и в вакууме - то да. А так - промпт всегда значимый весь, и разбирается целиком. Даже "young girl, fashion" и "young girl, dollhouse" дадут разный результат, в смысле возраста.
>>1397738 Ебанутый? Очевидное квеновое мыло, скорей всего со слабой фото лорой. Либо какой-то srpo, не видел его фактуру. Генерации не плохие. >>1397403 >включая ван Ты VACE (и прочие чужие разработки) называешь контролнетом? Ну, если считать это именем нарицательным, то ок.
>>1397791 да в принципе большинство называет. в контексте вана часто говорят просто "контроль видео". я хз используется ли код того самого контролнета в этих моделях.
Напитонил скрипт для превращения тегов с данбуры в нормальные теги для обучения (стилевых) лор. Убирает словесный понос, характерный для данбур, удаляет теги по блэклисту, конвертирует имена рисовак в class tokens. https://github.com/Seedmanc/token-merging-4-training
>>1398194 Учту, спасибо. Я еще удивлялся, почему ямла нет встроенного. >>1398209 Большинство аниме-моделей все-таки на тегах обучалось (и хочется верить, что эти теги тоже обрабатывали). Ну и я уже разучился на натуральном языке промтить, проще 1girl писать.
>>1398084 Вот эту пробовал https://civitai.com/models/1790792 Даже скачал квантованную на 2,5Гб и геммой - https://civitai.com/models/2023440 Результат один и тот же, тупо вылет без ошибок. ComfyUI обновлена, недостающие ноды поставлены. Судя по комментам у всех она работает без проблем. Однако хрома работает, но мне не нравится.
>>1398099 Это пример, в котором я ничего не менял. Там говорят, что эти строчки в начале обязательны.
А кто нибудь помнит такую забытую технологию древних - instantID? Там можно из 2х фоток в SDXL любого перса без лоры генерить в любой позе с сохранением в точности лица и выражения. Так вот, есть ли возможность это сделать в qwen или wan?
instantID Как будто бы был точнее. Квен (помимо мыла) добавляет какие то мелкие детали, которые делают лицо уже чут чут другим, вроде бы похоже а вроде бы и нет. А вот у instantID все как с референса, даже если с косяками, человека уже можно было узнать
>>1399256 > AFTER MORE TESTING, IT SEEMS LIKE EXTREMELY LONG PROMPTS GIVE MUCH BETTER RESULTS.
походу это пенсионеры кумеры у которых развитие остановилось на сдхл по старинке ебашут промпт двумя тегами, когда нужен натуральный детальный промпт. что не исключает возможности косячности самой пони v7
>>1399327 Ты так написал, будто необходимость простыней текста для банального отсутствия уродливой кривизны это нормально, и мы должны адаптироваться, а не нахуй слать такую систему. Впрочем, я у пони7 ни с какими промтами хороших примеров пикч не видел, увы.
>>1399376 > будто необходимость простыней текста для банального отсутствия уродливой кривизны это нормально, и мы должны адаптироваться, а не нахуй слать такую систему А чего еще ждать от хромакуколда? У них иначе никак.
>>1399376 Ты какой-то тупой. Если новые архитектуры иначе не генерируют, терпеть нужно тебе, имбецильному дауну, а не откатываться на некромодели. Благодаря этому они слушают промпт и могут генерить кучу всего, не смешивая. Все онлайн-сервисы недоразвитость промптеров, таких как ты, решают ллм-агентами, а не даунгрейдом нейросетей.
>>1399376 я так написал как будто > что не исключает возможности косячности самой пони v7 но то что дауны игнорят гайды по промптингу, которые уже выложены на цивите автором модели и ожидают что им по промпту "1girl, blonde hair" вылезет что-то кроме кала, это рофл
>>1399438 Кул стори, бро. Жаль, что никакие современные модели так не работают, а спокойно генерят нормальные пикчи хоть из одного слова, хоть из пустого промта. Уж точно нигде от нехватки слов картинка не превращается в размазанное глючное дерьмо. Ты эту хуйню только что просто выдумал.
>>1399472 Ебантяй, промпт дописывается. То, что пони это кал, то ясно. Но требовать от новых моделей генерации по коротким промптам это какая-то умственная недоразвитость.
>>1399501 Чел, ты 6-ую поню вообще живем в чистом виде трогал? Практически та же херня ведь была на выходе. Капризная и непонятная, по дефолту - детсадовская мазня на выходе. Я с ней игрался неделю - ничего кроме шлака разной степени не получил, руки кривые слишком. Только через пару месяцев появились тюны которым и ''one girl standing' достаточно. Я не говорю, что 7-ая - это что-то достойное получилось, но твой нахрюк - совсем мимо. Там не оправдания а факты. Ждем тюнов...
>>1399496 Бля. Я конечно понимаю, что он сильно расстроился, когда лицензию sd3 увидел, но продолжать долбиться в аурафлоу в 2к25 - это воистену sunk cost fallacy. Хули она даже "Pony" не смогла написать-то? Уж одному слову можно было научить.
Что посоветуете 12GB быдлу из тюнов на SDXL? На цивите посмотрел самые популярные модели и все они генерируют какую-то пластиковую хуйню с одной и той же мордой.
>>1399635 до сих пор юзаю. вполне себе хорошая модель и по генерациям от пользователей и по собственному опыту. поэтому много людей плюется, когда видит, во что превратилась 7 версия - видит кривое нечто, которое ещё надо допиливать
>>1400057 >где ваши пруфы?! Ты реально не видишь иронии в своём посте или это такая попытка в толстенный троллинг в мертвом треде? >>1400066 пруфопетух.жпг
>>1400111 Он по всем 4 моделям которые пытается скачать такое выдаёт. Это я просто концовку там скопировал. Max retries exceeded. face_yolov8s.pt: 0%| | 0.00/22.5M [00:10<?, ?B/s] face_yolov8s.pt: 0%| | 0.00/22.5M [00:21<?, ?B/s] face_yolov8s.pt: 0%| | 0.00/22.5M [00:32<?, ?B/s] face_yolov8s.pt: 0%| | 0.00/22.5M [00:43<?, ?B/s] face_yolov8s.pt: 0%| | 0.00/22.5M [00:54<?, ?B/s] face_yolov8s.pt: 0%| | 0.00/22.5M [01:05<?, ?B/s] [-] ADetailer: Failed to load model 'face_yolov8s.pt' from huggingface
>>1400215 Либо конфиги смотри, либо системный ВПН накати. РКН пару дней назад в очередной раз наебнул клаудфлару, даже совершенно безобидные сайты теперь без обхода не открываются. Если в браузере еще можно расширениями обойтись, то для вот таких штук только системный ВПН поможет. Ну или можно те же антизапреты/ГДПИ в роутер попытаться забить, но это я не пробовал.
>>1400269 Да потому что НАХЕР не нужны эти гиты, менеджеры и т.п. хуйня. Плагины должны устанавливаться посредством копирования файлов в папочку, а не через ебучие вечнолезущие в интернет менеджеры.
DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion https://noamissachar.github.io/DyPE/ Дотягивает разрешение до 4K × 4K и выше. Учитывает временную составляющую и прогресс в появлении деталей в процессе деноизинга. При этом не требует ни дообучения, ни дополнительных затрат на сэмплирование.
>>1400351 Оно откидывает 90% вариативности и лепит по усредненке, попутно выкручивая кфг. Можно сказать что результативность не единицу генерации становится лучше, проблема в том что этот результат является конченым слопом.
>>1400348 Я помучился и сделал себе самодостаточную версию, бэкапнул венв в архив, и положил в сендбокс, после чего запретил сендбоксу лезть в интернет. У меня теперь полностью оффлайн пайплайн, можно хоть шлюзы за пределы РФ вообще отрубать. То же самое с трейнерами.
>>1400388 Правильный выбор. Весь тред фапа на ваших подруг из nf забит кривым флюксо-слопом, но хомяк даже не просекает, что это не фото и пилит видосы с раздеванием и горлотраханьем. Если уж нейроанон не может от фото отличить, то обычные вкантактуны и подавно не станут превью открывать.
Сап двач, пришел просить советов мудрых. Нашел следующие пики и решил, что вот оно, моё, хочу научится делать так же. Поставил ComfyUI, есть видюха, научился чет генерить, но как достичь подобного уровня? Здесь дофига разных лор + апскейл?
Чё за шляпа, обновил Комфи, теперь он предлагает генерировать через Квен, которому, как написано, нужно 16 гигов, а старый воркфлоу из примеров не работает, выдаёт CUDA error: no kernel image is available for execution on the device. Что за говно? Теперь ещё и модели с цивитая перестали качаться чё-то. Пиздец, чё началось-то? Хоть не обновляйся вообще.
>>1400716 Если на пикче провода, шланги артефачат, круги - не груги, ассиметрия там где должна быть симметрия - это сдохля СДХЛ, люстры и т.п. кал может даже хрома. Ясное дело лора может быть дохуя на всякое. Топтир сейчас флюкс с лора, ван/квен. Но не их тюны. Тюны и мержи кал. Лучше лора подрубать. Если хочешь именно как на пике твоём, то как анон выше написал - качай люстротюны с фотореалистик.
>>1400719 Спасибо большое, я буду пробывать. Я в последний раз тыкал нейронки когда дрочить было на них невозможно, а сейчас прям глаз зацепился, приятная картинка.
>>1400729 Спасибо, буду тестить всё что ты написал
Че случилось с цивитом. Они там опять алгоритм поменяли или шо. Раньше я постил картинки через запланированный постинг и стабильно получал на них лайки, хотя бы по пять-десять на каждую прилетало стабильно. Сейчас делаю все точно так же и получаю хуй с маслом, пять лайков уже чудо, чаще один-два. Это все из-за хуйни с синим баззом?
>>1400831 Анимация хороша, но сделай сцену динамической. Чтобы фон двигался. Чтобы эти шланги и провода ползли и раскачивались. Что-то там крутилось бы. Ещё, если цфг не единичка, то используй стандартный предлагаемый негатив из шаблона Вана. Там хорошо режется статика.
>>1401154 > нормально Если ты знаешь, как её "нормально" пробовать, то почему сам не пробуешь, а в треде спрашиваешь? И почему тебе кажется, что все предыдущие её пробовали не "нормально"?
>>1401181 Бля, ну он сколько ее делал блядь - года 1.5 >>1401191 Я не знаю, поэтому и спрашиваю, логика, дружок. Потому что картинок на сивитае мало и они всратые блядь.
>>1401202 > и они всратые блядь Так и есть. Может кто-то на цивите возьмется её допиливать и сделает что-то нормальное, как он уверяет. А может и не сделает нормальное. А может никто и не возьмется время терять и ебстись с аурафлоу, когда есть другие варианты, которые еще и промпт понимают лучше. > логика, дружок Логика подсказывает, что если ты спрашиваешь про "нормальную" проверку, значит считаешь то, что уже есть в треде не "нормальной". Впрочем, похуй.
>>1401221 Ну в треде вроде пару картинок вкидывали, но я про в целом интернеты. Посмотреть бы где-нибудь большую выборку генераций. Зачем пониняша столько ресурсов въебал на хуйню? Мне его жалко.
>>1401236 > Зачем пониняша столько ресурсов въебал на хуйню? Как-то так >>1399650 > sunk cost fallacy
Он начал въебывать ресурсы, когда ему казалось, что это лучший вариант. А потом скорее всего просто стало жалко уже въебаных ресурсов и не стал начинать сначала на чем-то другом. Или может у него бабло на ресурсы было со strings attached и не на чем другом пилить седьмую поню не было возможности. Хуй его знает.
Чому у меня Мусуби на тренинг Квен-Эдит-Плюс-2509 жрет на 10 слоев больше памяти чем на просто Квен (не эдит), а время дает в 2 с хуем раза дольше, если модели по размеру одинаковые?
Для просто Квена на 24гб 16/40 слоев оффлоад, для Эдита - 26. Но просто Квен с таким оффлоадом все равно намного быстрее.
И кроме самой базовой модели ничего менять не надо, энкодер тот же?
>>1401432 Используй Lenovo, Samsung, True Realism, Goontune лоры, их комбинации в разных пропорциях. Не бойся пробовать ставить cfg повыше. У меня самый топовый реализм (вообще, в целом на среди всех локальных моделей и лор) получался вообще без лор, на цфг 6. Но это в основном woman standing без экшена и без сцены, просто белый фон, analog photo, без дополнительного описания стиля. Самое главное - не юзай буру теги. Попробуй взять средней длины описание из JoyCaption, убрать из него стилистическое описание и добавить что-то про candid, analog, low quality, amateur. Должно получаться хорошо.
У хромы лучшая работа с текстурой (по крайней мере с учётом скорости по отношению к полному квену). У квена - с формой. Ван 2.1 lx2v - средний быстрый компромисс + топовый инпейнт/аутпейнт вокруг лица за счёт VACE.
Так, нид хелп. Короче есть деньга до 90к. Собираюсь брать 5070 ti ща как раз пока скидоны на 11.11 Но есть нюанс, вроде как обещают скоро линейку супер и даже вроде как цены будут такие же как на ti но видеопамяти больше. Имеет ли смысл подождать 5070 ti super на 24 гига или же наши барыги цены заломят за 100к?
>>1401800 Ориентируйся на размер врам, остальное не важно, ну поколение 50ХХ хорошо тем, что на уровне ядра может в FP4 нативно и ещё пару технологий важных для ИИ
Ребят, для локального запуска лучше ноут хоть как-то сойдет? Если для работы. Просто переезжаю регулярно, нормальный ПК собрать и таскать не вариант, ранпод и облака не то.
Я уже думал попердолиться, и подключать внешнюю ГПУ к ноуту по тандерболту, я хуй знает что делать. Может есть уже решения?
>>1401979 Ты не согласен? Думаешь лучше следовать совету безавторитетного авторитета независимо от результата? Только сгинирил картинку на хроме и другим советую, лучшая фотка в треде естественно.
Какое же это ебучее говно этот комфи ваш просто ебаный пиздосий. Почему блять нынче делают софт, который буквально на глазах разваливаются чуть стоит не туда ткнуть, какие-то зависимости конфликтующие, не то поставил - переустанавливай всё к хуям, сноси, хуй соси. Весит, блять, десятки гигабайт, жрёт оперативу, интернеты, время. 30 лет назад 95ую винду с кучей прикладного софта запихнули в 100 мегабайт, оно могло стабильно работать без ежедневных апдейтов на 35 гигов каждый, без миллиарда зависимостей и прочей ебалы. Прости, Кнут, мы всё проебали.
>>1401919 Минимальный ноут с 12Гб начаинется от 150к. Неттопы тоже примерно так же. Можешь поковыряться в носимых корпусах вмещающих полноразмерную видюху. Но там тоже едва ли меньше 100к выйдет.
Пока диффузию для m4 оптимизируют, ожидать разумных носимых вариантов не стоит.
>>1402076 Уже бы и сам за 3 часа мог попробовать инпейнт на ване, чем всю эту хуйню нести. Ты думаешь тот анон тебе щас покажет чего и куда подключать? Максимум напишет "всё идеально инпейнтится атвичаю", без картинки естественно и тем более воркфлоу, который тебя за руку держать будет и шнурки вместо тебя завяжет, и с ложечки покормит, и горшок за тобой вынесет.
>>1402082 Тут вопрос коммьюнити - будут ли они заёбываться и пилить оптимизацю. В сегменте лоКАЛьных LLM такие задроты нашлись и эпл сегодня однозначный фаворит.
Анончики имею 12 гигов видеопамяти + 16 ОЗУ и 2тб нвме (маловато знаю в 2025 но пока руки не дошли закинуть ещё 16) что можно потыкать с таким набором?
>>1401488 Какая-то чухня, или у меня лоры срут?.. На 1.4-турбо, если промпт не переписывать, на всех сидах почти одна и та же картинка выходит. Ща еще обычную попробую.
Как ваще затестить, насколько на лору влияет: - выбор картинок для датасета - выбор кэпшнов для датасета - выбор настроек тренинга лоры - выбор настроек применения лоры - промт в финальной генерации ?
По-хорошему надо арендовать йоба-сервак, и настроить агента, который бы все эти варианты перебирал. Руками это год можно сидеть.
>>1402638 Хорошо >10 минут Страшно. В некоторых местах текстура, отдаленно напоминает генерацию в 6 шагов на турбо. Странно её видеть при таком времени генерации. 20 шагов - 2-3 минуты.
>>1402126 >считает риторическими вопрос является ли ван лучшим для фоторила >ещё даже не качал ван с таким подходом ты уже почти топ креатор треда лол) осталось только начать поливать говном тех, кто постит картинки, а не просто срет текстом, и тогда точно будешь лучшим. видюха и пекарня даже не нужны, главное просто переспорить хрома-словоблуда)
я не понимаю как лоры на квен обучать. обучаешь её, обучаешь а кожа всё равно страусиная и мыло. подключаешь к ней какую-нибудь реалистик лора, хуяк фотографическое качество, кожа 1 в 1 из датасета. оставляешь только реалистик и опять страусиная кожа. сделай всё в одном ты мразь
>>1403260 Там всего 32В вместе со всем барахлом. Даже в Q6 взлетит на нормальных картах без оффлоада. Но я думаю нам эта хуйня не нужна, её никто в комфи не запилит, т.к. даже в репе китайцев в TODO допил функционала генерации пикч. И по скорам оно не сильно лучше Квена.
>>1403111 О, жиза, кажется. Вроде, на ранних эпохах все хорошо, но узнаваемость не такая хорошая как на более поздних эпохах. Костыль: генерить общий план на ранней лоре, а лицо на поздней. На какой видеокарте обучаешь?
Какое же это всё говно. Почему я могу генерить прон только на модели 2 летней давности? Все эти флаксы, ваны, хуяны - бесполезная сейфти срань. Хрома вроде что то может, но с релизом финальной версии нихуя не поменялось, всё так же одни мутанты
>>1403591 > в соседний тредик Нахуя? А главное зачем? Если бы нужен был анеме сисик, он бы изначально там написал бы, не? > аниме сисик генерировать Аниме сисик генерится на любой модели без проблем со времен сд14. Любые косяки в виде кривых/рваных линий и даже лишних рук запросто списываются на "это стиль такой".
>>1403595 двачаю. любой пик из шапки соседнего треда был бы тщательно обосран в этом треде будь он не аниме, скорее всего самим автором большинства пиков из шапки соседнего треда лол
>>1403590 Пиздец как оно работает - генерит следующий кадр, а не по референсу как Квен. Из-за этого нельзя в другом разрешении сгенерить и качество референса перетекает в генерацию.
>>1403608 В воркфлоу Вана без проблем работает, 8-шаговая лора тоже работает. Ставь генерацию 5 кадров, остальное как в Ване 2.1. Результат будет после 1 кадра. Но мне пока не нравится, хуже Квена.
>>1403610 Ну, значит делаем препроцессинг с ресайзом и обрезкой прямо на соурс-пике, а потом уже скармливаем на вход CE. Пока не звучит как что-то убивающее смысл.
Мне вот интереснее - насколько оно может менять позу, при этом точно сохраняя фон неизменным, и лицо персонажа без искажений. Чтобы ключевые кадры анимации делать, для Wan'а же.
Как назло - сегодня времени не будет нормально заняться и проверить...
>>1403644 Промпт точно хуже Квена понимает. На некоторых пиках вообще отказывается реагировать на промт, тупа оставляет оригинальное фото без изменений. Позы очень плохо меняет, пытается коллаж сделать. Хуйня какая-то. Может надо как-то по особому генерить, ждём нормального воркфлоу, мне лень пердолиться дальше.
>>1403651 >потестил Иии? Есть простой способ понять получилось ли у тебя что-то хорошее, но этот способ требует времени. Откладываешь в отдельную папку картинки. Не очень много, до шести штук. Потом просто ждёшь сутки или больше, затем смотришь эти картинки. И видишь все недостатки, которые ты не мог увидеть сразу после генерации. Я теперь так делаю. Раньше выкладывал в этой теме свои шедевры. Потом, на следующий день, я смотрел на них и не понимал как мне вообще пришла мысль их вообще сохранить и даже выложить здесь. Очень помогает. Если через сутки картинку снова хочется рассматривать, то это цепляющая картинка.
>>1403671 > Я теперь так делаю. А нельзя ли так же и с текстом сделать? Пишешь ответ в тред, но не отправляешь его, а копируешь в блокнот. Потом на следующий день перечитываешь его. Если он всё еще имеет смысл - отправляешь. Я понимаю, что при таком подходе постов с текстом тут будет еще меньше, чем постов с картинками, но лучше так, чем 30 картинок на 400 постов с шизофазией.
>>1403671 картинка смотрет названя картинка читат картинка нраица, название картинка запоминат по названию картинка искат качат картинка не нраица, название картинка запоминат не качат
Я как прошаренный с айсикю больше 1, смекнув что цивиткал блокирет ркн иногда, как-то начал бекапить всё на хагинфейс, т.к. оттуда удобно было пулить. Представили щас моё ебало, когда я решил скачать пару своих моделей оттуда?
Если юзать контролнет, то есть разница между Эдит моделью и обычной? И с ним будет вообще отличаться от просто хорошо составленного промта и подобранного кфг в Эдит модели?
Далеко от компа и пока собираю так сказать теорию. До этого недолго тыкал sdxl в фордже, результатом был не очень доволен. Вопросы к мудрецам: 1) ComfyUI самое гибкое и универсальное решение, верно? 2) у меня 4070, смогу пощупать qwen и насколько это будет больно? 3) хочу генерить сисик-писик, qwen может? Или на что обратить внимание?
>>1403827 >ComfyUI самое гибкое и универсальное решение, верно? Самое лучше это сварм, потому что во первых полностью включает в себя комфи, вплоть до возможности просто пользоваться одним только чистым комфи, а во вторых дополнительно обладает интефейсом, похожим на сд. Любые настройки в интерфейсе одной кнопкой переносятся в функциональный воркфлоу комфи, а любые воркфлоу комфи одной кнопкой переносятся в сд интерфейс. Я хз почему это мало кто использует итт. >меня 4070, смогу пощупать qwen Это будет больно и имхо - того не стоит. >хочу генерить сисик-писик, qwen может Может, но это забивание гвоздей машиной для забивания свай. Готов по 5 минут ждать вот такого качества картинки >>1402880 →, когда что-то такое можно с закрытыми глазами и рандомно нажимая клавиатуру при написании промпта сгенерировать в сдохле секунд за 10?
>>1403863 Бля, щас перепроверил, хагинфейс и так работает без впн и т.п. лол, только что не работал, пару дней дрочился. Так нахуй, надо на облако мылосру всё бекапнуть.
>>1403827 Я свежий вкатун. На дефолтных настройках лора 32/16 на Квен Эдит до недоваренной но юзабельной с силой 1.5 тренится на 3090 за ~1700 шагов ~12 часов. Хз может на других настройках будет тренить намного быстрее без потери качества, но на таких с 4070 ты охуеешь. А если не тренить а только генерить - то на чем угодно можно, там необязательно фул модель юзать, можно скукоженные.
>>1403904 да qwen даже не заведется в automatic1111.
Да, я знаю что это старинная прога и памяти надо бы побольше, но видюха только на 8гб. Да и хочу разобраться в историческом контексте. Как же год назад художники вообще действовали?
>>1403903 img2img рисует свою картинку, условно основываясь на твоей, причем опирается он в основном на общие контуры, силуэты, цвета, а вовсе не мелкие детали, которые первым делом размываются шумом. Тебе остается только контрол-нет осваивать, там больше инструментов для сохранения исходного пика, хотя тоже не идеально по части лиц.
Вот я наблюдаю как тян играет в эти ваши новеллы на телефоне (забыл на называется, но это очень популярные игрушки) Там все картинки как будто штампованы. Вот мне и захотелось разобраться! Как сейчас художники их штампуют ?
>>1403921 Если ты хочешь наштамповать не абстрактное левое изображение, а не посредственно продукт самой нейронки (т.е. изначальный пик сгенерен в ней же), то тогда сходства у персонажа добиться намного, потому что одна и та же модель при одних и тех же настройках всегда будет рисовать очень похожие лица.
>>1403810 Попробовал и нихуя не понял. Еще раз, задача: заменить перса на изображении.
Если юзать просто промт: оставляет все детали из изображения, но проебывает необычные положения головы/выражения лица перса, старается их сделать более дефолтными.
Попробовал контролнет: отлично сохраняет положения головы/выражения лица, но проебывает детали изображения.
>>1403954 Короче очень странно. Решил заново шаг за шагом идти от обычного воркфлоу к контролнету, и у меня каким-то хуем сразу поломался и обычный. Полчаса генерил хуйню, потом так же внезапно починился, и после этого заработал полностью и контролнет. Похоже что комфи закешировал че-то не то, и какой-то слой фейлил рассчеты, но вместо того чтобы хрюкнуть ошибкой просто молча отдавал дальше что успело до него отработать.