/ai/ - Stable Diffusion тред X+176

Stable Diffusion тред X+176 /sd/ Аноним 09/12/25 Втр 18:54:22 № 1448719 1

Тред локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• Z-Image-Turbo
• Flux 2
• Qwen Image и Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза. Пример: 4-8 шагов, CFG 1. https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion
Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)

► Предыдущий тред >>1438893 (OP) ► https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03

Аноним 09/12/25 Втр 18:56:02 № 1448724 2

>>1448719 (OP)
Поделитесь последними годными воркфлоу, лорами и промтами для Z-image плиз. Ну или просто добавте их в шапку

Аноним 09/12/25 Втр 19:01:34 № 1448737 3

>>1448724
>промтами
1girl, naked, big booba

Аноним 09/12/25 Втр 19:04:58 № 1448740 4

>>1448724
на, перетащи в комфи, сам юзаю, все мои наработки, не жалко для анона

Аноним 09/12/25 Втр 19:07:08 № 1448744 5

>>1448740
Неужели наконец картинка с метаданными, вот что значит 2025 год!

Хоть промт заберу, спасибо

Аноним 09/12/25 Втр 19:08:15 № 1448746 6

>>1448724
Я хз чё вы там зетку пердолить пытаетесь. Она изкоробки просто работает. Что пишешь - то и риусет.

Аноним 09/12/25 Втр 19:09:45 № 1448749 7

>>1448746
не все это поняли ещё, травма от сдохлей и ванофлюскалов осталась у многих

Аноним 09/12/25 Втр 19:11:33 № 1448753 8

TA-2025-11-28-1[...].png 1397Кб, 1024x1024

>>1448723 →
И пиксельвэйв еще на зетке хотелось бы.

Аноним 09/12/25 Втр 19:14:36 № 1448758 9

>>1448746
Потому что я хз, может я что-то делаю неправильно или неправильно для нее пишу промт.
Пока у меня претензии только к тому, что нет лор и приходится прописывать стиль через жопу и их мало. Но это базовая модель.

Аноним 09/12/25 Втр 19:15:11 № 1448760 10

>>1448740
какой у тебя маленький

Аноним 09/12/25 Втр 19:15:22 № 1448761 11

>>1448746
и это еще только турба. надеюсь дичайше охуеть от Z-Image-Base

Аноним 09/12/25 Втр 19:17:26 № 1448764 12

image.png 21Кб, 604x172

я до сих пор трахаюсь стренингом енкодера зимага
увидел, что transformer_only: в положении true, поменял на false
теперь лорка выходная получается на 20 метров жирнее, но при тренинге не инциализирует енкодер все равно, но результат получается лучше чем тренить без "включенного" текстэнкодера

еще есть вопрос как подрузить ликорис модуль чтобы юзнуть BOFT алгоритм в конфиг остриса...

Аноним 09/12/25 Втр 19:17:28 № 1448765 13

>>1448761
А база будет столько же весить?
Если больше, то я буду разочарован, это ведь будет одна категория с Квин, но хуже

Аноним 09/12/25 Втр 19:17:53 № 1448766 14

>>1448758
>нет лор
далбаеб штоли? дохуя уже на циве и каждый день еще дохуя накидывают

Аноним 09/12/25 Втр 19:18:51 № 1448769 15

>>1448766
>дохуя уже
Окей, значит не проверял давно. Пороюсь, может есть годнота

Аноним 09/12/25 Втр 19:19:21 № 1448771 16

>>1448758
Это да, рабочих стилей не так много. Анимца, мультики, некоторая олдовая иллюстрация, чб графика, ну и фотография аналоговая нормально рисуется. Остальное - дефолтный лоп.

Аноним 09/12/25 Втр 19:21:15 № 1448776 17

>>1448765
схуяли хуже?

Аноним 09/12/25 Втр 19:23:06 № 1448777 18

>>1448758
ты бери промпты от флюскала и вана или натвиса как я щас спиздил, неча ленгвич, попроси нейронку ллмку, а лора на цивите дохера щас к зетке, на всё есть уже, но смотри чтоб датасет был 2мегапикселя, остальное днищенский мусор

Аноним 09/12/25 Втр 19:28:40 № 1448782 19

охлолблять, зимаж без лора, что вам ещё надо-то епта

Аноним 09/12/25 Втр 19:29:15 № 1448783 20

>>1448777
Окей, попробую
>2мегапикселя
А там указано?

>>1448776
Имхо у Квин лучше архитектура. При сравнимых размерах Квин будет лучше. Z-image берет тем что лучше SDXL, но при этом меньше Квин и Флюкса (особенно второго флюкса)

Аноним 09/12/25 Втр 19:39:54 № 1448795 21

>>1448783
>А там указано?
там где это есть обычно указано

Аноним 09/12/25 Втр 19:43:07 № 1448804 22

>>1448795
Тогда норм.
А то я помню как некоторые гении SDXL на 768 тренировали и это было странно

Аноним 09/12/25 Втр 19:47:30 № 1448810 23

>>1448804
это днищуки, которые зачем-то берутся не за то что потянут, дело в том ,что зимаж как и флюс 2040х2048 имеет датасет и многие нормальные челики уже делают лора в этих рамках, видел несколько так и писали разрешение датасета, есть пару на вульвы даже в этом
>>1448760
зато свои на самом деле это тупо дефолт от кофи, которого для всего достаточно

Аноним 09/12/25 Втр 19:48:17 № 1448812 24

>>1448810
>2048х2048
фикс

Аноним 09/12/25 Втр 19:49:49 № 1448816 25

>>1448810
так это же база делать лоры в разрешении модели, нет? Единственная проблема - иногда не найти картинки для датасата, особенно в 2048

Аноним 09/12/25 Втр 19:58:07 № 1448831 26

>>1448777
>но смотри чтоб датасет был 2мегапикселя, остальное днищенский мусор
але дядь, зимаге это флоу с поддержкой начиная от 256px, размер картинок буквально не важен, результат будет что на 256px что на 100500px одинаково хорош

Аноним 09/12/25 Втр 20:04:10 № 1448843 27

Может ли нейронка делать картинки с анимегао масками типо пикрил?

Аноним 09/12/25 Втр 20:14:29 № 1448865 28

Я ныл, что кожа хуевая, а оказывается надо было юзать не euler, а er_sde smg_uniform хотя бы. Не говоря уже про другие способы улучшить картинку.
Хотя эта комба явно не лучшая, на мокрой коже уже видны артефакты.

Аноним 09/12/25 Втр 20:16:15 № 1448867 29

>>1448843
Что-то типа того...

Аноним 09/12/25 Втр 20:23:17 № 1448881 30

Аноним 09/12/25 Втр 20:53:31 № 1448959 31

Zимаг модет в img2img? Даю на вход картинку он просто не видит ниче. Или edit ждать?

Аноним 09/12/25 Втр 20:56:49 № 1448965 32

>>1448959
Может.
Анончик в прошлом треде кидал пару воркфлоу

Аноним 09/12/25 Втр 20:58:13 № 1448970 33

>>1448959
Обычный и2и сетап как для сдохли. Всё работает, хз что там у тебя нахуеверчено.

Аноним 09/12/25 Втр 21:03:30 № 1448981 34

>>1448764
1 лора с якобы вкл текст енкодером, 2 без, 3 дефолт, остальные настройки одинаковые. Слоев текст енкодера в модели нет. Очевидно что связи в лин-конв слоях выдрачиваются относительно тренируемого текст енкодера, но не сохраняются сами модули текст енкодера. Можно наверно юзать как трейнхак для более агрессивного схождения в принципе.
В скриптах остриса видел кстати конфиги где он коменты ставил для т5 флюхкала и люмины в стиле "ну тренинг текст енкодера не работает вероятно".

Аноним 09/12/25 Втр 21:18:34 № 1449020 35

>>1448843
Берёшь с делаешь.

Аноним 09/12/25 Втр 21:20:25 № 1449025 36

Как нибудь чинится отвал в ООМ в зимаге при разрешении выше 1300? В квене я в 2к генерил, а тут не хочет и делает пукнум

Аноним 09/12/25 Втр 21:27:30 № 1449039 37

z-image по уровню реализма, понимания, деталей, уже близко к Imagen и Seedream. Да еще и быстрее флуксокала в десятки раз

Аноним 09/12/25 Втр 21:28:46 № 1449042 38

>>1448981
Имхо 3 лучшая. Нет мыла как на 2, а 1 какая-то тусклая и тонна складок на платье

Аноним 09/12/25 Втр 21:28:58 № 1449043 39

>>1449039
Слишком много додумывает в какую-то свою сторону.

Аноним 09/12/25 Втр 21:29:37 № 1449048 40

>>1448518 →
>>1448792 →
Получается дипсик пиздит о том, что noobai не может в естественный язык в отличии от люстры, а может только в теги? Ведь если это развитие, то по идее нубка должна мочь все что люстра и даже больше.

Аноним 09/12/25 Втр 21:36:39 № 1449053 41

Чёт не могу спайкам любого вида в зетке

Аноним 09/12/25 Втр 21:39:05 № 1449056 42

>>1449025
Купить карту не с 8 гигами?
>>1449039
Промптится очень плохо только. После больших моделей знает очень мало.

Аноним 09/12/25 Втр 21:40:48 № 1449060 43

>>1449025
"Ты перестала пить коньяк по утрам, отвечай - да или нет?"(с)

Аноним 09/12/25 Втр 21:43:15 № 1449063 44

>>1449056
>После больших моделей знает очень мало.
Да. Кентавров и минотавров как концепты не знает. Страшная трагедия и недостаток.

Аноним 09/12/25 Втр 21:47:13 № 1449076 45

>>1449042
Это не реквест оценки, еблан.

Аноним 09/12/25 Втр 21:54:31 № 1449099 46

>>1449076
А нахуя ты постишь тогда?

Аноним 09/12/25 Втр 21:56:22 № 1449108 47

>>1449099
Ты че тупой?

Аноним 09/12/25 Втр 22:02:44 № 1449134 48

Чет типы походу поняли, что З годнота и выложить базу просто так это нелегально хорошо, либо база на самом деле без трубы слабая и очень медленная. Ваши мысли? Чет qwen edit тоже притих.

Аноним 09/12/25 Втр 22:03:28 № 1449136 49

>>1449063
Да, это пиздец, без фурей нет жизни.

Аноним 10/12/25 Срд 00:26:42 № 1449272 50

Как увидеть процесс генерации по шагам? Как это было на автоматике. Есть настройки такие в комфи?

Аноним 10/12/25 Срд 00:33:39 № 1449281 51

>>1449272
Есть. Но не для всех моделей и sampler-узлов работает нормально.
В ComfyUI-Manager включаешь «Preview method: Latent2RGB (fast)».
В настройках ComfyUI включаешь «Display animated previews when sampling» (ищи поиском по слову animated).
Перезагружаешь сервак и ComfyUI. Приобретаешь тормоза (небольшие) и предпросмотр в узлах KSampler, SamplerCustom (чуть ниже настроек узла будет отображаться миниатюра генерируемого изображения).

На Flux.2 не передаёт яркость. На Z-Image примерно совпадает. На Qwen-Image тоже. Остальные не пробовал.

Аноним 10/12/25 Срд 00:53:10 № 1449295 52

Неразрешимая тема выбора Sampler/Scheduler.
TLDR: Какой-то выбор без выбора.

Тесты в сети, выполненные на одних моделях, нерелевантны для других.
Samplerов и Schedulerов огромное количество.
Отбросил неконвергентные ancestral.

Комбинаций море, проверять всё не осилю.
На дефолтном workflow Z-Image прогнал комбинации Euler с разными schedulerами. Несколько других рабочих связок.

Prompt:
A close-up shot depicting a Caucasian man and a Caucasian woman looking at each other. There is a spherical object hovering between them in the centre of the image, left half of the object is Earth, right half is an intricate clockwork mechanism. There is a birch tree with lush leaves in the foreground. Cinematic lighting. Hyperfocal, deep depth of field.

(hyperfocal и deep depth of field были проигнорированы всеми и не позволили оценить «зелень» на втором плане, которую Qwen-Image, например на Euler/Simple просто шакалил дизерингом, а на res_2s/bong_tangent рисовал нормально; повторюсь, для Z-Image, например, последняя связка вообще вредная, это к слову о неприменимости комбинаций Scheduler/Sampler от одной модели к другой, просто так)

Model: z_image_turbo_bf16.safetensors;
ModelSamplingAuraFlow Shift: 3.0 (default);
Seed:42 (фиксированное);
Steps: 9;
CFG: 1.0;
Denoise: 1.0.

Никаких LoRAs и дополнительных обработок. Только стоковая генерация.
Названия SamplerScheduler указаны прямо в именах файлов.
Начинаем с Euler с разными scheduler.
Euler/Simple;
Euler/Beta;
Euler/Beta57.

Аноним 10/12/25 Срд 00:55:30 № 1449299 53

>>1449295
Далее:
Euler/linear_quadratic;
Euler/bong_tangent.

Аноним 10/12/25 Срд 00:59:33 № 1449304 54

>>1449299
С заданием не справились:
Euler/karras (очевидно, к нему нужен был и Karras sampler в пару, но я не проверял);
Euler/kl_optimal (возможно, к нему тоже нужен был другой sampler).

Аноним 10/12/25 Срд 01:02:37 № 1449308 55

>>1449295
Все выглядят как сорта жипег-шума. И чего так бледно всё?

Аноним 10/12/25 Срд 01:04:48 № 1449311 56

>>1449304
Далее Heun, как более толстый и медленный, но более точный Euler (опять же по словам из сети).
Heun/Simple;
Heun/Beta;

Для сравнения третьим изображением опять даю Euler/Beta, чтобы можно было попереключать, сравнивая.

Аноним 10/12/25 Срд 01:07:25 № 1449315 57

>>1449308
Стоковый workflow, фиксированный seed, указанные настройки.
В заключение выгружу webp workflow для повторяемости результатов.

Аноним 10/12/25 Срд 01:09:16 № 1449318 58

>>1449311
Наконец res_2s;
Варианты:
res_2s/simple;
res_2s/beta.

Аноним 10/12/25 Срд 01:16:59 № 1449331 59

Пацаны, как фиксить, кроме переустановки с нуля?

Аноним 10/12/25 Срд 01:20:22 № 1449333 60

>>1449318
Тестовый workflow для воспроизводимости результатов.

Аноним 10/12/25 Срд 01:28:39 № 1449338 61

>>1449333
Финалочка, которую я пропустил (первая связка вроде рекомендована была);
res_multistep/simple;
res_multistep/beta.

Больше пока у меня идей нет. Если кто-то использует какие-то другие годные связки (не ancestral), будет любопытно посмотреть.

>>1449333 этот workflow прогнать с вашими sampler/scheduler, ничего больше не меняя.

Композиция для проверки деталей лиц, мелких деталей (часовой механизм), текстуры поверхности Земли, листьев и зелени на втором плане.

Аноним 10/12/25 Срд 01:30:45 № 1449342 62

>>1449331
Попробуй обновить WAN VHS до актуальной nightly версии.
Они там что-то намудрили и ComfyUI тоже, и всё пошло через одно место.

Аноним 10/12/25 Срд 01:46:26 № 1449362 63

>>1449308
Скинь, пожалуйста, свой насыщенный цветами workflow.
Будет любопытно посмотреть, есть ли там второй проход в качестве рефайнера или ещё что-нибудь подобное в качестве face detailer.

Аноним 10/12/25 Срд 02:04:05 № 1449394 64

>>1449281
Спасибо, анон. Заработало.

Аноним 10/12/25 Срд 02:42:26 № 1449434 65

>>1449308
Сейчас пригляделся. Ещё может быть тут LoRA какая-нибудь или модель не Z-Image (или Z-Image, но LATENT оправлен в ClownSharkSampler на unsample, а потом второй проход KSampler). Детализация лиц мне нравится, а шестерни часового механизма слизало и зашакалило.

Аноним 10/12/25 Срд 03:27:00 № 1449478 66

>>1449134
>либо база на самом деле без трубы слабая и очень медленная
Это так. Я очень много генерировал с натвиз дмд2. Получалось для него очень хорошо. Но головый натвиз так и не смог. Сам попробуй. Ну и медленный будет. Сейчас 9 шагов цфг1, а если будет 36 шагов и цфг больше 1 то скорость будет в 8 раз медленнее!

Аноним 10/12/25 Срд 07:25:00 № 1449548 67

чо я понял: если обучаете лору то если ее пихнуть на fp8 зимагу будет хуйня полная. ток на fp16 пихать

Аноним 10/12/25 Срд 07:25:47 № 1449549 68

>>1449548
обученную лору всм

Аноним 10/12/25 Срд 07:58:15 № 1449554 69

>>1449311
тут первый норм
>>1449308
тут второй
>>1449311
здесь первый
>>1449338
тут первый

Всё остальное - каловый кал.

Аноним 10/12/25 Срд 08:03:24 № 1449555 70

>>1449548
Никаких различий нет пихать куда. Хуйня может быть только если комфинода дефолтная не смогла корректно прочесть ключи лоры и их применить, что имеется сейчас в наличии и лоры для зита надо грузить через другую шпициальную ноду Lora Loader (Z-image) (CRT) из пака crt-nodes.

Аноним 10/12/25 Срд 08:59:13 № 1449561 71

>>1449362
Простая генерация с одной лорой там.

Аноним 10/12/25 Срд 10:22:38 № 1449625 72

Я правильно понимаю, что лучше не обновляться вообще никогда?

Аноним 10/12/25 Срд 10:35:59 № 1449635 73

>>1449295
>>1449299
>>1449304
>>1449308
>>1449311
>>1449318
>>1449333
>>1449338
Ну и нахуй ты тут высрал это? Мы это и так можем проверить у себя. Свои тесты держи у себя. Не твой личный бложик

Аноним 10/12/25 Срд 10:51:44 № 1449651 74

>>1449635
Не дрочил на сисик писик сегодня? Че нервничаешь

>>1449625
Лучше не использовать комфигуи.

Аноним 10/12/25 Срд 11:03:40 № 1449660 75

>>1449134
Выпустят вместе с тюном на NoobAI, чтобы показать какие можно делать модели. Инфа 100% с погрешностью -100%.

Аноним 10/12/25 Срд 11:05:52 № 1449664 76

>>1449635
>Свои тесты держи у себя. Не твой личный бложик
Ебанутый что ли? Всегда хорошо, когда доп тесты видишь. Удобней было бы в одном большом xyz. Но это забытые технологии форджа, недоступные комфидаунам.

Аноним 10/12/25 Срд 11:07:03 № 1449666 77

>>1449664
>Удобней было бы в одном большом xyz. Но это забытые технологии форджа, недоступные комфидаунам.
Форджемрась, xyz делается за пять сек в комфе.

Аноним 10/12/25 Срд 11:10:28 № 1449668 78

>>1448744
>Неужели наконец картинка с метаданными, вот что значит 2025 год!
Это из-за того что webp харкач не может мету чистить

Аноним 10/12/25 Срд 11:13:25 № 1449671 79

>>1449664
Ебанутый даун, в комфи есть такая фича, как запуск гена при изменении. Ставишь отдельно ноду семплера/шедулера и врубаешь увеличение значения и тупо 1 кнопу нажимаешь запуска и оно за пару сек тебе сохранит все с именем файла семплера/шедулера или сделает zxy на автомате, тупой ты форжедаун

Аноним 10/12/25 Срд 11:14:45 № 1449673 80

>>1449666
>xyz делается за пять сек в комфе
Как?

Аноним 10/12/25 Срд 11:20:22 № 1449676 81

>>1449666
>>1449671
>всё есть, честное слово
>даже нормальный фейсдетейлер
>ну просто нет желания включить
>правда-правда

Аноним 10/12/25 Срд 11:22:18 № 1449677 82

>>1449673
Тонны нод для плоттинга типа https://github.com/TinyTerra/ComfyUI_tinyterraNodes

Аноним 10/12/25 Срд 11:22:41 № 1449678 83

>>1449676
>фейсдетейлер
Как там в 2022? Виза мастеркард работают?

Аноним 10/12/25 Срд 11:22:54 № 1449680 84

>>1449676
Ни дня без форджешизика-неосилятора

Аноним 10/12/25 Срд 11:26:46 № 1449681 85

>>1449678
>>1449680
Уже 3 года не могут запилить базовый функционал из автоматика? Сожалею.

Аноним 10/12/25 Срд 11:30:34 № 1449683 86

>живая форджешиза в почти 2026
А что там с факасом

Аноним 10/12/25 Срд 11:39:53 № 1449688 87

>>1449681
Бери больше, все 8.

Аноним 10/12/25 Срд 15:43:59 № 1449951 88

Пытаюсь обчеловечить зеткой полученные с другой модели картинки, так чтобы один и тот же скрипт схема с одними и теми же коэффициентами использовались в тупую без дроча циферок, и уже оттуда выбирать удачные результаты.
Использую ваши же i2i блоксхемы.
Дрочил на одну из схем (быструю) с одним набором коэффициентов, который иногда получал замечательные результаты, но был шумным. Думаю, ну, раз быстрая справляется, должна и медленная справляться, зато без шума. А оно что-то не подбиралось так хорошо. Не выдавало те же результаты.
Дёргал ползунки туда-сюда. В итоге решил проверить, погенерил с одними и теми же "удачными" коэффициентами обе схемы на нескольких сидах подряд - всё-таки мне попадался удачный сид, а не отличный набор коэффициентов+схема.
1 - оригинал (нётенгу лол, надо было другую лору брать)
23 быстрая с разным сидом
45 долгая с разным сидом
Всё-таки сид даёт слишком дохера.

Следующим постом ещё один маняпример.
зачем пишу - чтобы не забывали дрочить сиды, а не только цифры и промпт

Аноним 10/12/25 Срд 15:45:14 № 1449953 89

>>1449951
Иногда даже достаточно близко к человечности подбирается, но это именно везение сида.

Аноним 10/12/25 Срд 16:34:43 № 1449989 90

AQODM7T9UXeq0S6[...].mp4 20008Кб, 1280x716, 00:01:21

Отрывок из работы итальянского художника. Получил известность как 3d видеоартист. Потом увлекся нейронками. Один из первых стал с ними делать арты. Использует json.

Оказывается, кроме баб можно еще что-то гененрить!!! Только не говорите никому. Это наш с тобой секрет, анон.

кривой конвертер, файл может не открыться

Аноним 10/12/25 Срд 16:38:43 № 1449992 91

>>1449989
Откровенно после пары первых дней я тоже немного поехал в любом нейрослопе начал пытаться найти смысл.
Но скоро отбросил это. Вспомнил, что можно кроме нейродерьма ещё ручками задавать направление, и рулит здесь пользователь, а не нейронка, которая обычно высирает чепуху.
А "художник" потерялся. Небось из-за постоянного употребления наркотических веществ, потеряться ему было проще.

Аноним 10/12/25 Срд 19:24:35 № 1450163 92

Аноним 10/12/25 Срд 20:41:35 № 1450283 93

Анон, есть ли нода, чтобы описать загруженную картинку с помощью Квин от Z-image идругой Квин? Потому что wd14 tagger не справляется со сложными не аниме картинками

Аноним 10/12/25 Срд 20:41:42 № 1450284 94

>>1449989
>Оказывается, кроме баб можно еще что-то гененрить!!! Только не говорите никому. Это наш с тобой секрет, анон.
Ха-ха очень смищно. Вот только вангёлстендинг генерят не из-за того что только это могут, а потому что это нравится. Нахера мне эти вдумчивые генерации, что за бред блять?!

Аноним 10/12/25 Срд 21:00:27 № 1450307 95

>>1450295
Это называется, искусство тронуло что-то глубоко внутри человека.

Аноним 10/12/25 Срд 21:00:44 № 1450308 96

>>1449989
Это вопрос не генерации, а постинга. Обычным людям не особо надо сюда постить, а вот кумерам совать другим под нос свои фап-материалы - это почти так же необходимо как на них дрочить. Универсальный психологический симптом кумерства, до нейронок так же было.

Аноним 10/12/25 Срд 21:02:14 № 1450310 97

>>1450308
Могу гмена запостить, если очень надо разбавить тредик.

Аноним 10/12/25 Срд 21:46:27 № 1450351 98

>>1450286
Это и с точки зрения искусства - низкосортное говно. Эксплуатационный жанр.

Аноним 10/12/25 Срд 21:53:25 № 1450354 99

>>1450351

Ясн. Босх для тебя говно. Ну неудивительно.

Аноним 10/12/25 Срд 21:59:44 № 1450363 100

>>1450354
В картинах Босха больше эсхатологии. В них каждый элемент несёт религиозный смысл.

Аноним 10/12/25 Срд 22:01:01 № 1450364 101

>>1450363
Так Босх дурачком был с промытыми мозгами.

Аноним 10/12/25 Срд 22:02:23 № 1450365 102

>>1450364
Как что-то плохое

Аноним 10/12/25 Срд 22:10:09 № 1450370 103

Аноним 10/12/25 Срд 22:27:07 № 1450379 104

https://youtu.be/e8aB0OIqsOc?si=WbrGJthFwxG41DCS

Аноним 10/12/25 Срд 23:50:48 № 1450448 105

Аноним 11/12/25 Чтв 00:00:34 № 1450452 106

>>1450448

Аноним 11/12/25 Чтв 00:30:10 № 1450483 107

Какой лучший вф для апскейла?

Аноним 11/12/25 Чтв 01:48:47 № 1450564 108

OviWan-00009-au[...].mp4 350Кб, 480x640, 00:00:05

>>1450163

Аноним 11/12/25 Чтв 01:50:06 № 1450570 109

OviWan-00022-au[...].mp4 733Кб, 640x480, 00:00:05

>>1450365

Аноним 11/12/25 Чтв 02:19:15 № 1450605 110

dump

Аноним 11/12/25 Чтв 02:43:22 № 1450644 111

>>1450483
Недостаточно конкретно поставлен вопрос. От этого много зависит.
Если просто апскейл, то меня устраивает SeedVR2.

Аноним 11/12/25 Чтв 03:02:06 № 1450669 112

Дефолт зетка...

Аноним 11/12/25 Чтв 03:16:12 № 1450674 113

Аноним 11/12/25 Чтв 05:39:34 № 1450785 114

Кому интересно:

Earlier I mentioned that enabling TE training improves convergence a lot - but there are no TE layers stored in the LoRA at all.

Here are the setups:

1. Base Z-image

2. transformer_only: true + train_text_encoder: false
(default training, no TE)

3. transformer_only: false + train_text_encoder: false
(larger LoRA, +20 MB)

4. transformer_only: false + train_text_encoder: true
(larger LoRA + TE training)

Test prompt: jewish girl in office suit, fortnite

The dataset contains only real-life photos, and setup #3 converges to the target the fastest, but loses the “fortnite” knowledge.

> whats transformer_only? first time i hear of this option. do i put this into the .yaml config like train_text_encoder?

It is an argument from AIT’s config_modules.py, and it is enabled by default.
Yes, you need to add this argument in the [network] block and set it to false.

I checked what the LoRA contains when trained with false in trans_only + true in TE, and it includes additional layers such as:

context_refiner

all_final_layer

all_x_embedder

cap_embedder

noise_refiner

t_embedder.mlp

The default LoRA training config only uses ffnet and attention layers.

The difference between LORA with TE and without just in parameters numbers lol. Considering that the TE layers are not physically preserved in LORA because apparently this is not provided for during training, it is clear where the changes come from.

For example in difference:

TE false:
diffusion_model.layers.0.feed_forward.w1.lora_A.weight,(32-3840),0.009208115749061108,9.266659617424011e-08
TE true:
diffusion_model.layers.0.feed_forward.w1.lora_A.weight,(32-3840),0.009162179194390774,3.4691765904426575e-08

Even if the text encoder (T5) has no LoRA layers and its weights are not saved, the flag
train_text_encoder = true still changes the gradients that flow into the UNet.

So:
TE does not save LoRA
TE does not initialize LoRA
But TE still affects UNet-LoRA training indirectly because the backward pass goes through the text encoder.

Numbers means:
smaller std - more stable gradients
mean closer to zero - less drift
small but consistent improvement

Exactly what happens when TE participates in backprop.

As a result, given the rather limited LoRA implementation in AIT, you can still use the extended training without any issues in two ways:

1. Training all LoRA-supported layers + enabling gradient passthrough for the Text Encoder - this produces a more consistent LoRA that relies on the base model more effectively.

2. Training only all LoRA-supported layers - this gives a massive boost to adaptation on the dataset.

Аноним 11/12/25 Чтв 06:57:40 № 1450798 115

вся еотова в зе имаге хранится на 20-25 блоках, 15-19 накидывают стабильности. остальное мусор, можно удалять.

Аноним 11/12/25 Чтв 08:55:48 № 1450833 116

>>1450644
А какие нужны? Мне фотки шакальные улучшать. В сд какая-то улучшалка вроде гфпган была. Она только лица восстанавливала. Мне надо целиком и желательно еще чтобы убирала двоение от тряски камеры.

Аноним 11/12/25 Чтв 10:28:14 № 1450857 117

Только собираюсь вкатываться, подскажите актуальную приложуху для нуба. ComfyUI - очень страшно, я не знаю что это такое. Скачал Fooocus, но говорят, что это прям вообще основы. automatic1111 - типа давно не поддерживается. Может что-то еще есть нуб-френдли? Меня больше интересует обработка изображений: апскейл, дорисовка фона, наложение эффектов на фото, замена лиц, зачистка/замена объектов, совмещение - вот это вот все. С меня как обычно нихуя

Аноним 11/12/25 Чтв 10:41:04 № 1450862 118

image 471Кб, 1414x372

>>1450785
Но ведь 4 пик самый хуёвый. Третий сильнее изменился потому что transformer_only: false дополнительно пикрил слои тренит, а не только линейные в блоках.
> For example in difference
В тулките не детерминированная тренировка, веса всегда отличаться будут даже на одинаковых прогонах, это ничего не значит.
> TE still affects UNet-LoRA training indirectly because the backward pass goes through the text encoder
Это пиздёж, ТЕ в графе до лоры трансформера находится, он не может участвовать в обратном проходе для вычисления градиентов трансформера. Да и время шага не увеличивается от его включения. То что у чела происходит - это скорее всего градиенты скейлятся тулкитом зачем-то при включении ТЕ, поэтому выглядит как недотрен.
> smaller std
> mean closer to zero
Собственно просто градиенты меньше.

Аноним 11/12/25 Чтв 11:24:48 № 1450877 119

>>1450833
>фотки шакальные улучшать
Зависит от степени шакальности. Мелкие уберёт и SeedVR2. Серьёзные надо через edit модель прогонять и просить дорисовать потерянную информацию.
Общая схема такая: чистишь от мусора в qwen edit. Апаешь в SeedVR2. Потом можно опционально маленьким денойзом в wan 2.2 артефакты подчистить.
Может быть flux2 в один проход сможет, но я нищброд, у меня не лезет.

Аноним 11/12/25 Чтв 12:51:31 № 1450902 120

В итоге для Зет ничего лучше euler/simle нет? Я сам перепробовал несколько вариантов. Некоторые иногда лучше дофолта. То есть ролить приходится и все равно посматривать что там на дефолте. Некоторые комбинаци семплера/шедулера могут генерит только в 1к разрешении. При большем мутная каша.
Про шаги, возможно мне просто показалось, но какая-то проблема с шагами 10 и в меньшей степени на 11, а с 12 норм начинается. Не замечали?
Про разрешение. Опять по моему опыту, лучше это 1536х1536. Или около него.
Кто-то поделиться своими наблюдениями?

Аноним 11/12/25 Чтв 12:53:58 № 1450904 121

>>1450877
>Может быть flux2 в один проход сможет

Не сможет, к сожалению. Возможности FLUX.2 dev (которую в свободное плавание выпустили, в отличие от коммерческой версии) слишком преувеличены.
С ней можно добиться результатов на Edit, но нужен свой подход. На слабом железе точно.

IMHO Wan в цепочке не на своём месте. Мне кажется SeedVR2 это конечная точка. После неё трогать изображение, только портить. Лучше сразу для SeedVR2 давать уже финальную версию изображения, которой кроме простого апскейла больше ничего не нужно.

Аноним 11/12/25 Чтв 12:54:20 № 1450905 122

А в б пропали треды ваши

Аноним 11/12/25 Чтв 12:56:54 № 1450906 123

>>1450877
Обосрался с этого RTX ON

Аноним 11/12/25 Чтв 12:58:57 № 1450909 124

>>1450902
>В итоге для Зет ничего лучше euler/simle нет?
В чьём итоге? Почитай тред глазами, а не жопой. Куча комбинаций лучше. Они дефолтно поставили Euler, видимо, потому что это надежный минимум для всех случаев.

Аноним 11/12/25 Чтв 13:07:52 № 1450922 125

>>1450902

9 шагов достаточно. Выше — плацебо в лучшем случае или шакалит/зашумляет. Это турбо-модель Z-Image для вывода за малое количество шагов (по смыслу типа lightning LoRA для Qwen-Image).

Здесь >>1449295 я пробовал разные Sampler/Scheduler. IMHO, как стоят дефолтные res_multistep/simple, так можно и оставлять. Про всякие ClownSharkSampler узлы с ворохом вариантов не говорю. Не проверял экзотику. Те, кто туда лезут либо точно знают как работают семплеры, либо тыкают наобум «о, custom RES4LYF крутяк, его прошаренные юзают, я тоже должен, а то не труъ».

Разрешение 2048×2048 можно сразу получать.

Аноним 11/12/25 Чтв 13:24:06 № 1450934 126

>>1450862
>Но ведь 4 пик самый хуёвый.
Вообщето самый лучший - сохранена баба, сохранен фортните.
>Третий сильнее изменился потому что transformer_only: false дополнительно пикрил слои тренит, а не только линейные в блоках.
Ты бля пост жопой читаешь?
>В тулките не детерминированная тренировка, веса всегда отличаться будут даже на одинаковых прогонах, это ничего не значит.
1. Сид выставь еблан
2. Изменения сидов практически не влияет на аутпут, сто раз уже проверено на всех сетках

>Это пиздёж, ТЕ в графе до лоры трансформера находится, он не может участвовать в обратном проходе для вычисления градиентов трансформера
Спокойно может, ты же не оффлоадишь т5.

>Да и время шага не увеличивается от его включения.
Ты шо еблан, оно увеличивается! Вот прямо щас включил - увеличилось с трех сек до 4.5.

>Собственно просто градиенты меньше.
Ты даже не понял че написано.

Аноним 11/12/25 Чтв 15:09:52 № 1451020 127

>>1450934
> Спокойно может, ты же не оффлоадишь т5.
Градиенты распространяются только в одну сторону. Градиенты ТЕ зависят от трансформера, не наоборот. Автоград при любой операции добавляет к результирующему тензору grad_fn - функцию обратного прохода. И выполняются они строго в обратном порядке. ТЕ у тебя при форварде ПЕРЕД трансформером, соответственно при обратном проходе градиенты ТЕ считаются ПОСЛЕ трансформера, а не наоборот. Градиенты не могут в обе стороны распространяться, а расчёт градиента - это просто дифференциация каждой операции форварда. Учи матчасть, чтоб не быть батхертом.
Что там на самом деле происходит в кривущем тулките только устрице известно, но никак не влияние ТЕ на градиенты трансформера.

Аноним 11/12/25 Чтв 15:15:52 № 1451024 128

image 7Кб, 725x55

image 6Кб, 728x40

>>1450934
> оно увеличивается
Алсо, нагло пиздишь, попробуй догадаться на каком из скринов было с включенным ТЕ. И с включенным ТЕ концепт очень плохо натренился, как будто на 500 шагах, а не 3500.

Аноним 11/12/25 Чтв 15:31:54 № 1451056 129

>>1451020
>>1451024
> Что там на самом деле происходит в кривущем тулките только устрице известно
Вангую ТЕ действительно тренится, просто не сохраняется, поэтому часть натренированного выкидывается. Или там совсем наговнокожено тогда.

Аноним 11/12/25 Чтв 15:43:52 № 1451091 130

>>1450904
>IMHO Wan в цепочке не на своём месте.
Да, иногда WAN стоит включить до апскейла. Иногда он вообще лишний.
Главная идея, что ретушь сильных шакалов - это ручной процесс. Надо двигаться по шагам, подбирать промпты, сиды и числа. Особенно ели речь идёт о личных фотках, где надо сохранить узнаваемость.
Универсальных расшакаливателей в локалках сегодня нет

Аноним 11/12/25 Чтв 16:35:01 № 1451210 131

>>1451020
> но никак не влияние ТЕ на градиенты трансформера.
Блять да иди ты нахуй, они не в вакууме тренируются а связанно. Возьми сдхл, натренируй 100 шагов с те, и без те, потом отключи те на том что натренировано с те и сравни с тем что без те - результы будут разные критически. Я этой фишкой еще с сд 1.5 периодически пользовался.

Аноним 11/12/25 Чтв 16:36:46 № 1451215 132

>>1451056
> Вангую ТЕ действительно тренится, просто не сохраняется, поэтому часть натренированного выкидывается
Так о том и речь, нет наговнокоженного лора адаптера под т5 вообще чтоб сохранять, а так оно тренируется само по себе естественно.

Аноним 11/12/25 Чтв 16:39:26 № 1451222 133

>>1451210
Чел, у тебя есть изменения потому что обновляются веса ТЕ и меняются эмбединги. Если ты включишь градиенты, но не будешь обновлять веса ТЕ, то они никак не будут влиять. В рамках одного прохода ТЕ никак не влияет. То что ты натренил ТЕ и выкинул его - это вообще пиздец. В том посте была шиза про "backward pass goes through the text encoder", что невозможно в принципе.

Аноним 11/12/25 Чтв 16:39:37 № 1451223 134

>>1451024
> Алсо, нагло пиздишь,
Смысл мне пиздеть, ты дурачок что-ли?

> И с включенным ТЕ концепт очень плохо натренился, как будто на 500 шагах, а не 3500.
Я ебу че ты там наконфигурировал, криворучка, не ко мне вопросы, у меня все работает как надо.

Аноним 11/12/25 Чтв 16:43:01 № 1451231 135

>>1451222
Ты мудак ебаный даже сид не смог зафиксировать и начал пиздоту разводить про недетерминированность, зачилься наху

Аноним 11/12/25 Чтв 16:49:35 № 1451248 136

>>1451231
> сид не смог зафиксировать
Ты сид генерации с тренировкой не путай, чухан. В тулките сиды только для генерации, тренировка недетерменированная там.

Аноним 11/12/25 Чтв 16:51:42 № 1451255 137

>>1451248
Иди скрипты тулкита открой, дура шизоидная, а потом в окно прыгни от недетерминированности бамболейла твоей жопы

Аноним 11/12/25 Чтв 17:00:49 № 1451271 138

image 32Кб, 1103x259

>>1451255
Я в отличии от тебя умею пользоваться поиском. В конфиге сид только для генерации. При тренировке шум без сида и в датасете порядок рандомный.

Аноним 11/12/25 Чтв 19:45:09 № 1451522 139

Сколько у вас занимает генерации zimage и на каких картах?

Аноним 11/12/25 Чтв 19:46:52 № 1451524 140

>>1451522
недавно было 30 секунд для 800х1200 на 4070 шагов там вроде было всего 10 или типа того

Аноним 11/12/25 Чтв 19:56:34 № 1451533 141

>>1451522
Prompt executed in 27.38 seconds
4070 super

Аноним 11/12/25 Чтв 20:11:41 № 1451550 142

>>1451522
Во, 10 шагов, 4070.
Нижние две при включённом твиче.
Может если браузер закрыть будет быстрее, хз

Аноним 11/12/25 Чтв 20:34:53 № 1451578 143

Аноним 11/12/25 Чтв 20:42:47 № 1451582 144

Аноним 11/12/25 Чтв 20:43:57 № 1451584 145

>>1451522
От 15 до 30 секунд на дефолтных 1024, 9 шагов
4060 16

Аноним 11/12/25 Чтв 20:45:06 № 1451585 146

>>1451522
3060 12GB
simple+euler, 9 шагов
2.0mp - 60 сек
1.6mp - 45 сек
1.2mp - 35 сек

Аноним 11/12/25 Чтв 20:49:58 № 1451588 147

>>1451533
>>1451550
Слишком долго как-то. Пикрил 5090.

Аноним 11/12/25 Чтв 20:52:10 № 1451590 148

>>1451588
Терпимо. Вот видео - просто жопа.

Аноним 11/12/25 Чтв 20:53:05 № 1451591 149

>>1451588

Аноним 11/12/25 Чтв 20:53:49 № 1451593 150

>>1451590
Видео же 2 минуты генерится. Быстрей чем большая пикча на хроме.
мимо

Аноним 11/12/25 Чтв 20:56:50 № 1451596 151

>>1451593
> Видео же 2 минуты генерится.
Подскажи, на какой сетке генерится две минуты, в каком разрешении и какой длительности.
Если есть пример - было бы славно, но можно и без примера видео. А то ждать подолгу видео вообще неудачно, когда их надо по несколько раз перегенерировать. Если, конечно, у тебя что-то около 4070, а не 5090.

Аноним 11/12/25 Чтв 21:03:25 № 1451602 152

>>1451522
3060, 8 шагов в 1024 ну секунд 20-25, но я обычно генерю в меньшем разрешении.

Аноним 11/12/25 Чтв 21:29:54 № 1451639 153

>>1451596
Ван 2.1 с ускорялками, 480p, 81 кадр
На 4090, говорят, минуту генерилось.
Хз что там по 2.2, изменений почти нет, впадлу чекать, жду сразу 3.0, остальное можно скипать

Аноним 11/12/25 Чтв 21:37:23 № 1451656 154

Хоспаде как же хочица базовую модель зит, нормальные скрипты тренировки, файнтюнчики нсфвшные...

Аноним 11/12/25 Чтв 21:38:36 № 1451659 155

1765478315120.webm 1894Кб, 1248x704, 00:00:02

>>1451639
Хм, ну если тебе норм, то можно попробовать.
А то у меня на какой-то сетке при малом разрешении был пикрил, и надо было выше разрешение поднять, чтобы было хоть что-то терпимое.
Ну или какая-то хтонь с девушкой.
>>1451656
Не, пусть валяется как улучшатель результатов других моделей. Слишком мало знает, слишком "безопасная"

Аноним 11/12/25 Чтв 21:42:16 № 1451662 156

>>1451659
>Слишком мало знает
are you охуел там
>слишком "безопасная"
безопасная это флюх2, а зит ебать какая опасная

Аноним 11/12/25 Чтв 21:53:56 № 1451683 157

>>1451656
>хочица базовую модель зит
Тоже отложил тренировки, чтобы не нагружать лишний раз видеокарту, пока не выйдет официальная версия. На нормальные файнтюны не надеюсь, если только они не выпустят NoobAI на Z, тогда уже мердже-тюнеры что-то выдадут.

Аноним 11/12/25 Чтв 21:56:06 № 1451688 158

>>1451683
>>1451656
Не вижу особого смысла тренировать ее, если она сыпется при подключении нескольких лор.
Так бы можно было подключить стиль, перса и сложные концепты хотя бы

Аноним 11/12/25 Чтв 21:56:44 № 1451690 159

image.png 22Кб, 956x256

>>1451522
4070ti, 12gb (fp16 вся не влазит), 1m. Енкодер на цпу.

Аноним 11/12/25 Чтв 22:02:49 № 1451698 160

>>1451688
Так ты веса отбаланси, это тебе не сдхл которая ниже 0.75 уже катастрофически не применяется

Аноним 11/12/25 Чтв 22:11:56 № 1451718 161

1765480315995.png 2Кб, 203x68

1765480316000.png 9Кб, 359x113

>>1451639
> Ван 2.1 с ускорялками, 480p 81 кадр
Годнота, хорошо что спросил.

Аноним 11/12/25 Чтв 22:26:26 № 1451736 162

>>1451656
Надо хорошую едит модель, в которую можно пихать референсы из сдохли. Новые модели без встроенной обработки референсов - нинужны.

Аноним 11/12/25 Чтв 23:33:28 № 1451862 163

>>1451690
С хуя ли так быстро?

Аноним 12/12/25 Птн 00:10:23 № 1451903 164

какого хуя эти пидоры там нахуевертили?

Аноним 12/12/25 Птн 00:12:42 № 1451907 165

i.webp 37Кб, 1500x500

>>1451903
всё, починил

Аноним 12/12/25 Птн 00:25:52 № 1451929 166

image.png 247Кб, 1101x337

image.png 4Кб, 335x102

>>1451522

Аноним 12/12/25 Птн 00:40:05 № 1451954 167

>>1451683
Ну и зря, IMHO. Я тут как раз попробовал - лора на предмет/персонажа 30 минут - 2 часа на 3060 с зажатым на 110W уровнем мощности (65 градусов MAX).
Разброс по времени - это в зависимости от качества.

И попутно - год назад пробовал тренить лоры на сдохлю, страдал - почему такая херня выходит. А тут, мне наконец gemini мозги вправил - это Batch Size, блядь. Он, оказывается, не только на скорость влияет (типа - больше исходников за раз), но и на качество результата (потому, что что-то вычисляет на основе всех картинок - среднее выводит избавляясь от случайного эффективнее). Проверил - точно. На BS=1 - хрень с зерном и артефактами на выходе еще до того как перс на себя стал похож. А на BS=2 уже хорошо. Благо, что на 12GB можно даже с BS=4 для Zит тренить. (На устрице.)

Аноним 12/12/25 Птн 00:52:20 № 1451974 168

Аноним 12/12/25 Птн 00:56:44 № 1451982 169

>>1451974
Не ожидал?

Аноним 12/12/25 Птн 00:58:55 № 1451988 170

>>1451639
Спасибо анон, я не ожидал, что она настолько мощная.

Аноним 12/12/25 Птн 01:03:55 № 1452001 171

>>1451982
Это новый супермэн?

Аноним 12/12/25 Птн 03:13:25 № 1452161 172

>>1451862
Енкодер на цпу. Тут челы видимо офлоадят модель и лоадят вместо нее енкодер (на пиках стоит дефолт у челов) и обратно каждый промпт.

Аноним 12/12/25 Птн 03:58:32 № 1452203 173

>>1452161
>Енкодер на цпу.
Это оффлоад в озу, это не может быть быстрей врама. Причина не в этом. Вон выше на 4060 быстрей чем у некоторых на 4070. Зависит от многих факторов

Аноним 12/12/25 Птн 04:26:17 № 1452216 174

>>1452203
>Зависит от многих факторов

Вангую, что там разрешение 1024x1024 поставили и Euler/simple поставили вместо sampler/scheduler.
А затем запостили скриншот окошка с удобными циферками.
К сожалению, ко всему тому что здесь размещают ещё приходится относиться с изрядной долей скепсиса.

Аноним 12/12/25 Птн 06:52:05 № 1452289 175

>>1452216
>Вангую, что там разрешение 1024x1024 поставили и Euler/simple поставили вместо sampler/scheduler.
Какие же вы еьынутуе стали. Тесты всегда делают на дефолте. Всегда на известном всем разрешении, на семплере/шедулере по умолчанию. На шаблоне который есть у всех. Это же тест скорости, а не качества.
А теперь посмотри на идиотов которые выше разрешение хуй пойми почему не дофолтное поставили. А ещё пишут " ну 15-30 секунд". Это ппц. Так 15 или 30? Дебилы, мояьь, школота.

Аноним 12/12/25 Птн 08:23:31 № 1452321 176

>>1451688
Ощущение будто с лора лоадерами что-то не то. Данриси юзает какой-то кастомный и сочетает свои две лоры, получается совсем не так хуево как когда делаешь то же сам на дефолтных.
Плюс надежда, что на base такого обучения не будет.
>>1451954
Странно, обычно батч повышают (если есть возможность) немного жертвуя качеством ради скорости.
>Благо, что на 12GB можно даже с BS=4 для Zит тренить.
Что за магия? Я выше одного не пробовал, но все разы потребляло чуть больше 12гб (вместе с системой) из 16гб врам.

Аноним 12/12/25 Птн 08:33:01 № 1452329 177

>>1451718
>>1451988
Если просто поиграться, то можно вообще пробовать 1.3B (2.1) или 5B (2.2), они ещё быстрей будут генерить 720p, но лор на них сильно меньше. Ну и ван, да и старый hunyuan даже на лоурезе выдают что-то, если проблемы с врам. Помню hy даже на 32x256 что-то связное выдавал.
>>1452203
15 секунд на закешированном промпте, на загрузке модели в fp8_fast. Получается немного хуже. В среднем 25 секунд.

Аноним 12/12/25 Птн 08:46:37 № 1452337 178

>>1452289
> А теперь посмотри на идиотов которые выше разрешение хуй пойми почему не дофолтное поставили.
Потому что квадраты не рендерим. В квадрат ничего не вписывается. Я понимаю, тесты для тестов, но тогда и другие условия надо соблюдать. Вроде перезагруженный комп, отсутствие браузера с ютубом на фоне, 11 винда последнего обновления. Да всем плевать. Рендерится картинка примерно такого формата в разбросе от 15 до 30 секунд в засисимости от кучи переменных сред внутри винды. Такие дела.

Аноним 12/12/25 Птн 09:00:42 № 1452344 179

>>1452216
Для теста берётся дефолт рекомендуемых настроек ясное дело и очевидно в 1МП.

Аноним 12/12/25 Птн 09:09:41 № 1452347 180

>>1452337
>Да всем плевать
Я примерно про это и написал. Современное поколение, которому на всё плевать. На культуру использования софта, на культуру его разработки.

Аноним 12/12/25 Птн 09:12:23 № 1452349 181

>>1452347
> На культуру использования софта
Ок ответь, какой тест будет верным.
Сразу после загрузки, потому что комфи ещё не загружал ничего в систему, и не насрал в память-кеши.
Или после первых десяти-двадцати, когда уже предзагрузил себя и данные нейросетки с ссд в оперативную память, потому что это его настоящая работа на практике.

Аноним 12/12/25 Птн 09:34:05 № 1452367 182

>>1452349
Ровно второй прогон со сменой Сида и не изменным промптом. Блять, со времён сд1.4 такое было.

Аноним 12/12/25 Птн 12:34:16 № 1452510 183

>>1449625
лучше ставить портабельную версию

Аноним 12/12/25 Птн 12:48:51 № 1452515 184

Можно ли заменить ноду Mask Bounding Box Aspect Ratio какой-то схемой их только встроенных нод? Нужно определять координаты и размер области имнпаинта X, Y, wid,hig стандартными, встреонными нодами. Можно такое сделать?

Аноним 12/12/25 Птн 12:49:24 № 1452516 185

>>1449625
Я недавно обновил что бы затестить парашу флакс 2,
И у меня перестало работать вообще всё. Все дефолтные воркфлоу отвалились. Потому пришлось качать портативку с нуля.
Флакс 2 как и ожидалось оказалась парашей и пошла под снос.
Потраченного времени жаль, пятикратно переваренный кал.

Аноним 12/12/25 Птн 12:59:18 № 1452524 186

Аноним 12/12/25 Птн 13:09:09 № 1452530 187

>>1452321
>Ощущение будто с лора лоадерами что-то не то.
А у меня создалось ощущение, что модель просто более чувствительна к косякам использования лор. Если их "зоны ответственности" перекрываются - нужно силу применения уменьшать, иначе косячит изображение. Так и на SD/SDXL было, но этот эффект там заметно слабее. А здесь, прямо подбирать надо, чтобы итог не корежило.

>Странно, обычно батч повышают (если есть возможность) немного жертвуя качеством ради скорости.
Как я выяснил на практике - строго наоборот. По крайней мере в моем сетапе - BS=1 самый быстрый, но самый шакальный вариант. В прочем, возможно занижение Learning Rate при сильном увеличении количества шагов и дадут лучший результат.
Но тут даже на везде рекомендуемых везде параметрах - получается первые изменения к 350-ому шагу, и даже на 600 персонаж очень отдаленно на себя похож, при уже начинающихся артефактах. С BS=4 - лора готова на 250-350 шагов, качество - зашибись. LR при этом завышен в 2-3 раза от стартовых рекомендаций. (Поднят до 0.0002)

>Что за магия? Я выше одного не пробовал, но все разы потребляло чуть больше 12гб (вместе с системой) из 16гб врам.
Опция на Offload Unet в настройках устрицы - 100% в память (из VRAM). Правда тут еще от размера картинок в датасете зависит - BS=4 у меня получился с 768 квадратами.
При этом без offload вообще - даже с BS=1 не получается. Мало 12GB.

Аноним 12/12/25 Птн 13:41:58 № 1452562 188

We upgraded Z-Image-Turbo-Fun-Controlnet-Union-2.0! Better quality and the inpainting mode is supported as well. https://www.reddit.com/r/StableDiffusion/comments/1pknfku/we_upgraded_zimageturbofuncontrolnetunion20/?share_id=LFl8-qeLSUNZk16DQ5vU3

Models and demos: https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union-2.0

Аноним 12/12/25 Птн 13:44:05 № 1452565 189

>>1452562
Лучше бы тайл или апскейл сделали. Кому вообще HED нужен.

Аноним 12/12/25 Птн 14:23:07 № 1452631 190

Кто-то заводил это на Z:
https://github.com/shootthesound/comfyUI-Realtime-Lora
Via Musubi Tuner:
Z-Image - faster training, smaller LoRA files, no diffusers dependency. Requires the de-distilled model for training, but trained LoRAs work with the regular distilled Z-Image Turbo model.
Via AI-Toolkit:
Z-Image Turbo

Аноним 12/12/25 Птн 14:44:27 № 1452666 191

Гайд по генерации ZIT на русском https://3dnews.ru/1133660/masterskaya-z-image-turbo/ там есть совет как увеличить вариативность изображений

Аноним 12/12/25 Птн 14:45:04 № 1452667 192

>>1452530
>офлоад
> Опция на Offload Unet в настройках устрицы - 100% в память (из VRAM). Правда тут еще от размера картинок в датасете зависит - BS=4 у меня получился с 768 квадратами.
> При этом без offload вообще - даже с BS=1 не получается. Мало 12GB.
Вы дегенераты блять, вам дали зетку которая может в 256 трениться отлично, плюс устрица ебанули квантизацию на лету, бы буквально можете все запихать на карту и не терпеть говно с выгрузками.

Аноним 12/12/25 Птн 14:48:09 № 1452674 193

>>1452562
Не работает после апдейта. Прошлый работал.
>>1452667
Ты точно не фанат сделать омном-ном за щеку? Выглядит как чистой воды коупинг. Уверен, уровень узнаваемости лица упадет, но захотелось попробовать.

Аноним 12/12/25 Птн 14:49:09 № 1452676 194

>>1452667
чел они скорее на гугуфе будут пробовать тренить

Аноним 12/12/25 Птн 14:50:08 № 1452678 195

>>1452674
> Ты точно не фанат сделать омном-ном за щеку? Выглядит как чистой воды коупинг. Уверен, уровень узнаваемости лица упадет, но захотелось попробовать.
Я бля только в 256 с выхода зетки делаю, там все прекрасно. Астралайт вон тест пони на 256 делает тоже. Реально вы как дауны тыкаетесь в то во что не надо когда есть топ решения для нищеты.

Аноним 12/12/25 Птн 14:51:55 № 1452684 196

>>1452678
>только в 256 с выхода зетки делаю
Понятно, гигакоупинг. Ну так ты оторвись от бочки с говном и попробуй нормальную еду, потом влезай в разговоры.
>Астралайт вон тест пони на 256 делает тоже.
АХхахахаха

Аноним 12/12/25 Птн 14:53:39 № 1452690 197

>>1452684
Ебать ты дебил сука нахуя ты живешь ебень

Аноним 12/12/25 Птн 14:54:51 № 1452692 198

>>1452676
Я вижу нахуй. Ебланидзе выше думает что флоу зетка это сдхл которая жество привязана к 1024 датасету. Тред ебанатов хули.

Аноним 12/12/25 Птн 14:58:00 № 1452704 199

256 4бит крута, я могу в карту реальный батч ебовый запихать 💪💪💪

Аноним 12/12/25 Птн 15:02:47 № 1452714 200

а я кушаю какашки и потом тренирирую пиксельарт у меня зрение -5 мне похуй я все равно даун и лица не различаю

Аноним 12/12/25 Птн 15:12:22 № 1452723 201

>>1452714
Тяжело вам на SDXL. Нам партия выдала Z-image, которая тренируется в 256 пукселей и генерирует 4к.
Объясните довену что латент спейсу зета пихуй на разрешение.

Аноним 12/12/25 Птн 15:31:36 № 1452746 202

>>1452667
>Вы дегенераты блять, вам дали зетку которая может в 256 трениться отлично
Ты там чего куришь, или вообще уже ширяешся прямо? Вообще всё одинаковым видишь? Ладно еще 512 - можно еще в такую картинку уложить что-то, боле-менее узнаваемое. Но, сцуко, 256 - это наутральный VGA, пиксельарт эпохи кинескопов до первых пентиумов. Там мелкие детали, в принципе будут одним пикселем на общем плане - это угадайка а не изображение. Спасибо, не надо.
Хотя конечно, если мне нужна лора с уровнем "зеленый шар на синем фоне" по детализации - это вариант, конечно. Но что еще можно натренить на том, что на картинке просто вообще отсутствует, из-за сверхнизкого разрешения? Смысл заморачиваться с качеством - если тату, кулон, элемент вышивки, или просто прилипший лист - один хрен - 1-2 пикселя и выглядят одинаково на фигуре в полный рост?

Аноним 12/12/25 Птн 15:34:39 № 1452750 203

>>1452723
>Объясните довену что латент спейсу зета пихуй на разрешение.
До латент спейса - надо еще через токенизатор пройти. И чтобы тот понял, вот этот пиксель - это что: тату, родинка, складка одежды, тень, и ли вообще муха на фото насрала.
А потом уже латент, да...

Аноним 12/12/25 Птн 15:38:52 № 1452755 204

>>1452746
>>1452750
>два дауна не понимают что значит 256 для зетки и упорно хуячат дичь про низкое разрешение картиночек из которых в манямире получаетс мыло и нет деталей

Реально дебилов тред. Хотя мне какая разница, это ваше проблемы что вы аут оф зе бокс не способны мыслить и хуйней занимаетесь со 150 секунд на шаг.

Аноним 12/12/25 Птн 15:44:40 № 1452763 205

>>1452746
Мощный коуп братан👍👍👍

Аноним 12/12/25 Птн 15:49:17 № 1452768 206

>>1452763
Это стадия отрицания. Потом со временем дойдут до мощи 256 пикселей, как с дмд было. Зетурба кстати сделана полностью на принципах дмд, вот у хейтеров очко подгорает наверно.

Аноним 12/12/25 Птн 15:54:44 № 1452773 207

>>1452723
>>1452755
>Орёт весь тред без конкретных объяснений своих слов
Это точно челик из локалочек ллм. Там такие довены оруны. Прям магистры хуйпойми каких знаний(они ими не делятся, но ссылаются на то ими обладают)

Аноним 12/12/25 Птн 15:56:47 № 1452774 208

>>1452773
Устаешь просто ебланам по триста раз базовые прописные истины пояснять. Проще на хуй послать.

Аноним 12/12/25 Птн 16:02:46 № 1452783 209

>>1452774
Для всех кроме тебя это не истина, а мусорные сведения. Чушь, потому что без доказательств. Доказательств ты не приводишь, несмотря на то что уже полтреда запакастил. А значит и к тебе относятся как к голословному *, пыль. Ссылку на статью какую-нибудь лень привести? А, ну да, обладать знаниями можешь лишь ты.

Аноним 12/12/25 Птн 16:10:32 № 1452796 210

Какая же Zеточка все таки вкусная, и легкая на обучение лор <3

Аноним 12/12/25 Птн 16:11:34 № 1452799 211

Сосочка просто

Аноним 12/12/25 Птн 16:12:04 № 1452800 212

>>1452783
Иди потренируй на 256 свою еот обоссаную и пиздак заткнешь сразу.
Для тебя наверно вообще в диковинку будет что вае сжимает картиночку в латенте, ага? Прикинь, на каскаде еще в 40 раз сжимало с полным восстановлением. Или ты думол, что ваешка картиночку в латенте разворачивает на основе конфига резолюшена твоей говнолоры? А еще наверно ты не в курсе что флоу чисто похуй и поебать на резолюшн тренировки? Потому что флоу учит СКОРОСТЬ, с которой шум превращается в изображение, а не хуйню предсказательную. Учи мемы чтобы не быть батхертом, время сдхл с привязкой к размеру датасета ушло.

Аноним 12/12/25 Птн 16:13:10 № 1452804 213

Аноним 12/12/25 Птн 16:27:23 № 1452819 214

>>1452800
Слушай, ты реально считаешь, что можно что-то натренировать на датасете из несуществующих деталей? Я допускаю что Zине пофиг на размер. Но она, блядь, у тебя получается телепатией владеет, или подключением к великому атсралу. Если на исходной картинке, из-за сверхнизкого разрешения, даже человек уже не понимает - что это за херня изображена - откуда сетка то поймет?
Речь именно об этом. Если ты тренишь что-то, что 256 пикселей еще разборчиво - базару нет. Но если там просто непонятно - что это такое конкретно, в таком малом разрешении? Ну вот, например затолкай в 256 пикселей какую-нить эмблему организации, где всего 10% ее поля занимает мелкий текст - из библии, строчек 8. Ага? Чтобы лора ее всегда без искажений текста потом воспроизводила. Ну, или что-то вроде вот этого: https://e7.pngegg.com/pngimages/206/618/png-clipart-nerv-neon-genesis-evangelion-2-logo-rebuild-of-evangelion-angel-game-text.png
И чтоб лора текст не путала.

Аноним 12/12/25 Птн 16:31:07 № 1452821 215

>>1452819
Сука доебешь меня фома неверующий. Ок, давай натренирую эту залупень твою в 256, ток дай СЛОВО ПАЦАН что как только я тебе хуев натолкаю, то ты не исчезнешь нахуй а напишешь что извиняешься, был не прав и больше не будешь доебывать людей.

Аноним 12/12/25 Птн 16:37:31 № 1452824 216

>>1452819
>что можно что-то натренировать на датасете из несуществующих деталей?
>она, блядь, у тебя получается телепатией владеет, или подключением к великому атсралу
Погоди, ты отразил вообще что ты даешь ваешке картиночку, ваешка СЖИМАЕТ ОЧКО твоей картиночки в милипиздрическую латентную залупку, обучает на ней и ей все равно на эти 256 пикселей потому что из латента вае будет восстанавливать обратно в исходный размер минуя выставленный конфиг резолюшена? То есть мы выставляя 256 в конфиге буквально экономим врам на пустом месте просто, понимаешь?

Аноним 12/12/25 Птн 16:38:57 № 1452825 217

>>1452667
> 256 трениться отлично, плюс устрица ебанули квантизацию на лету
Я треню в 1280 без квантов и что ты мне сделаешь? Рассмешишь микроквадратами и отсутствием новых текстур у лор?

Аноним 12/12/25 Птн 16:39:57 № 1452826 218

>>1452825
>Я треню в 1280 без квантов и что ты мне сделаешь?
Пока ты тренируешь одну лору, я тренирую десятую. Мы на разных уровнях.

Аноним 12/12/25 Птн 16:47:52 № 1452838 219

>>1452826
Хочешь сказать за 3 минуты лору тренишь? Потому что на 1280 за 30 минут тренится. Уже то что тебе стыдно показывать в треде натрененное о многом говорит.

Аноним 12/12/25 Птн 16:55:34 № 1452854 220

>>1452838
>Хочешь сказать за 3 минуты лору тренишь?
Достаточно для тренировки твоей матери.
>Уже то что тебе стыдно показывать в треде натрененное о многом говорит.
Ого, битва с соломой.

Аноним 12/12/25 Птн 16:56:20 № 1452855 221

>>1452821
Да я как бы сам тесты проводил, хоть и не дошел еще до 256. В 512 у меня перс "в общем" - не хуже получился чем в 768, на грани субъективной погрешности. А вот форма шрама (на груди у него) уже явно плывет даже на 512, тогда как на 768 - стабильно рисует как надо.
Так что не надо орать - я и в 256 попробую. И извинится за мной не заржавеет, если оно реально не повлияет совсем.
Пока же - как я вижу по результату, что если тренишь что-то общее как концепт - низкое разрешение может быть даже бонусом, там обобщение только в плюс. А вот если конкретного перса/объект, да с мелкими важными деталями - они могут и проебаться на датасете низкого разрешения.

Аноним 12/12/25 Птн 17:26:51 № 1452884 222

>>1452819
>Ну вот, например затолкай в 256 пикселей какую-нить эмблему организации, где всего 10% ее поля занимает мелкий текст - из библии, строчек 8. Ага? Чтобы лора ее всегда без искажений текста потом воспроизводила. Ну, или что-то вроде вот этого: https://e7.pngegg.com/pngimages/206/618/png-clipart-nerv-neon-genesis-evangelion-2-logo-rebuild-of-evangelion-angel-game-text.png
>И чтоб лора текст не путала.
Кароче лень ждать пока полностью скопирует, на тебе 80 шагов.

Аноним 12/12/25 Птн 17:41:16 № 1452898 223

>>1452884
Зина конечно умница, но ты же промптом детали картинки сделал, а не лорой. Если ты из промпта генерации детали и текст уберешь - она сама справится с его начертанием - только на базе информации из лоры? Т.е. - получится результат только с промптом "on the white background a red logotype" (где "red logotype" - токен на который лора тренилась)? Чтобы форма, содержимое и текст были взяты из лоры, а не из промпта?

Если да - мои извинения, был неправ.
А если нет - мы каждый при своем, т.к. как минимум о разном говорили.

Аноним 12/12/25 Птн 17:41:33 № 1452899 224

>>1452884
Пзц, у тебя в голове так же наверное. Простейшая схема, а выглядит жутко. Это же надо так суметь запутать

Аноним 12/12/25 Птн 17:48:36 № 1452909 225

>>1452884
И что это за говно? Покажи как лого генерится, а не текст. То что ты делаешь - просто промптом текст написал. Как по промпту "NERV logo" сможешь это сгенерить, так и приходи рассказывать что ты там натренил.

Аноним 12/12/25 Птн 19:53:59 № 1453011 226

>>1448719 (OP)
Кто-нибудь шарит, как использовать zimage или flux 2.0 на автоматике? Может есть какой-то костыль для этого? Комфи вообще кал ебаный неудобный. Или может есть какой-то аналогичный сервис, главное чтобы там был инпейнт по области с заданным разрешением как в автоматике.

Аноним 12/12/25 Птн 20:13:03 № 1453039 227

>>1453011
Тебя в гугле забанили? https://github.com/Haoming02/sd-webui-forge-classic/releases/tag/2.6

Не знаю, насколько это хорошо, не пробовал. Но пишут, что работает.

Аноним 12/12/25 Птн 20:18:36 № 1453047 228

>>1453039
Только надо вариант Neo ставить, а не собственно Classic.

Аноним 12/12/25 Птн 20:36:30 № 1453075 229

>>1453047
А где там ссылка, чтобы нео скачать?

Аноним 12/12/25 Птн 20:38:24 № 1453078 230

>>1453039
Тут вопрос а он с картами 50хх серии норм работает? Потому что там 50хх серия по умолчанию тоже не поддерживалась, пришлось качать какуюто ветку.

Аноним 12/12/25 Птн 20:42:56 № 1453083 231

>>1452898
>Зина конечно умница, но ты же промптом детали картинки сделал, а не лорой.
Бля, а ты как хотел? Чтобы по токену или на холостую логотип генерило? Это буквально надо несколько тыщ шагов ждать переобучения.
>Если ты из промпта генерации детали и текст уберешь - она сама справится с его начертанием - только на базе информации из лоры?
Конечно, но это ждать долго. Мало того тебе скажу, что даже если бы я просто на класс токен начал дрочить лору без описания, то все равно бы работало ток ждать долго пока оверфитнется. Я так на легаловских баб лору в 256 тренил вообще без описания, зетка сама всю нужную инфу с картинок спиздила.
>Т.е. - получится результат только с промптом "on the white background a red logotype" (где "red logotype" - токен на который лора тренилась)? Чтобы форма, содержимое и текст были взяты из лоры, а не из промпта?
Я не буду оверфитить лору 6 часов, я не ебанутый чтобы на дваче доказывать что-то с очевидным результатом. Могу легаловских баб показать, они хотя бы готовые.
>А если нет - мы каждый при своем, т.к. как минимум о разном говорили.
Я хз маневр это или нет у тебя, но по итогу получается тебе нужна не гибкая лора, а оверфит на объект, что не является стандартным использованием, но зетка и такое сделает.

>>1452899
Нашел до чего доебаться.

>>1452909
Щас, уже бегу 5к шагов оверфитить на картиночку, губу закатай опущенец малолетний на мамкиной шее нолайфер задрот омежка лох.

Аноним 12/12/25 Птн 20:51:27 № 1453087 232

>>1453083
>я не ебанутый чтобы на дваче доказывать что-то
Да.

Аноним 12/12/25 Птн 20:54:27 № 1453091 233

>>1453075
https://github.com/Haoming02/sd-webui-forge-classic/tree/neo

Аноним 12/12/25 Птн 20:54:52 № 1453093 234

>>1452796
Лол, это те самые "256 отлично обучают не отличишь от 1024"?

Аноним 12/12/25 Птн 20:57:03 № 1453095 235

>>1453093
анус зашивай, тебе его порвали в треде

Аноним 12/12/25 Птн 21:09:56 № 1453103 236

>>1453091
>>1453078

Аноним 12/12/25 Птн 21:13:04 № 1453104 237

>>1453093
Я другой анон, я с вами тут не срался))
Все что скинул это лоры обучались на 768, 1000 шагов, примерно 50 минут тренировка идет на 5070ti.
Потренил на 512 некоторые лоры, тренится за 30 минут всего.
Правда сильного отличая от 768 не заметил, все равно потом flashVSR + adetailer прохожусь по пикам которые понравились, а они уже детали дорисуют и ебальничек под лору подгонит

Вы так долго тут срались, что быстрее взяли бы 6-10 фоток селябы, потренили бы на 256 и сюда выложили)

Аноним 12/12/25 Птн 21:15:36 № 1453106 238

Теоретически, если узнать во сколько раз фактически сжимает вае от флюха, то можно и ниже 256 пробовать, не думаю что там меньше 10 раз ваеха жмет.

Аноним 12/12/25 Птн 21:24:31 № 1453116 239

>>1453104
>что быстрее взяли бы 6-10 фоток селябы, потренили бы на 256 и сюда выложили
Я еотову на 256 натренил, никаких отличий от 1024. Выкладывать надо с еотовыми фотками, а ето диванен.

Аноним 12/12/25 Птн 21:31:09 № 1453120 240

>>1453083
>Я не буду оверфитить лору 6 часов
Я тебя доказывать не заставлял, ты сам полез. Но теперь уж или приводи нормальное доказательство, или подожди, пока я сам до тренировки с размером 256 доберусь (уж прости - сегодня рабочий день, не раньше завтра получится).

>Я хз маневр это или нет у тебя, но по итогу получается тебе нужна
Мне не нужна сама лора - я хочу понять, насколько реально теряются или нет мелкие детали при датасете из маленьких изображений. Везде об этом говорится, и это, сцуко, логично - ведь если на картинке деталь даже глазом не разобрать - откуда в лоре возьмется правильная информация об этой детали, ведь ее буквально вообще НЕТ в исходнике. А на квадрате 256 - там что-то мелкое но важное может реально как 2-3 пикселя выглядеть. Еще ДО того, как вообще в процесс обработки попадет. Я именно про это.
Остальное - просто проверка. Если лора на единственный объект не может генерировать правильное изображение в деталях, даже в оверфите, просто по токену без детального промпта - значит что детали в такой лоре проебываются, и малый размер картинок датасета таки не годен там, где эти мелкие детали важны. вот и все.
Мне сейчас не свое доказать важно, а реально разобраться. То что лора созданная на мелких картинках в принципе возможна - я под сомнение не ставлю. Скажем, крупный план чего-то без мелких деталей.

(И т.к. я уже остыл) И если бы ты с оскорбления не зашел здесь: >>1452667 я бы тоже в другом тоне ответил с самого начала.

Аноним 12/12/25 Птн 21:39:19 № 1453124 241

>>1451954
> Batch Size, блядь. Он, оказывается, не только на скорость влияет (типа - больше исходников за раз), но и на качество результата (потому, что что-то вычисляет на основе всех картинок - среднее выводит избавляясь от случайного эффективнее). Проверил - точно.
>>1452321
>>1452530
> меняют BS
> не меняют LR и steps
> удивляются

Буквально магическое мышление каргоультистов. Почитать не пробовали как и на что BS влияет? Хинт: может быть на что-то надо умножить число шагов?

https://github.com/spacepxl/demystifying-sd-finetuning

Аноним 12/12/25 Птн 21:40:22 № 1453125 242

>>1453104
>Вы так долго тут срались, что быстрее взяли бы 6-10 фоток селябы, потренили бы на 256 и сюда выложили)
Так оно этот спор не решит. Узнаваемость лица - достаточно крупными деталями достигается. Тут для проверки надо что-то более специфическое - машину с отбитой фарой или точным номерным знаком, или еще что-то такое - где важна мелкая но уникальная деталь.

Аноним 12/12/25 Птн 21:52:06 № 1453138 243

Аноним 12/12/25 Птн 21:53:35 № 1453139 244

>>1453125
В топе лор на civitai всегда позы, стили, персонажи, детали тела (писик/сисик).
Если эту хуйню можно обучить на 256 без потери каких ну прям пиздец важных деталей, то в рот оно ебись ваш спор если честно, дрочь ради дроч
Не знаю даже, конкретно под определенную задачу, когда нужна овердохуя детализация в каком то определенном концепте, то у меня не возникнет вопросов каких размеров тренить, я естесно вьябу 1024 (ибо мои 16гб пук-среньк делают на большем разрешении).
Но если на 256 мне даст спокойно сделать персонажа, позу или сисик писик, то это заебись и смысла я не вижу генерить выше

Аноним 12/12/25 Птн 21:54:44 № 1453140 245

>>1453138
Концептуальное дерьмо

Аноним 12/12/25 Птн 21:57:43 № 1453141 246

Аноним 12/12/25 Птн 22:00:46 № 1453143 247

>>1453124
>Буквально магическое мышление каргоультистов. Почитать не пробовали как и на что BS влияет?
Я потому на себя и ругался, что как раз читал, и не одно руководство. Общую взаимосвязь между BS и LR - они описывают. И число шагов я для BS считал под свой датасет, и выставлял согласно всем этим руководствам, а потом еще и с гемини консультировался для проверки. По всем прогнозам лора должна была быть готова примерно на 800 шагов. Но она начала шакалить картинку признаками оверфита уже на 500-600, при том что персонаж и близко не дошел до кондиции.
Т.е. либо все руководства все равно лгут, и LR надо ставить еще меньше, а шагов еще больше для BS=1. И намного. Или установка BS>1 реально влияет критически, как гемини про это выдала, и подтвердилось на практике. Вот что было ей сказано по данному вопросу, дословно:

Batch Size (BS) — это один из самых важных гиперпараметров, который влияет не только на скорость, но и на качество и стабильность LORA.
BS=1 Низкая точность. Градиент (направление, куда нужно двигать веса) вычисляется по одному изображению. Это делает обучение "шумным" и менее стабильным.
BS=2 Высокая точность. Градиент вычисляется по двум изображениям. Это более точно отражает "среднее" направление, куда должна двигаться LORA, что дает более стабильное и лучшее качество.

Может напиздела, разумеется. Но похоже, если по результату судить. Я ее пробовал в другой сессии чата потом расспрашивать чтоб контекст не влиял - повторяет. Либо глобальная ошибка в ее знаниях, либо оно таки действительно так.

Аноним 12/12/25 Птн 22:11:04 № 1453161 248

>>1453143
Батчсайз от оптимизатора зависит. У каждого свой оптимальный. Какой-нибудь Lion имеет оптимальный батчсайз 128-256. У адама 16-32. Шакалы на Z имеем не из-за оверфита, а из-за Турбы - тренить на дистиле всегда хуёво было на любых моделях, на базе такого не должно быть. Тут у нас выходов не много - не дотренивать лору до конца или сидеть на батчсайзе 8+ с оптимизатором под низкий батчсайз.

Аноним 12/12/25 Птн 22:14:31 № 1453173 249

>>1453139
Если - то да.
Но я хочу точно понимать на что подписываюсь, уменьшая размер картинок в датасете. Так что все равно проверять буду.

Аноним 12/12/25 Птн 22:17:48 № 1453180 250

>>1453124
Учту.
Попробовал въебать максимум говна, сделал 256/bs=4/uint4. На 1500 получилась хуйня. Ладно, не прям хуйня, да и может ненастроенный lr виноват, но начало ухудшаться качество, а лицу нужно было ещё хотя бы тысяча шагов. На 1024 и 768 с bs=1 такого не было.
Делаю сейчас ещё один тест, на 200 пикч на 256х занимают смешные 7.8гб во врам. Потом попробую это же с bs=8.

Ну, для каких-то грубых концептов или стилей 256 - топ выбор. Если оно не хуярит по качеству.

Аноним 12/12/25 Птн 23:38:22 № 1453272 251

Ну, вот лицо на 256, в 4 бит, кеширование включено, чтобы не хранить энкодер, 2к шагов.
Последние две - euler-simple vs er_sde-sgm_uniform.
Хз. Обучалось вдвое или даже втрое быстрей дефолтных настроек на 768/1024.

Аноним 12/12/25 Птн 23:43:30 № 1453276 252

>>1453272
>Обучалось вдвое или даже втрое быстрей дефолтных настроек на 768/1024.
Удивительно, да?

Аноним 12/12/25 Птн 23:45:22 № 1453278 253

>>1453272
Что-то выглядит на уровне референсов Квена, явно хуже референсов Флюкса 2.

Аноним 13/12/25 Суб 00:05:05 № 1453302 254

>>1453272
Енкодер тоже можешь в карту впиздячить в 2 бита, от него толку ноль.

Аноним 13/12/25 Суб 00:07:10 № 1453303 255

>>1453302
Нахуя это делать? Он отрабатывает отдельно перед тренировкой. Его лучше вообще не квантовать.

Аноним 13/12/25 Суб 00:09:46 № 1453304 256

>>1453303
> Нахуя это делать?
Инициализации моментальные, в отличие от фулового говнеца да еще в рамке

Аноним 13/12/25 Суб 00:10:45 № 1453306 257

>>1453304
А да еще кеш не надо хранить.

Аноним 13/12/25 Суб 00:21:51 № 1453315 258

>>1453272
На пик 3 - "не верю". Схожесть приблизительная, разрез глаз и нижнее веко не то. На пик 4 - "и так сойдет". И везде - подбородок неправильный. Он у нее хоть и острый выступающий, но все же не настолько, и не вперед, а скорее вниз - губы выделяются а не подбородок. У нее еще заметная ямка есть по центру - что в сумме не дает такого эффекта сверхтяжелой челюсти.
Хотя первые две - хорошо смотрятся в целом.
Это только лицо в датасете было, крупным планом? Из роли в сериале, или были общие фото вне роли?

Аноним 13/12/25 Суб 00:42:15 № 1453342 259

>>1453315
Ебать шиз

Аноним 13/12/25 Суб 00:48:20 № 1453347 260

>>1453342
Рили далбаеб

Аноним 13/12/25 Суб 01:05:17 № 1453351 261

>>1453342
Человек-шиздетектор, ты? Сходи в ремонт.

>>1453347
Ну, да - теперь алиса - универсальный аргумент. :)

Только вот вопрос вообще не в том, узнает сетка лицо или нет.
Я просто расписал мелкие детали, которые искажены. Художник такое увидит сразу.
Я ж тут не говорил, что все совсем плохо, а ты уже окрысился.

Аноним 13/12/25 Суб 01:27:12 № 1453370 262

Z-Image-Edit када?

Аноним 13/12/25 Суб 06:29:26 № 1453466 263

Я не понял щас, че комфи наконец-то научился сам обновлять пути к чекпойнтам, лорам и всяким другим ваям при загрузке воркфлоу...

Аноним 13/12/25 Суб 07:37:56 № 1453477 264

>>1453351
> Ну, да - теперь алиса - универсальный аргумент. :)
Ну так кожаный мешок в нейротреде ошизел, нужна компвис нейросеть, которая скажет кто на пикчах.

> Только вот вопрос вообще не в том, узнает сетка лицо или нет.
Ого, вот это маневр.

> Я просто расписал мелкие детали, которые искажены.
Это ты в зоге удмуртов и банкетных классифицируешь? Ты доебался до человека на ровном месте потому что тебе припекло от того что лора натренена на 256, что обоссало тебе ебало и нужно срочно искать минусы чтобы задемеджконтролить рваную сраку. Первый раз что-ли на дваче?

>Художник такое увидит сразу.
У меня худ образование, много лет худ школы, академический специалитет 6 лет, а рисую я 26 лет. Не лезь в этот аргумент, я тебя сожру.

> Я ж тут не говорил, что все совсем плохо, а ты уже окрысился.
Ты токсично пассивноагрессировал, упаковав в коннотацию говна, мне со стороны более лутше видно.

Аноним 13/12/25 Суб 07:49:19 № 1453480 265

всё хуйня ваши споры, попробуйте обучить лору кого-нибудь с родинкой

Аноним 13/12/25 Суб 07:55:23 № 1453482 266

>>1453480
Да, Мерелин Монро с испанской мушкой. Слабо? Чтобы не вызвать мушку промптом, но она была.

Аноним 13/12/25 Суб 07:57:18 № 1453483 267

>>1453120
>насколько реально теряются или нет мелкие детали при датасете из маленьких изображений. Везде об этом говорится, и это, сцуко, логично - ведь если на картинке деталь даже глазом не разобрать - откуда в лоре возьмется правильная информация об этой детали, ведь ее буквально вообще НЕТ в исходнике. А на квадрате 256 - там что-то мелкое но важное может реально как 2-3 пикселя выглядеть. Еще ДО того, как вообще в процесс обработки попадет. Я именно про это.
Братик, ты игнорируешь, что я второй раз щас буду описывать.
1. Держим в уме что флоу насрать на резолюшн выставленный в конфиге, он завязывается на резолюшн латента для корректной генерации, поэтому апскейл латента на флоу такой хуевый и нужны флоу апскейлеры специальные если именно латент скелить.
2. Допустим у тебя датасет из 1 картинки 1024, а резолюшн конфига лоры 256. Её реальный размер может быть хоть 4096×4096 - не важно.
3. После ресайза в 256 вае енкодит ее в раз 20 (я не знаю во сколько раз сжимает вае флюха, но примерно столько) в латент, и флоу подвязывается к этом латенту вычисляя/обучая поля скоростей. Казалось бы, даталоадер сжал картинку и потерял данные, но тут с ноги врывается пункт...
4. Flow не учит шум, детали, и прочее, поэтому все изображения с флоу точные и четкие на практически любых разрешениях - это архитектура синтетического статистического восстановления, а не прямого шумового предикшена. Так в том числе работают супер резолюшен модели. Все что ты видишь на картинках из флоу моделей это статистическая интерпретация модели. Побочным продуктом flow является внутренний принцип модели который можно описать как "галлюцинирующие высокочастотные детали", это так скажем статистика всей модели которая используется при генерации. Так как манямирок нейронок это работа со статистикой (как собственно у всех нейрокалов), то флоу ничего не стоит статистически предположить недостающие элементы опираясь на полученное поле скоростей с датасета.

То есть флоу НЕ может ФИЗИЧЕСКИ достать детали, уничтоженные при ресайзе даталоадером, но флоу они и не нужны, она в принципе их не изучала и не могла изучать, флоу достаточно информации и статданных чтобы их прямо синтезировать обратно, основываясь на знании из всего датасета и всей модели целиком. Магия нейросетевой статистики буквально.

Аноним 13/12/25 Суб 08:05:29 № 1453486 268

>>1453315
Согласен. Первая вообще не узнаваемая. Есть куда бустить узнаваемость, когда будет base и интересные файнтюны. Меня больше волновала эта лесенка, не замечал её на других генерациях на 9 шагах, но причины могут быть разные. Скорей всего несколько хуевых пикч в датасете. В принципе на другом 256 трейне её нет, там более натуральные jpeg артефакты.
В основном по плечи. Старый датасет только из первого сезона.
>>1453304
Он не в раме, он выгружается нахуй за ненадобностью после стартовой отработки. И раз ты экономишь 10 секунд загрузки и 10-100мб кеша, по-твоему где квантизация происходит?
>>1453466
Не понимаю хули они не сделают поиск по хешу, а не по имени. Даже когда добавят такую фичу, со старыми воркфлоу не сработает.

Аноним 13/12/25 Суб 08:06:35 № 1453488 269

>>1453482
>Чтобы не вызвать мушку промптом, но она была
У тебя фетиш на оверфит и генерацию без промта?

Кстати, если флоу не работает с контентом картинок, то можно хакнуть жопу флоу через дробление условной 1024 картинки на 4 чанка по 256, а батчсайзом скомпенсировать увелчивишийся датасет. Сайнс, бич.

Аноним 13/12/25 Суб 08:48:25 № 1453503 270

>>1452826
Десять лор говна - это просто очень много говна.
Такими лорами весь цивит засран.

Аноним 13/12/25 Суб 09:03:19 № 1453504 271

>>1453488
>>1453482
Да какая Монро, вы о чем вообще. Это ж примитив дизайна, плюс сетка такую личность скорее всего и так знает, хотя бы в следовых количествах.

Возьмите перса с какой-нибудь гачи-дрочильни по типу геншина или ZZZ. Вот уж где обилие мелких деталей, которые на сжатии в 256 пикселов просто в кашу превратятся, плюс тотальная ассиметрия костюма.

Хорошо тренированные лоры на сдохле с такими костюмами справлялись. Правда, все равно пердели от натуги, ибо у вае не хваало силенок детали обратно рисовать. Но - справлялись.
Причем были лоры как с вызовом "персонажа в костюме" одним токеном, так и с разграничением по частям.

Аноним 13/12/25 Суб 09:14:18 № 1453505 272

Как работают бакеты (в ai-toolkit для z)? Если в датасете 1024х1024 и 768x768, а выбраны бакеты 512, оно само отресайзит пикчи или кропнет? А что произойдет если датасет наоборот меньше бакета, допустим 384x384? Или лучше самому отресайзить? Не берем в расчет обучение pixel art, когда нужен особый метод ресайза.

Аноним 13/12/25 Суб 10:15:58 № 1453548 273

>>1453488
>робление условной 1024 картинки на 4 чанка по 256, а батчсайзом скомпенсировать увелчивишийся датасет
Ради инетерса тестанул. Взял пикчу анимедауна выше, разрезал на 12 чанков, пизданул скорость экстремальную и несколько эпох сделал. Роботает.

Аноним 13/12/25 Суб 10:18:10 № 1453553 274

Аноним 13/12/25 Суб 10:46:22 № 1453596 275

Шах и мат.
https://huggingface.co/DiffSynth-Studio/Qwen-Image-i2L

Аноним 13/12/25 Суб 11:11:50 № 1453612 276

>>1453505
отресайзит и если надо кропнет

Аноним 13/12/25 Суб 11:48:39 № 1453625 277

Как быть с вариативностью у тел/лиц? Буквально дефолтное ебло и тушка у каждой бабы, смена промпта и разрешение не спасает, только если конкретно описывать возраст, пропорции, и то дает примерно одинаковые вариации. В сдохле и то хотябы каждый сид это может быть смена ракурса, композиции. А тут буквально одно и тоже, каждый раз, пока абсолютно другой промпт не напишешь. Както чинится это, или это фишка зимагв? ( в квене то же самое кста)

Аноним 13/12/25 Суб 11:49:22 № 1453626 278

изображение.png 2Кб, 57x53

>>1453548
>Роботает.
Что работает?

Аноним 13/12/25 Суб 11:51:02 № 1453627 279

>>1453626
Ты тупой?

Аноним 13/12/25 Суб 11:57:32 № 1453630 280

>>1453627
Нет, ты тупой!
Что работает то?
Что именно у тебя на пикрилах натренировалось? Цвет фона?

Аноним 13/12/25 Суб 12:00:02 № 1453633 281

>>1453625
SeedVarianceEnhancer

Аноним 13/12/25 Суб 12:24:15 № 1453646 282

>>1453625
Ты там майнер встроил штоли? Зависает интерфейс комфи от пик2

Аноним 13/12/25 Суб 12:54:35 № 1453679 283

>>1453477
Ты доебался до человека на ровном месте потому что тебе припекло от того что лора натренена на 256
Чел, я не доебался. Я еще раньше написал, что уже остыл, и теперь просто хочу разобраться на практике. И просто перечислил то, где вижу разницу с оригиналом по мелким деталям/нюансам. Главное же - человек запостил ниже датасет на котором это тренировалось - я ему очень благодарен. Стало явно видно, что потеря мелочи хоть и есть, но намного менее критична чем я предполагал. Еще потом сам потестирую, но видимо, кроме совсем уж специфичных случаев, 256 хватает на практике.

Кому я извинения задолжал - тебе или нет, в любом случае, прямо говорю: я был неправ. Прошу прощения.

>>1453486
Большое спасибо за картинку с датасетом. Таки сильно помогло прояснить вопрос.
Кстати, гайды рекомендуют для конкретного персонажа ограничиться 15-20 изображений, а у тебя более 50-ти, что рекомендуется уже для концептов. Это было специально сделано под Z, и у нее другие надобности и в этом, или ты просто всегда так делаешь?
Спрашиваю потому, что и в гайдах, и гемини настоятельно рекомендуют не превышать количество, если нужен именно конкретный персонаж/объект - мол: "только потеряется детализация от обобщения, и увеличится время тренировки почем зря". Врут получается?

Аноним 13/12/25 Суб 13:26:42 № 1453726 284

охуенную лору обучил на зите, лицо прям один в один, родинка есть и присутствует где надо, 2100 шагов всего, нихуя не работает кроме крупных планов

Аноним 13/12/25 Суб 13:40:59 № 1453740 285

Какая модель хорошо подходит для удаления ватермарок и прочего мусора?

Аноним 13/12/25 Суб 15:08:36 № 1453806 286

>>1453272
Не похожа. Хуиту сделал. Переделывай говнодел. Учись.

Аноним 13/12/25 Суб 16:57:32 № 1453878 287

Z-Image-Omni-Base
A foundation model designed for easy fine-tuning, which unifies the core capabilities of image generation and editing to unlock the community's potential for custom development and innovative applications.
секси

Аноним 13/12/25 Суб 17:08:15 № 1453888 288

>>1453477
>У меня худ образование, много лет худ школы, академический специалитет 6 лет, а рисую я 26 лет. Не лезь в этот аргумент, я тебя сожру.
Запости побольше нейрокартиночек, плиз. Очень любопытно посмотреть, что генерит человек с таким бэкграундом.

мимо

Аноним 13/12/25 Суб 17:13:58 № 1453893 289

>>1453625
>это фишка зимагв
Это фишка всех пиздоглазых моделей, похоже. Все рисуют одну и ту же бабу. Нужны едит версии моделей, чтобы рисовать нужных тянучек с референса. Чистый т2и прумптинг — морально устаревшая методология на сегодняшний день.

Аноним 13/12/25 Суб 17:50:23 № 1453916 290

>>1453740
В принципе любая сдохля, но есть специализированные типа флюкс контекст. По ощущениям контекст лучший для быстрого редактирования исходника.

Аноним 13/12/25 Суб 17:56:08 № 1453921 291

>>1453740
Я Lama Cleaner для такого использую.

Аноним 13/12/25 Суб 17:58:08 № 1453925 292

>>1453893
Это фича вообще всех копронейронок еще с первой сд 1.5. Причем чем дальше тем больше, потому что раньше от смены задника цеплялась инфа по остальным элементам, но современные сетки обученный по развернутым промтам из мультимодалок умеют изолировать лица и абстрагировать их вот в такое нейроебало.

Аноним 13/12/25 Суб 18:59:14 № 1453943 293

>>1453878
где

Аноним 13/12/25 Суб 19:07:12 № 1453950 294

>>1453925
>Это фича вообще всех копронейронок еще с первой сд 1.5
Файнтюнов от васяна - да. Ваниллы - нет. Такого разнообразия всего на свете как в ванильной 1.5 нет больше нигде, и не будет, увы.

Аноним 13/12/25 Суб 19:10:19 № 1453951 295

>>1453625
Кароче я заметил что фича вариативностью проявляется если тренить с transformer_only:false лоры, просто тупа датасет с бабами на токен woman надрачиваешь и пользуешься.
Вовторых помогает переключение клипскипа на -3 (ну или на -1, если ты шиз и ненавидишь промты), -2 дефолтный слишком стабильный. Втретьих уже кидали сидвариатор, он там шум подмешивает согласно настройкам.

Аноним 13/12/25 Суб 19:12:35 № 1453952 296

>>1453951
>ну или на -1, если ты шиз и ненавидишь промты
Значение знаешь?

Аноним 13/12/25 Суб 19:14:02 № 1453955 297

>>1453952
NSFW фильтр на полную катушку на -1

Аноним 13/12/25 Суб 19:17:06 № 1453957 298

>>1453955
Хуйню сморозил.

Аноним 13/12/25 Суб 19:21:19 № 1453962 299

>>1453957
В рот тебе насрал. Скип -1, скип -3

Аноним 13/12/25 Суб 19:22:31 № 1453964 300

Блять кто делает интерфейс к ебаной комфилапше? Он заебал дергать элементы туда-сюда. Так ему и передайте.

Аноним 13/12/25 Суб 19:23:40 № 1453967 301

А за то что сломал превью в queue дайте ему в ебасос.
Все скозал. Мухожукаюсь.

Аноним 13/12/25 Суб 19:26:42 № 1453971 302

>>1453962
Ты же дебил, в теме хоть разберись. -1 у него цензурный клипспик орю нахуй

Аноним 13/12/25 Суб 19:53:32 № 1453984 303

Зачем китайцы зацензурили русик...
клип -3, клип -1

Аноним 13/12/25 Суб 19:55:31 № 1453985 304

>>1453984
как же так аноны

Аноним 13/12/25 Суб 20:02:53 № 1453988 305

>>1453950
У исходной 1.5 просто вместо тэгов вообще рандомный кал, поэтому у нее по любому промту вариативность долбанутая, поэтому ее еще приводило в чувство повесть в качестве негативного промта, откидывавшего 80% инфы и придававшего хоть какую-то когерентность.

Аноним 13/12/25 Суб 20:06:41 № 1453992 306

Мужики че за хуйня

Аноним 13/12/25 Суб 20:11:00 № 1453993 307

>>1453992
мужики блять партия скрывала от нас цензуру мужики

Аноним 13/12/25 Суб 20:12:57 № 1453994 308

>>1453993
бляяяя

Аноним 13/12/25 Суб 20:17:19 № 1453998 309

>>1453985
>тупой даун с минусовым айсикю из /б думает что это цензура и продолжает срать под себя

Аноним 13/12/25 Суб 20:19:11 № 1454000 310

>>1453998
Цензуры нет - твердость и четкий контур! Удар!

Аноним 13/12/25 Суб 20:55:27 № 1454011 311

Будни нищеты.

Аноним 13/12/25 Суб 21:17:50 № 1454020 312

>>1453964
>Блять кто делает интерфейс к ебаной комфилапше?
Теперь по этому темплейту открывается ZiT. Исправьте!

Аноним 13/12/25 Суб 23:59:12 № 1454205 313

>>1453679
Да я на похуе взял сет, собиравшийся ещё для сд 1.4, с более поздними сырыми дженерик капшенами из llava, посмотреть что вообще будет на 256, 200 пикч. Я не знаю советов и рекомендаций. Всё на что я натыкался за эти годы это было "делайте пуки, а не каки", по 10 параграфов на банальную очевидную хуиту. Я бы прочел советы реально крутого чела, но не натыкался на гайды от подобных. Обычно гайды пишут теоретики с копро-лорами.
>>1453726
>нихуя не работает кроме крупных планов
Кек

>Не похожа. Хуиту сделал. Переделывай говнодел. Учись.
Не дожал сообщение, добавь ещё 5 предложений.

Аноним 14/12/25 Вск 00:05:02 № 1454217 314

https://huggingface.co/malcolmrey/zimage
Чел ебать выдал уже 400+ лор на лица, которые теперь даже не загрузить на цивит.
Вот проба с его лорами. Дженна сходу лучше.

Аноним 14/12/25 Вск 00:12:53 № 1454234 315

>>1454217
>селебы селебы селебы
дегенеративное тупое бесполезное говно

Аноним 14/12/25 Вск 00:14:43 № 1454238 316

>>1454205
Пикчи это Z ? Круто, напоминает dall-e 3 из тех самых тредов с генерациями в /b/.

Тогда ещё ванговали, когда появится что-либо открытое, равное по возможностям. Те, кто назвал 2 года, были правы.

Аноним 14/12/25 Вск 00:44:28 № 1454284 317

Я как и хотел тоже попробовал опять. 256, BS = 8, steps = 300 (намеченные 2500 шагов на 8, с округлением результата), lr = 0.0001*sqrt(8) = 0.000282842712474619
https://imgur.com/a/01fX8bu
20 пикч, автокапшены с цивита, то есть дженерик описание без имён и триггер вордов.
Около 15гб врам, 45 минут, но ощущение, что можно было ускорить.
Просто, быстро, удовлетворительно, почти несочетаемо с другими лорами, по крайней мере на стандартных лоадерах. Поэтому удивляет, что чел наобучал уже столько лор ещё до выхода базы.
>>1454238
Всегда 2 года. AGI через 2 года, кстати.
Видеонейронка приблизительно сравнимая с Veo 3 и Сора 2 тоже через 2 года на локалках.

Аноним 14/12/25 Вск 01:47:49 № 1454336 318

В общем, потрахался я весь вечер с устрицей, и выяснил, что на 3060 12GB лору для зины без offload unet тренировать в принципе нельзя (на моем калькуляторе). Даже на датасете с картинками размером 256, и BS=1. Не лезет. Нужно хотя бы 25% offload. Зато на 50% и BS=4 - 4.5 сек. на шаг. Если еще и получится хорошо - ну так и совсем замечательно, в общем то. В этот раз концепт тренить поставил, а не персонажа.

Аноним 14/12/25 Вск 03:47:07 № 1454384 319

>>1454336
>Даже на датасете с картинками размером 256, и BS=1. Не лезет.
че? у меня 11.1 занимает если трансформер 4бита а енкодер 2 бита. если не держать енкодер то гигов 7 будет.

Аноним 14/12/25 Вск 08:13:02 № 1454450 320

>>1454336
Зачем ты вообще держишь TE в памяти во время обучения, ты ебанутый? Она выгружается из памяти даже при выключенных Unload/Cache опциях. Возможно, Low VRAM нужно тыкать.

Аноним 14/12/25 Вск 08:41:16 № 1454454 321

image 232Кб, 2684x802

ЧТо подустали от Зет? Вот вае с перешарпом к ней подходит. Резкость просто жесть добавляет и нахаляву как бы получается. На клозапах вообще перешарп выходит.

https://www.reddit.com/r/comfyui/comments/1plqamw/increased_detail_in_zimages_when_using_ultraflux/

Сам файл: https://huggingface.co/Owen777/UltraFlux-v1/blob/main/vae/diffusion_pytorch_model.safetensors

Аноним 14/12/25 Вск 09:04:52 № 1454462 322

>>1454454
зато не мыло на сдохле, правда ведь?
только выиграле ведь, правда...?

Аноним 14/12/25 Вск 09:18:39 № 1454464 323

>>1454454
Лол. Столько способов шарпить, а они додумались делать это через вае.
Даже простая смена настроек на er_sde - sgm уже делает более четко

Аноним 14/12/25 Вск 09:26:26 № 1454467 324

CLIPAttentionMultiply нода с такими настройками, как бы "стабилизирует" картинку. Масштаб объектов более адекватный друг к другу, лучше пальцы и глзза и много другое. Слева без нее, справа с ней. Почти всегда лучше пальцы и мелкие элементы. Влияет на текст. Не только в Зет, но и во многих других моделях, с такими настройками, картинка будет исправлена.
Прямо панацея какая-то. Хз, почему никто не знал.

Аноним 14/12/25 Вск 09:28:31 № 1454468 325

>>1454464
>Даже простая смена настроек на er_sde - sgm уже делает более четко
Этот вае от флюкса работает с многими моделями. И ты теперь можешь шарпить их все. Не везде можно использовать сгм. МОжно же бонго-батя57 с перешарпом

Аноним 14/12/25 Вск 10:26:06 № 1454491 326

>>1454217

Аноним 14/12/25 Вск 12:43:35 № 1454565 327

Аноним 14/12/25 Вск 13:12:18 № 1454585 328

>>1454384
>>1454450
Low VRAM всегда стояла. Но трансформер в 4 бита не пробовал. Значит надо попробовать...
А что касается encoder'а - если ставить просто галку на его выгрузку, то судя по описанию в справке к ней, не будут работать индивидуальные теги для каждой картинки из .txt - только один общий на все картинки заданный прямо в задании.
Мне для обучения на концепт это не подходит - там стиль изображения надо явно указывать - это фото, арт, аниме, 3d рендер или еще что, чтобы не смешивало стили в общую кашу. По крайней мере - так руководства учат...

Аноним 14/12/25 Вск 13:19:00 № 1454588 329

>>1454565
Хочу поделиться настройкой семплера/шедулера: dpm_2/ddim_uniform. Старый забытый семплер. Шедулер ddim любит сильно наваливать деталей по мелочам везде. В свызке с Зет именно они дали совсем не похожую на дефолт картинку. Отличается всё, что можно. Один минус - присутствует узорчатый шум(кривые кружочки) на коже, если резкие клозапы голого тела делать. Но в принципе проявляется не всегда и его можно потерпеть. На 9 шагах самое то.
В общем картинку преображает, если глаз уже замылился от Зет, то попробуйте.
Пик1 дефолт.

Аноним 14/12/25 Вск 13:22:10 № 1454591 330

>>1454588
Еще, по моим тестам за пару дней, он лучше следует промпту. Если упомянешь нсвф, то долой одежу, а дефолт может остаться в купальнике. Вот на пик1 дефолт, а я просил нарисованную картину. На пик2 dpm_2/ddim_uniform

Аноним 14/12/25 Вск 13:25:15 № 1454596 331

>>1454588
CFG на скрине 1.5, но лучше начинать с 1.0 и до 2.5

Аноним 14/12/25 Вск 13:30:15 № 1454605 332

>>1454596
>CFG на скрине 1.5, но лучше начинать с 1.0 и до 2.5
Тут, как бы, или начинать с 1.1, или сидеть на 1.0 - там же принципиальная разница. На 1.0 отрицательный промпт не работает. И при переходе на 1.1 время на один шаг растет практически вдвое.

Аноним 14/12/25 Вск 13:31:44 № 1454607 333

>>1454605
Ну, да. По сути я делал только три варианта 1.0, 1.5 и 2.0.

Аноним 14/12/25 Вск 14:01:19 № 1454620 334

>>1454238

Стилизацию под 60-е не может делать. Ещё ляхи не умеет рисовать.

dall-e 3 до лоботомии и запечатывания цензурой не приходилось упрашивать, а у Z те же болезнь, что и у SD - даже когда ему пишешь "большие бёдра", он всё равно худышек хуярит

Аноним 14/12/25 Вск 14:07:17 № 1454624 335

>>1454620
Зина любит подробности. Если ты написал "большие бедра" - она только бедра и изменит. Пиши детально про фигуру. Не нужны худышки - пиши что "пухлая фигура", или там "амазонка" в зависимости от того, что надо.

Аноним 14/12/25 Вск 14:07:17 № 1454625 336

the-upcoming-z-[...].webp 171Кб, 1920x1080

"Будущая Модель редактирования Z-Image настолько умная, что вы вводите ингредиенты и говорите: «Приготовьте блюдо»!!! Просто невероятно!"

"это может стать альтернативой Nanobanana Например, можно напрямую попросить изменить позу или добавить 3 случайных человека на одно фото и т.д."

Аноним 14/12/25 Вск 14:29:59 № 1454671 337

я со своей тянкой

Аноним 14/12/25 Вск 14:43:37 № 1454700 338

>>1454671
Грудь больше, чем у тянки, респект.

Аноним 14/12/25 Вск 14:46:09 № 1454705 339

>>1454588
>Хочу поделиться

>Почти под каждой лора на сивикале пишут про dpm_2/ddim_uniform

>на деле наваливает мусор из деталей но пидорасит геометрию этих деталей

Аноним 14/12/25 Вск 14:55:42 № 1454721 340

>>1454705
Я не пользуюсь лорами(кроме ускорялок), не хожу на цивитай. Всё придумал сам и поделился.
Вопрос: почему ты не поделился этой информацией здесь? Сэкономил бы мне время.

Аноним 14/12/25 Вск 15:04:22 № 1454736 341

>>1454721
Не поделился из-за того, что не хотел анону советовать кал. В влюбом случае все эти тесты делаются за час, с прогоном всех шедулеров и сеплеров на автомате.

Аноним 14/12/25 Вск 15:05:48 № 1454740 342

>>1454625
Дико. Складывается ощущение, что если они выпустят Z-Video, то и она приблизится к Соре. Но это вряд ли, в видео сфере итак был большой прогресс, это пикчевые модели так безнадежно устарели и были стародревним говном из жопы с кривой анатомией и всратой композицией, что нагнать было не сложно.

Аноним 14/12/25 Вск 15:07:52 № 1454748 343

>>1454740
Кому вообще нужны видеомодели, кроме ололошкололоты с тиктока?

Аноним 14/12/25 Вск 15:11:54 № 1454757 344

>>1454467
Может, потому что никакая не панацея?
А в некоторых случаях, ещё и делает всё хуже.

Это, конечно, хорошо, что запостил. Спасибо.
Только ни про настройки и их смысл ни слова, ни тестирования нормального (которое покажет, что не всегда это годится).

https://www.reddit.com/r/comfyui/comments/1f9n4te/why_clip_attention_can_improve_your_images_or/

Аноним 14/12/25 Вск 15:20:03 № 1454770 345

>>1454585
>Low VRAM всегда стояла.
Ну так она всегда вкл должна быть у нищеты.
>Но трансформер в 4 бита не пробовал. Значит надо попробовать...
Если че 4 бита для трансформера это аналог настроек как в QLoRA, так что кволити не страдает. Вот ниже 4 уже вопросы есть, но у нас как бы флоу архитектура, а ей в теории и 1 бита информации достаточно чтобы правильно апроксимацию скорости сделать. Но я не пробовал.
>А что касается encoder'а - если ставить просто галку на его выгрузку, то судя по описанию в справке к ней, не будут работать индивидуальные теги для каждой картинки из .txt - только один общий на все картинки заданный прямо в задании.
Там где анлоад те галка там да кепшены не работают.
А если галка где леер офлоад, на 100% для енкодера в 2 бита и 0% для трансформера, то тогда кепшены работают и те выгружается в рамку. Еще можно включит кеш текст эмбедингов, но тогда не работают дропауты и триггер ворд.

Аноним 14/12/25 Вск 15:31:14 № 1454795 346

В случае с зеткой всё зависит от промпта. Дефолтные настройки не значит плохие. Ваши изъёбства - самовнушение.

Аноним 14/12/25 Вск 15:37:39 № 1454810 347

Дайте гайд на тренировку лор для Z image плиз.

Аноним 14/12/25 Вск 15:41:01 № 1454819 348

соя2.png 56Кб, 1372x377

>>1454620
Для хвалёной микро бананы эта картинка оказалось чересчур горяча

Уменьшил до шакалов, потом попросил увеличить

Аноним 14/12/25 Вск 15:46:45 № 1454830 349

>>1454819
Людям откровенно нечем заняться.

Лучше бы выпускники философских факультетов и дальше продолжали работать в общепите, курьерами и грузчиками, чем устраивались в IT-компании, а потом ломали модели своей дебильной душной этикой.

Аноним 14/12/25 Вск 15:55:17 № 1454833 350

>>1454748
Рекламщикам. Режиссерам. Долбоебам.

Аноним 14/12/25 Вск 15:59:36 № 1454836 351

>>1454748
Всё, расходимся. Эксперт из комментариев сказал, что жизнь тлен и никакие видеомодели не нуж0ны.

Аноним 14/12/25 Вск 17:26:16 № 1454959 352

>>1454770
Да, так у меня примерно и стоит. 100% для encoder 25% для unet. Но unet сейчас в 8 бит, и вероятно, если выставить в 4 bit то можно 0% попробовать.

Аноним 14/12/25 Вск 17:33:26 № 1454969 353

>>1454770
>>1454959
Попробовал 4 бит и 0 оффлоад. Ы...
Оно так медленнее, чем 8 bit и 25% offload. 5.25 против 4.5 sec/it.
Логично, сцуко. 3060 нативно не то что в 4 - в 8 бит не умеет. А своей шины туда-сюда гонять остаток модели ей видать и так хватает, чтоб ядра загрузить.

Аноним 14/12/25 Вск 17:36:31 № 1454977 354

>>1454620
>Стилизацию под 60-е не может делать

Всё же может делать. По стилистике довольно натуралистично получает. Но, похоже, у него слабо с фантазией: не умеет додумывать окружение, нужно всё прописывать в промоте, что хочешь увидеть. Ну и да, нужно изъебнуться, чтобы это была не худышка.

Короче говоря, в плане качества это левел-ап, но в плане промтинга - практически то же самое, что и SD.

Qwen, кстати, умел бурно фантазировать, но потом заменили на какую-то более тухлую версию.

Аноним 14/12/25 Вск 17:40:38 № 1454990 355

анончики подскажите в какой нейронке они это делают ?

Аноним 14/12/25 Вск 17:42:29 № 1454993 356

>>1454990
нах ты принёс сюда этот кал? В /б параше спрашивай

Аноним 14/12/25 Вск 17:47:09 № 1455001 357

>>1454977
>но в плане промтинга - практически то же самое, что и SD.
Чел, побойся... ну кого угодно. :)
SD промптинг по сравнению с тем что у Зины - просто отсутствует. Чистый рандом по отдаленным мотивам. А то что у Зины фантазии нету - это может быть как багом так и фичей.
Лично я предпочту сам детально написать - что мне надо, если сетка это поймет и сделает. А чтобы рандом на картинках получать - wildcards подстановки в промпты давно придуманы.

Аноним 14/12/25 Вск 17:48:05 № 1455002 358

>>1454993
Не злись, анончик, это не твоя личная доска.

Аноним 14/12/25 Вск 17:50:11 № 1455003 359

>>1454993
ну блядь сюда и принес потому что тут прошаренные аноны сидят. а чё в /b/ шизы одни

Аноним 14/12/25 Вск 18:13:03 № 1455025 360

>>1454748
Нетрудно догадаться, если посмотреть, что здесь постят из треда в тред. Местному контингенту все модели нужны с одной единственной целью: чтобы дрочить. Сгенерил картинку няшной тяночки - подрочил. Анимировал картинку - еще раз подрочил.

Аноним 14/12/25 Вск 18:29:52 № 1455037 361

>>1455025
>чтобы дрочить

Как-то у тебя всё плоско и примитивно. Сплошная картонная профанация в духе постмодернистской деконструкции. Дело ведь в чувствах (а ведь это именно то, что отличает живое от неживого), в эстетическом восприятии.

Аноним 14/12/25 Вск 19:18:06 № 1455079 362

>>1455025
>Сгенерил картинку няшной тяночки - подрочил. Анимировал картинку - еще раз подрочил.

База.

Аноним 14/12/25 Вск 19:32:43 № 1455109 363

>>1451974
Одно видео высрал, потом начал триггериться

Аноним 14/12/25 Вск 19:44:29 № 1455124 364

grok-video-1b8a[...].mp4 1370Кб, 560x560, 00:00:06

>>1455109

Аноним 14/12/25 Вск 19:50:29 № 1455138 365

Аноним 14/12/25 Вск 19:52:04 № 1455139 366

Аноним 14/12/25 Вск 19:59:50 № 1455155 367

Аноним 14/12/25 Вск 20:03:08 № 1455158 368

>>1454810
Ставишь ai-toolkit, дальше всё однокнопочно.
>>1454795
А теперь попробуй это же на er_sde.
>>1454830
Это не этика, это капитализм. Этика это у грока, который в принципе позволяет генерить голых баб.
>>1454990
Nano Banana

Чел проебался мимо грок треда.

Аноним 14/12/25 Вск 20:05:34 № 1455162 369

>>1455025
Так а нахуя ещё использовать? Ты дохуя дизайнер рекламы? Геймдев? Или у тебя гнилая душонка и нужно САМОВЫРАЖАТЬСЯ?

Аноним 14/12/25 Вск 20:13:37 № 1455182 370

>>1455162
Может, это бот пишет? Подозрительно что тут, что в вк стали попадаться такие душно-уёбищные тупые комментарии.

Не, такие и до этого были. Но дело, как бы правильнее это сказать, в ощущении некоторой неуместности. В добавок таких было меньше. И исходили от несколько другого контингента.

Аноним 14/12/25 Вск 20:14:38 № 1455186 371

>>1455158
>А теперь попробуй это же на er_sde.
Лучше не стало. Стало по-другому. О чём я и писал.

Аноним 14/12/25 Вск 20:16:19 № 1455189 372

>>1454810
>Дайте гайд на тренировку
Поддерживаю, нужен гайд от адеквата.

Аноним 14/12/25 Вск 20:37:19 № 1455222 373

>>1455186
Как-то ты зажал с генерацией, что simple вышел более детализированный чем sgm_uniform.

Аноним 14/12/25 Вск 21:44:38 № 1455283 374

ComfyUItempzpbi[...].jpg 638Кб, 2160x2864

Аноним 14/12/25 Вск 21:51:58 № 1455289 375

>>1454810
>>1455189

Хуле там гайдить. Базовый лейаут пикрел.
Меняется только:
- скорость на адафакторе, хотите сейфово тренить - ставите меньше
- можно заофлоадить енкодер на 100%
- можно поменять таймстеп биас - хайпас изучает по сути калтент, лоупасс стиль, баланс - и то и другое
- дикей на маленьких датасетах не нужен

Если офлоадить енкодер можете резолюшн на 512 поставить или батч выше ставить или вместе с акумуляцией чтоб быстрее тренить и градиенты чище были.

В адвансед настройках можете выставить в блоке нетворка transformer_only: false - будет обучать все доступные для лоры слои а не только ффнет и атеншен, генерализация быстрее все дела адапатация лучше
Можете поменять конв дименшен на равный линейным слоям - будет больше локальной инфы с датасета пиздить, флоу похуй.

Переключать на локр с квантизацией на трансформере смысла нет - он не поддерживает ее и просто не запустится, а так локр лучше лора модуля по капасити и точности есличе. Ликорис в тулките пиздец старый версия 1.8 (актулаьная 3 сколькототам), поэтому нихуя больше не работает, я пишу патчик на поддержку всех актуальных алго (хочу BOFT заставить работать, потому что это наиболее близкое к полноценному файнтюну решение в части адаптеров т.к. меняет веса напрямую не затрагивая базовое поведение модели) но пока не понимаю как в этом говне устрицы все работает.

Аноним 14/12/25 Вск 21:58:40 № 1455294 376

>>1455289
>0.001
>10000
э?

Аноним 14/12/25 Вск 21:58:50 № 1455295 377

image.png 11Кб, 556x207

>>1455289
А да, в адвенседе вот ету хуйню тоже включайте, хуже не будет.

Аноним 14/12/25 Вск 22:06:09 № 1455299 378

image.png 22Кб, 501x138

>>1455294
10000 чтобы поставить и забыть, адафактору хватит 1000-1500 шагов для датасета 100 картинок, то есть 10 рипитов на картинку. В идеале обычно 100 рипитов на картинку делается чтобы прям все выжать, но это хуита как по мне нинужная.
0.001 просто в 10 раз меньше чем стандартная скорость адафактора, но то для гигантских датасетов и батчей. 0.0001 слишком медленно, 0.0005 норм.

Аноним 14/12/25 Вск 22:19:04 № 1455306 379

>>1455289
Петух-теореточник, можешь показать сравнения чем вся эта ебля лучше дефолтных настроек?

Аноним 14/12/25 Вск 22:57:04 № 1455333 380

>>1455222
Там у меня везде simple. sgm_uniform вообще не в тему.

Аноним 14/12/25 Вск 22:59:36 № 1455341 381

>>1455289
Чисто от себя - если концепт тренится, а не перс, то разница между 512 и 256 исходниками все таки немного есть. Не очень большая, но заметная, если упарываться в качество. "Текстуры" и мелкие детали все же лучше передаются. Если 256 - оно тоже не получается говном, но все это мелкое добро просто подменяется тем, что и так в модели есть. Скажем, кожа будет обычной, даже если в исходнике везде есть мелкие бледные малозаметные венки, и это часть концепта. Но пока процесс такую деталь вытащит из 256 - оно в оверфит по крупным деталям уходит, аж до поломанных пальцев (не шутка - начинает их корежить как сдохля а то и 1.5). При 512 - нормально получается именно вместе с этой мелочью. В остальном - не влияет, с чего я таки в охуе до сих пор. Магия какая-то. :)

Эксперементирую со вчерашнего вечера на терировке концепта.
Rank 96, LR 0.0002, DG=2, BS=4, 69 картинок датасет. 600 шагов - уже оверфит для концепта. Но заметить очень трудно, потому что единственный признак - детали текут из стиля в стиль, и сами стили смешиваются. Рандомных артефактов и прочей херни от случайного шума на картинке вообще нет.

Если 3060 (и возможно вся 30хх) быстрее работает с Transformer Offload 50% и 8 бит, чем 0% offload и 4 bit - уже писал выше.

Аноним 14/12/25 Вск 23:06:39 № 1455350 382

Получится ли пилить комиксы в Зимадже? Или оно не понимает как располагать фреймы?

Аноним 14/12/25 Вск 23:32:58 № 1455402 383

>>1455138
Это продолжение Гарри Поттера.

Аноним 14/12/25 Вск 23:34:18 № 1455410 384

>>1455306
>ебля
>перетыкнуть пару тумблеров
ты еблю не видел, шезлонг
>лучше дефолтных настроек
А какие у тебя вопросы? Ты аналитическим мышлением не владеешь и сам умозаключения сделать не можешь?
Адафактор самый лоурам оптим, при этом не являющийся 8бит калом. Еще пару аргов включишь и вообще будет авто лр.
4бит для трансформера потребляет в джва раза меньше врама, а никаких потерь нет.
2бит для енкодера буквально не влияет ни на что, енкодер необучаем, а врам и рам экономит.
256-512 пукселей для датасета очень экономит врам, флоу все равно откуда поля скоростей считать, а батчем можно значительно улучшить чистоту градиента.
Доп слои тренировать лучше, потому что там есть контекст рефайнеры и прочие важные штуки.

Аноним 14/12/25 Вск 23:34:31 № 1455412 385

>>1455155
>1
Неплохая бы получилась реклама Windows XP в начале 2000-х.

Аноним 14/12/25 Вск 23:40:52 № 1455422 386

>>1455341
>Чисто от себя - если концепт тренится, а не перс, то разница между 512 и 256 исходниками все таки немного есть. Не очень большая, но заметная, если упарываться в качество. "Текстуры" и мелкие детали все же лучше передаются. Если 256 - оно тоже не получается говном, но все это мелкое добро просто подменяется тем, что и так в модели есть. Скажем, кожа будет обычной, даже если в исходнике везде есть мелкие бледные малозаметные венки, и это часть концепта. Но пока процесс такую деталь вытащит из 256 - оно в оверфит по крупным деталям уходит, аж до поломанных пальцев (не шутка - начинает их корежить как сдохля а то и 1.5). При 512 - нормально получается именно вместе с этой мелочью. В остальном - не влияет, с чего я таки в охуе до сих пор. Магия какая-то. :)
Есть рабочая страта как обойти ограничения 256: берутся 2 идентичных датасета - только в одном целые изображения уменьшаются до 256, а во втором эти же изображения разбиваются на чанки по 256 (можно без капшенов). Поля скоростей будут идентичными для каждого датасета, но полезного сигнала больше.

Аноним 14/12/25 Вск 23:47:24 № 1455431 387

Аноним 15/12/25 Пнд 00:48:05 № 1455525 388

>>1455283
Индика.

Аноним 15/12/25 Пнд 01:00:58 № 1455538 389

>>1455422
>Есть рабочая страта как обойти ограничения 256
А это точно будет лучше, чем просто датасет из 512? Картинок то больше будет, эпоха длиннее.
Сейчас у меня просто 512 запущено с BS=4, памяти хватает, падение скорости строго линейно (было 4.5 с 256 стало 9 с 512).
Выигрыша по скорости от двойного датасета я точно не получу, а вот по качеству?..

Аноним 15/12/25 Пнд 01:27:14 № 1455556 390

>>1455538
>А это точно будет лучше, чем просто датасет из 512?
Это точно будет лучше по количеству информации, чем просто ресайз до 512, т.к. будешь иметь полную информацию с изображений в формате множества 256 слайсов.

Аноним 15/12/25 Пнд 01:57:10 № 1455608 391

>>1455556
А, дошло. Это выход, когда исходники мегапиксельного и выше качества. А я тут для тестов просто надергал картинок без особого подбора из сети - так они сами примерно около 512 после обрезки до квадрата оказались. Вот и затупил - их разве что пополам еще резать.

Аноним 15/12/25 Пнд 05:36:17 № 1455720 392

>>1455350
Попробуй.

Аноним 15/12/25 Пнд 05:46:27 № 1455723 393

>>1455350
комиксы можно в NewBie делать https://civitai.com/models/2197517/newbie-image?modelVersionId=2474326

Аноним 15/12/25 Пнд 08:42:37 № 1455753 394

>>1452562
Пытался завести инпейнт, а он ещё не имплементирован. Главная фича - аутпейнтить вокруг лица. Справится ли оно лучше вана.

Аноним 15/12/25 Пнд 09:25:06 № 1455782 395

Пару дней ковыряю этот ваш стейбл дифьюжн, попробовал разные модели и походу моя гтх1660 флюкс не потянет без шансов (500 сек на итерацию лол). Пошел искать 3060

Аноним 15/12/25 Пнд 09:34:22 № 1455784 396

>>1455782
>флюкс
нинужон
>Пошел искать 3060
вот ето правильно, но можно и с 16 гигами ченить взять бюджетное
а лучше 3090 24 гига сразу

Аноним 15/12/25 Пнд 09:44:56 № 1455787 397

И чо, какая модель сейчас ебет, раньше юзал flux shnell gguf, потом забил?

Аноним 15/12/25 Пнд 10:15:16 № 1455794 398

>>1455787
Для быстрого развлечения Z. Qwen по сути убит им. Если попердолиться, то на Qwen можно сделать лучше фото, но в остальном вообще не вижу преимуществ. Тот же Edit абсолютно ущербный, а при необходимости проще сделать что-то в Banana.
Поэтому имеют смысл разве что Z, Chroma и XL, ну и для специфических задач Wan, но и его может заменить Z. Хотя какие-то отдельные редкие лора лучше всего обучены на Flux.

Аноним 15/12/25 Пнд 10:37:43 № 1455805 399

>>1455784
>нинужон
Я прост хочу типа такого делать
https://civitai.com/models/1821327/csci-fi-mechanical-designdesigns-such-as-space-stations а там как раз он используется, хотя может там больше лора решает, хз

Аноним 15/12/25 Пнд 10:44:31 № 1455814 400

>>1455794
Flux Schnelle и читается как Флюкс Шнелле, а не как Флакс Шнел, в чём смысл шебм?

Аноним 15/12/25 Пнд 11:10:29 № 1455824 401

>>1455821
Я флюксом совсем не пользуюсь, просто мимопроходил и поинтересовался.

Аноним 15/12/25 Пнд 11:13:44 № 1455827 402

В галереях моделей обычно 90% мусор. В хроме вообще 99% мусор. Причем те немногие кто делает хорошо, нередко оставляют вф, но их не юзают повсеместно, а юзают дегенеративные EXTENDED EXTENSIVE SUPER PRO WORKFLOW, который после 100 недостающих нод за 1 час генерит копропикчу хуже дефолтного семплера.
В связи с этим вопрос. Покажите самые охуенные чужие пикчи из Z Image, увидеть что на ней можно делать.

Аноним 15/12/25 Пнд 11:38:42 № 1455844 403

Бляяя, а ведь Z-Image влезает в колаб и теоретически его там можно тренить, не нагружая свое ведро.

Аноним 15/12/25 Пнд 11:46:48 № 1455846 404

>>1455844
клёво https://colab.research.google.com/github/ostris/ai-toolkit/blob/main/notebooks/SliderTraining.ipynb
как проверишь расскажи нам

Аноним 15/12/25 Пнд 12:12:31 № 1455850 405

>>1455846
Running 1 process
Loading ZImage model
Loading transformer
config.json: 100% 473/473 [00:00<00:00, 3.67MB/s]
(…)ion_pytorch_model.safetensors.index.json: 49.0kB [00:00, 141MB/s]
transformer/diffusion_pytorch_model-0000(…): 82% 8.18G/9.97G [00:51<00:08, 217MB/s
кек, что-то даже запускается. жаль у меня все конфиги под н100 и лень настраивать

Аноним 15/12/25 Пнд 12:17:35 № 1455852 406

>>1454217
Зачем, блять и нахуя?
Если зитка и так выдает ортегу и айлиш из коробки.

Аноним 15/12/25 Пнд 13:19:37 № 1455908 407

>>1454454
> 2

Что это за пиздец такой? Причём тут шарп, если сетка нахуярила какую-то ебучую чешую и щетину.

Аноним 15/12/25 Пнд 13:33:03 № 1455925 408

>>1455794
Ну мы же не англичане, чтобы читать это слова как "флакс".

Sam Altman знаешь ли тоже Сэм Олтмэн. Ракеты Маска тоже не Фалькон, а Фэлкон. Так ещё можно долго продолжать.

Это нормально переиначивать заимствованные слова так, как удобно.

Более того, часто стремление достигнуть максимальной фонетичности уродует слова. Хотел бы пользоваться единицей измерения уатт (Watt)?

Аноним 15/12/25 Пнд 13:45:55 № 1455945 409

>>1455925
А Маск кстати Элон, а не Илон. Блэт, Обэмэ

Аноним 15/12/25 Пнд 13:53:45 № 1455958 410

>>1455925
> тоже не Фалькон, а Фэлкон. Так ещё можно долго продолжать.
Ага. И football тоже у нас, как фотбал произносится, не так ли?
> Это нормально переиначивать заимствованные слова так, как удобно
Кому удобно? Переиначивание флакс просто выдает нетакусика. Переиначивание его даже не во флукс, а в флюкс, выдает либо школьника, либо овулирующую сельдь, привыкшую готовить кашку с молочком и вареньицем своему пиздючку.

мимо проходил

Аноним 15/12/25 Пнд 14:23:00 № 1456012 411

>>1455852
Блядь, даже страшно представить как ты видишь мир, если у тебя Z выдает селеб из коробки. В двери осторожно на ощупь входишь?
>>1455925
Ну фэлкон это вообще база. Илон тоже звучит очень похоже.

Аноним 15/12/25 Пнд 15:25:52 № 1456091 412

фу, гадость какая. зачем такие лоры делать?

Аноним 15/12/25 Пнд 15:27:02 № 1456092 413

>>1456091
Ты больше по хуям?

Аноним 15/12/25 Пнд 15:29:56 № 1456095 414

>>1456092
котикам и щеночкам

Аноним 15/12/25 Пнд 15:30:57 № 1456097 415

>>1456012
Вот тупо первые не черипикнутые генерации в 768х1024 тупо по имени, с ортегой дописал венсдей. Если покрутить несколько раз и добавить разрешения будет больше схожести.

Аноним 15/12/25 Пнд 15:42:01 № 1456102 416

>>1456097
> с ортегой дописал венсдей
Вообще не похожа, Квен по референсу лучше генерит.

Аноним 15/12/25 Пнд 15:47:57 № 1456110 417

>>1456102
>Квен
Ну да ведь изначально по треду спрашивали именно про квен. Так ведь?

Аноним 15/12/25 Пнд 16:00:04 № 1456125 418

>>1456102
>Вообще не похожа

Аноним 15/12/25 Пнд 16:01:36 № 1456128 419

>>1456125
как же мне нравится когда местного шизоэксперта утверждающего о непохожести унижают нейронки

Аноним 15/12/25 Пнд 16:22:33 № 1456153 420

>>1456125
Сейчас бы аргументировать ии-слоп ии-слопом. Ещё и тупым. Нейронка и по скетчу тебе скажет кто это или вообще по одежде/причёске догадается. Дело же не в этом, а в том что ты натренил какое-то говно с лицом другого человека.

Аноним 15/12/25 Пнд 16:52:32 № 1456250 421

>>1456097
Ну и что это за рандомные раскрашенные бомжихи.

Аноним 15/12/25 Пнд 16:54:11 № 1456254 422

Возможно тупой вопрос но насколько критично отсутствие видюхи?
RAM 32, i9 13gen
текстовые копайлоты более-менее пашут.
ебнутая скорость/качество не нужны 512х512 достаточно, надо редачить картинки по промпту, будет ли это адекватно работать (условно до получаса) или без cuda это часы?

Аноним 15/12/25 Пнд 17:08:02 № 1456265 423

>>1456254
Сегодня, в мире лоКАЛок
>редачить картинки по промпту
означает сделать подбор промта из 5-10 попыток, потом ролл сида на 4-8 вариантов. То есть умножай свои полчаса 10 точно, а то и на 20.

Аноним 15/12/25 Пнд 17:08:21 № 1456266 424

>>1456254
Для лоурезов в SDXL-моделях хватит, раз тебе полчаса это терпимо. Хотя речь будет идти о минутах, И можно ускоряками обмазаться (lightning lora, dmd2 всякие) для генерации за меньшее количество шагов.

Аноним 15/12/25 Пнд 17:15:13 № 1456271 425

>>1456265
мне прям охуенно не надо, скорее просто хоть какой-то апскейл в 2-4 раза с добавлением деталей и сглаживанием шума
>>1456266
спасибо!

Аноним 15/12/25 Пнд 17:30:06 № 1456293 426

>>1455003
тут сидят прошаренные в своей шизовости

Аноним 15/12/25 Пнд 17:32:00 № 1456296 427

>>1456271
> хоть какой-то апскейл в 2-4 раза с добавлением деталей и сглаживанием шума
SeedVR2 попробуй, он и на ЦПУ в разумное время должен просраться

Аноним 15/12/25 Пнд 19:30:04 № 1456434 428

>>1456097
Готов поспорить, ты печатаешь СЛЕПЫМ набором.
Пожалуйста, не вылазь больше. Ты почему-то решил, что тут будет терпимость к таким умственным инвалидам как ты. Если еще осмелишься цифровым способом сравнивать, тащи хотя бы дистанцию между лицами.

Аноним 15/12/25 Пнд 19:32:14 № 1456439 429

>>1456271
>>1456254
Нахуй тебе тогда локал? Столько возможностей вокруг. Локал для дрочки. Качество и скорость в онлайне.

Аноним 15/12/25 Пнд 20:03:43 № 1456526 430

ModelScope https://x.com/ModelScope2022/status/2000394797434163654
🚀 Good news for Z-Image Turbo users!
We’ve open-sourced DistillPatch LoRA to restore true 8-step Turbo speed for any LoRA fine-tuned on Z-Image Turbo.

💡 The problem:
Standard LoRA training breaks Z-Image Turbo’s acceleration—images turn blurry at steps=8, cfg=1, even though they look fine at steps=30.

✅ We tested 4 approaches:
1️⃣ Standard SFT → high quality, but slow
2️⃣ Diff-LoRA → fast, but inflexible
3️⃣ SFT + distillation → great results, heavy lift
4️⃣ SFT + DistillPatch (our recommendation) → plug in one LoRA, instantly get 8-step Turbo performance back 🚀

https://modelscope.cn/models/DiffSynth-Studio/Z-Image-Turbo-DistillPatch/summary
https://github.com/modelscope/DiffSynth-Studio/blob/main/docs/en/Model_Details/Z-Image.md

Аноним 15/12/25 Пнд 20:04:09 № 1456528 431

>>1454748
>Кому вообще нужны видеомодели, кроме ололошкололоты с тиктока?

Аноним 15/12/25 Пнд 20:05:48 № 1456530 432

>>1456526
> The problem
Зачем они придумали несуществующую проблему?

Аноним 15/12/25 Пнд 20:32:48 № 1456571 433

>>1456530
Чому бы и нет.

Аноним 15/12/25 Пнд 21:14:34 № 1456649 434

>>1456526
Лол, сука. Это типичная ситуация "у чужого решения один изъян - оно сделано не мной"? Ostrich сделал же адаптер и теперь уже де-турбо модель.

Аноним 15/12/25 Пнд 23:07:05 № 1456809 435

>>1455794
Чёт проорал с долбоёба, у которого всё написанное латиницей это дефолтно англюсик.

Аноним 15/12/25 Пнд 23:12:58 № 1456825 436

>>1456809
Чёт проорал с долбоёба, который считает что его нахрюк кто-то будет читать выдуманным языком

Аноним 16/12/25 Втр 02:11:35 № 1457091 437

Первый(?) тюн Z-Image-Turbo https://civitai.com/models/2227123/nova-reality-zi?modelVersionId=2507211

Сам не еще пробовал, просто наткнулся сейчас.

Аноним 16/12/25 Втр 02:16:25 № 1457099 438

>>1457091
Наврал. Оказывается вчера еще один был: https://civitai.com/models/2201950/daf-zit?modelVersionId=2506150

Аноним 16/12/25 Втр 02:22:32 № 1457111 439

>>1457091
>>1457099
Да стоило два дня не зайти - их там прорвало. Позавчера тоже был оказывается. https://civitai.com/models/2221503?modelVersionId=2500972

Аноним 16/12/25 Втр 02:29:12 № 1457122 440

>>1457111
>>1457099
>>1457091
В еблю могут? Если нет, то нахуй не нужны.

Аноним 16/12/25 Втр 03:05:17 № 1457154 441

Я может быть тупой, но почему cfg 1>2 увеличивает время генерации степа в два раза?

Аноним 16/12/25 Втр 03:08:13 № 1457155 442

>>1457154
Загугли что такое CFG.
Вкратце, увеличение CFG приводит к существенному увеличению времени генерации.

Аноним 16/12/25 Втр 03:14:22 № 1457162 443

Оно научилось в сисик и писик, модель можно считать успешной.

Аноним 16/12/25 Втр 03:33:13 № 1457181 444

>>1457162
какая из говен

Аноним 16/12/25 Втр 03:43:21 № 1457188 445

>>1457181
ZIT, очевидно

Аноним 16/12/25 Втр 03:52:57 № 1457189 446

>>1457188
так какой файнтюн

Аноним 16/12/25 Втр 04:34:46 № 1457207 447

>>1457189
Лора
https://civitai.com/models/2183555?modelVersionId=2466345

Аноним 16/12/25 Втр 04:36:30 № 1457208 448

>>1457189
Только там все негатив юзают с тремя словами, без него пидорасит.

Аноним 16/12/25 Втр 10:27:48 № 1457287 449

>>1457154
Когда CFG=1.0, то движок может существенно упростить вычисление гайденса. Если CFG отличается от 1.0, то приходится считать по полной формуле. И тут уже не важно 0.9, 1.1 или 4.0 - все будут одинаково тормозно.

Аноним 16/12/25 Втр 10:34:47 № 1457288 450

>>1457154
>>1457287
Кстати гпт мне объяснил что cfg 1.0 еще и влияние лор усиливает максимально, я так пару раз недоглядел а потом охуевал с того что получилось

Аноним 16/12/25 Втр 13:50:11 № 1457414 451

Прикол, если в Z использовать предложение "You are an assistant." перед промтом, то несколько генераций по подному и тому же промту будут более разнообразными, чем голый промт.

Аноним 16/12/25 Втр 13:52:26 № 1457418 452

Алсо, clip layer на -3 иногда убирает проблемы с текстом. Особенно, с кириллицей.

Аноним 16/12/25 Втр 14:58:07 № 1457485 453

>>1457418
Да ты што!!!
>>1453992
>>1453993
>>1453994
>>1453985
>>1453984

Аноним 16/12/25 Втр 14:58:57 № 1457488 454

Там очередной выдроч квен3 4б через херетик чтобы снизить количество рефузалсов https://huggingface.co/BennyDaBall/qwen3-4b-Z-Image-Engineer

Аноним 16/12/25 Втр 15:14:38 № 1457507 455

>>1457414
>более разнообразными
Спасибо! Я попробовал такой подход: сначала генерирую черновой вариант (настройки на скрине), а затем прогоняю его через i2i. С текущими параметрами черновик выдаёт совсем другой сюжет, и основная задача — получить с него качественный i2i‑результат.
При низком denoise картинка выходит мыльной, а при высоком — становится чётче, но сюжет заметно уходит. Возможно, кто‑то подскажет оптимальные настройки для такого случая i2i.

Аноним 16/12/25 Втр 16:32:23 № 1457624 456

>>1457488
Так это для рефайна промптов. Возьми аблитерацию и всё. Еретик, кста, тоже даёт рефьюзы, в отличии от аблитераций ХуйХуя.

Аноним 16/12/25 Втр 17:00:36 № 1457689 457

Подскажите, что задать в промте для Qwen3-VL чтобы она перестала срать цензурой на картинки голых аниме тянок

И на чем ее лучше запускать? Пробую Ollama, но с ComfyUI в связке не очень удобно

Аноним 16/12/25 Втр 17:05:19 № 1457693 458

>>1450857
ComfyUI - очень страшно, я не знаю что это такое. Скачал Fooocus, но говорят, что это прям вообще основы

Комфи, которая в виде приложения для винды вполне себе нуб-френдли на уровне фукуса. Выбираешь задачу и модель какую надо, она сама все скачивает. Главное ничего кроме промпта не меняй.

Аноним 16/12/25 Втр 17:19:29 № 1457734 459

>>1457693
>Комфи, которая в виде приложения для винды вполне себе нуб-френдли на уровне фукуса.
Пробовал скачать недавно вместо обычного портабла, так эта хрень даже не заработала.

Аноним 16/12/25 Втр 17:57:01 № 1457801 460

>>1450857
>Только собираюсь вкатываться, подскажите актуальную приложуху для нуба.
нет ничего кроме комфи
>ComfyUI - очень страшно, я не знаю что это такое.
Там буквально посмотреть из чего состоит дефолтный пайплайн и все поймешь.
>Скачал Fooocus, но говорят, что это прям вообще основы
Факас это для совсем дегенератов однокнопочных без функционала.
>automatic1111 - типа давно не поддерживается.
ну да, но он в принципе рабоатет, как и его говнофорки типа форджа которые до сих пор чето там обновляются
>Может что-то еще есть нуб-френдли? Меня больше интересует обработка изображений: апскейл, дорисовка фона, наложение эффектов на фото, замена лиц, зачистка/замена объектов, совмещение - вот это вот все.
Вот под такую задачу тебе нужна комбуха из криты и комфи.
Ну или просто комфи, но чтобы в самом комфи удобно было надо докачать кучу нод.
енжой кароче https://github.com/Acly/krita-ai-diffusion установка не пердольная, все расписано.

Аноним 16/12/25 Втр 18:03:21 № 1457804 461

>>1457689
>что задать в промте для Qwen3-VL чтобы она перестала срать цензурой
надо расцензуренную качать
>И на чем ее лучше запускать? Пробую Ollama, но с ComfyUI в связке не очень удобно
а че неудобно? под каждый ллм клиент есть свои ноды чтобы тащить ответы в комфи типа https://github.com/stavsap/comfyui-ollama

Аноним 16/12/25 Втр 18:08:14 № 1457808 462

>>1457488
Я хуею с пориджей которые не могут абзац текста в промт написать, я меня инглиш неродной и то проблем с этим близко нет. Дальше будет ЛЛМ которая будет принимать голосовой инпут типа "А-аа-ыы-е-а-ы" и пытаться конвертировать его в человеческую речь.

Аноним 16/12/25 Втр 18:10:23 № 1457811 463

>>1457734
Там нужно свежий VC_redist поставить наверное, на днях переустанавливал комфи после того как случайно удалил сандбокс со старым и столкнулся. Возможно git еще.

Аноним 16/12/25 Втр 18:19:15 № 1457822 464

>>1457804
Я их и использую. Думал есть вариант получше.
Можно название или ссылку на модель без цензуры?

Аноним 16/12/25 Втр 18:27:54 № 1457831 465

>>1456091
где взять?

Аноним 16/12/25 Втр 18:34:57 № 1457837 466

>>1456528
чем зделол?

Аноним 16/12/25 Втр 18:45:13 № 1457846 467

>>1457831
https://civitai.com/models/2222911/z-image-godpussy?modelVersionId=2502526

Аноним 16/12/25 Втр 21:08:46 № 1457958 468

>>1457822
https://huggingface.co/huihui-ai/Huihui-Qwen3-VL-8B-Instruct-abliterated
https://huggingface.co/huihui-ai/Huihui-Qwen3-VL-4B-Instruct-abliterated

Аноним 16/12/25 Втр 21:10:00 № 1457960 469

>>1457822
>Я их и использую. Думал есть вариант получше.
Ну ты поищи по поиску комфименеджера, там много ллм нод. Я через убабугу ллмки подключал через специальные ноды.

Аноним 16/12/25 Втр 21:14:46 № 1457975 470

image.png 5732Кб, 4096x1088

image.png 6512Кб, 4096x1088

image.png 7535Кб, 4096x1088

image.png 7741Кб, 4096x1088

>>1457808
>>1457624
вы не понили

Аноним 16/12/25 Втр 21:38:13 № 1458022 471

>>1457975
Не поняли что оно делает кривее пикчи?

Аноним 16/12/25 Втр 22:30:36 № 1458093 472

image 3Кб, 308x78

Всю жись обновлял комфи первым батником. И тут заметил, что оказывается есть батник СТАБЛЕ. Вы каким обновляете? Есть смысл обновлять на "стабильную" версию?

Аноним 16/12/25 Втр 22:45:06 № 1458114 473

>>1458093
Обновляю git pull'ом, захожу в venv и pip install -r requirements.txt, потом cd custom_nodes и там гоняю ls | xargs -I{} git -C {} pull. Нахуя чот еще?

Аноним 16/12/25 Втр 22:59:54 № 1458136 474

>>1458022
Ты убежище

Аноним 16/12/25 Втр 23:02:18 № 1458140 475

>>1458114
Обновляю кнопкой "обновить" в настройках (кнопка открывает сайт с последней версией, которую надо скачать и поставить. Не андроид, чай)

Аноним 16/12/25 Втр 23:05:42 № 1458144 476

>>1457801
>>>Факас это для совсем дегенератов однокнопочных без функционала.

Он просто уже года два не обновлялся и последнее что в нем доступно это пони

Аноним 16/12/25 Втр 23:11:32 № 1458151 477

>>1457162
А в хуй не научилось. Писик без хуя - деньги на ветер.

Аноним 16/12/25 Втр 23:20:46 № 1458170 478

>>1458151
В хуй его научили еще раньше. Глянь там - чуть не десяток лор уже.

Аноним 16/12/25 Втр 23:22:13 № 1458179 479

Ладно. Эта ваша зимага умеет в еблю из коробки или надо лорами обмазываться?

Аноним 16/12/25 Втр 23:26:42 № 1458185 480

>>1458179
Тюн скачай. Уже есть.

Аноним 16/12/25 Втр 23:26:56 № 1458186 481

>>1458179
В полноценную еблю не может, лоры сильно портят промпт

Аноним 16/12/25 Втр 23:31:34 № 1458196 482

Порекомендуйте где можно намотреться видосов по установке нейросетки себе на комп и тому, как ей пользоваться. Цель - генерация пикч с сиськами и письками

Аноним 16/12/25 Втр 23:33:52 № 1458203 483

>>1458186
Кстати о лорах. Как там с генерацией еотовных из датасета рожи?

Аноним 16/12/25 Втр 23:40:54 № 1458221 484

>>1458203
Отлично.

Аноним 16/12/25 Втр 23:50:42 № 1458238 485

>>1458179
я вот скачал

redcraftRedzimageUpdatedDEC03_redzimage15AIO

и не сказал бы что он вообще чем-то отличается от базовой версии в плане цензуры

Аноним 16/12/25 Втр 23:57:50 № 1458249 486

>>1458221
Заебок. Сдохля и хромая уже заебали. Поиграемся с этим.

Аноним 17/12/25 Срд 00:23:16 № 1458330 487

Подскажите, дайте код ноды, текстовое поле которое принимает текст и может сохранять его в ворфлоу. Из какого-то пака, но не хочу ставить целиком, мне только эта нода нужна. Мучал дипсик и квен они дают код не рабочий или не понимают меня. Вот есть стандартная нода Preview as Text только она ущербная, при переключении вкладок текст с нее пропадает и не сохраняется.
Спасите. Нужна простая маленькая нода

Аноним 17/12/25 Срд 00:46:15 № 1458391 488

>>1458330
Show Text 🐍от pythongosssss
https://github.com/pythongosssss/ComfyUI-Custom-Scripts/blob/main/py/show_text.py
Но на всякий случай напомню, что в воркфлоу сохраняется то состояние, которое было при нажатии Run, т.е. чтобы сохранился нужный текст (а не предыдущий, например), нужно чтобы он там уже был до нажатия Run.

Аноним 17/12/25 Срд 01:14:32 № 1458453 489

>>1458196
Тащемта никакого секрета тут нет.

Аноним 17/12/25 Срд 01:22:54 № 1458463 490

>>1458453

Аноним 17/12/25 Срд 01:30:08 № 1458465 491

Баляять, а че лора так быстро дрессируется для зимага?

Аноним 17/12/25 Срд 01:38:51 № 1458475 492

>>1458465
Ну да.

Аноним 17/12/25 Срд 01:38:52 № 1458476 493

Че за хуйня с WebUI?

Я спустя год решил его заново поставить и теперь он клянчит аккаунт гитхаба, а потом просто выдает ошибку 128 и впн не помогает.

Аноним 17/12/25 Срд 01:46:14 № 1458477 494

>>1458465
Ты там прихуеешь еще от скоростей когда узнаешь что флоу зимаже достаточно 256 резолюшена...

Аноним 17/12/25 Срд 07:03:15 № 1458652 495

176594347507713[...].jpeg 40Кб, 640x228

DFloat11 this quant is 100% lossless. https://www.reddit.com/r/StableDiffusion/comments/1poiw3p/dont_sleep_on_dfloat11_this_quant_is_100_lossless/?share_id=ubo-KJua5I7HxM_O2M47b

https://huggingface.co/mingyi456/Z-Image-Turbo-DF11-ComfyUI

https://github.com/BigStationW/ComfyUI-DFloat11-Extended

Аноним 17/12/25 Срд 07:31:17 № 1458667 496

>>1457958
Как эту хуйню в один файл собрать?

Аноним 17/12/25 Срд 08:36:17 № 1458740 497

Запись экрана 2[...].mp4 1221Кб, 840x330, 00:00:17

>>1458391
Спасибо. У меня получилось содрать ноду себе. Это было здесь https://github.com/chibiace/ComfyUI-Chibi-Nodes
Вот такое поведение текста мне нужно было как на видео. Очень удобно и сохраняется в вф.

Аноним 17/12/25 Срд 09:47:21 № 1458800 498

Хоть у меня и так всё летало, но заменил фп16 ТЕ на фп8 скейлед, ради интереса и стало вообще за наносек. Разницы в качестве вообще нет. Смысл в фп16 на ТЕ? Я про зимаж если что.

Аноним 17/12/25 Срд 10:12:11 № 1458809 499

>>1458463
Качество и резкость так и прет

Аноним 17/12/25 Срд 10:19:13 № 1458810 500

>>1458809
Сеймфейсы и сеймсиськи так и прут, я бы сказал.

Аноним 17/12/25 Срд 10:37:47 № 1458813 501

>>1458800
А где скачать? Дай ссылку

Аноним 17/12/25 Срд 10:39:08 № 1458814 502

>>1457689
Попробуй эту ноду, оно немного сыровато и пути поиска прибиты гвоздями, но оно работает. И там есть нода по сохранению сгенерированных промптов в библиотеку

https://github.com/FranckyB/ComfyUI-Prompt-Manager

Аноним 17/12/25 Срд 10:43:19 № 1458815 503

>>1458800
>Смысл в фп16 на ТЕ?
Его нет. Я гоняю гуфа в кванте4, даже тексты генерит.

Аноним 17/12/25 Срд 10:45:07 № 1458816 504

Кто активно работает с субграфами? Я думал они созрели начал активное внедрение. Сделал генератор -> конвертнул в субграф, настроил -> сделал клон и изменил ксемплер на другой -> в первом поля просто так поперепутались -> постоянно рвется линк на денойз внутрь субрафа.
Короче за 30 минут доверия они так и не заслужили. Я не хочу искать потом в сложных схемах где обрыв линии.
Как ваши успехи?

Аноним 17/12/25 Срд 10:46:32 № 1458819 505

>>1458813
Закинул всё в воркфлоу. Сделал себе ALL-IN-ONE стало вообще заебиись 1 чекпоинтом оперировать.

https://huggingface.co/T5B/Z-Image-Turbo-FP8/resolve/main/z-image-turbo-fp8-e4m3fn.safetensors

https://huggingface.co/jiangchengchengNLP/qwen3-4b-fp8-scaled/resolve/main/qwen3_4b_fp8_scaled.safetensors

https://huggingface.co/Comfy-Org/z_image_turbo/resolve/main/split_files/vae/ae.safetensors

Аноним 17/12/25 Срд 10:47:36 № 1458820 506

>>1458667
ее не нужно в один файл собирать

Аноним 17/12/25 Срд 11:06:44 № 1458828 507

>>1458809
>>1458810

Аноним 17/12/25 Срд 11:20:14 № 1458832 508

>>1458828

Аноним 17/12/25 Срд 11:24:36 № 1458839 509

>>1458832

Аноним 17/12/25 Срд 11:26:22 № 1458842 510

>>1457189
И как это грузить? Ошибку выдает

Аноним 17/12/25 Срд 11:27:10 № 1458844 511

>>1458842
што

Аноним 17/12/25 Срд 11:27:29 № 1458845 512

>>1457958
>>1458842

Аноним 17/12/25 Срд 11:32:26 № 1458853 513

>>1458839

Аноним 17/12/25 Срд 11:36:10 № 1458859 514

>>1458845
ты сам кванты найти не можешь чтоли?
https://huggingface.co/mradermacher/Huihui-Qwen3-VL-8B-Instruct-abliterated-GGUF/tree/main
https://huggingface.co/noctrex/Huihui-Qwen3-VL-4B-Instruct-abliterated-GGUF/tree/main

Аноним 17/12/25 Срд 11:40:32 № 1458860 515

>>1458853
орирую как зимага иронично делает ошибку в тексте робата

Аноним 17/12/25 Срд 11:44:15 № 1458862 516

>>1458860

Аноним 17/12/25 Срд 11:50:26 № 1458863 517

>>1458860
Просто ты скиллишью криворучка

Аноним 17/12/25 Срд 11:55:32 № 1458864 518

>>1458863

Аноним 17/12/25 Срд 12:00:55 № 1458867 519

>>1458864

Аноним 17/12/25 Срд 12:21:13 № 1458882 520

>>1458859
Все равно ругается. Семплер говорит че-то не то в него пихается.

Аноним 17/12/25 Срд 12:22:20 № 1458883 521

>>1458882
а так ты че вл в зимагу пихаешь чтоли? надо обычный qwen 4b

Аноним 17/12/25 Срд 12:26:40 № 1458888 522

>>1458867
Да пиздец на самом деле, не сивитаи а зеркало порнхаба.

Аноним 17/12/25 Срд 12:36:14 № 1458902 523

>>1458816
Активно пользуюсь, никакого непредвиденного поведения не замечал. Раздражает только невозможность свободно сортировать порядок выходов, в остальном - довольно урчу. Лучшая фича по наведению порядка в лапше.

Аноним 17/12/25 Срд 13:10:08 № 1458935 524

>>1456097
Какая модель лучше всего генерит знаменитостей по референсам.
Я качал флакс 2 50 часов какой-то квантованный.
Он вообще делает непохоже совсем.
Да и впринципе ничего общего с референсами не дает.

Аноним 17/12/25 Срд 13:31:01 № 1458950 525

Sd1.5 Понимание промпта конечно никакое. И люди кривые само- собой. Но блин это древняя полторашечка. Куда делся весь цвет, яркость вот это вот всё. Какая модель сейчас так генерит фон. Таким зеленым?

Аноним 17/12/25 Срд 13:37:09 № 1458951 526

>>1458883
Сука, я думал вы тут лоботомитов поумнее за руль промпта посадить пытаетесь, а вы какую-то хуйню делаете...

Аноним 17/12/25 Срд 13:37:42 № 1458953 527

>>1458950
>весь цвет, яркость вот это вот всё
Дрочеры требуют реализм. Реализм всегда идёт в приглушённых тонах.
Яркости тебе может навалить wan, он любит эту клипартовую постановочность.

Аноним 17/12/25 Срд 13:59:23 № 1458970 528

>>1458950
Z и ярче может.

Аноним 17/12/25 Срд 14:13:55 № 1458978 529

>>1458935
зетка вроде хорошо знает целебов
https://www.reddit.com/r/StableDiffusion/comments/1p9m78k/humans_of_zimage_how_many_celebrities_can_you_fit/

>>1458950
сделал по рефу в зетке, вроде с цветом и яркостью все нормально.

Аноним 17/12/25 Срд 15:58:28 № 1459094 530

>>1458477
Я уже прихуел с того что появилась вменяемая и быстрая модель. На сдохлю давно хуй не стоит, флаксы и хромы это медленнаблять даже с турбодурилками, квен больше технодемка, а тут все очень даже неблохо.

Аноним 17/12/25 Срд 16:01:33 № 1459097 531

>>1459094
>флаксы и хромы
Там реализма нет нихуя. Чёткость волос на руках есть, но всё смердит нейроговном и постановой. Зетка же будто фотки, даже я с полторашек дрочу модели, но порой не всегда могу точно сказать по генерациям зетки - фото это или нейрослоп. Впервые такое у меня.

Аноним 17/12/25 Срд 16:43:08 № 1459165 532

>Installation WAN 2.6
>Activation: Upon the first launch, the software will automatically register your HWID and start your 14-day unlimited timer.
Новый Ван всё? https://github.com/WAN-2-6/wan-2.6
https://wan26.ai/

Аноним 17/12/25 Срд 16:44:42 № 1459168 533

>>1459165
>Note: An active internet connection is required during the first launch to verify the trial license.
То есть на своем же железе и еще и платно?

Аноним 17/12/25 Срд 16:51:08 № 1459178 534

image.png 67Кб, 1079x100

>>1458819
В этом разрешении 1024х2048 на 4060ти

Аноним 17/12/25 Срд 16:51:58 № 1459181 535

image.png 84Кб, 1080x102

>>1459178
В 1МП

Аноним 17/12/25 Срд 16:58:20 № 1459194 536

Промпт конечно может сильно качество менять в зетке...

Аноним 17/12/25 Срд 17:26:34 № 1459213 537

>>1459165
Такое впечатление, что это если и не скам кого-то левого, то грубое нарушение условий использования GitHub. Он там сейчас используется фактически как файлообменик для екзешника под винду, а исходный код в репе отсутствует (затычка в наглую лежит вместо реальных исходников).
По идее - надо бы всем кагалом репортить эту хитрую морду гитхабу за нарушение. Дабы неповадно было.

Аноним 17/12/25 Срд 19:42:37 № 1459352 538

image.png 19Кб, 855x130

>>1458800
>>1458815
Не пиздите. С первой же нахуй генерации на фп8 отвалилось ползуба, появилась дыра в тени, упростилась геометрия фона и поменялась текстура на фоне, меняя восприятие глубины. Потом я специально нагенерил кучу пар, запутал себя и сделал слепой тест. Всегда в одной из пар какая-то хуйня то с зубами, то с глазами, то предметы превращаются в более простые, становятся более пластиковыми. И оказалось, что всегда это было fp8. И главное прирост, если и есть, то это около 25>21 или 29>25. Для анимекала или для черновых генераций пойдёт, для нормальной генерации это только деградация качества.
>>1459165
Какой-то васянский скам. С SEO keywords вообще обосрался. Нахуй ты сюда это притащил? Твой троян?

Аноним 17/12/25 Срд 19:49:49 № 1459362 539

>>1459097
>Чёткость волос на руках есть, но всё смердит нейроговном и постановой
This. А у СДоХЛи ссаной нет глубины, все плоское блять. Зимага удивляет.

Аноним 17/12/25 Срд 19:54:41 № 1459368 540

https://www.reddit.com/r/StableDiffusion/comments/1poiw3p/dont_sleep_on_dfloat11_this_quant_is_100_lossless/

Аноним 17/12/25 Срд 20:20:27 № 1459392 541

>>1458652
>DFloat11 this quant is 100% lossless. https://www.reddit.com/r/StableDiffusion/comments/1poiw3p/dont_sleep_on_dfloat11_this_quant_is_100_lossless/?share_id=ubo-KJua5I7HxM_O2M47b

>https://huggingface.co/mingyi456/Z-Image-Turbo-DF11-ComfyUI

>https://github.com/BigStationW/ComfyUI-DFloat11-Extended
>DFloat11 this quant is 100% lossless. https://www.reddit.com/r/StableDiffusion/comments/1poiw3p/dont_sleep_on_dfloat11_this_quant_is_100_lossless/?share_id=ubo-KJua5I7HxM_O2M47b

>https://huggingface.co/mingyi456/Z-Image-Turbo-DF11-ComfyUI

>https://github.com/BigStationW/ComfyUI-DFloat11-Extended
>>1459368
Я выше про это писал

Аноним 17/12/25 Срд 20:31:52 № 1459404 542

>>1459352
Скиллишью.

Аноним 17/12/25 Срд 20:47:01 № 1459438 543

Z-Image-Turbo-Fun-Controlnet-Union-2.1 https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union-2.0/tree/main

2.1 is faster than 2.0 because of a bug in 2.0.
Ran a quick comparison using depth and 1024x1024 output:

2.0: 100%|██████| 15/15 [00:09<00:00, 1.54it/s]

2.1: 100%|██████| 15/15 [00:07<00:00, 2.09it/s]

Аноним 17/12/25 Срд 21:27:47 № 1459497 544

>>1458978
Селебы/100. Большую часть не знаю даже по имени, в лицо узнаю только пару потусов, Меркель и Бреда Пита.

Аноним 17/12/25 Срд 21:35:33 № 1459506 545

>>1459352
>Не пиздите. С первой же нахуй генерации на фп8 отвалилось ползуба, появилась дыра в тени, упростилась геометрия фона и поменялась текстура на фоне, меняя восприятие глубины. Потом я специально нагенерил кучу пар, запутал себя и сделал слепой тест. Всегда в одной из пар какая-то хуйня то с зубами, то с глазами, то предметы превращаются в более простые, становятся более пластиковыми. И оказалось, что всегда это было fp8.
Дурка ебаная

Аноним 17/12/25 Срд 21:37:01 № 1459510 546

>>1459392
с етой ебаниной лоры не рабтают кста

Аноним 17/12/25 Срд 21:51:54 № 1459529 547

>>1457846
Это я, конечно, качаю.

Но немного удивлён, что тут все продолжают на Z дрочить.
Причём на саму Z, а не использовать Z как обёртку для обреализмевания результатов генерации других моделей, которые в большую шизу, позы и лоры умеют.

Ну или может у меня просто Z слишком плохо на лоры реагирует даже при дроче коэффициентов, и либо ломается, либо фиксируется на лорах.

Аноним 17/12/25 Срд 22:35:59 № 1459589 548

https://civitai.com/models/2172944/z-image-tensorcorefp8
У вас это даёт прирост скорости? На 40XX/50XX.
В консоли пишет manual cast: torch.float16 и хоть какие ему флаги суй, ничего не меняется.
Владельцы 50XX в теории могут вообще nf4 значительно быстрей юзать.
>>1459438
Сама генерация кал, но сравнение на одинаковом вф. 2.0, 2.1 (походу комфи не полностью обновилось), 2.1 после ещё одного перезапуска комфи. Сравнение ни о чем не говорит кроме как о необходимости обновить комфи.
Инпейнт до сих пор не получается.

Аноним 17/12/25 Срд 22:55:58 № 1459639 549

>>1459529
>обреализмевания
Сисик и писик на зетке видел?

Аноним 17/12/25 Срд 23:02:41 № 1459649 550

>>1459639
С лорой видел.
Анус - нет.

Аноним 17/12/25 Срд 23:08:16 № 1459661 551

Почему в зимадж мочатся изо рта? Это такой троллинг разрабов?

Аноним 17/12/25 Срд 23:47:17 № 1459744 552

>>1459661
Очевидно потому, что писи-каки неизвестный для модельки концепт. Вряд ли китайский корпорат напихивал в датасет испражняющихся людей, если оно даже гениталии не видело ни разу.

Аноним 18/12/25 Чтв 00:29:17 № 1459785 553

>>1459639
>Z слишком плохо на лоры реагирует
>С лорой видел.
Тогда непонятно что ты имеешь ввиду под "использовать Z как обёртку для обреализмевания".

Аноним 18/12/25 Чтв 00:36:40 № 1459798 554

>>1459785
> Тогда непонятно
Одну лору ещё можно подружить. Две... ну побалансить весы...
В то время как на илюстросы вешаешь 5-10 лор, и оно не захлёбывается, а рисует что подхватывает с лор.
А Z рисует уже "реализм" по тому, что видит, какая бы бредятина там ни была.
Хотя надо признаться, у меня мало примеров такого применения, так что понимаю, что со стороны выглядит как фантазёрство. Надо самому побольше нормальных примеров наделать сначала.

Аноним 18/12/25 Чтв 00:45:07 № 1459823 555

>>1459798
А как они видит? через ControlNet? Опиши воркфлоу который ты используешь.

Аноним 18/12/25 Чтв 00:46:55 № 1459827 556

>>1459823
Да дурацкий image 2 image же. С дрочем коэффициентов на вкус пользователя и в зависимости от оригинала.
Лица правда может полностью переделать, но это же "реализм".

Аноним 18/12/25 Чтв 01:07:39 № 1459857 557

>>1459798
>В то время как на илюстросы вешаешь 5-10 лор, и оно не захлёбывается
Далеко не всегда. У меня регулярно начинались шакалы картинки уже на 3-ей лоре - что не делай. Зависит от самих лор.
На Z я уже тоже поиграться с лорами успел. IMHO - можно и больше двух заюзать, но тут вступает основной нюанс Z - чувствительность к промпту. Ей надо на боле-менее естественном языке писать, и как-то вплетать ключевые слова активации в промпт так, чтобы нормально читалось. Если лор несколько, это еще сложнее. Особенно, если автор лоры об этом не подумал.
И очень важно - "зоны действия" лор. Если одна, скажем, делает модель автомобиля, а вторая - дом, они почти не влияют друг на друга, и можно силу почти не трогать. А если это два стиля, т.е. затрагивают все - действует золотое правило "сумма силы лор должна быть <= 1".
В общем - капризнее Z к этому делу, несомненно. Но все-же использовать можно, если приловчиться.

Аноним 18/12/25 Чтв 01:16:38 № 1459879 558

>>1459857
> Но все-же использовать можно, если приловчиться.
Ну вот мне пока кажется, что легче приловчиться генерить шизу на других моделях, а её использовать уже на готовом.
Ну или через месяц-два-три что-то случится, и Z станет не такой капризной. Что угодно, какой-нибудь плагин для комфи, какая-нибудь автоматизированная система весов (херню несу) или другая версия зетки.
По крайней мере текст зетка генерит постабильнее других.

Аноним 18/12/25 Чтв 01:35:06 № 1459898 559

Куды технотред уплыл? Похуй. Лапшу в докер кто нибудь пихал?

Аноним 18/12/25 Чтв 05:34:56 № 1460015 560

>>1459827
Спасибо за наводку по поводу img2img, чет как-то мимо прошло. На сравнении слева скриншот персонажа из virtamate, справа результат в Z. Порадовало как зет сделал лес на заднем плане и замок.

Аноним 18/12/25 Чтв 05:57:04 № 1460019 561

>>1460015
>чет как-то мимо прошло
ага, ночью на ципочках)

Аноним 18/12/25 Чтв 05:58:45 № 1460020 562

>>1459194
а оно, судя по разъёбу на пикриле, типа выросло, да?

Аноним 18/12/25 Чтв 06:01:32 № 1460021 563

>>1458978
>с цветом и яркостью все нормально
ага, всё норм))
продолжай жрать говно, и нахваливать...

Аноним 18/12/25 Чтв 06:02:58 № 1460022 564

>>1458970
>ярче может
хватит, больше не надо))
ахахахахах

Аноним 18/12/25 Чтв 08:09:41 № 1460057 565

>>1460020
Оно просто другое. Чуть изменил описание освещения, это и показал. Там ни лора, ни апскейлеров, зетка как есть.

Аноним 18/12/25 Чтв 11:06:28 № 1460172 566

>>1460015
теперь голую давай

Аноним 18/12/25 Чтв 11:46:38 № 1460206 567

image 15Кб, 374x135

Попробуйте на Зетке вот такие настройки. Другая картинка, не так желтит, как дефолт. Меньше не нужного шума.

Аноним 18/12/25 Чтв 13:16:43 № 1460313 568

>>1460019
>ага, ночью на ципочках)
Ну вот далеко не любые модели хороши в img2img. Qwen активно перерисовывает всё под себя. Chroma вообще рисует хтонь раньше чем проявится стилизация.
Wan заебок, flux заебок. Z вот я наконец сел i2i проверять, и там тоже не всё гладко. Он артефачит на маленьком денойзе, но для некоторых стилей это норм
мимо

Аноним 18/12/25 Чтв 13:25:15 № 1460324 569

>>1460206
Линканите канал какой-нибудь где можно шаг за шагом научиться пользоваться актуальной версией стейбл дифьюжена и ГШ к нему. Чтоб от установки до объяснения основных функций

Аноним 18/12/25 Чтв 14:03:23 № 1460346 570

>>1460324
>ГШ
UI

Аноним 18/12/25 Чтв 14:30:27 № 1460361 571

Чо там, какие тюны и лоры помогают на зетке выдавать вменяемые писи и разные сиси (без огромных ореолов блядь)??

Аноним 18/12/25 Чтв 15:05:37 № 1460376 572

>>1460324
Хватит видоса минут на 20 чтоб всё установить, собрать воркфлоу в комфи с лорой и тд и понять что за что отвечает

Аноним 18/12/25 Чтв 15:17:38 № 1460383 573

>>1460324
>актуальной версией стейбл дифьюжена
стейблдифушен это семейство моделей брат, последняя актуальная сд 3.5, но она мертва с точки зрения коммунити, последняя не мертвая сд - сдхл, на ней тонна файнтюнов на все случаи жизни
если тебя интересуют конкретно новые модели вообще то сейчас все дрочат в Z-image
> ГШ к нему
UI на данный момент один под все нейронки визуальные - ComfyUI, качаешь портабл, ставишь https://github.com/Comfy-Org/ComfyUI-Manager менджер кастомных расширений, качаешь модель или ее составные части, раскидываешь по папкам в портабл комфи, изучаешь дефолтный пайплайн из премейдов - буквально пикрел для сдхл, все ты магистр комфи, остальное по пути изучишь

Аноним 18/12/25 Чтв 15:38:19 № 1460407 574

>>1460383
Ну и соотвественно простой рабочий пайплайн для зетки

Аноним 18/12/25 Чтв 15:55:56 № 1460425 575

>>1460407
Эти пайплайны там буквально воткнуты в шаблоны, как вы каждый раз ухитряетесь просить вещи которые буквально встроены в базовый функционал?

Аноним 18/12/25 Чтв 16:01:32 № 1460434 576

>>1460425
>Эти пайплайны там буквально воткнуты в шаблоны
а кто спорит? ток там они теперь перегружены и их 185 штук, новичок потеряется и обосрется
вот например СИМПЛЕ СДХЛ ТЕМПЛАТЕ, вот скажи зачем было пихать рефайнер блок которым никто не пользуется никогда

Аноним 18/12/25 Чтв 16:01:35 № 1460435 577

>>1460425
Ты бы еще спросил, как вы умудряетесь в ZeroOut отправлять отдельную ноду, вместо энкода от позитива.

Аноним 18/12/25 Чтв 16:47:49 № 1460503 578

>>1460407
Хуя шизоид

Аноним 18/12/25 Чтв 16:48:18 № 1460504 579

>>1460407
Спасибо, добрый ананас!
Наконец-то стало понятно куда некоторые ноды пихать.

Аноним 18/12/25 Чтв 18:37:08 № 1460563 580

>>1460313
>Он артефачит на маленьком денойзе
А кто не артефачит на маленьком денойзе, назови, я жду...

Аноним 18/12/25 Чтв 19:19:48 № 1460608 581

>>1460313
Некоторые прям заебись. Беру свои слова назад. Зетка тотально рулит когда тебе надо апскейлить нечёткие генки.

Аноним 18/12/25 Чтв 19:28:37 № 1460625 582

>>1460563
Они, конечно, все артефачат. Но вот артефакты Wan, например, они консистеные, непротиворечивые. Ты можешь крутить денойз в большом диапазоне и получать разные оттенки детализации и пластиковости. А у зетки диапазон очень узкий.

Аноним 18/12/25 Чтв 19:29:43 № 1460628 583

>>1460608
>прям заебись
как оно маслом рисует? чтобы пряи мазки были неибические

Аноним 18/12/25 Чтв 19:40:54 № 1460649 584

>>1460608
Крутое, это лоры?

Аноним 18/12/25 Чтв 19:43:15 № 1460657 585

>>1460628
Импасто наверное

портрет красивой девушки, она улыбается, лицо.
Холст масло, oil painting
Импасто техника, impasto, крупные рельефные мазки.

Высокий контраст, яркая картина

Аноним 18/12/25 Чтв 19:58:34 № 1460673 586

>>1460407
с "зануления" разорвало к хуям

Аноним 18/12/25 Чтв 20:00:11 № 1460674 587

>>1460425
потому что большинство банально не в курсе про темплейты в комфи

Аноним 18/12/25 Чтв 20:21:52 № 1460698 588

>>1460657
>Импасто
Значение знаешь? Где там рельеф от мазков? Не вижу тени на краях мазков

Аноним 18/12/25 Чтв 20:35:03 № 1460715 589

image 57Кб, 1209x461

Дайте ссылку на аблит или еретик ллм для флюкс2. Нигде нет что ли?

Аноним 18/12/25 Чтв 20:47:24 № 1460724 590

test

Аноним 18/12/25 Чтв 20:50:57 № 1460727 591

>>1460724
не тот тред сорян

Аноним 18/12/25 Чтв 20:53:59 № 1460731 592

>>1460715
Используемая мистраль во флюхкале Mistral-Small-3.2-24B-Instruct-2506
https://huggingface.co/huihui-ai/Huihui-Mistral-Small-3.2-24B-Instruct-2506-abliterated

Аноним 18/12/25 Чтв 21:30:53 № 1460772 593

>>1460628
Да в общем то как все. Попросишь - навалит масла.

Аноним 18/12/25 Чтв 21:36:40 № 1460777 594

>>1460649
Не, без лог. Это я взял свои старые генки с хромы и апнул обычным зимагом

Аноним 18/12/25 Чтв 22:11:23 № 1460818 595

>>1460777
Это и хрома столько стилей без лор делает?

Аноним 18/12/25 Чтв 22:15:28 № 1460823 596

>>1460818
Хрома единственное что и умеет - в кучу стилей изкоробки. Её в этом плане можно исследовать бесконечно.
Жаль только сами картинки вечно разваливаются

Аноним 18/12/25 Чтв 22:19:46 № 1460830 597

>>1460823
Вот этого я не понимаю, хули он обучал-обучал, дрочит какой-то пиксельспейс в то время как у него мид-нойз просто в хламину проёбан. Хуй знает как такое фиксить. Крупные детали и очень мелкие детали у него заебись же.

Аноним 18/12/25 Чтв 22:59:42 № 1460854 598

Что за модель?

Аноним 18/12/25 Чтв 23:19:56 № 1460867 599

>>1460854
tvoyamamka

Аноним 19/12/25 Птн 00:03:44 № 1460904 600

Что это за цитата дня?

Аноним 19/12/25 Птн 00:21:21 № 1460930 601

Владельцы tesla v100 в треде есть? На ней возможно с приемлемой скоростью обучение лор под z-image?
В ллм треде один анон тестил, но только в генерации. 60-80% от 3090 вроде как может дать.

Аноним 19/12/25 Птн 01:30:31 № 1461100 602

>>1460930
>60-80% от 3090 вроде как может дать.
Загнул, насколько я помню там производительность на нейрокале в четыре раза хуже чем на 4090, то есть где-то уровень 3060 будет.

Аноним 19/12/25 Птн 01:35:56 № 1461111 603

>>1461100
В текстовом кале GPU не решает, память в основном.

Аноним 19/12/25 Птн 01:38:49 № 1461116 604

>>1461111
А я не про ллм.

Аноним 19/12/25 Птн 01:46:09 № 1461132 605

>>1461111
Анон тестил sdxl - ~90%, z-image - 60-80. Но только со слов, без пруфов конкретного конфига и че у него там напердолено - не знаю.

Аноним 19/12/25 Птн 01:52:59 № 1461142 606

>>1461132
Чет не знаю, это даже не 2000 серия, у этих Вольт и тензоры не тензоры и вообще. Я когда искал тоже давно инфу, в конечном итоге, помню, тоже как чел выше по найденной инфе пришел к тому, что это 3060 в говноформате, уж никак не 3090. И расхотел ее.

Аноним 19/12/25 Птн 01:58:24 № 1461150 607

>>1460383
>то сейчас все дрочат в Z-image
это не стейбл дифьюжен а другая модель какая-то?

Аноним 19/12/25 Птн 03:00:00 № 1461202 608

>>1461142
>>1461111
>>1461132
Вот достаточно подробный обзор в100 с тестами на нейрокале в т ч https://www.youtube.com/watch?v=G5DBks2IsYI

Аноним 19/12/25 Птн 08:57:24 № 1461291 609

>>1461150
Ты не понял, стейбл это как инструмент для работы с моделями, в него ты модели грузишь а уже они тебе картинки генерируют, а zimage это именно моделькотоиую в стейбл можно засунуть, как и любую другую.

Аноним 19/12/25 Птн 09:10:27 № 1461303 610

>>1461150
> это не стейбл дифьюжен а другая модель какая-то?
Нет. Да.
>>1461291
Зачем так тролеть... Модели ты грузишь в графический интерфейс, который отношения к сд не имеет вообще.

Аноним 19/12/25 Птн 09:20:02 № 1461305 611

>>1461303
Графический интерфейс это прост прокладка между сд и моделью. Если б он спросил "а zimage это comfyui?" я б ответил по-другому

Аноним 19/12/25 Птн 09:23:11 № 1461307 612

>>1461305
Графический интерфейс это прокладка между моделью и скриптами на питоне чтобы инферировать, шиз.

Аноним 19/12/25 Птн 09:48:33 № 1461324 613

>>1461307
Я думал эта папка со скриптами это и есть sd. Видимо я ещё никогда так не ошибался...

Аноним 19/12/25 Птн 10:13:52 № 1461349 614

>>1461324
>Видимо я ещё никогда так не ошибался...
Бывает.
>Я думал эта папка со скриптами это и есть sd.
Для справки: вот состав сдхл https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/tree/main
Оно может (как и любая модель) использоваться для генерирования через голые диффузерсы на питоне буквально через пикрел.

Аноним 19/12/25 Птн 10:36:53 № 1461357 615

Проанализировали количество даты содержащейся в слоях лор зимага
https://www.youtube.com/watch?v=dkEB5i5yBUI

Некоторые челики уже тренируют только конкретные слои (что еще быстрее чем тренировать фул лееры и вообще меса меньше занимает), при этом импакт от лоры выше (потому что дата распределяется не по всем леерам и не уходит в менее важные части, которые имеют малое влияние), например:
network_kwargs:
only_if_contains:
- "layers.17."
- "layers.18."
- "layers.19."
- "layers.20."
- "layers.21."
- "layers.22."
- "layers.23."

Вообще это аналог B-Lora тренинга, ток больше свободы для выбора слоев.

Аноним 19/12/25 Птн 11:19:29 № 1461372 616

>>1461357
можно таким образом сисик писик впиздячить в слой связанный с сисиками писиками и надрочить ультимативно модель однослойной лорой

Аноним 19/12/25 Птн 11:21:59 № 1461374 617

в тулкит завезли лосс граф

Аноним 19/12/25 Птн 11:32:10 № 1461378 618

>>1460731
>Используемая мистраль во флюхкале Mistral
Спасибо. Как я и думал проблема с анатомией Flux2 зашита в текстовой энкодер. Пик1 дефолт, пик2 аблит. Просто на ровном месте вот так всё портит цензура в ллм. Хотя в самой модели флюкс2 всё норм.
Файлик качать этот https://huggingface.co/maerong3/Huihui-Mistral-Small-3.2-24B-Instruct-2506-abliterated-Q4_K_M-GGUF/resolve/main/huihui-mistral-small-3.2-24b-instruct-2506-abliterated-q4_k_m.gguf

Аноним 19/12/25 Птн 11:35:25 № 1461381 619

>>1461378
Так что в Зет возможно так же. Дайте ссылку на норм аблит ллм для Зет.

Аноним 19/12/25 Птн 11:42:38 № 1461385 620

>>1461381
Выше где-то постили квен прогнанный через херетика.

Аноним 19/12/25 Птн 12:13:17 № 1461402 621

>>1461381
Вот тут неплохой >>1457488
Еще есть аблитерейтед от хуйхуя (в1 и в2), но он какой-то с ебанцой буквально, с лораим крайне странно работает и генерит ебанину на -2 клипскипе, а на -1 вообще артефачит (чего нет на дефолте есличе)

Аноним 19/12/25 Птн 13:06:25 № 1461458 622

туимадж по мотивам Бексински

Аноним 19/12/25 Птн 14:32:32 № 1461629 623

>>1457488
>>1461402
В отличии от этого лоботомированного в говно квена, камменты там намного интересней и полезней

Аноним 19/12/25 Птн 14:42:33 № 1461645 624

>>1461378
Ради интереса попробовал перебрать CLIP, пока трудно сказать насколько аблиты фиксят анатомию, надо найти сломаный промпт.

Аноним 19/12/25 Птн 14:45:26 № 1461654 625

>>1461645
Баба на скамейке. ВОобще сломано накед и лоли всякие.
4K high-definition quality.
A drunk, naked young female idol lies asleep on a bench. Behind her, a man lifts one of her legs, exposing her genitals. Paparazzi in the foreground are filming her.

Аноним 19/12/25 Птн 14:57:36 № 1461686 626

>>1461654
Я на зетке проверяю. Я заметил что чем меньше промпт тем сильнее меняется от clip.
В целом имхо клип бесполезно менять на зетке. больше имеет смысл иметь отдельную аблиб ллм для улучшения промпта, да и еще и с вижионом в комплекте.

Аноним 19/12/25 Птн 15:41:42 № 1461768 627

>>1461686
>>1461645
>>1461654
Чё вы там проверяете, болезные? Если в еблю Зетка не может (пока что), то говорить тупо не о чем.

Аноним 19/12/25 Птн 15:48:45 № 1461779 628

>>1461645
>надо найти сломаный промпт
А вот еще промпт древний, в натвиз-дмд знатные пикчи выходили. И тут только с дефолтным енкодером вообще гёрл получается, а не собака
(pov, doggystyle, anal:1.2), grab ass, (looking back,:1.2) epic light, cluttered room

Аноним 19/12/25 Птн 16:23:10 № 1461828 629

>>1461768
вообще то умеет, даже без лор что то получается фапабельное, но без анатомии нижних органов, тут уже нужны лоры.

Аноним 19/12/25 Птн 16:29:30 № 1461834 630

>>1461768
> Если в еблю Зетка не может
Да может, если отрезать клипом слоев 5 и описать словами не нсфвшными. Другое дело что прям на одной ебле модель не обучали, поэтому там крайне ограниченные концепты уровня сосать негру хуй стоя на коленях.

Аноним 19/12/25 Птн 16:37:28 № 1461841 631

>>1461834
или pov sex тоже вон знает изкаропки

Аноним 19/12/25 Птн 17:10:24 № 1461878 632

>>1461645
>>1461686
>gguf
Ой бля, ой нахуй, тестировщик епта

Аноним 19/12/25 Птн 17:24:47 № 1461934 633

>>1461686
Как такие графики делать? Побольше бы сидов, пускай Z и не всегда вариативна.

Аноним 19/12/25 Птн 17:38:21 № 1461985 634

Снимок.JPG 11Кб, 556x118

Знающие, поясните пж

Аноним 19/12/25 Птн 17:56:38 № 1462025 635

>>1461878
Я нищук на 3060 6Гб

>>1461934
https://github.com/geroldmeisinger/ComfyUI-outputlists-combiner
Вот эта штука хорошо помогает, там есть примеры. на её основе собрал свою лапшу

Аноним 19/12/25 Птн 18:01:32 № 1462042 636

image.png 6200Кб, 1019x4693

>>1461779
С этого промпта интересный результат получился, в принципе некоторые выводы можно сделать. сид и промпт один и тот же, только разный CLIP

Аноним 19/12/25 Птн 18:02:13 № 1462045 637

>>1461985
че пояснить

Аноним 19/12/25 Птн 18:04:33 № 1462053 638

>>1462025
>Я нищук на 3060 6Гб
Тогда сорян, зря быканул, думал ты топишь за ггуфы

Аноним 19/12/25 Птн 18:31:35 № 1462133 639

ПЕРЕКАТ

>>1462124 (OP)
>>1462124 (OP)
>>1462124 (OP)

ПЕРЕКАТ