/ai/ - Stable Diffusion тред X+189

Stable Diffusion тред X+189 /sd/ Аноним 01/05/26 Птн 10:31:52 № 1602441 1

Тред локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• Z-Image-Base
• FLUX.2 klein (4b и 9b)
• Z-Image-Turbo
• Flux 2
• Qwen Image / Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/Comfy-Org/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

► Предыдущий тред >>1596721 (OP) ► https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03

Аноним 01/05/26 Птн 10:36:52 № 1602443 2

Как подключить beta57 scheduler отдельной нодой без KSampler?
Это нужно добавить beta scheduder и выставить a=0.5 b=0.7 и это будет равноценно пикрилу или есть нюансы?
Спасибо

Аноним 01/05/26 Птн 10:41:47 № 1602445 3

>>1602443
Нода шедулер симпл, в ней выбери из списка.

Аноним 01/05/26 Птн 10:43:03 № 1602446 4

>>1602430 →
Про деформацию хорошее замечание. Реально такое есть - начинаешь разбираться и тянуть определенное качество сам и сразу начинает плыть собственное чувство эстетики, вплоть до полной потери эмоций и отклика от эстетики.

Но в этом плане плюс генераций в том, что ты конвертируешь текст в изображение, и эта дистанция принципиально избавляет от непосредственности в процессе создания. Ты не художник, ты манипулируешь художником. Если бы результат на выходе был удовлетворительным - можно было бы не поплыть и кайфовать с этого. Не ты рисовал, ты просто технически пришел к такому результату, где ии рисует тебе то, что радует.
Проблема в том, что этого достичь пока непонятно как

Аноним 01/05/26 Птн 10:49:57 № 1602453 5

>>1602445
> Нода шедулер симпл
Нет такой. Есть только такие

Аноним 01/05/26 Птн 10:51:01 № 1602455 6

>>1602225 →
Какая анима лучше сейчас, preview2 или preview3?

Аноним 01/05/26 Птн 10:53:26 № 1602458 7

>>1602446
Ценность того что дается легко, во множестве и случайно стремится к нулю чел.

Попробуй в голове составить виденье того чего ты хочешь хотя бы примерно, определиться со стилем, композицией набрать референсов, потом прогнав генерацию и отобрав нужное инпейтом фиксить до идеала - тогда у тебя получится арт ничуть не хуже чем те что получаются от рисобак, без ощущения нейрослопа.

Аноним 01/05/26 Птн 10:53:41 № 1602459 8

>>1602455
Да. А сам-то как думаешь, если есть 1, 2 и последняя 3?

Аноним 01/05/26 Птн 11:14:03 № 1602471 9

>>1602443
> выставить a=0.5 b=0.7
Да.
> или есть нюансы
Нет.

Аноним 01/05/26 Птн 11:18:23 № 1602472 10

image.png 10Кб, 625x82

image.png 31Кб, 663x243

>>1602459
> думаешь
В этом и была проблема
In progress
У модели приписка base, а про base пишут - модель для обучения или специального применения, не для базовой генерации

Аноним 01/05/26 Птн 12:06:25 № 1602501 11

>>1602155 →
> всё остальное уже есть

Аноним 01/05/26 Птн 13:47:21 № 1602556 12

Есть только одно: маркетинг и продвижение + коллабы.
Песня может быть хуже 10 других похожих, но она сыграет в новом блокбастере и все будут ее любить, потому что ее услышал миллиард человек, а остальные 9 - услышало пара соток анонов.
И так во всем. Картинка из треда и та же самая картинка в каком-то популярном канале на лям подписоты - это разное. А если она распечатана и вставлена в рамку на модной выставке - это еще одна реальность.

На самом деле, положа руку на сердце, чисто картинки/фотки, музон, да и видеоряд месами - все это вне контекста очень сложно оценивается.
Именно поэтому какие-то художники были успешными при жизани, а например Ван Гог нахуй никому не был нужен.
Но как только за картинки начинают платить лямы ништяков - человеки вынуждены оценивать ее уже по-другому.
Один и тот же кадр на странице просто какого-то чела в телеге, и тот же самый кадр но подписанный модным челом и опубликованный в популярном канале - это разные кадры, хотя и одинаковые.

Аноним 01/05/26 Птн 13:56:31 № 1602561 13

16gb vram slop и однобокость не позволяет креативить
Даже банальные тестовые идеи показывают, насколько хуевый контроль и сама модель не знает эстетики. Просто лепит соответствие, максимально не эстетичное
Отдельная беда - это генерация оригинального заднего плана. Она не может просто взять и по промту нарисовать гигантичное футуристичное красивое здание на 2/3 ширины кадра уходящее за пределы экрана. Она будет рисовать офисники и всё в таком духе.
Она будет рисовать картуниш механизм руки

Аноним 01/05/26 Птн 14:27:33 № 1602578 14

Идея с промт оркестрацией под мультипроход t2i > iti > ... > image
Суть в том, что промт энхансер (пусть даже корп llm) генерит не 1 промт, в расчет на t2i, а разбивает промты в расчет на мультипроход, рассчитывая, что одна идея будет собираться в несколько этапов соблюдая соответствующие правила для каждого прохода. Особенно если t2i и iti модели отличаются.
Здесь простор для экспериментов возникает в:
- выборе подходящих моделей под каждый шаг
- еще более важно: поиск наиболее эффективной и стабильной разбивки (генерить ли фон / главные объекты раздельно, или сразу генерить второе в iti, и тогда что генерить первым)

А вообще, если бы была дообученная под специфичную диффузию модель, которая шарит в композиции и эстетике и знает как это описывать удачными промт-паттернами, это в один проход могло бы улучшить качество. Вот только где это высрать, сами авторы моделеке кроме общих правил промта не делают никаких реально существенных примочек.
Промтить через общие ллм, которые мало что знают про конкретные модели или тем более писать промт самому, не зная ничего о том, что внутри модели это какой то бред ебланский. Неужели нельзя на основе данных об обучении модели, сразу создавать еще лоры или файнтюны для локальных ллм - промт энхансеры, адаптированные под модель. Ведь корпоративные рисовалки наверняка применяют подобные подходы, и оркестрацию многопроходки, и обученный промт энхансер

Где вместо просто Standing, в диффузию уходит подобранное сюжет и конкретную модель нечто вроде "Standing in a relaxed, natural contrapposto stance" или "Standing with a slight lean toward the object".

Вы спросите что мешает это же делать через гпт? То что они с трудом даже справляются с форматом промта специфичной модели. То что они хуево всему этому обучены, "видению" того как лучше и красивее и точному описанию этого на языке диффузии (который они не знают).

Интуитивный промтинг, перебирание слов и формулировок вручную почти не работает, уходят часы на гринд сидов. Это говно из жопы, копинг.

Аноним 01/05/26 Птн 14:32:05 № 1602587 15

>>1602561
>Отдельная беда - это генерация оригинального заднего плана.
А меня больше прохожие умиляют.
Но надо заметить, что "гигантичное футуристичное красивое здание" это не то описание, по которому нейронка сгенерит то, что ты под этим имел в виду.

Аноним 01/05/26 Птн 14:36:35 № 1602594 16

>>1602587
> "гигантичное футуристичное красивое здание
Я попробовал около 5 разных подходов. Включая Bladerunner стайл.
Там были гигантские здания во весь экран.

Это второй раз, когда я наталкиваюсь на такую хуйню. Он точно так же не может нарисовать нормальные эффектные массивные руины большого города в заднике.
Есть вероятность, что я просто не зацепил нужную ассоциацию. Пока не знаю, надо отдельно сидеть и экспериментировать, с целью выяснить, могу ли я в принципе получить примерно то, что хотел. Если да, то в такой модели значит надо гриндить шаблоны промтов.

Аноним 01/05/26 Птн 15:00:55 № 1602615 17

ComfyUItempgbuu[...].png 1451Кб, 1024x1024

>>1602561
Я тебе больше скажу, даже сумарно 40gb vram и 64 ram не дают креативить... потому что нет нормальных локальных моделей которые работали бы с нормальной скоростью и с нормальным датасетом.

Аноним 01/05/26 Птн 15:31:16 № 1602632 18

>>1602561
>креативить на локалке
Ты ещё через ллм в svg попытайся креативить. Локал только для голых срак создан, всё остальное в банане про, графическое в гпт 2.

Аноним 01/05/26 Птн 16:17:34 № 1602671 19

>>1602430 →
То, что ты описал, это не деформация, а уровень профессионализма, когда знаешь как должно быть и все косяки автоматом бросаются в глаза. Несколько лет отработал в печатном издании на верстке текста, даже не вчитываясь в текст уже вижу как сверстано, висячие строки, двойные пробелы и тд. А вот проф.деформация начинается тогда когда начинаешь выдрачить там где это не нужно. 3 зеленых пикселя на 2к картинке, сделать идеальную генерацию через 100500 нод без плесени, пережара с первой попытки и тд

Аноним 01/05/26 Птн 18:49:29 № 1602768 20

>>1602671
Это главный бич всех хобби. Сначала ты без задней мысли кайфуешь для души, а потом превращаешься в желчное чудовище, ищущее зеленые пиксели.

Аноним 01/05/26 Птн 18:54:04 № 1602773 21

>>1602561
как фиксить этот цифровой шум?
убирать лоры только?
это simple + euler

Аноним 01/05/26 Птн 19:05:58 № 1602780 22

>>1602773
>>1602768
Идеально совпало. Вся суть™

Аноним 01/05/26 Птн 19:12:08 № 1602784 23

>>1602780
Не совпало, вспомнил когда читал про зеленые пиксели.
Было бы неплохо знать что на это влияет. Но жертвовать чем то существенным ради этого я бы не стал, и так на лимитах через жопу всё.

Аноним 01/05/26 Птн 19:40:13 № 1602803 24

>>1602225 →
Есть какие то годные лоры или файнтюны не тематические аниме?
Кроме вот этих что нашлись:
https://civitai.com/models/2414435?modelVersionId=2746109
https://civitai.com/models/2545707/anima-aesthetic-improvement
https://civitai.com/models/2583128/anima-rl
https://civitai.com/models/2505242/scenery-anima

Аноним 01/05/26 Птн 19:48:50 № 1602810 25

>>1602784
>Было бы неплохо знать что на это влияет.
Кривой VAE FLUX.2, которому не помог выпуск обновления. Загаживает изображение цветным мусором как вотермаркой. Какие-то пиксели более заметны, какие-то менее, но изображение загажено всё.
Не лечится.

Костыли:
1) upsample изображения в более высокое разрешение и его последующее скукоживание, чтобы разноцветный мусор съело в процессе (не поможет если пиксельный мусор слипся и стал более одного пикселя в размере);
2) Удаление пиксельного мусора ценой некоторой потери «цветового разрешения». После VAE Decode изображение разбивается на YCbCr и к каналам CbCr аккуратно применяется bilateral фильтр, а затем каналы снова собираются в выходное изображение.

мимо

Аноним 01/05/26 Птн 20:11:09 № 1602831 26

Анима > Гред рудковский лора > Klein edit
Минусы?
Главный минус, что нет пизды

Аноним 01/05/26 Птн 22:30:18 № 1602959 27

Так что теперь получается нунчака и не нужна вовсе? Она имела смысл на контексте (ебать, помните, была такая модель?) и вроде всё, а теперь те модели заменены лучшими. Ещё вроде на Qwen Image делал, но то ли не сделал поддержку лор, то ли получалась говнина вместо качества, что сейчас проще на клеин с лорами данриси гонять и делать в разы лучше.

>>1602831
На клейн есть пизда. Скачай.

Аноним 01/05/26 Птн 23:23:26 № 1602993 28

>>1602361 →
>товарищ майор, я чисто кораблики на ней генерю вот пруфы, а эти извращения просто были для теста
Лол, если уж на то пошло, нахуя мне ЕЩЕ ОДНА модель для кума, если с этим и так прекрасно справляются годами отточенные воркфлоу для сдохли? Аниму я скачал для того, чтобы проверить предел её возможностей, и по части генерации кума она выигрывает лишь в том, что из коробки знает больше стилей, чем любой чекпоинт сдохли. При этом имеет фатальный недостаток в виде отсутствия контролнета, а с 0.6В энкодером особо не навоюешь. Так что не, пока анима - для пейзажей и корабликов, а про изврат после релиза 1.0 подумаем. Если контролнет завезут, вроде обещали.

>>1602803
Да не, пока особо ничего интересного нет. Есть неплохой фэнтези-детайлер, эстетик импрувмент ты уже запостил, и еще там была интересная лора на освещение с нестандартными концепциями. Ну оно и понятно, сообщество пока присматривается и ждет полного релиза.

Аноним 02/05/26 Суб 00:14:04 № 1603020 29

ComfyUItemphojf[...].png 3941Кб, 1800x1200

Аноним 02/05/26 Суб 00:34:32 № 1603034 30

>>1602831
>Минусы
Kleinовский CGI-feel. И его ничем не перебить.
Текстуры, освещение (и, вероятно, заpromptченный dramatic lighting, cinematic lighting) в комплексе воспринимаются как CGI или скриншот из видеоигры.
Возможно ли что-то с этим сделать, непонятно.

Аноним 02/05/26 Суб 01:00:04 № 1603048 31

>>1603034
> Kleinовский CGI-feel.
То же самое в корп генераторах будет, почти уверен, хоть и пизже по деталям/выразительности.
Щас будто бы не существует моделей, которые могут нереалистичное изобразить фотореалистичным. И это согласуется с главным принципом ллм.
Разве что стиль можно выбрать поинтереснее чем cgi, он и проще

Аноним 02/05/26 Суб 03:02:13 № 1603112 32

Что по ernie?

Аноним 02/05/26 Суб 03:42:06 № 1603122 33

>>1603112
Кал про который сразу забыли. Как я писал на релизе, а мне не верили.

Аноним 02/05/26 Суб 03:52:55 № 1603123 34

Аноним 02/05/26 Суб 06:16:49 № 1603139 35

>>1603112
У Эрни нормально работает инпаинт, со времён сдхл такое впервые вижу.

Аноним 02/05/26 Суб 16:35:05 № 1603435 36

Вы тут вымерли все...?

Аноним 02/05/26 Суб 16:43:23 № 1603442 37

Скукатв

Аноним 02/05/26 Суб 16:44:51 № 1603443 38

>>1603442
Движухи захотелось?

Аноним 02/05/26 Суб 17:37:31 № 1603496 39

Сделай пожалуйста реалистичное фото.

У девушки цвет волос темно желтый.

Аноним 02/05/26 Суб 18:05:13 № 1603529 40

d18c5641-d0ac-4[...].jpg 242Кб, 1280x800

>>1603496

Аноним 02/05/26 Суб 18:10:20 № 1603535 41

>>1603496
>Сделай пожалуйста реалистичное фото.
>
>У девушки цвет волос темно желтый.
Gemini 3.1 Flash (первая), Gemini 3 Pro вторая

промпт копи-паст твоего

Аноним 02/05/26 Суб 18:53:13 № 1603557 42

>>1603496

Аноним 02/05/26 Суб 19:03:26 № 1603562 43

>>1603557
>>1603535
>>1603529
Надо наверно возраст 20 лет в промт добавить.

Аноним 02/05/26 Суб 19:05:00 № 1603564 44

Можно еще с этим кадром реалистичное фото сделать? Пусть будут желтые волосы, возраст 20 лет.

Аноним 02/05/26 Суб 19:05:43 № 1603566 45

>>1603139
у turbo или обычного?

Аноним 02/05/26 Суб 19:06:03 № 1603567 46

Как промтить такие волосы, то есть прям не афро-афро, а чтоб как на пикриле? (в зетке и кляйне)

>>1603562
>20 лет
ага, желательно... чтобы тебе их не дали)

Аноним 02/05/26 Суб 19:13:12 № 1603569 47

>>1603564
А тебе зачем?

Аноним 02/05/26 Суб 19:15:16 № 1603571 48

>>1603569
> зачем?
что бы и дальше вайпать засохшую тред-мумию

Аноним 02/05/26 Суб 19:24:43 № 1603575 49

>>1603569
Да просто интересно как персонаж бы выглядит.

В аниме вот такая внешность, но в манге стиль лучше проглядывается.

Аноним 02/05/26 Суб 19:28:44 № 1603578 50

Сделайте плз что-то среднее между костюмом палача и костюмом пингвина

Аноним 02/05/26 Суб 19:33:11 № 1603582 51

>>1603578
блядь, пошёл нахуй уже...

Аноним 02/05/26 Суб 21:05:52 № 1603629 52

>>1603567
Загрузил твой пик в грок, чтобы спросить о прическе, он мне заблокировал все по причине несовершеннолетия субъекта, ну ты и пидор.

Аноним 02/05/26 Суб 21:07:55 № 1603630 53

>>1603629
>ну ты и пидор
я то нет...

Аноним 02/05/26 Суб 21:21:50 № 1603633 54

>>1603629
Грок несовершеннолетие по дойкам определил?

Аноним 02/05/26 Суб 21:27:27 № 1603636 55

>>1603633
По лицу.

Аноним 02/05/26 Суб 21:30:38 № 1603638 56

>>1603629
Замажь литсо и опять загрузи, делов то...

Аноним 02/05/26 Суб 21:31:56 № 1603640 57

a5dad548-a548-4[...].jpg 249Кб, 832x1216

>>1603567
Короче, вот какой промт он все-таки высрал:

woman with voluminous curly hair, 3C-4A curls, long defined ringlets, caramel brown with golden highlights, natural frizzy volume, central parting, tropical wild curls, detailed texture

Зетка по нему рисует пикрил.

>>1603638
Помогло обрезание сисек, его трясло от сочетания сисек с детским лицом.

Аноним 02/05/26 Суб 21:39:48 № 1603645 58

>>1603640
неплохо, но это не совсем то, там что вроде: burnt out - то бишь типа слегка выгоревшие волосы, у тебя получилась модельная завивка для показа, и нужен какой-то пробивной одноэтажный токен.

Аноним 02/05/26 Суб 21:44:56 № 1603647 59

>>1603575

Аноним 02/05/26 Суб 22:08:52 № 1603653 60

>>1583617 →
>Давай кати уже, у меня накопились геймченжеры. Срочно надо поделиться.
И где? Оказывается уже несколько тредов прошло. Были запощены эти игроизменщики?

Аноним 02/05/26 Суб 22:10:09 № 1603655 61

>>1603139
>со времён сдхл
Ты flux.fill не юзал что ли? Да и нынче вроде edit модели нормально работают с зарисованными областями.

Аноним 02/05/26 Суб 22:47:39 № 1603674 62

>>1603640
>>1603567
ох, ебать, какая-же всётаки зетка тупорылая, ничего не знает ни о каких выгоревших волосах. Как же я заебался с ней.

распущенные, свободно спадающие mixed-race afro 4с curly blonde:0.8 fluffy hair with shiny ends

Аноним 02/05/26 Суб 23:09:14 № 1603685 63

>>1603569
Красиво, можно еще?

Аноним 02/05/26 Суб 23:13:04 № 1603687 64

>>1603685
>можно
нет, пиздуй в аниме-загон, и там заёбывай всех своими кастратами.

Аноним 02/05/26 Суб 23:25:47 № 1603695 65

>>1603496
>>1603564
У нас для этого отдельный тред есть, если кто не знал >>1591303 (OP)

Аноним 03/05/26 Вск 00:04:03 № 1603705 66

>>1603695
Спасибо.

Аноним 03/05/26 Вск 01:17:47 № 1603732 67

Аноним 03/05/26 Вск 01:28:45 № 1603736 68

>>1603732
она обоссалась или обблевалась? что было в промте?

Аноним 03/05/26 Вск 01:30:49 № 1603737 69

>>1603736
Открыто для интерпретации.

Аноним 03/05/26 Вск 01:44:56 № 1603741 70

>>1603737
ну, тыж там чёт писал...

Аноним 03/05/26 Вск 01:59:38 № 1603744 71

>>1603736
Кляйн и вроде зетка ещё ссут изо рта и судя по струйке из её рта он промптил обоссывание.

Аноним 03/05/26 Вск 02:08:08 № 1603746 72

>>1603744
зетка умеет ссать?
может быть она ещё и срать умеет?
Я до сих пор не пробовал, кстати...

Аноним 03/05/26 Вск 02:16:46 № 1603747 73

>>1603741
Слюна стекает на платье. Лужа под ногами.

Аноним 03/05/26 Вск 11:05:21 № 1603858 74

https://www.reddit.com/r/StableDiffusion/comments/1t23isk/lciet_longcat_image_edit_turbo_lightweight_and/

Длиннокоты едит модель выпустили

Аноним 03/05/26 Вск 11:12:34 № 1603861 75

image.png 1Кб, 50x43

>>1603858
Не могу пройти.

И еще вопрос: кто-нибудь тут реально делал инпейнт на хромофуре? Мне другой агент советует фордж, мол, меньше ебли будет, илюха типа все уже настроил. Спасибо за ответ, а то не знаю что пользователю сказать.

Аноним 03/05/26 Вск 11:14:36 № 1603863 76

Аноним 03/05/26 Вск 11:15:06 № 1603864 77

>>1603861
Ладно, я поторопился насчет выпустили, 3 месяца назад. Но гуфы вот недавно подъехали с воркфлоу на комфи
https://huggingface.co/vantagewithai/LongCat-Image-Edit-Turbo-GGUF

Аноним 03/05/26 Вск 11:19:59 № 1603866 78

>>1603864
Все говорят что говно и приведенные примеры это что вообще, я такое на сд1,5 делал когда контролнеты появились. Приложи раздетую юаюу с пиздой тогда поговорим.

Аноним 03/05/26 Вск 12:05:11 № 1603894 79

Охуенно, flux 2 klein промт гайд страница просто выпелена, и .md файл туда же. Щас где официальный гайд и принципы брать?

Flux 2 гайды написанные для корпоратной версии это говно из жопы и близко не адаптированное для klein, к тому же написанное бабой.

Мб у кого сохранился .md файл?

https://docs.bfl.ai/guides/prompting_guide_flux2_klein
https://docs.bfl.ai/guides/prompting_guide_flux2_klein.md

Аноним 03/05/26 Вск 13:54:28 № 1603952 80

>>1603894
в кеше яндекса что то сохранилось, попробуй оттуда вытащить

Аноним 03/05/26 Вск 14:19:47 № 1603968 81

>>1603952
https://web.archive.org/ только веб страница, которая еще валит сервис, но я сохранил её
А вот .md файла который там был сохранен нет.

> в кеше яндекс
я не могу найти где это и что

Аноним 03/05/26 Вск 14:50:16 № 1603987 82

>>1603894
Вчера родился чтоль?
https://web.archive.org/web/20260420011101/https://docs.bfl.ai/guides/prompting_guide_flux2_klein

Аноним 03/05/26 Вск 14:51:54 № 1603989 83

image.png 10Кб, 892x122

>>1603987
Я её уже сохранил. Страница через 5-10 секунд редиректит в пикрил
И я сказал что там еще был https://docs.bfl.ai/guides/prompting_guide_flux2_klein.md файл с текстовым форматом гайда. Вот его и не получается найти.

Аноним 03/05/26 Вск 15:20:24 № 1604005 84

>>1603989
Пздц, теперь всю оставшуюся жизнь ты будешь думать, что у тебя ничего не получается именно из-за потери гайда, а не потому что руки кривые. Ну, может так и легче жить даже.

Аноним 03/05/26 Вск 16:09:30 № 1604032 85

>>1603989
Норм шиза

Аноним 03/05/26 Вск 20:21:28 № 1604173 86

>>1604005
>>1604032

Я этот мдшник скармливал ллм как доп. контекст и основа для промтинга. В мдшке в отличие от страницы нет лишней хуеты выжирающей токены и отвлекающей внимания.
Кроме того её составляли сами разрабы, и ниче лучше для исходной точки нет. А ты можешь себе коупить, что ты знаешь лучше, по факту ты в душе не ебешь как и на что лучше реагирует модель.
Для flux.2 dev вообще есть своя модель для promp upsampling, которой нет для клейна, и она в отличии от гпт и гемини знает че делать.
На клейне кроме соло рыла с пиздой в t2i ничего не создать, кроме голимого слопа.

Аноним 03/05/26 Вск 20:31:36 № 1604182 87

>>1604173
Скиллишью

Аноним 03/05/26 Вск 22:41:53 № 1604262 88

>>1603866
Вот еще сравнение с клейном. ТЛДР - например можно требовать раскрашивать только определенные части тела.

https://www.reddit.com/r/StableDiffusion/comments/1t2us8t/lciet_and_klein9b_a_quick_fair_comparison/

длиннокот более строго следует промпту. а качество мб файнтюнами поднимут. свою нишу найдет короче

Аноним 03/05/26 Вск 23:08:10 № 1604281 89

>>1604173
>скармливал ллм как доп. контекст
Допустим, а где же 2 картинки на одном сиде, с одним и тем же промтом, одна с мдэшником, а другая без, и типа, смотри ребзя, какая разница охуительная, какое понимание промта, расстановка приоритетов, и всё такое? Есть шанс увидеть такое? Или я спросил это у тебя без должного уважения?

Аноним 03/05/26 Вск 23:09:05 № 1604284 90

>>1604182
покажи скилл на генерации клейна, что то кроме фоток бессмысленно позирующих тян

Аноним 03/05/26 Вск 23:09:25 № 1604285 91

>>1604182
Поиск философского камня в 2к26)

Аноним 03/05/26 Вск 23:10:45 № 1604288 92

>>1604281
Я и не брался доказывать ценность мд, но теперь я его в принципе не могу достать и это важнее, чем размышления нужен он или нет.

Аноним 03/05/26 Вск 23:15:34 № 1604293 93

>>1604284
Это когда есть что показывать) А нахуя? Можно просто сыпать заумными словечками, цитируя бред нейронки.

Аноним 03/05/26 Вск 23:18:22 № 1604295 94

>>1604262
Брат, не поверишь, я только этим и занимаюсь, что раскрашиваю фрагменты лиц, я дорвался до этого, так до сих пор остановиться не могу.

удаление цифрового шакала после Кляйна Аноним 04/05/26 Пнд 02:24:37 № 1604370 95

smooth-and-soft[...].webp 45Кб, 1080x1620

что писать в промте после 1-й проходки? Пробовал: remove artefacts of digital compression - не то чтобы это прям сильно помогло, возможно контуры стали чуть чётче но внутри них координально ничего не поменялось. Вообще, вторая проходка гарантированно наваливает артефактов, вытаскивая уже имующиеся и добавляя свои, как с этим бороться не превращая картинку в картун?
1. оригинал
2. убрал лишнее, сделал Piper чуть моложе (не сильно, не ссыте, нах)
3. ваш вариант, с вашей рецептурой

Аноним 04/05/26 Пнд 04:28:40 № 1604408 96

>>1604262
>качество мб файнтюнами поднимут
Спустя 3 года впопенсорса можно уже понять что ничего никто и никогда не поднимет. Вышел кал - значит и будет кал. Максимум данриси бустанет фото качество или дислит выйдет и на этом всё.

Аноним 04/05/26 Пнд 10:16:57 № 1604555 97

>>1604370
Под "удали артефакты" поднимается очень сложный процесс "удали потери сжатия, чтобы после удаления потерь что-то появилось, додумай сам".
Для сетки лучше говорить "сделай ретушь/реставрацию", "повысь резкость", "сделай реконструкцию текстур". В предельном случае "преобразуй картинку в идеальное студийное RAW фото", но надо будет наваливать всяких уточнений про "сохрани лицо узнаваемы и так далее"

Про многошаговые аретфакты - нихуя не поделать. Можно попробовать не дрочить VAE и сохранять исходный латент. Но имхо проще в конце просто попросить перегенировать всё без шакалов, пусть и ценой потери сходства с источником.

удаление цифрового шакала после Кляйна Аноним 04/05/26 Пнд 10:26:52 № 1604568 98

>>1604555
я попробую всё из того что ты перечислил, оегче конечно было бы достать исходную картинку в идеальном качестве, но зачастую референс запредельно шакальный, спасибо за подсказку.

я тут было вспомнил молодость и прогна на сдохле имг2имг с денойзом 6.5, слегка уточнил мордашку (с лорой перса и без) и заролил поней анус.

Аноним 04/05/26 Пнд 13:40:27 № 1604692 99

Собираюсь тестить эту лору https://civitai.red/models/1972981?modelVersionId=2818111 с обычными klein моделями.

Какой text encoder нужен, если базовый не будет работать?
Есть flux2-klein-9b-uncensored-q8_0.gguf - не подойдет?
i2i режим тоже буду юзать

Аноним 04/05/26 Пнд 14:06:02 № 1604707 100

Выкладывать nsfw незаконно ведь публично? под статью порнография попадает не? До самого последнего момента об этом не задумывался, хотел выложить и приуныл

Аноним 04/05/26 Пнд 15:37:46 № 1604775 101

>>1604707
Так и карандаши нельзя продавать. Ведь при помощи их можно нарисовать порнографию с малолоетками.

Аноним 04/05/26 Пнд 16:06:41 № 1604803 102

>>1604707
Получается что так. Забыл когда мог даже ради рофла что-то выложить в картинках, даже карикатуры. Доебаться смогут ко всему, сказав что это не 1000-летный суккуб, а

Аноним 04/05/26 Пнд 16:11:31 № 1604810 103

Как заставить клейн едит не рисовать или убрать блики от фронт-софтбокса?
У него просто везде софтбокс студийный.

Аноним 04/05/26 Пнд 16:33:05 № 1604828 104

>>1604707

Аноним 04/05/26 Пнд 19:34:18 № 1604911 105

>>1604810
студийное фото в негатив пробовал?

Аноним 04/05/26 Пнд 20:06:50 № 1604933 106

>>1604810
В процессе edit или t2i? Edit сложнее, там можно попробовать relight scene with practical lighting. Скорее всего не поможет. При t2i на klein не давать в prompt цвета в явном виде, писать very soft natural lighting, practical lighting, very dim lighting, dark silhouettes.

>>1604911
У FLUX.2 нормального рабочего negative prompt нет by design и разработчики прямо указывают на гимнастику с positive prompt для обхода.

Аноним 04/05/26 Пнд 21:16:44 № 1604944 107

>>1604933
Блики изначально дает cinematic shot, но он же неплохо трансформирует в реалистик вместе адекватным освещением/цветами. Проще изначально как то этого избегать

Частично лечится natural lighting RAW shot, но с металлических объектов блик не уходит.

Еще заметил, что клейну катастрофически нехватает лоры на реалистичные текстуры и лэндскейп. Он может в текстуру кожи и лицо на файнтюне, но вот материалы и лэндскейп любой нестандартный - сразу в лучшем случае cgi, но чаще семириал.

Аноним 04/05/26 Пнд 21:44:23 № 1604958 108

Заключительные попытки в Эрни

Аноним 04/05/26 Пнд 22:43:08 № 1604975 109

>>1604958
Ну чет такое себе...

Аноним 05/05/26 Втр 02:28:26 № 1605069 110

Аноним 05/05/26 Втр 02:35:06 № 1605070 111

>>1605069
Линолеум прям как у меня.

Аноним 05/05/26 Втр 11:47:19 № 1605177 112

посоветуйте реалистичную nsfw модель для картинок.

Аноним 05/05/26 Втр 11:52:22 № 1605181 113

https://github.com/capitan01R/Comfyui-flux2klein-Lora-loader/blob/main/README.md
Кто-то пользовался уже? Что думаете?

Аноним 05/05/26 Втр 12:02:45 № 1605191 114

>>1605177
Realistic_image_model.safetensors

Аноним 05/05/26 Втр 12:33:19 № 1605204 115

>>1605191
Он просил нсфв.

Аноним 05/05/26 Втр 13:13:02 № 1605234 116

>>1605204

Аноним 05/05/26 Втр 13:52:12 № 1605262 117

ComfyUItemprcai[...].png 4980Кб, 1440x1440

Посоветуйте модель + лора + промт стиля который может красиво и детализированно (не SD мазня) рисовать относительно сложные сцены с хорошей фантазией (несколько проработанных объектов + проработанный бэкграунд). Какой-нибудь семи риал, либо digital painting в реализме.

Анима плывет свыше 200 слов и часто плохо понимает пространственные инструкции. Пока сижу с лорой greg rutkowski, неплохо, но стабильность низкая, много мазни, сложно контролировать и не понятно как уточнять стиль, с этой лорой.

Аноним 05/05/26 Втр 15:41:09 № 1605332 118

>>1604707
/нейроскуф есть там все мужики свои

Аноним 05/05/26 Втр 15:41:48 № 1605333 119

>>1605262
зит тоже не одупляет

Аноним 05/05/26 Втр 16:00:26 № 1605348 120

Короче, мужики ))) вопрос такой ебаныйрот поставил эту изю комфуи, обматался всем чем положено, вчера там, зит себе скачал, енкодер етот квеновский, еще какую-то хернюшку контролнет короче, сперва неудачные ворфлов собирал, и пару нерабочих еще нашел, ну тупо, но потом короче натянул https://github.com/scraed/LanPaint (сам зит работает, базару ноль, быстрей сидрикселя, промптится немножко на русском хоть и туповат), и вот тут хуйня такая на пиках. Пик 1 - я после 1 суток попыток. Пик 2 - делаю маску в дефолтном менеджере масок. Загружаю все это на пик 3 (да я там выпилил какую-то лору на пиксель арт, но она ни на что не влияла). И на выходе я получаю дрисню времен первой поняхи импейнта. Настройки семплера ланпейнета - я крутил. Можно сделать чуть лучше, но не сильно это влияет. Я заметил что хитрый пидор в примерах ланпейнета не красил какие-то участки, а замазывал полпикчи сразу, и так - да что-то там, с плохо впихнутым в маску оно генерит (у меня там плотная кистть но на неплотной там какие-то мультики). Тут еще хорошо получилось, неудачнфый пример. Но как присмотритесь там шум есть, как будто песка насыпали. И в зависимости от пика это может быть какой угодно мусор - полупрозрачная ткань, бумсы, песок камни полный пиздец. Я не понимаю, даже, это пережарка или недожарка? Все крутил, все равно сорт оф хуйня на выходе.

Объясню свою конечную цель: промптить естественным языком. Разумеется я вот здесь и сейчас могу получить хороший результат на сидиэкселями, но 4 года промптить тегами немножко заебало. И не пишите что там надо по английски писать и прочий бред, я все это знаю и я знаю чё я делаю, хуйня тут выходит не поэтому. Дело в том что это именно зит а не зимага бейс? Мне качать 60 гиг надо чтоб проверить? Еще я видел есть зимага АЛЛОгараж
, она лучше/хуже? С виду там васянка со встроенными лорами времен первых порнотюнов на сидиксель.

Помогите короче мужики, тут без бутылки не разобраться и с ней тоже. У железного дурака спрашивал, он ту еще хуергу несет. Про лору на детали тоже не надо, я видел там юзают, но должно же нормально изкоропки быть, тут хуйня какая-то явно происходит. Цензуры встроенной я тоже не заметил, это не похоже на сопротивления модели, у меня есть ворфлоу где просто текст ту имидж там все генерится сисик-писик, как может, но генерит.

Аноним 05/05/26 Втр 16:16:24 № 1605360 121

>>1605348
>Дело в том
что для edit не нужно насиловать ЗИТку, а нужно взять flux2.klein 9b distil.

Аноним 05/05/26 Втр 16:28:20 № 1605363 122

image.png 1Кб, 50x43

>>1605360
Мне показалось, что там в будущем будут норм тюны и как бы она быстро запускается как сидиксель.

>flux2.klein 9b distil.
А это наверное что-то тяжелое уже. У менявсего 16гб врама и 32 рама. Не хотелось бы по минуте ждать. Но, есть какие-то на примете готовые воркфлоу для инпейнта? А то на цивитае даже там ну статьи какие то сумбурные, даже ланпейнт я на гите искал уже, а на реддите просто говна за щеку навалили неработающего.

Аноним 05/05/26 Втр 16:29:06 № 1605365 123

В идеале, конечно, я бы хотел инпейнтить на хроме. ^_-

Аноним 05/05/26 Втр 16:31:50 № 1605368 124

Теперь меня как будто энкодер квеновский цензурить начал. Такое может быть?

Аноним 05/05/26 Втр 16:33:32 № 1605370 125

>>1605363
нет, оно очень легкое и быстрое, легче квен едит. в твой конфиг со свистом залетит в 5 секунд на картинку

Аноним 05/05/26 Втр 16:38:10 № 1605374 126

>>1605370
Ок, спосеба, попробую. А то я в восприятии флюкса застрял на временах его старта кляйна этого, много свободного доступа было для онлайн моделей, а сейчас все прикрутили и на фокусе сидеть уныло чот.

Аноним 05/05/26 Втр 16:51:15 № 1605379 127

>>1605360
> flux2.klein 9b distil.
Дистил не может в реалистичную текстуру кожи. А лор к этому нет, разве что снофс какой-нибудь, который сам по себе плоховат

> А это наверное что-то тяжелое уже
Он как раз в 4 степа работает по секунде. Жаль что он хуйня

Аноним 05/05/26 Втр 16:54:01 № 1605381 128

>>1605363
>готовые воркфлоу для инпейнта
Там не нужны какие-то хитровыделанные воркфлоу для старта. Берешь вф i2i из темплейтов - и уже можно редачить через промт. Если нужна маска, то в это же вф добавляешь пару нод. В твое железо спокойно лезет 9В, base-версию не качай, как по мне оно не стоит того, чтобы пердолится на 20+ шагах. Дистил делает тоже на 4-8. 8 шагов - примерно 15сек, у меня такие же статы 16/32

Аноним 05/05/26 Втр 17:00:26 № 1605384 129

>>1605379
>хуйня
Альтернативу предложить сможешь? Нет? Я так и думал

Аноним 05/05/26 Втр 17:07:11 № 1605387 130

>>1605348
клейн работает, но тоже не сразу.

Мне наоборот инпейта не хватает в клейне, т.к. он очень туго реагирует на промт в эдите. Хотелось бы выделить область с которой он должен работать.

>>1605384
Я уже писал в треде про альтернативу много раз. Тот кто в глаза не ебется видел. А кого устраивает дистил - сидите на нем. Я про дистил забыл. Толку от скорости мало, когда это слоп без нормальных лор

Аноним 05/05/26 Втр 17:15:51 № 1605391 131

>>1605387
>писал в треде много раз
Хз, может это было в каком-то другом треде, лично я не видел. Квен, как по мне, тяжелее и хуже. Я его вообще удалил.

>Хотелось бы выделить область
У клейна нет проблем с масками, даже получше, не перерисовывает всю картинку.

>без нормальных лор
Тренируй лоры сам кто? я?

Аноним 05/05/26 Втр 17:19:37 № 1605395 132

>>1605391
> Хз, может это было в каком-то другом треде, лично я не видел.
В прошлом. Тот же клейн просто не дистил

> Тренируй лоры сам
Не умею пока, рано мне

Аноним 05/05/26 Втр 17:20:07 № 1605397 133

>>1605379
> Дистил не может в реалистичную текстуру кожи

ничего не мешает сделать рефайн отредактированного изображения в модели где есть реалистичная кожа, тот же зит

Аноним 05/05/26 Втр 17:36:03 № 1605403 134

>>1605395
>клейн не дистил
У меня единственный вопрос к базе - нахуя я это скачал. Потестил, КАРДИНАЛЬНОЙ разницы не увидел. Возможно она и лучше, но генерировать по минуте уже не хочу.

Аноним 05/05/26 Втр 17:42:59 № 1605405 135

>>1605403
База еще хуже дистила. Кто бы что не говорил - не увидел преимуществ в t2i в fp8

Аноним 05/05/26 Втр 17:58:11 № 1605409 136

>>1605387
>клейн работает, но тоже не сразу.
Что это значит? И еще вопрос: если я в воркфлоу хромофур подсуну - будет инпейнтить? Он же тюн флюкса.

А на зите я тут такую хуйню заметил. Там был другой семплер, адвансит. Но почему так? Написано везде что можно с ним только жесткую кисть использовать на маске. Но я вижу он не учитывает контекст картинки а инпейнтит строго в окне отмеченном не захватывая края (не помню как это по вумному называется). я зит мучаю потому что он уже скачан, конечно.

Аноним 05/05/26 Втр 18:28:35 № 1605424 137

>>1605409
>почему так
1. Очевидно, что нет ноды, которая размывает края маски на заданные размеры
2. Очевидно, что нет ноды, которая тянет контекст с загруженного имиджа

>я зит мучаю
чтрадай

Аноним 05/05/26 Втр 18:30:34 № 1605426 138

>>1605409
Ну и да, у тебя скачан LanPaint - идешь на гитхаб и читаешь про настройки, там все написано

Аноним 05/05/26 Втр 19:00:28 № 1605436 139

>>1605424
>1. Очевидно, что нет ноды, которая размывает края маски на заданные размеры
>2. Очевидно, что нет ноды, которая тянет контекст с загруженного имиджа
>
Очевидно ты пишешь хуйню.

Аноним 05/05/26 Втр 20:33:45 № 1605480 140

>>1605409
А нахера ты эту полоску внизу оставил, чтобы что?
То, что лапша не умеет нихуя толком в импЭйнт, это как бы уже общее место, те кто кричит, что у тебя типа скилишью: >>1605436
, ещё ни разу не проиллюстрировали свой собственный скилл на хотя-бы удобоваримом примере. Интерфейс у импаинт-ксамплера чудовищный, половина из крутилок нихуя не даёт (или тупо не работает), а другая половина при всех вариантах выдаёт хуету а-ля 1.5 в лучшем случае. Не теряй своё время с этой ебалой, юзай эдит Кляйн, или Фотошоп + фокус, если нужно побырику что-то наролить..

Аноним 05/05/26 Втр 21:01:05 № 1605498 141

>>1605480
>А нахера ты эту полоску внизу оставил, чтобы что?
Чтобы посмотреть.

>То, что лапша не умеет нихуя толком в импЭйнт, это как бы уже общее место, те кто кричит, что у тебя типа скилишью:
Вот и я не понимаю, почему оно так жестко по маске, если я туда еще сверху костыльной чуши накидаю, то это только утяжелит воркфлоу, полагаю.

>Не теряй своё время с этой ебалой, юзай эдит Кляйн
Ты имеешь в виду полное изменение всей фотографии? Потому что выше вроде бы про инпейнт говорили.

Аноним 05/05/26 Втр 21:02:33 № 1605499 142

Вообще, еще дело в руках. У меня стоит люструспони тюн какой-то, он жестко проебывает руки, рисует даже на детализации в фокусе какие-то микроанимешные закорючки вместо рук.

Аноним 05/05/26 Втр 22:07:29 № 1605534 143

>>1605498
>Ты имеешь в виду полное изменение всей фотографии?
пример: >>1604370
ты просто в промте пишешь что нужно сделать, в данном случает я написал, что нужно убрать нижнее бельё и обувь оставив всё как есть, а затем ролишь, м выбираешь лучший вариант. Мало того, можно ретушировать (довести до кондиции херовый референс), если тот недоступен в хорошем качестве, здесь анаон говорит о том, что именно нужно: >>1604555

Аноним 05/05/26 Втр 22:12:02 № 1605539 144

>>1605498

Аноним 05/05/26 Втр 22:14:58 № 1605541 145

>>1605498
>про инпейнт
зачем тебе импейнт, если можно без него?
Повоторяю, если тебе там приспичило отредактировать что-то по маске, то есть прекрасный инструмент для этого, это Фокус, больше нихуя не надо, выбираешь модель которая умеет в то, во что ты хочешь и подходит по гамме к референсу и хуяришь... там всего 2 ползунка тебе нужно, это: денойз и контест, чем выше контекст тем лучше будет результат, но это всегда качели, большое выделение снижает качество рисовки а высокий денойз добавляет шизы, ищешь золотую середину, помогаешь фотошопом.

>>1605539
да-да, это тот самый пример, когда сигна соответствует исполнению)

Аноним 05/05/26 Втр 22:45:08 № 1605555 146

>>1605534
> а затем ролишь
Уже маркер того, что не оптимальный метод. В зависимости от сложности условий - иногда % успеха может уходить к 1к50.

Можешь показать воркфлоу клейн+импейнт?
У меня с прошлого треда бенчмарк, с которым клейн едит в общем режиме почти не справляется. 5ый палец убрать с бутылки, да и третью коленку тоже не так просто.
Такую хуйню только импейнтом либо заново генерить

Аноним 05/05/26 Втр 22:47:02 № 1605556 147

>>1605534
А как снофс работает со стандартным текст энкодером с цензурой?
Разве квен 3_8 не должен быть зацензурен, что бы игнорить порно-промты?
Смысл тогда в uncensoured текст энкодерах? Я зачем то выкачал такой специально для клейна. Хуета непонятная уебская повсюду

Аноним 05/05/26 Втр 22:50:21 № 1605559 148

image.png 2Кб, 50x43

>>1605534
так там нет ворфлоу

Аноним 05/05/26 Втр 23:19:23 № 1605578 149

>>1605555

Аноним 05/05/26 Втр 23:21:58 № 1605579 150

>>1605578
нет, ты решил одну проблему и создал новую

Хотя как ты пофиксил мотик я не знаю.

Аноним 05/05/26 Втр 23:45:38 № 1605584 151

>>1605579
>создал новую
мне похуй

>как ты пофиксил мотик я не знаю.
я тебе подробно расписал в прошлом треде, что тебе нужжно сделать, но ты промухал как всегда.

Аноним 05/05/26 Втр 23:57:51 № 1605588 152

>>1605579
> пофиксил мотик я не знаю
Загадка века. Премию Тьюринга дадут разгадавшему.

Аноним 06/05/26 Срд 00:05:30 № 1605593 153

>>1605588
>Загадка века
разгадка в прошлом треде.

Аноним 06/05/26 Срд 00:06:23 № 1605595 154

ComfyUItempvpcp[...].png 4656Кб, 1920x1072

>>1605584
>>1605588

Аноним 06/05/26 Срд 01:16:09 № 1605633 155

>>1605556
>А как снофс работает со стандартным текст энкодером с цензурой?
Нормально работает, потому что его, text encoderа, задача не делать inference, а перегнать слова-токены в эмбеддинги.

>Смысл тогда в uncensoured текст энкодерах?
Ну хотя бы в том, чтобы проигнорировать всё то, что о них писалось, а потом упорно продолжать есть кактус, because you can.

Аноним 06/05/26 Срд 01:36:49 № 1605649 156

>>1605556
>Смысл тогда в uncensoured текст энкодерах?
я сравнивал, разницы никакой, снофс говно, концепты у него поневские, уёбищные с проёбами в анатомии, порно ты один хер не сможешь на нём делать, для ебли нужен wan 2.1-2.2 с nsfw лорой, ни zit ни клфйн не умеют в порнуху.

Аноним 06/05/26 Срд 01:56:13 № 1605664 157

>>1605556
Я тебе вот чего скажу, что снофс, что кляйн бесполезная хуита, разве что в кляйн-эдит снять с кого-нибудь трусы, всё... Композиционно кляйн абсолютно беспомощен, все его концепты из коробки - уебанские. Поэтому хуйнёй не занимайся, ковыряй zit, он гораздо интересней.

короткие стрижки zit Аноним 06/05/26 Срд 03:56:55 № 1605691 158

ComfyUItempmdhh[...].png 3816Кб, 1600x1400

1. very short bob cut
2. buzz cut
2. side parted pixie cut
бля... Это всё, ребзя. НИкаких гарсонов, никаких андеркатов. если у кото-то что-то получалось, поделитесь...

Аноним 06/05/26 Срд 06:55:27 № 1605724 159

>>1605691
> гарсонов
fuzzy short woman haircut
> андеркатов
slick back man haircut + бритые виски немопню как
пробуй просто описать, две недели блять уже дрочишь свои волосы

Аноним 06/05/26 Срд 07:26:59 № 1605732 160

>>1605724
>две недели блять уже дрочишь свои волосы
ну так они-ж всё никак не отрастут
щас попробую...

Аноним 06/05/26 Срд 08:01:32 № 1605743 161

Аноним 06/05/26 Срд 08:04:23 № 1605744 162

>>1605724
>fuzzy short woman haircut
1. ну, как бэ ок, выглядит так, будто у buzz cut слегка отрасли волосы. slick back не работает, зетка просто рисует хвост сзади и какие там виски уже никого не ебёт.

Предлагаем ещё варианты!

Аноним 06/05/26 Срд 08:30:53 № 1605754 163

>>1605743
Ну наконец-то что-то хорошее в треде!

Аноним 06/05/26 Срд 08:44:15 № 1605758 164

>>1605754
себя не похвалишь - ходишь как обосранный

Аноним 06/05/26 Срд 10:07:53 № 1605778 165

>>1605691 >>1605744
Ты застрял в своём узком тезаурусе из 3 слов и пытаешься из него что-то толковое выжать. Хотя когда ты приходишь к Инге Михайловне в парикмахерскую Молодость ты ей не говоришь "side parted pixie cut", сидишь с покерфесом 30 минут, и в конце говоришь "я не это хотел". Ты говоришь "как раньше" или показываешь картинку из журнала "как тут", она видит, что тут 4 выбрить, там 8 оставить, здесь прорядить, там протушевать, зачесать, здесь на уровне виска, тут до плеча. То есть наваливаешь кучу дополнительного констекста, которого в названии из трёх слов не хватало.

Потому просто возьми референс который тебе надо. Скорми его в vision llm, тот же квен, и попроси максимально подробно описать причёску в тех терминах, в которых text encoder мыслит.
И уж когда ты начнёшь писать промты в той же форме что и текст энкодер, тогда можно делать выводы о пригодности-непригодности самой модели.

A cinematic close-up portrait of a young Caucasian skinhead girl named "Jax," embodying a raw, rebellious street spirit. She has a distinct skinhead hairstyle: the back and sides of her head are completely shaved smooth, while a thick, straight, blunt-cut dark fringe (bangs) covers her forehead, framing her intense gaze. Her expression is one of defiant indifference and stoic confidence, with a piercing look directed at the camera. A small beauty mark is visible on her cheek. She wears a faded black oversized punk band t-shirt and small silver hoop earrings. The camera angle is a slight high-angle shot, creating an intimate yet confrontational perspective that emphasizes the geometry of her haircut and the intensity of her eyes.

Аноним 06/05/26 Срд 10:50:53 № 1605803 166

>>1605778
> в которых text encoder мыслит.
твой квен может мыслить всё что ты захочешь, но если модель не занет что это, то нихуя не и будет. И если я буду тратить на описание причёски по 20-30 слов, то у меня не останется ничего для основного промта. профессура, ёптить...

Аноним 06/05/26 Срд 10:53:14 № 1605807 167

>>1605778
>3 слов
обычно это одно слово: канадка, или полубокс, или полька, одно слово.

Аноним 06/05/26 Срд 10:56:29 № 1605813 168

>>1605778
> в vision llm
Я другой чел. А поподробнее можно? Откуда модель знает в каких терминах мыслит текст энкодер? Что за vision llm?
Есть какая то локальная модель, которая хорошо промт-энхасит, лучше чем фри гпт/гемини, которые просто не имеют ни фантазии, ни художественного видения, только хуевые шаблоны первые попавшиеся.

Аноним 06/05/26 Срд 10:58:13 № 1605817 169

>>1605813
>в каких терминах мыслит текст энкодер?
хороший вопрос.

Аноним 06/05/26 Срд 11:00:30 № 1605818 170

>>1605803
> но если модель не занет что это
Ещё раз. Бессмысленно рассуждать о диффузионной модели, если ты с текстовым энкодером говоришь на разном языке
> не останется ничего для основного промта
Ну очень жаль, что ты всё ещё мыслишь категориями полторахи, и пытаешься делать какие-то выводы о сегодняшних моделях

Аноним 06/05/26 Срд 11:08:01 № 1605822 171

>>1605813
Вот смотри. У тебя в качестве текст энкодера используется вполне конкретная LLM. Совершенно нормально взять этот же квен и спросить его "вот картинка, расскажи какими бы словами ты её описала". Чтобы она извлекла из себя, какие у неё текстовые конструкции совпадает с конкертными визуальными токенами. Не отгадывать путём проб и ошибок, а в лоб спросить текстовую модель что она знает.

Целиком реверс промт конечно делать квеном тупо. Но спросить его "какими словами можно описать такую причёску, такую одежду, такой ракурс, такое цветовое решение" можно и нужно.

Аноним 06/05/26 Срд 11:08:37 № 1605823 172

>>1605818
> категориями полторахи
Это не я мыслю это зетка так работет. там количество токенов в промте чуть больше чем в сдохле. ох уж эти теоретики! твоё описание причёск годится только для выебонов. но никак не для реальной работы.

Аноним 06/05/26 Срд 11:10:41 № 1605826 173

>>1605822
Вот-вот, давай, спроси...

Аноним 06/05/26 Срд 11:11:30 № 1605828 174

>>1605823
>там количество токенов в промте чуть больше чем в сдохле
Количество токенов на входе бесконечное. Есть ограничение на размер скользящего окна и на размер выходного эмбеддинг вектора.

Аноним 06/05/26 Срд 11:14:02 № 1605829 175

На улице +26, генерить перехотелось.
Летом генерить с кондеем в комнате получается по стоимости за электричество как токены во flux 2 max. Либо терпеть жар 35С в комнате

Аноним 06/05/26 Срд 11:15:45 № 1605831 176

>>1605828
бла-бла-бла...
а на деле через 15-20 слов зетка уже забывает о чём там речь шла в начале

Аноним 06/05/26 Срд 11:20:25 № 1605836 177

>>1605831
Да в общем то соглы, чего это я правда. Промты больше 20 слов не работают. Модели причёски рисовать не умеют. В локалках только застой и разочарование. Точки ещё эти зелёные. Пора завязывать.

Аноним 06/05/26 Срд 11:24:40 № 1605840 178

>>1605836
сдохля базовая и та больше знала знала причёсок

Аноним 06/05/26 Срд 11:25:25 № 1605841 179

Есть редкие промты, которые дают в локальной модели очень хороший и стабильный результат. Например афро-тян в желтых листьяю в вагоне метро.
Другие же промты дают исключительную хуйню.

Если дело в промте, почему эту проблему не пытаются решить промт-энхансером прямо в воркфлоу? Проблема смещается из плоскости танцев с бубноми (копингом) вокруг промта в плостью системного промта для энхансера.
Огромный плюс в том, что любой прогресс с таким системным промтом для конкретной диффузии - будет масштабироваться на любые промты, сколько то улучшая результат.
В идеале получить энхансер, который умеет "придумывать красиво" заполняя или корректируя все слабые / некорректные места твоего промта.

Но для этого нужно обучение локальной ллм под промтинг конкретного типа, или вовсе специально для модели.

Что точно известно: GPT / Gemini - думающая / Pro - мало что понимает в этом плане. Самые разные запросы, не приводили к значимому эффекту, они выдают промт с рэндомно-посредственным описанием, на уровне худ. реализаций, композиции.

Аноним 06/05/26 Срд 11:26:23 № 1605842 180

>>1605828
>бесконечное
Было гладко на бумаге)

Аноним 06/05/26 Срд 11:35:23 № 1605851 181

>>1605841
Ты так скоро додумаешься давать нейронке картинку и просить описать ее.

Аноним 06/05/26 Срд 11:37:51 № 1605853 182

>>1605841
Как же заебала вся вот эта ваша маниловщина. Нихуя из этого не будет, если бы это было возможно, то это давно бы сделали. Весь пиздец заключаетчя в том, что языковые модели, даже локальные, настолько ушли вперёд, что между ними образовалась пропасть, и чем дальше, тем глубже и шире.

Аноним 06/05/26 Срд 11:45:58 № 1605857 183

>>1605853
>ними
Кеми?

Аноним 06/05/26 Срд 11:46:03 № 1605858 184

>>1605778
Ты просто написал промт специфичной прически, ассоциированной со специфичной суб-культурой - и о чудо, в модельке оказалась эта челка.

То до чего докопался этот >>1605691 - это проблема не промта, а именно ограниченность локальной модельки. Ты сам не решишь её промтингом. У моделей крайне ограниченный набор возможностей в видении всевозможных узкоспециализированных образов.
Например клейн не способен нарисовать в принципе НИЧЕГО красиво, кроме людей и close up shot объектов по центру.
И как правильно замечено, даже если промт на 100 слов работал - невозможно работать, если 100 слов уходит на одну прическу.
А еще, когда заставляешь локальную модель через силу высрать что то детальным описанием - она начинает рисовать это отвратительно не естественным с говной.

Аноним 06/05/26 Срд 11:48:27 № 1605859 185

>>1605857

Аноним 06/05/26 Срд 11:50:34 № 1605862 186

@artmonkey нарисуй a cinematic close-up portrait of a young Caucasian skinhead girl named "Jax," embodying a raw, rebellious street spirit. She has a distinct skinhead hairstyle: the back and sides of her head are completely shaved smooth, while a thick, straight, blunt-cut dark fringe (bangs) covers her forehead, framing her intense gaze. Her expression is one of defiant indifference and stoic confidence, with a piercing look directed at the camera. A small beauty mark is visible on her cheek. She wears a faded black oversized punk band t-shirt and small silver hoop earrings. The camera angle is a slight high-angle shot, creating an intimate yet confrontational perspective that emphasizes the geometry of her haircut and the intensity of her eyes

Аноним 06/05/26 Срд 11:52:36 № 1605866 187

>>1605841
Множество хороших промптов очень сильно отличается от модели к модели и от зрителя к зрителя. Кому-то нравится вылизанный 1girl слоп с цветокором, кому-то надо навалить аналогового зерна, расфокуса, боке и кросспроцессинга, кому то надо композици, ракурс, рыбий глаз и голландский угол, кто-то на аниму чёрно-белую дрочит.
То есть ты вполне можешь наколдовать энхансер на llm для какой-то одной ситуации, много кто так делает. Но унивесральной балалайки собрать не удастся, потому что на вкус и цвет фломастеры разные. (все картинки с осенней негритянкой - говно)

Аноним 06/05/26 Срд 11:52:56 № 1605868 188

@artmonkey сделай кинематографичное фото девушки-скинхедки с недовольным лицом и дурацкой прической с лысой башкой и только челкой

Аноним 06/05/26 Срд 11:53:40 № 1605869 189

>>1605862
А там по французски вставки будут как в войне и мире?

Аноним 06/05/26 Срд 11:56:44 № 1605875 190

image.png 46Кб, 1598x348

>>1605868
>дурацкой прической

Аноним 06/05/26 Срд 11:58:02 № 1605877 191

>>1605862 >>1605868
Вот вроде текста меньше, а согласованность картинки пропала. Из средней портретной фотографии в ширпотребный нейросплоп.