Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 191 92 51
Stable Diffusion тред X+189 /sd/ Аноним 01/05/26 Птн 10:31:52 1602441 1
image.png 3284Кб, 2048x1152
2048x1152
image.png 2159Кб, 1280x1152
1280x1152
image.png 3210Кб, 1080x1920
1080x1920
image.png 2106Кб, 1280x1152
1280x1152
Тред локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• Z-Image-Base
• FLUX.2 klein (4b и 9b)
• Z-Image-Turbo
• Flux 2
• Qwen Image / Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/Comfy-Org/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

► Предыдущий тред >>1596721 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Аноним 01/05/26 Птн 10:36:52 1602443 2
image.png 22Кб, 258x267
258x267
Как подключить beta57 scheduler отдельной нодой без KSampler?
Это нужно добавить beta scheduder и выставить a=0.5 b=0.7 и это будет равноценно пикрилу или есть нюансы?
Спасибо
Аноним 01/05/26 Птн 10:41:47 1602445 3
>>1602443
Нода шедулер симпл, в ней выбери из списка.
Аноним 01/05/26 Птн 10:43:03 1602446 4
>>1602430 →
Про деформацию хорошее замечание. Реально такое есть - начинаешь разбираться и тянуть определенное качество сам и сразу начинает плыть собственное чувство эстетики, вплоть до полной потери эмоций и отклика от эстетики.

Но в этом плане плюс генераций в том, что ты конвертируешь текст в изображение, и эта дистанция принципиально избавляет от непосредственности в процессе создания. Ты не художник, ты манипулируешь художником. Если бы результат на выходе был удовлетворительным - можно было бы не поплыть и кайфовать с этого. Не ты рисовал, ты просто технически пришел к такому результату, где ии рисует тебе то, что радует.
Проблема в том, что этого достичь пока непонятно как
Аноним 01/05/26 Птн 10:49:57 1602453 5
image.png 33Кб, 533x303
533x303
>>1602445
> Нода шедулер симпл
Нет такой. Есть только такие
Аноним 01/05/26 Птн 10:51:01 1602455 6
>>1602225 →
Какая анима лучше сейчас, preview2 или preview3?
Аноним 01/05/26 Птн 10:53:26 1602458 7
>>1602446
Ценность того что дается легко, во множестве и случайно стремится к нулю чел.

Попробуй в голове составить виденье того чего ты хочешь хотя бы примерно, определиться со стилем, композицией набрать референсов, потом прогнав генерацию и отобрав нужное инпейтом фиксить до идеала - тогда у тебя получится арт ничуть не хуже чем те что получаются от рисобак, без ощущения нейрослопа.
Аноним 01/05/26 Птн 10:53:41 1602459 8
>>1602455
Да. А сам-то как думаешь, если есть 1, 2 и последняя 3?
Аноним 01/05/26 Птн 11:14:03 1602471 9
>>1602443
> выставить a=0.5 b=0.7
Да.
> или есть нюансы
Нет.
Аноним 01/05/26 Птн 11:18:23 1602472 10
image.png 10Кб, 625x82
625x82
image.png 31Кб, 663x243
663x243
>>1602459
> думаешь
В этом и была проблема
In progress
У модели приписка base, а про base пишут - модель для обучения или специального применения, не для базовой генерации
Аноним 01/05/26 Птн 12:06:25 1602501 11
image.png 118Кб, 368x301
368x301
Аноним 01/05/26 Птн 13:47:21 1602556 12
Есть только одно: маркетинг и продвижение + коллабы.
Песня может быть хуже 10 других похожих, но она сыграет в новом блокбастере и все будут ее любить, потому что ее услышал миллиард человек, а остальные 9 - услышало пара соток анонов.
И так во всем. Картинка из треда и та же самая картинка в каком-то популярном канале на лям подписоты - это разное. А если она распечатана и вставлена в рамку на модной выставке - это еще одна реальность.

На самом деле, положа руку на сердце, чисто картинки/фотки, музон, да и видеоряд месами - все это вне контекста очень сложно оценивается.
Именно поэтому какие-то художники были успешными при жизани, а например Ван Гог нахуй никому не был нужен.
Но как только за картинки начинают платить лямы ништяков - человеки вынуждены оценивать ее уже по-другому.
Один и тот же кадр на странице просто какого-то чела в телеге, и тот же самый кадр но подписанный модным челом и опубликованный в популярном канале - это разные кадры, хотя и одинаковые.
Аноним 01/05/26 Птн 13:56:31 1602561 13
ComfyUI00100.png 3184Кб, 1920x1088
1920x1088
16gb vram slop и однобокость не позволяет креативить
Даже банальные тестовые идеи показывают, насколько хуевый контроль и сама модель не знает эстетики. Просто лепит соответствие, максимально не эстетичное
Отдельная беда - это генерация оригинального заднего плана. Она не может просто взять и по промту нарисовать гигантичное футуристичное красивое здание на 2/3 ширины кадра уходящее за пределы экрана. Она будет рисовать офисники и всё в таком духе.
Она будет рисовать картуниш механизм руки
Аноним 01/05/26 Птн 14:27:33 1602578 14
Идея с промт оркестрацией под мультипроход t2i > iti > ... > image
Суть в том, что промт энхансер (пусть даже корп llm) генерит не 1 промт, в расчет на t2i, а разбивает промты в расчет на мультипроход, рассчитывая, что одна идея будет собираться в несколько этапов соблюдая соответствующие правила для каждого прохода. Особенно если t2i и iti модели отличаются.
Здесь простор для экспериментов возникает в:
- выборе подходящих моделей под каждый шаг
- еще более важно: поиск наиболее эффективной и стабильной разбивки (генерить ли фон / главные объекты раздельно, или сразу генерить второе в iti, и тогда что генерить первым)

А вообще, если бы была дообученная под специфичную диффузию модель, которая шарит в композиции и эстетике и знает как это описывать удачными промт-паттернами, это в один проход могло бы улучшить качество. Вот только где это высрать, сами авторы моделеке кроме общих правил промта не делают никаких реально существенных примочек.
Промтить через общие ллм, которые мало что знают про конкретные модели или тем более писать промт самому, не зная ничего о том, что внутри модели это какой то бред ебланский. Неужели нельзя на основе данных об обучении модели, сразу создавать еще лоры или файнтюны для локальных ллм - промт энхансеры, адаптированные под модель. Ведь корпоративные рисовалки наверняка применяют подобные подходы, и оркестрацию многопроходки, и обученный промт энхансер

Где вместо просто Standing, в диффузию уходит подобранное сюжет и конкретную модель нечто вроде "Standing in a relaxed, natural contrapposto stance" или "Standing with a slight lean toward the object".

Вы спросите что мешает это же делать через гпт? То что они с трудом даже справляются с форматом промта специфичной модели. То что они хуево всему этому обучены, "видению" того как лучше и красивее и точному описанию этого на языке диффузии (который они не знают).

Интуитивный промтинг, перебирание слов и формулировок вручную почти не работает, уходят часы на гринд сидов. Это говно из жопы, копинг.
Аноним 01/05/26 Птн 14:32:05 1602587 15
>>1602561
>Отдельная беда - это генерация оригинального заднего плана.
А меня больше прохожие умиляют.
Но надо заметить, что "гигантичное футуристичное красивое здание" это не то описание, по которому нейронка сгенерит то, что ты под этим имел в виду.
Аноним 01/05/26 Птн 14:36:35 1602594 16
>>1602587
> "гигантичное футуристичное красивое здание
Я попробовал около 5 разных подходов. Включая Bladerunner стайл.
Там были гигантские здания во весь экран.

Это второй раз, когда я наталкиваюсь на такую хуйню. Он точно так же не может нарисовать нормальные эффектные массивные руины большого города в заднике.
Есть вероятность, что я просто не зацепил нужную ассоциацию. Пока не знаю, надо отдельно сидеть и экспериментировать, с целью выяснить, могу ли я в принципе получить примерно то, что хотел. Если да, то в такой модели значит надо гриндить шаблоны промтов.
Аноним 01/05/26 Птн 15:00:55 1602615 17
ComfyUItempgbuu[...].png 1451Кб, 1024x1024
1024x1024
>>1602561
Я тебе больше скажу, даже сумарно 40gb vram и 64 ram не дают креативить... потому что нет нормальных локальных моделей которые работали бы с нормальной скоростью и с нормальным датасетом.
Аноним 01/05/26 Птн 15:31:16 1602632 18
>>1602561
>креативить на локалке
Ты ещё через ллм в svg попытайся креативить. Локал только для голых срак создан, всё остальное в банане про, графическое в гпт 2.
Аноним 01/05/26 Птн 16:17:34 1602671 19
>>1602430 →
То, что ты описал, это не деформация, а уровень профессионализма, когда знаешь как должно быть и все косяки автоматом бросаются в глаза. Несколько лет отработал в печатном издании на верстке текста, даже не вчитываясь в текст уже вижу как сверстано, висячие строки, двойные пробелы и тд. А вот проф.деформация начинается тогда когда начинаешь выдрачить там где это не нужно. 3 зеленых пикселя на 2к картинке, сделать идеальную генерацию через 100500 нод без плесени, пережара с первой попытки и тд
Аноним 01/05/26 Птн 18:49:29 1602768 20
>>1602671
Это главный бич всех хобби. Сначала ты без задней мысли кайфуешь для души, а потом превращаешься в желчное чудовище, ищущее зеленые пиксели.
Аноним 01/05/26 Птн 18:54:04 1602773 21
image.png 420Кб, 756x761
756x761
image.png 660Кб, 1080x805
1080x805
image.png 348Кб, 883x537
883x537
>>1602561
как фиксить этот цифровой шум?
убирать лоры только?
это simple + euler
Аноним 01/05/26 Птн 19:05:58 1602780 22
Аноним 01/05/26 Птн 19:12:08 1602784 23
>>1602780
Не совпало, вспомнил когда читал про зеленые пиксели.
Было бы неплохо знать что на это влияет. Но жертвовать чем то существенным ради этого я бы не стал, и так на лимитах через жопу всё.
Аноним 01/05/26 Птн 19:40:13 1602803 24
Аноним 01/05/26 Птн 19:48:50 1602810 25
>>1602784
>Было бы неплохо знать что на это влияет.
Кривой VAE FLUX.2, которому не помог выпуск обновления. Загаживает изображение цветным мусором как вотермаркой. Какие-то пиксели более заметны, какие-то менее, но изображение загажено всё.
Не лечится.

Костыли:
1) upsample изображения в более высокое разрешение и его последующее скукоживание, чтобы разноцветный мусор съело в процессе (не поможет если пиксельный мусор слипся и стал более одного пикселя в размере);
2) Удаление пиксельного мусора ценой некоторой потери «цветового разрешения». После VAE Decode изображение разбивается на YCbCr и к каналам CbCr аккуратно применяется bilateral фильтр, а затем каналы снова собираются в выходное изображение.

мимо
Аноним 01/05/26 Птн 20:11:09 1602831 26
ComfyUI00111.png 2949Кб, 1264x1632
1264x1632
Анима > Гред рудковский лора > Klein edit
Минусы?
Главный минус, что нет пизды
Аноним 01/05/26 Птн 22:30:18 1602959 27
Так что теперь получается нунчака и не нужна вовсе? Она имела смысл на контексте (ебать, помните, была такая модель?) и вроде всё, а теперь те модели заменены лучшими. Ещё вроде на Qwen Image делал, но то ли не сделал поддержку лор, то ли получалась говнина вместо качества, что сейчас проще на клеин с лорами данриси гонять и делать в разы лучше.

>>1602831
На клейн есть пизда. Скачай.
Аноним 01/05/26 Птн 23:23:26 1602993 28
ComfyUI00207.png 1666Кб, 1920x1080
1920x1080
>>1602361 →
>товарищ майор, я чисто кораблики на ней генерю вот пруфы, а эти извращения просто были для теста
Лол, если уж на то пошло, нахуя мне ЕЩЕ ОДНА модель для кума, если с этим и так прекрасно справляются годами отточенные воркфлоу для сдохли? Аниму я скачал для того, чтобы проверить предел её возможностей, и по части генерации кума она выигрывает лишь в том, что из коробки знает больше стилей, чем любой чекпоинт сдохли. При этом имеет фатальный недостаток в виде отсутствия контролнета, а с 0.6В энкодером особо не навоюешь. Так что не, пока анима - для пейзажей и корабликов, а про изврат после релиза 1.0 подумаем. Если контролнет завезут, вроде обещали.

>>1602803
Да не, пока особо ничего интересного нет. Есть неплохой фэнтези-детайлер, эстетик импрувмент ты уже запостил, и еще там была интересная лора на освещение с нестандартными концепциями. Ну оно и понятно, сообщество пока присматривается и ждет полного релиза.
Аноним 02/05/26 Суб 00:14:04 1603020 29
ComfyUItemphojf[...].png 3941Кб, 1800x1200
1800x1200
ComfyUItemphojf[...].png 3952Кб, 1800x1200
1800x1200
ComfyUItemphojf[...].png 4111Кб, 1800x1200
1800x1200
Аноним 02/05/26 Суб 00:34:32 1603034 30
FLUX2dk00026.png 2612Кб, 1920x1088
1920x1088
>>1602831
>Минусы
Kleinовский CGI-feel. И его ничем не перебить.
Текстуры, освещение (и, вероятно, заpromptченный dramatic lighting, cinematic lighting) в комплексе воспринимаются как CGI или скриншот из видеоигры.
Возможно ли что-то с этим сделать, непонятно.
Аноним 02/05/26 Суб 01:00:04 1603048 31
>>1603034
> Kleinовский CGI-feel.
То же самое в корп генераторах будет, почти уверен, хоть и пизже по деталям/выразительности.
Щас будто бы не существует моделей, которые могут нереалистичное изобразить фотореалистичным. И это согласуется с главным принципом ллм.
Разве что стиль можно выбрать поинтереснее чем cgi, он и проще
Аноним 02/05/26 Суб 03:02:13 1603112 32
Что по ernie?
Аноним 02/05/26 Суб 03:42:06 1603122 33
>>1603112
Кал про который сразу забыли. Как я писал на релизе, а мне не верили.
Аноним 02/05/26 Суб 03:52:55 1603123 34
1777683176885.png 4022Кб, 1216x1600
1216x1600
Аноним 02/05/26 Суб 06:16:49 1603139 35
>>1603112
У Эрни нормально работает инпаинт, со времён сдхл такое впервые вижу.
Аноним 02/05/26 Суб 16:35:05 1603435 36
Вы тут вымерли все...?
Аноним 02/05/26 Суб 16:43:23 1603442 37
image 5652Кб, 1536x2048
1536x2048
Скукатв
Аноним 02/05/26 Суб 16:44:51 1603443 38
>>1603442
Движухи захотелось?
Аноним 02/05/26 Суб 17:37:31 1603496 39
изображение.png 220Кб, 475x299
475x299
Сделай пожалуйста реалистичное фото.

У девушки цвет волос темно желтый.
Аноним 02/05/26 Суб 18:05:13 1603529 40
d18c5641-d0ac-4[...].jpg 242Кб, 1280x800
1280x800
Аноним 02/05/26 Суб 18:10:20 1603535 41
image.png 1810Кб, 1296x816
1296x816
image.png 1662Кб, 1296x816
1296x816
>>1603496
>Сделай пожалуйста реалистичное фото.
>
>У девушки цвет волос темно желтый.
Gemini 3.1 Flash (первая), Gemini 3 Pro вторая

промпт копи-паст твоего
Аноним 02/05/26 Суб 18:53:13 1603557 42
testing123.jpg 417Кб, 1632x1024
1632x1024
Аноним 02/05/26 Суб 19:03:26 1603562 43
Аноним 02/05/26 Суб 19:05:00 1603564 44
299312882395074[...].jpg 115Кб, 529x699
529x699
Можно еще с этим кадром реалистичное фото сделать? Пусть будут желтые волосы, возраст 20 лет.
Аноним 02/05/26 Суб 19:05:43 1603566 45
Аноним 02/05/26 Суб 19:06:03 1603567 46
image.png 1523Кб, 768x1152
768x1152
Как промтить такие волосы, то есть прям не афро-афро, а чтоб как на пикриле? (в зетке и кляйне)

>>1603562
>20 лет
ага, желательно... чтобы тебе их не дали)
Аноним 02/05/26 Суб 19:13:12 1603569 47
image 2740Кб, 1089x1444
1089x1444
Аноним 02/05/26 Суб 19:15:16 1603571 48
>>1603569
> зачем?
что бы и дальше вайпать засохшую тред-мумию
Аноним 02/05/26 Суб 19:24:43 1603575 49
71+f-VRZw2L.ACS[...].jpg 102Кб, 638x879
638x879
>>1603569
Да просто интересно как персонаж бы выглядит.

В аниме вот такая внешность, но в манге стиль лучше проглядывается.
Аноним 02/05/26 Суб 19:28:44 1603578 50
image.png 347Кб, 830x1000
830x1000
image.png 1233Кб, 736x981
736x981
Сделайте плз что-то среднее между костюмом палача и костюмом пингвина
Аноним 02/05/26 Суб 19:33:11 1603582 51
>>1603578
блядь, пошёл нахуй уже...
Аноним 02/05/26 Суб 21:05:52 1603629 52
>>1603567
Загрузил твой пик в грок, чтобы спросить о прическе, он мне заблокировал все по причине несовершеннолетия субъекта, ну ты и пидор.
Аноним 02/05/26 Суб 21:07:55 1603630 53
image.png 703Кб, 1074x524
1074x524
>>1603629
>ну ты и пидор
я то нет...
Аноним 02/05/26 Суб 21:21:50 1603633 54
>>1603629
Грок несовершеннолетие по дойкам определил?
Аноним 02/05/26 Суб 21:27:27 1603636 55
Аноним 02/05/26 Суб 21:30:38 1603638 56
>>1603629
Замажь литсо и опять загрузи, делов то...
Аноним 02/05/26 Суб 21:31:56 1603640 57
a5dad548-a548-4[...].jpg 249Кб, 832x1216
832x1216
>>1603567
Короче, вот какой промт он все-таки высрал:

woman with voluminous curly hair, 3C-4A curls, long defined ringlets, caramel brown with golden highlights, natural frizzy volume, central parting, tropical wild curls, detailed texture

Зетка по нему рисует пикрил.

>>1603638
Помогло обрезание сисек, его трясло от сочетания сисек с детским лицом.
Аноним 02/05/26 Суб 21:39:48 1603645 58
>>1603640
неплохо, но это не совсем то, там что вроде: burnt out - то бишь типа слегка выгоревшие волосы, у тебя получилась модельная завивка для показа, и нужен какой-то пробивной одноэтажный токен.
Аноним 02/05/26 Суб 21:44:56 1603647 59
130.jpg 240Кб, 864x1200
864x1200
144.jpg 212Кб, 880x1168
880x1168
Аноним 02/05/26 Суб 22:08:52 1603653 60
>>1583617 →
>Давай кати уже, у меня накопились геймченжеры. Срочно надо поделиться.
И где? Оказывается уже несколько тредов прошло. Были запощены эти игроизменщики?
Аноним 02/05/26 Суб 22:10:09 1603655 61
>>1603139
>со времён сдхл
Ты flux.fill не юзал что ли? Да и нынче вроде edit модели нормально работают с зарисованными областями.
Аноним 02/05/26 Суб 22:47:39 1603674 62
image.png 2674Кб, 1400x1200
1400x1200
>>1603640
>>1603567
ох, ебать, какая-же всётаки зетка тупорылая, ничего не знает ни о каких выгоревших волосах. Как же я заебался с ней.

распущенные, свободно спадающие mixed-race afro 4с curly blonde:0.8 fluffy hair with shiny ends
Аноним 02/05/26 Суб 23:09:14 1603685 63
>>1603569
Красиво, можно еще?
Аноним 02/05/26 Суб 23:13:04 1603687 64
>>1603685
>можно
нет, пиздуй в аниме-загон, и там заёбывай всех своими кастратами.
Аноним 02/05/26 Суб 23:25:47 1603695 65
Аноним 03/05/26 Вск 00:04:03 1603705 66
Аноним 03/05/26 Вск 01:17:47 1603732 67
1777760268660.png 3742Кб, 1216x1600
1216x1600
Аноним 03/05/26 Вск 01:28:45 1603736 68
>>1603732
она обоссалась или обблевалась? что было в промте?
Аноним 03/05/26 Вск 01:30:49 1603737 69
>>1603736
Открыто для интерпретации.
Аноним 03/05/26 Вск 01:44:56 1603741 70
>>1603737
ну, тыж там чёт писал...
Аноним 03/05/26 Вск 01:59:38 1603744 71
image.png 90Кб, 294x198
294x198
>>1603736
Кляйн и вроде зетка ещё ссут изо рта и судя по струйке из её рта он промптил обоссывание.
Аноним 03/05/26 Вск 02:08:08 1603746 72
>>1603744
зетка умеет ссать?
может быть она ещё и срать умеет?
Я до сих пор не пробовал, кстати...
Аноним 03/05/26 Вск 02:16:46 1603747 73
>>1603741
Слюна стекает на платье. Лужа под ногами.
Аноним 03/05/26 Вск 11:05:21 1603858 74
Аноним 03/05/26 Вск 11:12:34 1603861 75
image.png 25Кб, 651x479
651x479
image.png 1Кб, 50x43
50x43
>>1603858
Не могу пройти.


И еще вопрос: кто-нибудь тут реально делал инпейнт на хромофуре? Мне другой агент советует фордж, мол, меньше ебли будет, илюха типа все уже настроил. Спасибо за ответ, а то не знаю что пользователю сказать.
Аноним 03/05/26 Вск 11:14:36 1603863 76
image.png 35Кб, 719x321
719x321
Аноним 03/05/26 Вск 11:15:06 1603864 77
image.png 1330Кб, 1080x648
1080x648
Аноним 03/05/26 Вск 11:19:59 1603866 78
>>1603864
Все говорят что говно и приведенные примеры это что вообще, я такое на сд1,5 делал когда контролнеты появились. Приложи раздетую юаюу с пиздой тогда поговорим.
Аноним 03/05/26 Вск 12:05:11 1603894 79
Охуенно, flux 2 klein промт гайд страница просто выпелена, и .md файл туда же. Щас где официальный гайд и принципы брать?

Flux 2 гайды написанные для корпоратной версии это говно из жопы и близко не адаптированное для klein, к тому же написанное бабой.

Мб у кого сохранился .md файл?

https://docs.bfl.ai/guides/prompting_guide_flux2_klein
https://docs.bfl.ai/guides/prompting_guide_flux2_klein.md
Аноним 03/05/26 Вск 13:54:28 1603952 80
>>1603894
в кеше яндекса что то сохранилось, попробуй оттуда вытащить
Аноним 03/05/26 Вск 14:19:47 1603968 81
>>1603952
https://web.archive.org/ только веб страница, которая еще валит сервис, но я сохранил её
А вот .md файла который там был сохранен нет.

> в кеше яндекс
я не могу найти где это и что
Аноним 03/05/26 Вск 14:50:16 1603987 82
Аноним 03/05/26 Вск 14:51:54 1603989 83
image.png 10Кб, 892x122
892x122
>>1603987
Я её уже сохранил. Страница через 5-10 секунд редиректит в пикрил
И я сказал что там еще был https://docs.bfl.ai/guides/prompting_guide_flux2_klein.md файл с текстовым форматом гайда. Вот его и не получается найти.
Аноним 03/05/26 Вск 15:20:24 1604005 84
>>1603989
Пздц, теперь всю оставшуюся жизнь ты будешь думать, что у тебя ничего не получается именно из-за потери гайда, а не потому что руки кривые. Ну, может так и легче жить даже.
Аноним 03/05/26 Вск 16:09:30 1604032 85
Аноним 03/05/26 Вск 20:21:28 1604173 86
>>1604005
>>1604032

Я этот мдшник скармливал ллм как доп. контекст и основа для промтинга. В мдшке в отличие от страницы нет лишней хуеты выжирающей токены и отвлекающей внимания.
Кроме того её составляли сами разрабы, и ниче лучше для исходной точки нет. А ты можешь себе коупить, что ты знаешь лучше, по факту ты в душе не ебешь как и на что лучше реагирует модель.
Для flux.2 dev вообще есть своя модель для promp upsampling, которой нет для клейна, и она в отличии от гпт и гемини знает че делать.
На клейне кроме соло рыла с пиздой в t2i ничего не создать, кроме голимого слопа.
Аноним 03/05/26 Вск 20:31:36 1604182 87
Аноним 03/05/26 Вск 22:41:53 1604262 88
image.png 2014Кб, 1080x1080
1080x1080
Аноним 03/05/26 Вск 23:08:10 1604281 89
>>1604173
>скармливал ллм как доп. контекст
Допустим, а где же 2 картинки на одном сиде, с одним и тем же промтом, одна с мдэшником, а другая без, и типа, смотри ребзя, какая разница охуительная, какое понимание промта, расстановка приоритетов, и всё такое? Есть шанс увидеть такое? Или я спросил это у тебя без должного уважения?
Аноним 03/05/26 Вск 23:09:05 1604284 90
>>1604182
покажи скилл на генерации клейна, что то кроме фоток бессмысленно позирующих тян
Аноним 03/05/26 Вск 23:09:25 1604285 91
>>1604182
Поиск философского камня в 2к26)
Аноним 03/05/26 Вск 23:10:45 1604288 92
>>1604281
Я и не брался доказывать ценность мд, но теперь я его в принципе не могу достать и это важнее, чем размышления нужен он или нет.
Аноним 03/05/26 Вск 23:15:34 1604293 93
>>1604284
Это когда есть что показывать) А нахуя? Можно просто сыпать заумными словечками, цитируя бред нейронки.
Аноним 03/05/26 Вск 23:18:22 1604295 94
>>1604262
Брат, не поверишь, я только этим и занимаюсь, что раскрашиваю фрагменты лиц, я дорвался до этого, так до сих пор остановиться не могу.
удаление цифрового шакала после Кляйна Аноним 04/05/26 Пнд 02:24:37 1604370 95
smooth-and-soft[...].webp 45Кб, 1080x1620
1080x1620
Flux2-Klein00110.png 1103Кб, 1072x1616
1072x1616
что писать в промте после 1-й проходки? Пробовал: remove artefacts of digital compression - не то чтобы это прям сильно помогло, возможно контуры стали чуть чётче но внутри них координально ничего не поменялось. Вообще, вторая проходка гарантированно наваливает артефактов, вытаскивая уже имующиеся и добавляя свои, как с этим бороться не превращая картинку в картун?
1. оригинал
2. убрал лишнее, сделал Piper чуть моложе (не сильно, не ссыте, нах)
3. ваш вариант, с вашей рецептурой
Аноним 04/05/26 Пнд 04:28:40 1604408 96
>>1604262
>качество мб файнтюнами поднимут
Спустя 3 года впопенсорса можно уже понять что ничего никто и никогда не поднимет. Вышел кал - значит и будет кал. Максимум данриси бустанет фото качество или дислит выйдет и на этом всё.
Аноним 04/05/26 Пнд 10:16:57 1604555 97
изображение.png 1446Кб, 1072x1616
1072x1616
>>1604370
Под "удали артефакты" поднимается очень сложный процесс "удали потери сжатия, чтобы после удаления потерь что-то появилось, додумай сам".
Для сетки лучше говорить "сделай ретушь/реставрацию", "повысь резкость", "сделай реконструкцию текстур". В предельном случае "преобразуй картинку в идеальное студийное RAW фото", но надо будет наваливать всяких уточнений про "сохрани лицо узнаваемы и так далее"

Про многошаговые аретфакты - нихуя не поделать. Можно попробовать не дрочить VAE и сохранять исходный латент. Но имхо проще в конце просто попросить перегенировать всё без шакалов, пусть и ценой потери сходства с источником.
удаление цифрового шакала после Кляйна Аноним 04/05/26 Пнд 10:26:52 1604568 98
2026-05-0414-21[...].png 1405Кб, 1072x1616
1072x1616
2026-05-0417-13[...].png 1405Кб, 1072x1616
1072x1616
>>1604555
я попробую всё из того что ты перечислил, оегче конечно было бы достать исходную картинку в идеальном качестве, но зачастую референс запредельно шакальный, спасибо за подсказку.

я тут было вспомнил молодость и прогна на сдохле имг2имг с денойзом 6.5, слегка уточнил мордашку (с лорой перса и без) и заролил поней анус.
Аноним 04/05/26 Пнд 13:40:27 1604692 99
Собираюсь тестить эту лору https://civitai.red/models/1972981?modelVersionId=2818111 с обычными klein моделями.

Какой text encoder нужен, если базовый не будет работать?
Есть flux2-klein-9b-uncensored-q8_0.gguf - не подойдет?
i2i режим тоже буду юзать
Аноним 04/05/26 Пнд 14:06:02 1604707 100
Выкладывать nsfw незаконно ведь публично? под статью порнография попадает не? До самого последнего момента об этом не задумывался, хотел выложить и приуныл
Аноним 04/05/26 Пнд 15:37:46 1604775 101
>>1604707
Так и карандаши нельзя продавать. Ведь при помощи их можно нарисовать порнографию с малолоетками.
Аноним 04/05/26 Пнд 16:06:41 1604803 102
>>1604707
Получается что так. Забыл когда мог даже ради рофла что-то выложить в картинках, даже карикатуры. Доебаться смогут ко всему, сказав что это не 1000-летный суккуб, а
Аноним 04/05/26 Пнд 16:11:31 1604810 103
image.png 453Кб, 772x381
772x381
Как заставить клейн едит не рисовать или убрать блики от фронт-софтбокса?
У него просто везде софтбокс студийный.
Аноним 04/05/26 Пнд 16:33:05 1604828 104
image.png 2587Кб, 1200x1600
1200x1600
Аноним 04/05/26 Пнд 19:34:18 1604911 105
>>1604810
студийное фото в негатив пробовал?
Аноним 04/05/26 Пнд 20:06:50 1604933 106
>>1604810
В процессе edit или t2i? Edit сложнее, там можно попробовать relight scene with practical lighting. Скорее всего не поможет. При t2i на klein не давать в prompt цвета в явном виде, писать very soft natural lighting, practical lighting, very dim lighting, dark silhouettes.

>>1604911
У FLUX.2 нормального рабочего negative prompt нет by design и разработчики прямо указывают на гимнастику с positive prompt для обхода.
Аноним 04/05/26 Пнд 21:16:44 1604944 107
>>1604933
Блики изначально дает cinematic shot, но он же неплохо трансформирует в реалистик вместе адекватным освещением/цветами. Проще изначально как то этого избегать

Частично лечится natural lighting RAW shot, но с металлических объектов блик не уходит.

Еще заметил, что клейну катастрофически нехватает лоры на реалистичные текстуры и лэндскейп. Он может в текстуру кожи и лицо на файнтюне, но вот материалы и лэндскейп любой нестандартный - сразу в лучшем случае cgi, но чаще семириал.
Аноним 04/05/26 Пнд 21:44:23 1604958 108
изображение.png 951Кб, 1280x640
1280x640
изображение.png 1529Кб, 1280x640
1280x640
изображение.png 948Кб, 1280x640
1280x640
изображение.png 934Кб, 1280x640
1280x640
Заключительные попытки в Эрни
Аноним 04/05/26 Пнд 22:43:08 1604975 109
>>1604958
Ну чет такое себе...
Аноним 05/05/26 Втр 02:28:26 1605069 110
FLUX2dk00025.png 3526Кб, 1920x1088
1920x1088
Аноним 05/05/26 Втр 02:35:06 1605070 111
>>1605069
Линолеум прям как у меня.
Аноним 05/05/26 Втр 11:47:19 1605177 112
посоветуйте реалистичную nsfw модель для картинок.
Аноним 05/05/26 Втр 11:52:22 1605181 113
Аноним 05/05/26 Втр 12:02:45 1605191 114
Аноним 05/05/26 Втр 12:33:19 1605204 115
Аноним 05/05/26 Втр 13:13:02 1605234 116
5729bc.jpg 393Кб, 1024x690
1024x690
Аноним 05/05/26 Втр 13:52:12 1605262 117
ComfyUItemprcai[...].png 4980Кб, 1440x1440
1440x1440
Посоветуйте модель + лора + промт стиля который может красиво и детализированно (не SD мазня) рисовать относительно сложные сцены с хорошей фантазией (несколько проработанных объектов + проработанный бэкграунд). Какой-нибудь семи риал, либо digital painting в реализме.

Анима плывет свыше 200 слов и часто плохо понимает пространственные инструкции. Пока сижу с лорой greg rutkowski, неплохо, но стабильность низкая, много мазни, сложно контролировать и не понятно как уточнять стиль, с этой лорой.
Аноним 05/05/26 Втр 15:41:09 1605332 118
image.png 39Кб, 196x148
196x148
>>1604707
ейроскуф есть там все мужики свои
Аноним 05/05/26 Втр 15:41:48 1605333 119
>>1605262
зит тоже не одупляет
Аноним 05/05/26 Втр 16:00:26 1605348 120
image.png 92Кб, 300x168
300x168
image.png 745Кб, 1361x775
1361x775
image.png 219Кб, 1311x794
1311x794
image.png 1080Кб, 1003x860
1003x860
Короче, мужики ))) вопрос такой ебаныйрот поставил эту изю комфуи, обматался всем чем положено, вчера там, зит себе скачал, енкодер етот квеновский, еще какую-то хернюшку контролнет короче, сперва неудачные ворфлов собирал, и пару нерабочих еще нашел, ну тупо, но потом короче натянул https://github.com/scraed/LanPaint (сам зит работает, базару ноль, быстрей сидрикселя, промптится немножко на русском хоть и туповат), и вот тут хуйня такая на пиках. Пик 1 - я после 1 суток попыток. Пик 2 - делаю маску в дефолтном менеджере масок. Загружаю все это на пик 3 (да я там выпилил какую-то лору на пиксель арт, но она ни на что не влияла). И на выходе я получаю дрисню времен первой поняхи импейнта. Настройки семплера ланпейнета - я крутил. Можно сделать чуть лучше, но не сильно это влияет. Я заметил что хитрый пидор в примерах ланпейнета не красил какие-то участки, а замазывал полпикчи сразу, и так - да что-то там, с плохо впихнутым в маску оно генерит (у меня там плотная кистть но на неплотной там какие-то мультики). Тут еще хорошо получилось, неудачнфый пример. Но как присмотритесь там шум есть, как будто песка насыпали. И в зависимости от пика это может быть какой угодно мусор - полупрозрачная ткань, бумсы, песок камни полный пиздец. Я не понимаю, даже, это пережарка или недожарка? Все крутил, все равно сорт оф хуйня на выходе.

Объясню свою конечную цель: промптить естественным языком. Разумеется я вот здесь и сейчас могу получить хороший результат на сидиэкселями, но 4 года промптить тегами немножко заебало. И не пишите что там надо по английски писать и прочий бред, я все это знаю и я знаю чё я делаю, хуйня тут выходит не поэтому. Дело в том что это именно зит а не зимага бейс? Мне качать 60 гиг надо чтоб проверить? Еще я видел есть зимага АЛЛОгараж
, она лучше/хуже? С виду там васянка со встроенными лорами времен первых порнотюнов на сидиксель.

Помогите короче мужики, тут без бутылки не разобраться и с ней тоже. У железного дурака спрашивал, он ту еще хуергу несет. Про лору на детали тоже не надо, я видел там юзают, но должно же нормально изкоропки быть, тут хуйня какая-то явно происходит. Цензуры встроенной я тоже не заметил, это не похоже на сопротивления модели, у меня есть ворфлоу где просто текст ту имидж там все генерится сисик-писик, как может, но генерит.
Аноним 05/05/26 Втр 16:16:24 1605360 121
>>1605348
>Дело в том
что для edit не нужно насиловать ЗИТку, а нужно взять flux2.klein 9b distil.
Аноним 05/05/26 Втр 16:28:20 1605363 122
image.png 1Кб, 50x43
50x43
>>1605360
Мне показалось, что там в будущем будут норм тюны и как бы она быстро запускается как сидиксель.

>flux2.klein 9b distil.
А это наверное что-то тяжелое уже. У менявсего 16гб врама и 32 рама. Не хотелось бы по минуте ждать. Но, есть какие-то на примете готовые воркфлоу для инпейнта? А то на цивитае даже там ну статьи какие то сумбурные, даже ланпейнт я на гите искал уже, а на реддите просто говна за щеку навалили неработающего.
Аноним 05/05/26 Втр 16:29:06 1605365 123
В идеале, конечно, я бы хотел инпейнтить на хроме. ^_-
Аноним 05/05/26 Втр 16:31:50 1605368 124
image.png 990Кб, 779x804
779x804
Теперь меня как будто энкодер квеновский цензурить начал. Такое может быть?
Аноним 05/05/26 Втр 16:33:32 1605370 125
>>1605363
нет, оно очень легкое и быстрое, легче квен едит. в твой конфиг со свистом залетит в 5 секунд на картинку
Аноним 05/05/26 Втр 16:38:10 1605374 126
>>1605370
Ок, спосеба, попробую. А то я в восприятии флюкса застрял на временах его старта кляйна этого, много свободного доступа было для онлайн моделей, а сейчас все прикрутили и на фокусе сидеть уныло чот.
Аноним 05/05/26 Втр 16:51:15 1605379 127
>>1605360
> flux2.klein 9b distil.
Дистил не может в реалистичную текстуру кожи. А лор к этому нет, разве что снофс какой-нибудь, который сам по себе плоховат

> А это наверное что-то тяжелое уже
Он как раз в 4 степа работает по секунде. Жаль что он хуйня
Аноним 05/05/26 Втр 16:54:01 1605381 128
>>1605363
>готовые воркфлоу для инпейнта
Там не нужны какие-то хитровыделанные воркфлоу для старта. Берешь вф i2i из темплейтов - и уже можно редачить через промт. Если нужна маска, то в это же вф добавляешь пару нод. В твое железо спокойно лезет 9В, base-версию не качай, как по мне оно не стоит того, чтобы пердолится на 20+ шагах. Дистил делает тоже на 4-8. 8 шагов - примерно 15сек, у меня такие же статы 16/32
Аноним 05/05/26 Втр 17:00:26 1605384 129
>>1605379
>хуйня
Альтернативу предложить сможешь? Нет? Я так и думал
Аноним 05/05/26 Втр 17:07:11 1605387 130
image.png 363Кб, 373x676
373x676
>>1605348
клейн работает, но тоже не сразу.

Мне наоборот инпейта не хватает в клейне, т.к. он очень туго реагирует на промт в эдите. Хотелось бы выделить область с которой он должен работать.

>>1605384
Я уже писал в треде про альтернативу много раз. Тот кто в глаза не ебется видел. А кого устраивает дистил - сидите на нем. Я про дистил забыл. Толку от скорости мало, когда это слоп без нормальных лор
Аноним 05/05/26 Втр 17:15:51 1605391 131
>>1605387
>писал в треде много раз
Хз, может это было в каком-то другом треде, лично я не видел. Квен, как по мне, тяжелее и хуже. Я его вообще удалил.

>Хотелось бы выделить область
У клейна нет проблем с масками, даже получше, не перерисовывает всю картинку.

>без нормальных лор
Тренируй лоры сам кто? я?
Аноним 05/05/26 Втр 17:19:37 1605395 132
>>1605391
> Хз, может это было в каком-то другом треде, лично я не видел.
В прошлом. Тот же клейн просто не дистил

> Тренируй лоры сам
Не умею пока, рано мне
Аноним 05/05/26 Втр 17:20:07 1605397 133
>>1605379
> Дистил не может в реалистичную текстуру кожи

ничего не мешает сделать рефайн отредактированного изображения в модели где есть реалистичная кожа, тот же зит
Аноним 05/05/26 Втр 17:36:03 1605403 134
>>1605395
>клейн не дистил
У меня единственный вопрос к базе - нахуя я это скачал. Потестил, КАРДИНАЛЬНОЙ разницы не увидел. Возможно она и лучше, но генерировать по минуте уже не хочу.
Аноним 05/05/26 Втр 17:42:59 1605405 135
>>1605403
База еще хуже дистила. Кто бы что не говорил - не увидел преимуществ в t2i в fp8
Аноним 05/05/26 Втр 17:58:11 1605409 136
image.png 95Кб, 328x339
328x339
image.png 877Кб, 682x810
682x810
image.png 181Кб, 905x723
905x723
image.png 269Кб, 640x321
640x321
>>1605387
>клейн работает, но тоже не сразу.
Что это значит? И еще вопрос: если я в воркфлоу хромофур подсуну - будет инпейнтить? Он же тюн флюкса.


А на зите я тут такую хуйню заметил. Там был другой семплер, адвансит. Но почему так? Написано везде что можно с ним только жесткую кисть использовать на маске. Но я вижу он не учитывает контекст картинки а инпейнтит строго в окне отмеченном не захватывая края (не помню как это по вумному называется). я зит мучаю потому что он уже скачан, конечно.
Аноним 05/05/26 Втр 18:28:35 1605424 137
>>1605409
>почему так
1. Очевидно, что нет ноды, которая размывает края маски на заданные размеры
2. Очевидно, что нет ноды, которая тянет контекст с загруженного имиджа

>я зит мучаю
чтрадай
Аноним 05/05/26 Втр 18:30:34 1605426 138
>>1605409
Ну и да, у тебя скачан LanPaint - идешь на гитхаб и читаешь про настройки, там все написано
Аноним 05/05/26 Втр 19:00:28 1605436 139
>>1605424
>1. Очевидно, что нет ноды, которая размывает края маски на заданные размеры
>2. Очевидно, что нет ноды, которая тянет контекст с загруженного имиджа
>
Очевидно ты пишешь хуйню.
Аноним 05/05/26 Втр 20:33:45 1605480 140
>>1605409
А нахера ты эту полоску внизу оставил, чтобы что?
То, что лапша не умеет нихуя толком в импЭйнт, это как бы уже общее место, те кто кричит, что у тебя типа скилишью: >>1605436
, ещё ни разу не проиллюстрировали свой собственный скилл на хотя-бы удобоваримом примере. Интерфейс у импаинт-ксамплера чудовищный, половина из крутилок нихуя не даёт (или тупо не работает), а другая половина при всех вариантах выдаёт хуету а-ля 1.5 в лучшем случае. Не теряй своё время с этой ебалой, юзай эдит Кляйн, или Фотошоп + фокус, если нужно побырику что-то наролить..
Аноним 05/05/26 Втр 21:01:05 1605498 141
>>1605480
>А нахера ты эту полоску внизу оставил, чтобы что?
Чтобы посмотреть.

>То, что лапша не умеет нихуя толком в импЭйнт, это как бы уже общее место, те кто кричит, что у тебя типа скилишью:
Вот и я не понимаю, почему оно так жестко по маске, если я туда еще сверху костыльной чуши накидаю, то это только утяжелит воркфлоу, полагаю.

>Не теряй своё время с этой ебалой, юзай эдит Кляйн
Ты имеешь в виду полное изменение всей фотографии? Потому что выше вроде бы про инпейнт говорили.
Аноним 05/05/26 Втр 21:02:33 1605499 142
Вообще, еще дело в руках. У меня стоит люструспони тюн какой-то, он жестко проебывает руки, рисует даже на детализации в фокусе какие-то микроанимешные закорючки вместо рук.
Аноним 05/05/26 Втр 22:07:29 1605534 143
image.png 261Кб, 1801x697
1801x697
>>1605498
>Ты имеешь в виду полное изменение всей фотографии?
пример: >>1604370
ты просто в промте пишешь что нужно сделать, в данном случает я написал, что нужно убрать нижнее бельё и обувь оставив всё как есть, а затем ролишь, м выбираешь лучший вариант. Мало того, можно ретушировать (довести до кондиции херовый референс), если тот недоступен в хорошем качестве, здесь анаон говорит о том, что именно нужно: >>1604555
Аноним 05/05/26 Втр 22:12:02 1605539 144
082.jpg 137Кб, 1152x896
1152x896
Аноним 05/05/26 Втр 22:14:58 1605541 145
>>1605498
>про инпейнт
зачем тебе импейнт, если можно без него?
Повоторяю, если тебе там приспичило отредактировать что-то по маске, то есть прекрасный инструмент для этого, это Фокус, больше нихуя не надо, выбираешь модель которая умеет в то, во что ты хочешь и подходит по гамме к референсу и хуяришь... там всего 2 ползунка тебе нужно, это: денойз и контест, чем выше контекст тем лучше будет результат, но это всегда качели, большое выделение снижает качество рисовки а высокий денойз добавляет шизы, ищешь золотую середину, помогаешь фотошопом.

>>1605539
да-да, это тот самый пример, когда сигна соответствует исполнению)
Аноним 05/05/26 Втр 22:45:08 1605555 146
image.png 3552Кб, 1920x1080
1920x1080
>>1605534
> а затем ролишь
Уже маркер того, что не оптимальный метод. В зависимости от сложности условий - иногда % успеха может уходить к 1к50.

Можешь показать воркфлоу клейн+импейнт?
У меня с прошлого треда бенчмарк, с которым клейн едит в общем режиме почти не справляется. 5ый палец убрать с бутылки, да и третью коленку тоже не так просто.
Такую хуйню только импейнтом либо заново генерить
Аноним 05/05/26 Втр 22:47:02 1605556 147
>>1605534
А как снофс работает со стандартным текст энкодером с цензурой?
Разве квен 3_8 не должен быть зацензурен, что бы игнорить порно-промты?
Смысл тогда в uncensoured текст энкодерах? Я зачем то выкачал такой специально для клейна. Хуета непонятная уебская повсюду
Аноним 05/05/26 Втр 22:50:21 1605559 148
image.png 2Кб, 50x43
50x43
>>1605534
так там нет ворфлоу
Аноним 05/05/26 Втр 23:19:23 1605578 149
Дальше сам.png 3045Кб, 1676x1080
1676x1080
Аноним 05/05/26 Втр 23:21:58 1605579 150
>>1605578
нет, ты решил одну проблему и создал новую

Хотя как ты пофиксил мотик я не знаю.
Аноним 05/05/26 Втр 23:45:38 1605584 151
>>1605579
>создал новую
мне похуй

>как ты пофиксил мотик я не знаю.
я тебе подробно расписал в прошлом треде, что тебе нужжно сделать, но ты промухал как всегда.
Аноним 05/05/26 Втр 23:57:51 1605588 152
image.png 1204Кб, 1610x849
1610x849
>>1605579
> пофиксил мотик я не знаю
Загадка века. Премию Тьюринга дадут разгадавшему.
Аноним 06/05/26 Срд 00:05:30 1605593 153
>>1605588
>Загадка века
разгадка в прошлом треде.
Аноним 06/05/26 Срд 00:06:23 1605595 154
ComfyUItempvpcp[...].png 4656Кб, 1920x1072
1920x1072
Аноним 06/05/26 Срд 01:16:09 1605633 155
>>1605556
>А как снофс работает со стандартным текст энкодером с цензурой?
Нормально работает, потому что его, text encoderа, задача не делать inference, а перегнать слова-токены в эмбеддинги.

>Смысл тогда в uncensoured текст энкодерах?
Ну хотя бы в том, чтобы проигнорировать всё то, что о них писалось, а потом упорно продолжать есть кактус, because you can.
Аноним 06/05/26 Срд 01:36:49 1605649 156
>>1605556
>Смысл тогда в uncensoured текст энкодерах?
я сравнивал, разницы никакой, снофс говно, концепты у него поневские, уёбищные с проёбами в анатомии, порно ты один хер не сможешь на нём делать, для ебли нужен wan 2.1-2.2 с nsfw лорой, ни zit ни клфйн не умеют в порнуху.
Аноним 06/05/26 Срд 01:56:13 1605664 157
>>1605556
Я тебе вот чего скажу, что снофс, что кляйн бесполезная хуита, разве что в кляйн-эдит снять с кого-нибудь трусы, всё... Композиционно кляйн абсолютно беспомощен, все его концепты из коробки - уебанские. Поэтому хуйнёй не занимайся, ковыряй zit, он гораздо интересней.
короткие стрижки zit Аноним 06/05/26 Срд 03:56:55 1605691 158
ComfyUItempmdhh[...].png 3816Кб, 1600x1400
1600x1400
ComfyUItempmdhh[...].png 3758Кб, 1600x1400
1600x1400
ComfyUItempmdhh[...].png 3779Кб, 1600x1400
1600x1400
1. very short bob cut
2. buzz cut
2. side parted pixie cut
бля... Это всё, ребзя. НИкаких гарсонов, никаких андеркатов. если у кото-то что-то получалось, поделитесь...
Аноним 06/05/26 Срд 06:55:27 1605724 159
>>1605691
> гарсонов
fuzzy short woman haircut
> андеркатов
slick back man haircut + бритые виски немопню как
пробуй просто описать, две недели блять уже дрочишь свои волосы
Аноним 06/05/26 Срд 07:26:59 1605732 160
>>1605724
>две недели блять уже дрочишь свои волосы
ну так они-ж всё никак не отрастут
щас попробую...
Аноним 06/05/26 Срд 08:01:32 1605743 161
1.png 4119Кб, 2304x1792
2304x1792
2.png 4591Кб, 1792x2304
1792x2304
Аноним 06/05/26 Срд 08:04:23 1605744 162
image.png 2737Кб, 1600x1400
1600x1400
>>1605724
>fuzzy short woman haircut
1. ну, как бэ ок, выглядит так, будто у buzz cut слегка отрасли волосы. slick back не работает, зетка просто рисует хвост сзади и какие там виски уже никого не ебёт.

Предлагаем ещё варианты!
Аноним 06/05/26 Срд 08:30:53 1605754 163
>>1605743
Ну наконец-то что-то хорошее в треде!
Аноним 06/05/26 Срд 08:44:15 1605758 164
>>1605754
себя не похвалишь - ходишь как обосранный
Аноним 06/05/26 Срд 10:07:53 1605778 165
изображение.png 1232Кб, 960x1280
960x1280
>>1605691 >>1605744
Ты застрял в своём узком тезаурусе из 3 слов и пытаешься из него что-то толковое выжать. Хотя когда ты приходишь к Инге Михайловне в парикмахерскую Молодость ты ей не говоришь "side parted pixie cut", сидишь с покерфесом 30 минут, и в конце говоришь "я не это хотел". Ты говоришь "как раньше" или показываешь картинку из журнала "как тут", она видит, что тут 4 выбрить, там 8 оставить, здесь прорядить, там протушевать, зачесать, здесь на уровне виска, тут до плеча. То есть наваливаешь кучу дополнительного констекста, которого в названии из трёх слов не хватало.

Потому просто возьми референс который тебе надо. Скорми его в vision llm, тот же квен, и попроси максимально подробно описать причёску в тех терминах, в которых text encoder мыслит.
И уж когда ты начнёшь писать промты в той же форме что и текст энкодер, тогда можно делать выводы о пригодности-непригодности самой модели.


A cinematic close-up portrait of a young Caucasian skinhead girl named "Jax," embodying a raw, rebellious street spirit. She has a distinct skinhead hairstyle: the back and sides of her head are completely shaved smooth, while a thick, straight, blunt-cut dark fringe (bangs) covers her forehead, framing her intense gaze. Her expression is one of defiant indifference and stoic confidence, with a piercing look directed at the camera. A small beauty mark is visible on her cheek. She wears a faded black oversized punk band t-shirt and small silver hoop earrings. The camera angle is a slight high-angle shot, creating an intimate yet confrontational perspective that emphasizes the geometry of her haircut and the intensity of her eyes.
Аноним 06/05/26 Срд 10:50:53 1605803 166
>>1605778
> в которых text encoder мыслит.
твой квен может мыслить всё что ты захочешь, но если модель не занет что это, то нихуя не и будет. И если я буду тратить на описание причёски по 20-30 слов, то у меня не останется ничего для основного промта. профессура, ёптить...
Аноним 06/05/26 Срд 10:53:14 1605807 167
>>1605778
>3 слов
обычно это одно слово: канадка, или полубокс, или полька, одно слово.
Аноним 06/05/26 Срд 10:56:29 1605813 168
>>1605778
> в vision llm
Я другой чел. А поподробнее можно? Откуда модель знает в каких терминах мыслит текст энкодер? Что за vision llm?
Есть какая то локальная модель, которая хорошо промт-энхасит, лучше чем фри гпт/гемини, которые просто не имеют ни фантазии, ни художественного видения, только хуевые шаблоны первые попавшиеся.
Аноним 06/05/26 Срд 10:58:13 1605817 169
>>1605813
>в каких терминах мыслит текст энкодер?
хороший вопрос.
Аноним 06/05/26 Срд 11:00:30 1605818 170
изображение.png 1364Кб, 960x1280
960x1280
>>1605803
> но если модель не занет что это
Ещё раз. Бессмысленно рассуждать о диффузионной модели, если ты с текстовым энкодером говоришь на разном языке
> не останется ничего для основного промта
Ну очень жаль, что ты всё ещё мыслишь категориями полторахи, и пытаешься делать какие-то выводы о сегодняшних моделях
Аноним 06/05/26 Срд 11:08:01 1605822 171
изображение.png 76Кб, 752x736
752x736
>>1605813
Вот смотри. У тебя в качестве текст энкодера используется вполне конкретная LLM. Совершенно нормально взять этот же квен и спросить его "вот картинка, расскажи какими бы словами ты её описала". Чтобы она извлекла из себя, какие у неё текстовые конструкции совпадает с конкертными визуальными токенами. Не отгадывать путём проб и ошибок, а в лоб спросить текстовую модель что она знает.

Целиком реверс промт конечно делать квеном тупо. Но спросить его "какими словами можно описать такую причёску, такую одежду, такой ракурс, такое цветовое решение" можно и нужно.
Аноним 06/05/26 Срд 11:08:37 1605823 172
>>1605818
> категориями полторахи
Это не я мыслю это зетка так работет. там количество токенов в промте чуть больше чем в сдохле. ох уж эти теоретики! твоё описание причёск годится только для выебонов. но никак не для реальной работы.
Аноним 06/05/26 Срд 11:10:41 1605826 173
>>1605822
Вот-вот, давай, спроси...
Аноним 06/05/26 Срд 11:11:30 1605828 174
>>1605823
>там количество токенов в промте чуть больше чем в сдохле
Количество токенов на входе бесконечное. Есть ограничение на размер скользящего окна и на размер выходного эмбеддинг вектора.
Аноним 06/05/26 Срд 11:14:02 1605829 175
На улице +26, генерить перехотелось.
Летом генерить с кондеем в комнате получается по стоимости за электричество как токены во flux 2 max. Либо терпеть жар 35С в комнате
Аноним 06/05/26 Срд 11:15:45 1605831 176
>>1605828
бла-бла-бла...
а на деле через 15-20 слов зетка уже забывает о чём там речь шла в начале
Аноним 06/05/26 Срд 11:20:25 1605836 177
>>1605831
Да в общем то соглы, чего это я правда. Промты больше 20 слов не работают. Модели причёски рисовать не умеют. В локалках только застой и разочарование. Точки ещё эти зелёные. Пора завязывать.
Аноним 06/05/26 Срд 11:24:40 1605840 178
>>1605836
сдохля базовая и та больше знала знала причёсок
Аноним 06/05/26 Срд 11:25:25 1605841 179
Есть редкие промты, которые дают в локальной модели очень хороший и стабильный результат. Например афро-тян в желтых листьяю в вагоне метро.
Другие же промты дают исключительную хуйню.

Если дело в промте, почему эту проблему не пытаются решить промт-энхансером прямо в воркфлоу? Проблема смещается из плоскости танцев с бубноми (копингом) вокруг промта в плостью системного промта для энхансера.
Огромный плюс в том, что любой прогресс с таким системным промтом для конкретной диффузии - будет масштабироваться на любые промты, сколько то улучшая результат.
В идеале получить энхансер, который умеет "придумывать красиво" заполняя или корректируя все слабые / некорректные места твоего промта.

Но для этого нужно обучение локальной ллм под промтинг конкретного типа, или вовсе специально для модели.

Что точно известно: GPT / Gemini - думающая / Pro - мало что понимает в этом плане. Самые разные запросы, не приводили к значимому эффекту, они выдают промт с рэндомно-посредственным описанием, на уровне худ. реализаций, композиции.
Аноним 06/05/26 Срд 11:26:23 1605842 180
>>1605828
>бесконечное
Было гладко на бумаге)
Аноним 06/05/26 Срд 11:35:23 1605851 181
>>1605841
Ты так скоро додумаешься давать нейронке картинку и просить описать ее.
Аноним 06/05/26 Срд 11:37:51 1605853 182
>>1605841
Как же заебала вся вот эта ваша маниловщина. Нихуя из этого не будет, если бы это было возможно, то это давно бы сделали. Весь пиздец заключаетчя в том, что языковые модели, даже локальные, настолько ушли вперёд, что между ними образовалась пропасть, и чем дальше, тем глубже и шире.
Аноним 06/05/26 Срд 11:45:58 1605857 183
Аноним 06/05/26 Срд 11:46:03 1605858 184
>>1605778
Ты просто написал промт специфичной прически, ассоциированной со специфичной суб-культурой - и о чудо, в модельке оказалась эта челка.

То до чего докопался этот >>1605691 - это проблема не промта, а именно ограниченность локальной модельки. Ты сам не решишь её промтингом. У моделей крайне ограниченный набор возможностей в видении всевозможных узкоспециализированных образов.
Например клейн не способен нарисовать в принципе НИЧЕГО красиво, кроме людей и close up shot объектов по центру.
И как правильно замечено, даже если промт на 100 слов работал - невозможно работать, если 100 слов уходит на одну прическу.
А еще, когда заставляешь локальную модель через силу высрать что то детальным описанием - она начинает рисовать это отвратительно не естественным с говной.
Аноним 06/05/26 Срд 11:48:27 1605859 185
image.png 271Кб, 300x450
300x450
Аноним 06/05/26 Срд 11:50:34 1605862 186
neuroslop.jpg 232Кб, 896x1280
896x1280
@artmonkey нарисуй a cinematic close-up portrait of a young Caucasian skinhead girl named "Jax," embodying a raw, rebellious street spirit. She has a distinct skinhead hairstyle: the back and sides of her head are completely shaved smooth, while a thick, straight, blunt-cut dark fringe (bangs) covers her forehead, framing her intense gaze. Her expression is one of defiant indifference and stoic confidence, with a piercing look directed at the camera. A small beauty mark is visible on her cheek. She wears a faded black oversized punk band t-shirt and small silver hoop earrings. The camera angle is a slight high-angle shot, creating an intimate yet confrontational perspective that emphasizes the geometry of her haircut and the intensity of her eyes
Аноним 06/05/26 Срд 11:52:36 1605866 187
>>1605841
Множество хороших промптов очень сильно отличается от модели к модели и от зрителя к зрителя. Кому-то нравится вылизанный 1girl слоп с цветокором, кому-то надо навалить аналогового зерна, расфокуса, боке и кросспроцессинга, кому то надо композици, ракурс, рыбий глаз и голландский угол, кто-то на аниму чёрно-белую дрочит.
То есть ты вполне можешь наколдовать энхансер на llm для какой-то одной ситуации, много кто так делает. Но унивесральной балалайки собрать не удастся, потому что на вкус и цвет фломастеры разные. (все картинки с осенней негритянкой - говно)
Аноним 06/05/26 Срд 11:52:56 1605868 188
neuroslop.jpg 288Кб, 1296x864
1296x864
@artmonkey сделай кинематографичное фото девушки-скинхедки с недовольным лицом и дурацкой прической с лысой башкой и только челкой
Аноним 06/05/26 Срд 11:53:40 1605869 189
>>1605862
А там по французски вставки будут как в войне и мире?
Аноним 06/05/26 Срд 11:56:44 1605875 190
image.png 46Кб, 1598x348
1598x348
>>1605868
>дурацкой прической
Аноним 06/05/26 Срд 11:58:02 1605877 191
>>1605862>>1605868
Вот вроде текста меньше, а согласованность картинки пропала. Из средней портретной фотографии в ширпотребный нейросплоп.
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов