• Ideogram 4.0 - closed-source, который стал open-source • FLUX.2 klein (4b и 9b) • Z-Image • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
Как же заебал этот ублюдок на кляйне, нихуя нормальные человеческие трусы не знает кроме бабушкиных панталон, ну может у меня скилл ишью конеш, но чет хуй выходит сделать нормальные мини стринги или танга, это либо хуйня размером с матрас либо 2 веревочки тонких...
>>1629238 (OP) >Ideogram 4.0 Насколько отличается от прошлых закрытых версий? Вроде в свое время говорили что идеограм был топом среди закрытых. Это оно или просто хуйня ради опенсорса? На мой взгляд пока непонятно зачем он нужен в базе кроме инфографики, потенциал для файнтюна пока тоже не видно кроме сломанных лор.
>>1629446 Если он в эдите может писать качественные тексты, особенно маской, то это уже незаменимая вещь как анима. Мне лень разбираться пока, каждая новая модель это всегда какой то душный гемор как испытание красноглазое. С флаксом 2 было удобно
>>1629446 О прошлых версиях не знаю, поэтому сравнить с ними не могу. Как у любой новой выброшенной в open-source модели на старте очень много хайпа. По-моему мнению, неоправданного. Вопросы к качеству генерируемого изображения. Пока требует рефайна. Но это субъективное мнение. Regional prompting с разметкой генерируемого изображения на области с отдельными prompt (с помощью Kijai nodes) интересен. Лично для меня связка FLUX.2 [dev] (композиция и полноценный edit) и FLUX.2 [klein] 9B (рефайн) всё ещё вне конкуренции.
Уже который твой пост об этом читаю. Не делай голову, даже для FLUX.2 [klein] скачай https://github.com/lquesada/ComfyUI-Inpaint-CropAndStitch Бери workflow из примера, выделяй на изображении маской нужную область, настрой на увеличение её разрешения и впечатывай edit-ом этого увеличенного куска изображения свой текст.
>>1629517 >на уровне Нано Бананы и ГПТ, только без эдита Оксюморон, в банане вся суть в эдите. То что там региональный промтинг в базе это немного другое. Так что даже не на уровне опенсорсных эдит-моделек.
>>1629446 по факту в опенсорс высрали хуиту, онли т2и без эдита, эдит зажали уебаны, а нахуй он такой нужен то, этих т2и насрали тонной, на слоповых тянок уже нафапался, всякой хуйни напромптил уже тонны, без эдита уже встает на новые модели а тут еще ебучий региональный промптинг, ну хуй знает короче
>>1629523 >этих т2и насрали тонной >>1629529 >т2и в 2026 не нужно Нужно но только где будет полноценно залито все аниме, вся фурятина, все пони и вся порнуха. А остальное не нужно да.
Кстати, самая большая боль в банане, что в ней нет нативного инпеинта. Казалось бы что мешало его добавить? Данные для него набираются на порядок легче эдита. Вместо того чтобы выделить мелкую хуйнюшку и подробно ее запромтить, она шакалит всю картинку зачем-то а саму хуйню всирает конечно же. Кроме как вручную вырезать квадрат и его отдельно пихать в банану вариантов нет? Может есть интерфейс где это автоматизировано?
>>1629517 > на уровне Нано Бананы и ГПТ Нано банана это слоп. Гпт генерит неотличимое от кинокадров через раз. Между ними сейчас пропать. Откуда пошла тема что нанобанана что то может? 1girl она хорошо делала? Сколько тестил - хуже локалки результаты
>>1629529 >т2и в 2026 не нужно Нужно. Но нужно, чтобы анатомия была хотя бы сука как в далли 2023 года. Картинкой может и догнали, на отдельных моделях даже композиция неплохая (но всё равно не дотягивает до 23 по артистичности). Весь лоукал релизят как инструмент, типа держите, ебитесь, красиво (как онлайн) делает только по эскизу, остальное просто превью или удачный рол. >>1629595 >Нано банана это слоп >Гпт генерит неотличимое от кинокадров Лол, сказочный шизоид. Попользуйся больше суток, криворукое уебище. Артефачная параша с одной глубиной у шума на всю картинку. Опении рухнули после 24 года, весь их кал стал дном на фоне, единственный пик был на релизе соры 2. Поражаюсь, что их продолжают поддерживать по иннерции, им уже впору закрываться с их недорелизами.
натренил себе трусишки посимпатичнее, заебали эти бабушкины панталоны, но сука эт на сколько надо было упорно цензурить модель, чтоб сломать нахуй всю анатомию и отупить модель так чтоб она вообще трусов не знала кроме бабулиной простыни xl размера... ебанаты ипаные
>>1629652 > нб и гпт слоп бесполезный Только НБ. Будь объективен, ГПТ-2 почти всегда лучше по эстетике, качеству и плотности. Но идеограм 4 действительно очень хорошо выглядит. И неизвестно сколько ты дрочился с идеограмом прежде чем получить это. Скорость результата тоже важный фактор
>>1629683 > зенки свои открой и смотри внимательно что гопота выдала Ты не скинул свой промт, во первых. Во вторых - у меня с зенками всё в порядке. Визуальный стиль и арт качество ГПТ-2 лучше, там пизже цвет, пизже рисовка, пизже детализация и плотность, и так было всегда. Даже если он отошел от изначального замысла - но ты не скинул промт, что бы это оценивать. Но даже если он чуть налажал с интерпретацией замысла, это вторично, т.к. с ретрями промтов быстро получишь что нужно. А вот получить качество которое он выдает на локале крайне сложно. Кукла у диограма всратая, а ГПТ нарисовал красивую тянку карандашом, скидывай промты которые скармливал идео4 и гпт.
> поди да сделай лучше, бестолочь Смысл агриться, если это сухой показатель отражающий реалистичные возможности модели. Это не в твою сторону выпад, а в справедливую критику твоей попытки сказать, что ideogram превосходит gpt-2, иначе говоря сказать, что ideogram4 лучшая модель в мир, что не корректно, т.к. она не дотягивает по качеству текстур и шумности до кляйнов/зитов, и как и все локалки не достягивает до мощности и детализации до гпт.
Но то что она делает что то с текстом лучше всех локалок - это наглядный факт.
>>1629722 > Визуальный стиль и арт качество ГПТ-2 лучше, там пизже цвет, пизже рисовка, пизже детализация и плотность, и так было всегда. Нет не пизже, есть нормальные сравнения на реддите. Он сгенерировал на гопоте изображения в большем разрешении, а с разрешением колоссально растёт качество. Хочешь качество, используй 2 мп разрешение и идеограм выдаёт идентичный уровень, на части промтов лучше, на части хуже. Единственная его проблема, у гопоты гораздо больше познаний. > т.к. она не дотягивает по качеству текстур и шумности до кляйнов/зитов Оно делает кляйна и зита с закрытыми глазами по любому параметру, если ты не криворучка.
А ещё потом надеюсь её с dmd2 задистилят и получим быструю генерацию в 2мп локально и ещё в более высоком качестве.
>>1629349 >>1629034 → Ты это по прежнему базу в аниме делаешь и вклеиваешь лицо кляйном? Или это кляйн тебе рисует? Сочно выглядят для базы под финальный рефайн с текстурками. Еще бы в интересные сюжеты такое
>>1629739 не это уже сам кляйн делает, тестирую настройки с промптами, сделал 2 прогона кляйна на разных моделях, чтоб последним скейлить и насыпать текстурами и прочим
>>1629728 > по любому параметру С текстом да, геймченджер. По текстурам нет, и по Edit режиму нет.
И еще нормальных генераций (не 1girl на стуле) с живой сценой и сложными задником не видел пока примеров. То есть насколько он лучше в t2i строит композицию и выдумывает объекты неизвестно.
1girl со студийным светом покажи для начала, уже там многое видно.
>>1629728 > А ещё потом надеюсь её с dmd2 задистилят и получим быструю генерацию в 2мп локально и ещё в более высоком качестве. И получится t2i кляйн который может писать норм текст, но так же не может нихуя годного сгенерить кроме односложных портретов и каталожки. Видимо я много хочу любой ценой, а ты в поисках филосовского камня универсального комбайна лучше чем GPT, так что даже свою планку качества и ожиданий снизил ради этой идеи фикс.
>>1629770 Грамотная дистилляция с dmd2 только улучшает качество, но уменьшает разнообразие. Кляйну до идеограма, как сд 1.5 до сдохли, пропасть, что с идеограмом не вытворяй.
>>1629766 >как в кляйне лица разнообразить? 1) лучше база вместо дистила 2) давать лицам персоналии "Людмила Павловна Груздёва, из Пскова, крановщица 7 цеха, некогда краса района, тепереча цветок увядающий, но всё ещё радующий глаз"
>>1629670 >Только НБ. Будь объективен, ГПТ-2 почти всегда лучше по эстетике, качеству и плотности конкретно в данном случае оба полный слоп, провалившие и стиль, и расположение текста. один недоборщил, второй переборщил гпт 2 ещё терпимо был по стилю до релиза, но после и качество понерфили, и артефактов срёт, щас ещё и synthid артефакты в добавку к архитектурным
>И неизвестно сколько ты дрочился с идеограмом прежде чем получить это. Скорость результата тоже важный фактор 2 сид по первому промпту, 1 сид тоже ок был. ниче черрипикать не надо даже
Как ты тестишь, если идеограм оптимизирован под JSON промт, а вот GPT хоть и всё прочитает - он то не оптимизирован явно, но ты ему суешь JSON идеограма, верно?
А если наоборот попробовать? Сперва запромтить хорошо для GPT, а потом этот промт перевести в JSON как хочешь и дать идеограмму, что тогда будет?
Пикрил - что сделал GPT с чистого промта снятого с твоей картинки (чаты изолированы). Так что не ясно как ты тестишь. Как установлю сам буду проверять.
>>1629879 Вот что бывает, когда просишь инструкции даже у копро гемини в Pro режиме. Эта гнида просто не поняла, что в карточке есть папка text_encoder где лежит нужный энкодер. Он видит только на неквантованный Qwen3-VL-8B-Instruct и предлагает сувать его в CLIP. Вот таком уровне галлюцинаций и не получается нихуя сделать когда не знаешь изначально нихуя, как советчики линуксоиды думают.
Почему в темплейте comfy прописаны совершенно другие модели, чем в офф карточке здесь? https://huggingface.co/ideogram-ai/ideogram-4-fp8 Я например уже накачал оттуда всё, но загрузив темплейт комфи, обнаружил что там всё, включая веса - другие какие то.
Как такое явление умом объять нахуй? Для кого в карточке описаны и лежат файлы, если многие юзают comfy, но для комфи нужно качать совершенно другие файлы? Истерический смех нахуй.
>>1629807 > Ну наконец то сейчас мастер покажет как надо правильно генерить сисик писик по фотке в и2и Не покажет. Я его уже просил показать лучшие примеры этой пони, видимо постеснялся. Причем он обзывает поникалом совершенно разный уровень текстур. Мб это разные адепты с плохим в зацарапанных очках.
>>1629877 > Как ты тестишь, если идеограм оптимизирован под JSON промт, а вот GPT хоть и всё прочитает - он то не оптимизирован явно, но ты ему суешь JSON идеограма, верно? образцовый даун, 1488% понимания как работают гпт и прочие онлайн залупы
>>1629879 открываешь комфи, качаешь что просит темплейт, даже оно само качает блять
>>1629894 открываешь комфи, качаешь что просит темплейт, даже оно само качает блять > Я например уже накачал оттуда всё ахаха даунище
>>1629899 эх бля... жаль я так то не спорю что идиотграм прикольный, но т2и модели уже настоебали, в каждой помойке по модели, а я не ценитель ии шедевров, это прикольно но быстро надоедает.
Тип ты посидел погенерил всякой хуйни, тя настоебало за пару дней и улетел идиотграм в корзину. А веса эдит модели они то нихуя не выложили, и скорее хуй выложат, потому что эдит это киллер фича сейчас. "Добавь ей в руку член" "Замени Х на фруктовый лед" и прочее заебывает меньше чем просто т2и генерации (ну и охотнее люди платят ради эдит фич).
А открытых эдит моделей у нас ток квен первый пластиковый, да, дитя цензуры кляйн. Так что вообще сравнивать идиотграм т2и с ними не совсем корректно.
А пока эта залупа не может мне вот так с фотки нагенерить сцену, это хуита без задач.
>>1629657 Последнняя хоть как-то нормальная. Этот говнограм не то что спицы, струны и провода не может, он блять даже прутья не осилил. Какой же кал. Даже Анима в струны может. Позор нах, ссу в рот говноедам дефающим свой говнограм
>>1629904 > образцовый даун, 1488% понимания как работают гпт и прочие онлайн залуп Судя по тому, что я получил максимально близкую картинку к твоей через ГПТ, а у тебя хуйня выходила - даун здесь ты, как следствие, твой подход тестирования полная хуйня. Потому что от факта ты не отделаешься: ГПТ может нарисовать, но у тебя не нарисовала.
> открываешь комфи, качаешь что просит темплейт, даже оно само качает блять Это без тебя ясно. Почему в офф карточке хф модели одно, а в комфи темплейте абсолютно всё другое?
> ахаха даунище пишет с сажей в тематическом непотопляемом треде
>>1629937 >Почему Потому что ты долбоеб, буквально ты нейросеть. Даже не так, ты скрипт. Набор скриптов. На любое сравнение чего-то с чем-то ты обязательно влезаешь и требуешь промпт. Это надоело уже. Как будто на всем белом свете остался один единственный промпт. И тебе его не дали. Подсказка: ты можешь сам провести свой тест со своим промптом. Ответь на твой вопрос в цитате: потому что на хаггингфейс даётся инструкция для запуска скриптом трансформерс. Им похую эта комфуй. Нестабильное нечто от опенсорс калек. Думаешь гпт, банана и прочее типа на Комфи крутится? Ебанулся? Комфиюи это как Линукс в мире операционных систем. Серьезные корпы используют свое. И трансформерс это универсальное средство запуска. Когда про модель пишут что она использует сколько-то врам, то это именно в трансформерс скрипте. В целом.
>>1629950 > Это надоело уже. Конечно, потому что тебе неудобно судя по всему. Ты пишешь заведомую хуйню для ГПТ и сравниваешь свои старания в идеограме, пытаясь чето доказать.
Тебя просят промт, потому что в твоем сравнении результатов он имеет значение, тебе сложно это понять? Я сгенерил близкую картинку в ГПТ, почему у тебя не сгенерилось? ПОтому что промт хорошо сработал в идеограме но не очень в ГПТ. Это ты и сравнил.
>>1629950 Для того чтобы рейтить нужен промт, без промта непонятно чего ты хотел, и как модель с этим справилась. Но тебе, по ряду медицинских показаний, этого не понять, потому что ты больной на голову шизик, и у тебя слюна до пола.
>>1629999 хлебушек, блять > Ты пишешь заведомую хуйню для ГПТ и сравниваешь свои старания в идеограме, пытаясь чето доказать. напиши свои идеальные промты во все модели и сравни/покажи/накажи, хуле ты доебался до забора
>>1630027 > идеальные промты Суть в том что для разных моделей разный подход в промтинге. Нужно быть дегенератом, что бы сравнивать одинаковый промт в моделях с разным подходом. То что ГПТ всеядная еще не означает что промт идеальный для идеограма идеально для него подходят, поэтому у него и плывет замысел возможно.
ПОЭТОМУ я просил у тебя промт, что бы в этом разобраться. Но ты дубовый. Сравни еще один и тот же промт со сдохлей
>>1630031 используй следующий промт: аноним № 1630031, отбитый нахуй даун аутист, сидит и строчит хуйню в тред, не в силах осилить мысль "сделать как угодно для сравнения"
>>1629950 > И трансформерс это универсальное средство запуска. будто бы комфи нет, если бы просто модельки выкладывали для неё, а не хуй знает чего
И какая разница между трансформерс и комфи, если по сути воркфлоу технически одинаково работает у модели, и какая хуй разница должна быть в весах? Они даже весят близко и формат одинаковый, но файлы разные тем не менее. Сам не до конца понимаешь?
>>1630273 >а клейн то могет нет, не могёт. >покрутить ползунки у эдита нет "ползунков" совсем, кроме этого: прибитый гвоздями кфг с денойзом, и количеством шагов посчитаных поштучно. С генеративной моделью дела обстоят ещё хуже. В сумме >22 гига абсолютно бесполезного, бесмысленного кала на винте. Кляйн ненужон.
>>1630454 > Кляйн ненужон. Незаменимая вещь для наваливания текстур и трансформа в реализм. Пока не появится модель, которая может креативить как анима, со структурой и текстом идеограма и текстурками фотореализмом ZIT/Klein - клейн останется актуальным.
>>1630463 >которая может креативить как анима тоесть никак) >клейн останется актуальным в какой-то нишевой сфере - да, реставрация, эдитинг а-ля: выпилить с фотки пиздюка с прошлого брака а новому ёбырю убрать живот, как-то так.
>>1630465 У фото теряется душа после и2и, ведь новый результат это будет всегда уже воссозданное по подобию. Все пиксели из модели. Ни одного не сохранится из оригинального фото. Это сатанизм
>>1630470 >Все пиксели нет, после словесного описания объекта, он находится, самостоятельного выделяется (без участия промтера) и область интереса выделяется по маске. Всё тоже самое как и в полторахе, но только "хандс-фри". >>1630472 >имба есть её нет, но кляйн говно, безотносительно.
>>1630476 >её нет, но кляйн говно, безотносительно. Это как с водой типа она говно, но анало говнет, но мааам говно нихачу воду пить бля нинавижу топ ножкой
>>1630465 > в какой-то нишевой сфере - да, реставрация, эдитинг Нет, для генерации чего угодно, или улучшения текстур для другой более способной в t2i модели, того же идеограма или анимы.
Ты ведешь себя так, будто бы таинственно скрываешь какой то золотой грааль, позволяющий генерить нечто на голову выше того, что позволяют современные модельки и клейн. ZIT /клейн могут выдать прикольные 1girl фотки, с лорами всякими, и бедноватым наполнением, или каталожку по типу "предмет на столе", где неизбежное отсутствие норм композиционки и художественности вписывается нормально. А за пределами этого что?
Покажи хоть что-нибудь, в ином случае твой скепсис выглядит не особо убедительно.
>>1630361 >какая разница между трансформерс и комфи Трансформерс просто работает. А комфуи может наебнутся в любой момент после обновления. Что уже было не раз и сейчас у меня в нем есть косяки. То есть постоянно ждёшь каких-то исправлений и молишься чтобы не добавили новых. В любой момент времени нет какой-то версии Комфи которая не старое говно и работает стабильно во всех мелочах. Чуешь разницу, дружок?
>>1630533 Трансморферы - ровно этот же пистон с его разваливающимся от каждого пука рантаймом. Хочешь стабильности - перекатывайся на stable-diffusion.cpp
>>1630542 А я и не про t2i говорю. T2i клейна это чисто узкоспециализированная штука быстро создать что то простое достаточно стабильно с хорошими текстурками/ современным светом. I2I универсальная и потенциальная мощная штука для рефайна. По сути щас сделают модель, которая генерит t2i слоп но с ризонингом и вкусом как GPT2 - и всё. Связка с клейном станет 2 шаговой домашней гпт. Без клейна это будет слоп генератором. Просто как грубый пример.
Завел ideogram по темплейту комфи: На 5070ti по 100секунд 1mpx в Quality генерит.
На выходе получаю хуету пока что. Из плюсов вижу больше плотность деталей, интересней задники, отдельные элементы неплохо рисует, эмоции неплохо передает.
Но у меня главный вопрос: это его предельное качество по текстурам в деталях или можно что то улучшить? Мб модели говно, которые комфи предлагает скачать? Пока не вчитывался в мануалы, там 2 CFG. На турбо/default еще хуже качество.
Супер медленно работает. MXFP8 или чего то ускоряющего нет? С такой производительностью / качеством вообще будто бы скорей хуйня чем что то стоящее, если не учитывать текст. Ждать 100 секунд, что бы словить брак, который частенько лезет
Теперь вопрос как этот идеограм ускорить, как минимум тестить промты и ролить даже 1mpx по 100секунд ебанешься. А норм качество только на 3х идет, это 7 минут. И еще рефайн потом. На пикриле промт тестовое говно через ллм с одной строчки.
>>1630669 >Ждать 100 секунд, что бы словить брак, который частенько лезет Смотри live preview во время генерации, если видишь, что получается плохо, останавливай, не дожидаясь завершения.
>помогите улучшить качество Пока только рефайн на FLUX.2 [klein] 9B.
Когда осела пыль от хайпа, пока в положительных моментах вижу только regional prompting. И то, FLUX.2 [dev] это тоже может, только не bounding boxами, а указанием ближний/дальний фон, центр, правые/левые, верхние/нижние края изображения. Не так гибко, как bounding box для Ideogram в Ideogram 4 Prompt Builder от Kijai, но всё же. В том, что касается деталей и текстур, всё очень посредственно. К освещению тоже есть вопросы.
>>1630766 >А двумя CFG, степами, семплером? Там и так default workflow для ComfyUI с double CFG на 7.0 и доводка на 3.0 (CFG Override), куда ещё? Но я пока в sigmas для этой модели не лез. Вообще, нужно посмотреть на каких sigmas и что именно она рисует. Может, нужно дольше задержаться на каком-то отдельном участке.
>А других вариков кроме FP8 реально нет? FP8 я субъективно считаю компромиссным вариантом, если нельзя запустить BF16. И это рабочий вариант, он даёт приемлемый результат. Я FLUX.2 [dev] в FP8 кручу, потому что для BF16, вместе с BF16 text encoder 128 Гбайт RAM для offload не хватает, она вываливается на SSD.
>Flux 2 vae же говно вроде бы Я не понял, почему они выбрали его. Сразу заменил на фикс full_encoder_small_decoder.safetensor и использовал свои фиксы для чистки цифрового мусора VAE Decode FLUX.2 VAE.
>ускорят и зафайнтюнят текстурки Из того, что выходило, кроме SDXL и его тюнов, я подобного не видел. Обычно цикл жизни таких новых моделей типа Ernie, Bernie: хайп на старте, вопли про SOTA, а затем через пару дней про неё забывают.
Пока не понял, почему модель так себя ведёт с мелкими деталями и геометрией на пикрил.
Даже Z-Image-Turbo из коробки лучше отрисует объект по центру.
A close-up shot depicting a Caucasian man and a Caucasian woman looking at each other. There is a spherical object hovering between them in the centre of the image, left half of the object is Earth, right half is an intricate clockwork mechanism. There is a birch tree with lush leaves in the foreground. Sunny day. Cinematic lighting. Hyperfocal, deep depth of field.
>>1630775 Решил проверить гипотезу и считерить, прописать «a spherical object, left half of the object is Earth, right half is an intricate clockwork mechanism» через отдельный bounding box, убрав его из основного prompt для background. Предположение было в том, что в отдельном bounding box может лучше детали прорисовать, с учётом его масштаба и расположения. Судя по детализации часового механизма, особо не помогло. Скорее всего, дело не в этом. Поразительно, что при этом лица получаются удовлетворительно, хотя вроде бы должны были плыть вместе с мелкими деталями часового механизма.
>>1630780 От sigmas навскидку особого результата на шестерёнках пока не вижу. Для 48 шагов default выглядит так (Sigmas001.png). Попытка погнуть sigmas ожидаемого результата не произвела.
>>1630780 От sigmas навскидку особого результата на шестерёнках пока не вижу. Для 48 шагов default выглядит так (Sigmas001.png). Попытка погнуть sigmas ожидаемого результата не произвела.
>>1630804 >Попытка погнуть sigmas Детсад. Очередные скоре бенчмарки. Как сравнивать эти две картинки: >>1630805 >>1630806 У тебя есть в голове эталон часового механизма, например?
>>1630669 Генерируй 20 степсов, 1.6-2мп, а не 1, там разница пропасть. Используй W8A8 веса, они гораздо быстрее. Используй FlashAttention, идеограм работает в комфи без ускорения. И получишь быструю генерацию и высокое качество. Ну и воркфлоу нормальный возьми.
>>1630877 > Ну и воркфлоу нормальный возьми. снова советы за двести нормальный это какой? чем комфи вф не нормален? Можешь показать качество которое у тебя на выходе с не крупным ебалом в кадре?
> W8A8 веса, они гораздо быстрее. На чем, на RTX 30x? Там качество вроде бы теряется, а текст в идеограме хрупкое место, не говоря про грязную мазню в текстурах - и то и другое усугубится. На 50ой серии INT8 возможно нихуя не даст, кроме гемора и возней с тритонами - я уже пробовал с другими моделями и с mxfp8 было быстрее.
>>1630775 >>1630780 >>1630805 Мне кажется ли у тебя качество заметно лучше даже на 2mpx В то время как у меня даже на 4mpx лезет шум и грязь, искажает детали. Тут дело не в сигмах явно
Идеограму можно как то скормить текстовки без конкретного зонирования, что бы он их размещал произвольно в подходящих местах? Юзкейс: хочется генерить рэндомный POV в мегаполисе по типу пикрила, что бы тексты были реальными, но нет никакого смысла описывать конкретные формы и расположение этих вывесок, что бы ролило само. Как это сделать в json?
>>1630845 >Детсад Это пытаться лезть в дискуссию о том, чего не понимаешь.
>Очередные скоре бенчмарки. Управление schedule через sigmas к этому отношения не имеет. Твои score benchmark — это презентация, где Ideogram 4.0 себе эти самые циферки бенчмарков рисует выше, чем у FLUX.2 [dev], а на практике получается как всегда.
>эталон часового механизма Да, это чёткие мелкие детали, сохранённая в целом геометрия, а не та срань, которую выдаёт Ideogram 4.0. Это не первая модель, которую я проверяю на этом prompt:
A close-up shot depicting a Caucasian man and a Caucasian woman looking at each other. There is a spherical object hovering between them in the centre of the image, left half of the object is Earth, right half is an intricate clockwork mechanism. There is a birch tree with lush leaves in the foreground. Sunny day. Cinematic lighting. Hyperfocal, deep depth of field. Modern digital photography, shot on Canon EOS 5D Mark IV, clean sharp. 35mm, ISO 100 f/16.
Он позволяет увидеть всё, что нужно на одном изображении (кроме текста).
>>1630564 >I2I универсальная и потенциальная мощная штука для рефайна Ты что рефайнить собрался, кто будет генерить референс, или ты будишь их брать картинки из стоков, или их будет генерить нано-банана по подписке? Какова ценность этого всего в данном случае? Ну, ладно я могу расставить фигурки в блендере каком-нибудь или даже в virt-a-mate, а дальше пройтись это на тоненького, но есть одно но, это то, что кляйн не умеет в слабый денойз) это тебе не сдохля, где можно на 0.3 радужку глаза деталить, там такое не проканает, там всё как вы любите, всё по: 1.0, прыжек на месте - провокация, шаг в сторону - попытка побега, кляйн в этом смысле абсолютно не гибок.
>>1630941 Нейрослоп апскейлер. Какой-нибудь шакальный 4x-UltraSharpV2.safetensors или 4x_foolhardy_Remacri.safetensors через узел LoadUpscaleModel. Если ресурсы позволяют, то SeedVR2. Есть ещё реализация апскейлера superresolution https://github.com/Comfy-Org/Nvidia_RTX_Nodes_ComfyUI
>Какая база сейчас вообще? На вкус и цвет фломастеры разные.
Подбирай инструмент под свои задачи, оценивая результат, который можно с его помощью получить. Каждый сектант будет с пеной у рта доказывать, что модель его кумиров — SOTA. Остальные будут молча пользоваться тем, что есть для разных задач. Я вообще до сих пор сижу на связке FLUX.2 [dev] для композиции и полноценного edit и FLUX.2 [klein] 9B для рефайна.
>>1630997 > а не та срань, которую выдаёт Ideogram 4.0. Не думал, что это больше связано с общей проблемой ошибок на низкой частоте или как это называется, что то на уровне текстур, но не совсем текстуры. Потому что текстуры у идеограма очень неплохие, если бы не этот грязе-шум / микро искажения?
Попробуй изобразить тот же самый промт механизма - но на весь кадр в 3 mpx. Сравни результат. Если ситуация с шестеренками улучшается, значит это та же самая проблема с чистотой картинки, портящая зубцы. Что касается продуманности и логичность механизма - здесь скорей всего неизбежные и естественные ограничения маленькой модели влезающей в видяху. Вроде как бенчмарк с шахматными иллюстрациями тоже будет почти везде провален. По типу "изобразить шахматную доску, где вместо фигур люди косплеящие шахматные фигуры". Карманная модель вряд ли сможет создать хорошую логику механизма из фантазии. Но вот создать эффект реалистичного механизма- это максимум что мы можем ожидать.
Ты свой промт энхансил и трансформировал в JSON под идеограм? Если ты суешь один и тот же промт в разные модели и считаешь это бенчмарком - это васянство в духе того чела, который тестировал сцену с куклой и скетчем, если ты не он. Это супер васянский подход, ты никогда не узнаешь и не поймешь возможности модели, циклясь на таком топорном подходе.
Попытаться изобразить моделью то что тебе нужно любым путем и сравнить максимальный уровень эстетики -вот это бенчмарк. Потому что главная конечная метрика качества слопа - это то насколько он доставляет человеку и насколько слоп как таковой теряется в этом качестве. А сранивать 1 промт в разных моделей это метод хуже синтетических бенчмарков с баллами. Те хотя бы представляют математический подход в оценке. А 1промтовый - представляет исключительно выдуманную и ничем не обоснованную методику. Еще один довод в пользу этого: у разных моделей разные возможности в объемах промта и разная способность контролировать детали. Пихая промт с обобщенным описанием, ты можешь не задействовать потенциал модели рисовать уточненные детали.
Твой подход мог бы подойти для тестирования генераторов-агентов типа GPT-2 с мощным ризонингом как важной частью. Но не локальных моделей.
Мне пары часов хватило, что бы увидеть, что идеограм делает то - что другие модели не могут, даже невзирая на грязь и шум. Не отрицаю, что часовые механизмы все модели могут рисовать всрато. Но твой подход тоже всратый
>>1631061 Ты не туда воюешь и путаешь меня с тем, который совал один и тот же prompt везде, чтобы получить ожидаемый результат: «Ideogram 4.0 — SOTA, остальное дно». Для Ideogram 4.0 я prompt делаю в Ideogram 4 Prompt Builder KJ, причём ещё иду ему навстречу, размечая bounding boxes, а не пихая всё в background, чтобы черрипикнуть и показать какое Ideogram 4.0 говно на фоне FLUX.2 [dev], который не боится, если ему не в JSON prompt давать. Там вообще ситуация странная. Он не должен так всирать шестерни. То есть он должен был и лица персонажей зашакалить в мелких деталях, поломать им мелкую геометрию. Пока думаю, что персонажи в background, а часовой механизм в bounding box. Вот отдельно. Лучше.
>>1631061 Вот шестерни на FLUX.2 [dev] без рефайна. Я ждал от Ideogram 4.0 чего-то подобного, но лучше и фотореалистичнее. Кстати, это без prompt upsample и без JSON.
>>1631078 Сто раз уже всем написал: Ideogram 4 Prompt Builder KJ (там прямо в заголовке узла написано). Узел от Kijai. Входит в https://github.com/kijai/ComfyUI-KJNodes Генерирует JSON c bounding boxes по формату Ideogram 4.0. Вообще, KJNodes полезные сами по себе в ComfyUI. И rgthree. Эти два набора закрывают 70 % моих потребностей в Custom Nodes. Ещё RES4LYF для sigmas.
>>1631132 Тем, что это очень шустрый на RTX картах (но не самого высокого качества) вариант апскейлера, который используется для апскейла видео в реальном времени от NVidia. Отдельные изображения он щёлкает практически моментально, пока SeedVR2 будет долго ковыряться (хоть и с более высоким качеством).
>>1631170 Всегда сохраняй резервную копию ComfyUI перед любыми экспериментами, пока не освоишься и не сможешь моментально чинить то, что поломал. Запоздалый совет. У тебя desktop версия? Portable удобнее тем, что там всё живёт без установки и привязки к системе. Можешь несколько резервных вариантов держать и откатываться, если что-то слишком сильно поломал. Но сломать ComfyUI не так просто как кажется. Нужно поломать Python dependencies, как-то очень криво поставить какой-нибудь Custom Nodes, причём руками, а не через ComfyUI-Manager (тот вполне нормально устанавливает и обновляет Custom Nodes).
>>1631172 Да, это десктоп версия. На сайте сейчас нет портейбл. Я скачал какую-то другую с гитхаба, но не ставил. Я создал новый instance, он заработал. Старый придется удалить. Сейчас попробую еще раз rtx поставить. Буду держать в курсе.
Бля. В новом инстансе нет тех гигабайтовых моделей, которые я скачавал. А куда они делись? Что за бред. Похоже действительно придется портейбл ставить.
>>1631072 Ок, но я думаю непонятная эта шумовая грязь в деталях у идеограма очень сильно портит впечатление и сбивает с толку при оценке характера генерации. Флукс 2 мб и выдает современные, гладкие реалистичные текстурки и свет без шума, но идеограм на самом деле в фотореализме может намного большее, и фотореализм у него в определенных аспектах на голову выше чем у Флакса. Идеограм может к уровню гпт подбираться в этом плане. Мне в шестернях не хватает увидеть сочленений шестеренок с подгонкой, это самое очевидно что бросается в глаза и мб это промтом лечится
>>1631187 Серьёзно. Я к ним на сайт зашёл https://comfy.org/download Давно уже давно этого не делал и офигел. Там реально нет portable. Есть desktop и сделан разводняк на облака для ньюфагов за деньги. Сначала с их портала надо на Install from GitHub выбрать и только потом найти там portable, и это неочевидно. Вкатуны по другому маршруту пойдут, на что и рассчитано.
>>1631189 Если ты удалил инстанс, то скорее всего, вместе с ним удалились и модели. На portable хотя бы папка с моделями не погибнет и её можно вытянуть, если что-то пошло совсем не так.
>>1631192 >идеограм может намного больше >и фотореализм у него на голову выше >уровень гпт, не меньше Хм, а мы сможем увидеть все эти охуенные картинки, а то второй тред одну срань от идиограма постят. Зато пиздеж стоит до небес. Ну и хотелось бы увидеть сравнения с зиткой или кляйном
Уважаемые, поясните как вкотиться. Хочу генерировать nsfw фото с лицом моей ЕОТовны. Либо качественно прифотошопливать её лицо в уже существующие nfsw фото. Какой инструмент для этого нужен, где этому учиться?
>>1631192 Это не то чтоб шум. Это именно геометрические искажения мелких деталей. Я предположил, что это могло быть из-за резких скачков sigmas, но default на 48 шагов там очень аккуратно монотонно убывающая кривая с ускорением к завершению. Пик вчера постил. Попытка её погнуть и дать возможно прорисовать мелкие детали, искусственно задержав в нужной зоне, особого эффекта не оказала. В принципе, понятно, что для diffusion моделей, когда размер объекта небольшой, начинаются проблемы. Большие объекты им рисовать проще. Вот, добился противоположного эффекта, скукожил персонажей, прописав их отдельными bounding box малого размера. На малом размере bounding box проявляется искажение геометрии. Хорошо видно на причёске персонажа слева. А вот увеличение размера bounding box часового механизма несколько помогает сохранить геометрию.
Флюс 2 дев генерит качественней как в плане геометрии, так и текстурок, понимание промпта адекватное. Идеограм называют геймчнджером, но он генерит в 2 раза дольше (докинь ещё + х2 на рефайн), текстуры каловые, геометрия вообще по пизде, понимание промпта плюсминус флюкс2дев. Я чего-то не понимаю? А плюсы будут?
>>1631234 Дружище, твои (бенчмарки) тесты, как ничего не подтверждают, так ничего и не опровергают, промтинг для разных моделей разный, даже внутри квена есть херава туча пресетов под разные модели, одни тренились на буровских тегах, другие содержат в себе много старого балласта от сдохли, третьим подавай стены текста иначе пук-среньк будет. Просто на одних семплерах будет стабильно-нормально, а на других будет дичайший разъёб, потому что модель не заточена под них. Всё подбирается индивидуально под конкретную модель, у каждой модели есть свои плюсы и минусы, задача лишь в том, чтобы минимизировать последние.
>>1631249 Чел, если ты только что вкатился, то тебе никакой менеджер нах не нужон, научись на стабильных стоковых нодах генерить, тебе эта кастомизация ничего не даст ни для понимания, ни для результата, многие кастомные ноды нихера не работают как надо, а аторами зачастую являются просто больными на голову.
>>1631253 >Так что лучше поставить? портабл конечно, тут все на нём сидят.
>>1631243 >флюкс2дев Да как вы достали с рекламой этой модели. У нее нет наконец-то понимания анатомии человека. Вспомни шум в сети на старте от невозможности сгенерировать одетую(!) девушку деда на траве. И не надо здесь трындеть про возможности лор. Тогда ждём лоры на идеограм полгода-год и сравниваем. Уже есть олимпус на него и другое. Но я считаю что править отсутствующую анатомию лорами это хрень на палочке. И вообще на каждый чих лоры это хрень. Короче: флукс2.дев это хренотень чуть получше чем сд3.5 в анатомии. Люди вас послушают, скачают и ужаснутся результатами.
Если трындеть, что единственный плюс идеокала это коконсистентность. Тогда погоди, получается у ЗИТ и анимы понимание промпта ещё лучше. А раз всё равно нужен рефайн, то... Секта идеокала обосралась жиденько
>>1631281 По-моему, ты путаешь FLUX.2 [klein] 9B и FLUX.2 [dev]. FLUX.2 [dev] с релиза тут использую, наверно только я (бросив Qwen-Image), потому что нужно много RAM (64+ Гбайт; это при 16 Гбайт VRAM). Массово тут сидели сначала на Z-Image-Turbo, а потом распробовали FLUX.2 [klein] 9B. FLUX.2 [dev] на релизе утонул из-за непомерных аппаратных требований для рядовой пекарни. На него практически нет LoRAs, в отличие от Z-Image-Turbo и FLUX.2 [klein] 9B. На него есть только одна единственная Turbo LoRA от fal.ai на 8 шагов. И она надо сказать, так себе. В том, что касается геометрии, композиции, знаний, широкого полноценного edit-функционала, я заметил потенцил FLUX.2 [dev] и не бросил её, а потратил время, чтобы научиться с ней работать так, чтобы она выдавала близкое к тому, что мне хочется получить. Кроме того, 16 Гбайт VRAM и 128 Гбайт RAM позволили мне, пусть и неспешно, но кое-как с ней работать, не ушатывая SSD. Такой подход я не рекомендую никому, потому что для меня это не реальный production, а баловство. В коммерческом сегменте мне бы не позволили играть пару месяцев с моделью, чтобы получить требуемый результат. Но так или иначе, лично для меня FLUX.2 [dev] в связке с FLUX.2 [klein] 9B сейчас лучшее из доступного в локальном варианте. Мой текущий опыт с Ideogram 4.0 пока это только подтверждает. А на хайп с Ernie я не повёлся.
>>1631243 Это FLUX.2 [klein] генерит быстро. FLUX.2 [dev] очень тяжёлый и генерит (у меня) по скорости сопоставимо с Ideogram, а на edit, возможно и дольше.
>>1631244 Если default workflow слеплен под определённый набор scheduler/sampler, то с него надо начинать, как с отправной точки, перед тем, как лезть куда-то ещё.
Начал своё знакомство с Ideogram 4.0 я с изучения promting guide конкретно под эту модель: https://github.com/ideogram-oss/ideogram4/blob/main/docs/prompting.md Как показал мой опыт, не зная особенностей promptинга конкретной модели (особенно бедной локалки), лучше не начинать. Тем более, что Ideogram 4.0 де-факто полноценно не приемлет prompts отличные от определённой для неё структуры JSON (о чём говорится в руководстве по prompting). И только потом, на основе JSON-prompts, собранных по этому гайду с помощью Ideogram 4 Prompt Builder KJ я начал пробовать работать с этой моделью. Так что всё, что я делаю с этой Ideogram 4.0 — чётко by the book.
Для FLUX.2 [dev], например я использую Perlin noise и SA-ODE sampler. Но это чистая субъективщина, частично подсмотренная у других. Радикального изменения результатов он не даёт, но субъективно даёт чуть более приятную картинку. Это всё результат поиска и эксперимента. До того же самого доберусь и для Ideogram 4.0, если не брошу его раньше.
>>1631335 > FLUX.2 [dev] в связке с FLUX.2 [klein] 9B сейчас лучшее из доступного в локальном варианте. Флакс в t2i похоже любой стремный. Я пробовал Pro версию и она выдает кал в дрочных сценах. И в этих же сложных сценах флакс переключается на пластиковый слоп, вместо фотореализма. Идеограм и генерит заметно богаче и сохраняет зерно реализма при этом. Хз как ты это не заметил, либо у тебя какие то свои критерии не понятные. У тебя есть примеры наиболее удачные по твоим меркам? Есть представление, что Ideogram4+Klein edit refine на голову это превзойдет
>>1631409 Ты меня с кем-то перепутал, значит. Пока я вижу >>1629936 искажение геометрии в мелких деталях. И получаю его на своих генерациях. Сколько хочешь можешь перья пробовать. Пока этот баг не пофикшен, ценность практического применения этого Ideogram 4.0 сильно падает.
>>1631423 >Я пробовал Pro версию и она выдает кал в дрочных сценах. И в этих же сложных сценах флакс переключается на пластиковый слоп, вместо фотореализма.
Для FLUX.2 [dev] (и, видимо, Pro; я не проверял). Нужен корректно написанный prompt: либо JSON, либо с выдержанной структурой IMAGE TYPE, SUBJECT, LOCATION, STYLE, CAMERA SETTINGS, LIGHTING, COLORS, EFFECT, ADDITIONAL ELEMENTS. Судя по твоим пикам на FLUX.2 [Pro] я сомневаюсь, что ты писал в этом порядке.
>флакс переключается на пластиковый слоп, вместо фотореализма. Вот здесь спорить не буду, так как спустя долгое время, полноценно выдавать фотореализм на FLUX.2 [dev] у меня не выходит. Я знаю, что есть пара ключевых слов с описанием параметров фотосъёмки. Они немного помогают, но не более того. Есть ещё Olympus LoRA, которая ломает геометрию (почти как Ideogram 4.0, кстати) но хорошо перетягивает изображения в сторону фотографий, снятых на цифромыло из нулевых с жёсткой вспышкой.
>Идеограм и генерит заметно богаче Вот здесь вообще мимо.
>и сохраняет зерно реализма при этом. Это правда. И такого из коробки не хватает FLUX.2 [dev]. Видимо, его обучали под рекламные брошюрки со студийной фотосъёмкой в части фотореализма. Репортажки, raw, unedited там получить сложно.
>>1631423 >либо у тебя какие то свои критерии не понятные Он просто купил много ОЗУ ддр3 и напоминает всем об этом в каждом втором треде. В целом, у него довольно приторные сообщения типа: смотри превьюшки и останавливай генерацию, если тебе не нравится. Типа как: если заблудился просто или домой, если у тебя нет дома просто купи дом, если хочешь накопить 12Млн просто откладывай по 1Млн в месяц. Зачем такие советы писать?
>>1631447 > Нужен корректно написанный prompt Сто раз убедился, что промт это копинг. Промт был большой, дроченый. Я оцениваю изображения с позиции индивидуального эстетического взгляда, и не могу описать точные критерии. У флакса нет художественности, какой то жизни в объектах, фонах, лицах. Он очень плох в передаче эмоций, микродинамике, позинге - всё очень механическое с большой градации. То же касается и задников: работает как тупая ЛЛМ, стоит упомянуть что то, он включает это в кадр и изображает это пошло навязчиво с точки зрения сцены, композиции. Компановка сцены, композиция - как правило нелепая. И в конечном итоге, это еще и даже близко не реалистично, если в сцену навалено много нетипичных, полуреалистичных вещей. Судя по постам сегодня, здесь похоже дохуя людей, которые вообще далеки от всей это материи. Раз ты на деве дрочил, видимо тоже не особо поймешь.
Вот твой пикрил композиционно нелеп - и даже если это рэндомный быстрый промт - вот именно в таком духе флакс всё и генерит, даже если дрочиться над промтом часами.
Вы поймите, ваши промты деталей,ракурсов, фотокамеры, света, точно исполняемые - НИХУЯ не стоят, если модель сама не понимает и не чувствует тонкие детали всего этого. Любой промт на 300-400 слов может быть изображен нелепо даже при 99% соответствии, и флакс делает именно это. Вам не хватит никаких токенов, прописать сцену по настоящему детально так, что бы она смотрелась хорошо. Это не 300-400 слов. Нужно 5-10к слов - и это локальная модель не переварит.
>>1631375 > Ideogram 4.0 в один проход без рефайна в тред.
>>1631317 >>1631309 >>1631301 > рефайном в кляйне это хрень на палочке и унижение. Ебать шизия религиозная в треде полезла. Вы че там генерите сами? Покажите
Сделай backup. Выключи ComfyUI и останови локальный ComfyUI сервер. 1) Установи Git, если нет; 2) Открой командное окно CMD (с нужными правами, если надо); 3) Перейди в папку custom nodes: cd путь/где/у/тебя/в/ComfyUI/custom_nodes; 4) Сделай там: git clone https://github.com/Comfy-Org/Nvidia_RTX_Nodes_ComfyUI; 5) Перейди в папку клонированного Custom Node, где лежит requirements.txt и сделай там: ..\..\..\python_embeded\python.exe -m pip install -r requirements.txt; 6) Запусти ComfyUI; 7) Когда всё пошло не так, восстановись из backup, поставь ComfyUI-Manager и накати на portable ComfyUI Nvidia_RTX_Nodes_ComfyUI как написано в readme.md.
>>1631553 Всего того, о чём ты написал, я от моделей не жду. И даже не надеюсь. >промты деталей,ракурсов, фотокамеры, света, точно исполняемые Если хотя бы это работало нормально, я уже был бы доволен. Меня бы это устроило, потому что на существующих локальных моделях, изучив руководства по promptингу, я этого полностью не получаю.
>художественности, какой то жизни в объектах, фонах, лицах Как найдёшь такую ультимативную модель, которая ещё и будет работать локально на консьюмерском железе, обязательно сообщи. Сразу брошу все FLUX.2 [dev] с [klein]нами и незамедлительно перейду.
>>1631622 Если совсем по-простому, заходишь в ComfyUI открываешь Nodes и ищешь там. Если появились, тащишь в Workflow и пробуешь. Ещё логи при запуске ComfyUI можно посмотреть. С ComfyUI-Manager проще. Там есть вкладка import failed. Если что-то криво из Custom Nodes встало, там будет написано.
Посоны, где я проебался? Я что, упустил какой-то гайд? Или чё бля. Хули мне говно генерирует. Я бухой, идите нахуи, просто обидно. Раньше получалось настроить что бы были охуенные картинки, щас хуита.
>>1631698 ЭЭ бля слиш пашол на хуй, я вообще не ебу что за автоматик этот, или чё там у вас. Я думал, только в AICG гейткипят, сука, а тут это говно по всей доске размазано. Тебе чё жалко ткнуть в место где я проебался? Пидор тупой.
>>1631719 Бля я так и думал что лучше в комфи. Самое интересное, что я уже настроил wan в comfy и он выдаёт... приемлимые результаты, но локальная генерация картинок как-то мимо прошла.
>>1631820 >>1631822 Так, увидел на втором скрине, что ты уже запостил частично. Смотри: делай бекап. Затем запускай update dependencies из папки для update твой portable ComfyUI. Это доломает почти всё, но подтянет нужные dependencies. Когда это произойдёт, запостишь сюда лог загрузки и сообщения из import failed. А я тебе постараюсь написать какие нужно dependencies откатить руками до тех версий (не самых новых) на которых всё вместе будет работать.
>>1631828 Если пропали после перезагрузки ComfyUI и ни в логах загрузки, ни в import failed их нет, то это неплохо и можно пробовать запускать эти Custom Nodes.
Тебе нужно знать версию Python, Pytorch, CUDA, которые в твоей portable сборке. Когда ты узнаёшь то, что нужно, ты подбираешь wheel и из CMD в папке с embedded Python твоей portable сборки запускаешь что-то вроде:
>>1631877 Всё с виду в порядке. Модель для SeedVR2 будет выкачиваться при первом использовании (в зависимости от выбранной модели). Проверять прогресс закачки в консоли сервера ComfyUI (CMD окно, откуда ты логи загрузки выкладывал). Может показаться, что при запуске Workflow завис, но на самом деле, это модель будет качаться (там есть жирненькие, объёмом 16+ Гбайт; смотря какую выберешь).
>>1631719 Комфи лютое говно для пони,sdxl и sd1.5. До сих пор на автоматиках в них сижу, со старой архитектурой он непревзойден, там все под это сделано. Комфи только для новых моделей, для старых в нем минимум усилий сделали, работают через жопу.
>>1631447 > Вот здесь вообще мимо. Я хз на чем ты тестишь. На спицах и шестиренках? Как здесь >>1630683 ни одна другая t2i локальная не способна кино нарисовать. (Пруфы обратного прикладываем, не стесняемся) Клейн тем более такой стимпанк никогда не нарисует, несколько тредов назад кто то пытался показать как клейн это рисует: там был голимый слоп с копипастами. Лучше варианта идеограма только гпт2 может, и то она через раз мультик рисует срываясь с реализма. Там по сути остается только промт получше сделать и сролить более удачный рефайн и цветокор в клейне.
Я разве что вариативность не проверял, это первая же генерация в 4mpx. Я с тех пор занят был и ничего не делал, мб это была случайность и там не будет вариативности или будут ошибки лезть.
4к у меня все таки не получается сделать, процесс зависает, не хватает памяти. 8гб
Есть фишка с тайлами, что можно разбить изображение на части и увеличить их последовательно. И вроде как в Seed2vr даже есть параметры, чтобы эту фишку сделать. Я уменьшал размер тайлов, но 4к сгенерить все равно не смог.
>>1632116 >ни одна другая t2i локальная не способна кино нарисовать Вино и домино. Это сорта слопа, только этот конкретный вариант слопа тебе нравится больше, вот и всё. Ideogram 4.0 местами проявляет себя неплохо, но имеет кучу других недостатков, которые перечёркивают положительные моменты. Ему можно найти применение. Но превозносить его uber alles — это прерогатива отбитых сектантов.
>>1632116 >Клейн тем более такой стимпанк никогда не нарисует
нахуя приплетать клейн в сравнение к идиограму т2и... как минимум не корректное сравнение, клейн это в первую очередь эдит модель, выжимать из него т2и это извращение Можно также сказать что идиограм тебе никогда в руку бабехи фруктовый лед не засунет или лицо не засвапает, а клейн может и не такое сунуть.
у моделей разная задача. Вот если случится чудо и выйдет их эдит модель идиограма в попен (да хуй там кажется) тогда и можно будет их сравнить
>>1632340 Сравнение не корректное, верно. Клейн принципиально хуже идеограма. Я это челу выше объяснял, он не видит разницы, навалил слопа и говорит это одно и тоже, просто вкусовщина. Ок, мне всё равно Я клейном уже 2 месяца не юзаю t2i, сидел на аниме. Щас хоть на идеогамк можно посидеть, наконец то хоть что то попромтить снова можно
Кто-нибудь сталкивался с такой проблемой, что комфи на этапе семплера начинает заново всю модель грузить? История такая: сидел генерил в комфи, все было ок. Переключился на пару часов на другие задачи и тут все началось. Обновил комфи и ноды - результат такой же. Экспериментальным путем выяснил, что этот глюк происходит если подключать лору. Причем не важно какой чекпоинт и какая лора и лоадер. Без лоры - 20сек генерация, подключил любую лору - 130сек, отключил лору - снова 20сек. Запускал с run_nvidia_gpu.bat и run_nvidia_gpu_fast_fp16_accumulation.bat - результат одинаковый. Ноды стандартные, подгрузка с диска начинается на KSampler (Advanced) и KSampler при любой лоре. В логах ничего. Я уже не знаю что делать.
>>1632422 Предположительно мало VRAM и RAM. Когда переваливается, происходит выгрузка на SSD. В предыдущем сценарии хватало, в текущем — нет. Ещё LoRAs в ComfyUI могут так подгружаться (всегда в оффлоад и обратно). Но я этому подтверждения не нашёл. Нужно другими средствами анализировать использование памяти (но я не стал).
>>1632422 >подключать лору лора всегда свопится, даже если оперативки до жопы. Посмотри не проебался ли у тебя прежний своп-файл, вернее его размер, не стал ли он дефолтным, у меня своп 16 гиг, если его оставить на выбор системы, то работать будет нельзя.
ты совсем тугой или притворяешься, нельзя же быть ну настолько тугим, это даже не смешно мы говорим об заточеной на и2и эдит модели которая может тебе с фоткой что угодно творить, свапать задники, менять освещение, стиль и прочее, убирать и добавлять элементы, менять позы и прочее. Понятно что клейном можно делать и т2и но сама модель не под это заточена.
И т2и модели которая кроме этого ничего больше не может, но т2и делает хорошо.
Как я сказал когда выйдет их эдит модель тогда и можно будет сравнивать (ну тут скорее клейн проиграет объективно), но эдит модель в попен сорс скорее не выйдет, так как они её монетизируют
Идиограм пиздос классный. Вот бы лор на него. Сколько не промптил биб буба дип кливедж вангёрл всегда выдавал прикрытую плоскую лохушку с кривыми зубами, но качество просто пиздец, особенно ворсинки всякие на ткани Но из совсем грустного - не знает джинкс
>>1632583 Ты слишком дерзко кудахчешь, для такого бреда который ты несешь. Флакс 2 это и t2i и i2i модель. То что ты там себе додумываешь и воображаешь меня мало волнует. По моим меркам он и в эдите не полноценный, как и ты судя по всему, разу тебя флакс заточен. Открой оф страницу флакса и покажи где она заточена под и2и онли + рот потише сделай.
>>1632699 Ой иди ты нахуй идиотограмный, тебе буквально на главной странице кляйна показывают и пишут для чего модель. Вот тебе ролик с офф сайта, с раздела кляйна.
Да фюкс2 сам у них многопрофильная модель, но я о нем и не говорил. в кляйне делают упор на быстрой генерации и эдите с поддержкой мультиреференса.
>По моим меркам он и в эдите не полноценный Ну свои задачи выполняет, в попен сорсе лучше нет.
Ну короч хуй с этим всем, я вообще не о том говорил и вообще без негатива короч анонче.
Идеограм тоже может в эдит, при чем их раздел Ideogram Character пиздец какой привлекательный и если судить по т2и то в эдите будет в разы лучше чем имеющиеся сейчас аналоги.
Но пока этого нету в руках наших, считаю именно сравнивать т2и с клейном не корректно, тогда уж с полным флаксом2 а не с обрубком кляйном, но он популярным не стал таки, слишком толстая моделька вышла
>>1632699 >>1632755 А ну хотя ладно напиздел, т2и идеограма такой же как клейн 9б обрубок, ну ладно Ну короч без негатива анонче если что, просто если бы умел идеограм этот в эдит, бы заткнулся, без этого он ну не лучше не хуже клейна, да в т2и лучше, в эдите никакой вообще, че тут сравнивать
Они идг4 походу специально заруинили качество вдеталях, буквально что бы жирно не было (забесплатно). Иначе не объяснить как модель одновременно так рисовать свет, текстуры, анатомию и точность, но при этом срать какой то микрохуйней в детали
>>1632825 Когда ты ей начнёшь реально пользоваться (по крайней мере тем, что доступно для ComfyUI), то заметишь все её болячки и огрехи. А потом, возможно, поймёшь, что она не лучше всех локалок, а в некоторых местах (точность геометрии мелких деталей, корректность освещения) ещё им уступает. Но ты просто ещё один из толпы Ideogram 4.0 — сектантов, который будет восторженно петь дифирамбы как под копирку.
>>1632825 Да но как вы убираете грязехлам слопный в микродеталях? Не могу воспринимать завершенно с этой хуйней. И мне кажется у всех более гладко рисует чем у меня. На каком вф / настройках гоняете?
>>1632832 Прогони через FLUX.2 [klein] с prompt: «preserve details of image 1, high resolution, very subtle fine texture». Можешь с помощью Custom Nodes порезать на тайлы, обработать каждый тайл и потом сшить (смешивая с исходным тайлом и делая смешение цветов, чтобы добавить изменение только в высокочастотные детали). Искажение геометрии мелких деталей есть практически всегда. Мне оно почему-то напомнило grid artifacts от Qwen-Image, но этого особо никто не заметил и про это не пишет. Ещё искажение мелких деталей можно получить, если задать слишком маленький, или непропорциональный bounding box. Если огрехи в мелких деталях совсем небольшие, то прогон через FLUX.2 [klein] с prompt, который я указал выше помогает. Если серьёзное искажение геометрии, то только edit (с помощью Crop and Stitch Custom Nodes).
>>1632833 А у тебя VAE от FLUX.2 насрал разноцветными (в основном зелёными) пикселями, которые здесь упорно не видят. Те, кто искал пример, вот отличный экземпляр.
>>1632835 >непропорциональный bounding box Здесь имел в виду случай, когда bounding box изначально не соответствует генерируемому объекту. Слишком вытянут, или, наоборот — сжат.
>>1632854 Не на "ошибку", а вообще. Бесят, что такие идиоты есть, которые пиксели с лупой смотрят. И вместо того, чтобы лечить свое отклонение, пишут свой бред нормальным людям.
>>1632854 Это сектанты Ideogram 4.0, а ты их ткнул в больное место. Причём тот факт, что workflow для ComfyUI содержит VAE от FLUX.2, а чудесные разработчики Ideogram почему-то не релизнули свой VAE вместе с «лучшей в мире SOTA моделью», должен только поднимать им градус накала.
Юмор в другом. В прошлом треде я выложил элементарный фикс, который хотя бы несколько снижает этот эффект. Но фикс не нужен. Они баг будут коллективным камланием превращать в фичу.
>>1632835 Да я это и сам знаю и делаю. Я просто вижу что идеограм выкладывают будто бы бы рефайна в лучшем качестве чем мутят у меня, с шумком но без такой грязе-мазни как у меня
>>1632595 >>1632598 Это ведь с рефайном идеограм? Если нет, покажи настройки / сэмплер / style_description? У меня грязь/ не красивый шум лезет не справедливо вообще
>>1632839 >>1632846 Больше походит на артефакты дешёвого сканера. Что в случае с иллюстрацией вполне естественный артефакт. мимо_только_сейчас_понял_на_какие_пиксели_тут_все_дрочат
>>1632858 >Но фикс не нужен. Фикс объективно не нужен. Это же прост постпроцессинг уровня того шизика с хроматической аберрацией. Кому надо - то сам замажет
>>1632989 Прогони в ComfyUI изображение (даже не сгенерированное) через FLUX.2 VAE Encode / VAE Decode и получишь эти самые «артефакты дешёвого сканера» даже не на «сканированном» изображении.
Я был прав, когда говорил, что «ссы в глаза — всё Божья роса» и баг VAE от FLUX.2 будет превращён в фичу.
Вот генерация с фиксом и без фикса. Первый проход на FLUX.2 [dev] (пока мой любимый слопогенератор; Ideogram 4.0 пока не удалён, но иллюзий относительно него у меня поубавилось), без рефайна.
>>1633021 Кстати, FLUX.2 [dev] точно так же замечательно рисует лишние пальцы и за этим нужно следить. (Я не уследил). FLUX.2 [dev] далёк от того, что бы мне хотелось использовать в качестве инструмента, но чего-то лучше для локальной генерации я пока реально не вижу. На Ideogram 4.0 устанешь коробочки рисовать и всё равно будут проблемы (с искажением объектов в этих коробочках). Кстати, для Ideogram 4.0 я видел приём, что даже персонажа целиком не прописывают а делают: bounding box на туловище персонажа, голову с выражением лица, руку с описанием положения руки и так далее. Вариант рабочий.
>>1631243 > Я чего-то не понимаю? Флакс дев генерит слоп без альтернатив, копипастит унылые образы. Текстуры у него говно Не понятно вообще для чего нужна эта модель. Идеограм несмотря на грязь в деталях выдает куда более реалииичные текстуры и свет, дает более высокий контроль, живее передает лица и эмоции. Дев не многим лучше клейн бейз и дистила. По сути, фантазия и возможности флакса2 в генерации настолько убоги, что даже корпоративный флакс мало интересен. Про текстуры базовых dev и клейн я вообще молчу - это фиксированный пластик, semi-real стилистика, slop-стилистика. Идеограм же делает шаг в сторону конкуренции локалки на жалкой консумер видяхи с GPT2 (можно получить определенные сложные сюжеты более реалистично чем ролит GPT, при этом не менее сочно). Идеограм может рольнуть хороший ыотореализм даже в не casual фото сценариях, что с учетом рефайна делает его лучше анимы, без других альтернатив.
Все результаты что ты показывал в DEV выглядят как слоп 24 года, хуже чем делали мастера на сдохле. То что выдает идеограм - это новое поколение. Ты можешь обзывать это слопом, потому что полный фотореал еще не достигнут или что структуры где то плывут, но это будет не точная и не справливая критика. Справедливо это то, что картинка флакса унылое говно и не радует глаз. А идеограм доставляет, на них интересней смотреть, интересней генерить и изучать понтенциал и возможности. Из флакса же ты ничего не выжмешь. А если не видишь разницы, чтож, таков у тебя путь.
>>1633031 Ты промахнулся. Это я FLUX.2 [dev] использую.
>FLUX.2 — говно, Ideogram 4.0 rulez 1111 Твоя позиция предельно понятна. И твой субъективизм в отношении FLUX.2 с оценкой текстур материалов, а также extremely high bias towards Ideogram 4.0 тоже.
На FLUX.2 [dev] я сижу с релиза. Знаю его слабые и сильные стороны. Ideogram 4.0 я так глубоко пока не знаю. Чтобы его узнать, нужно больше практических экспериментов, чтобы понять как он себя ведёт. Пока я вижу то, что поломанная геометрия мелких деталей, которую я рефайном не всегда могу вытянуть, а также странное поведение освещения не стоит всего остального. С ним нужно возиться ещё больше чем с FLUX.2 [dev], чтобы получить то, что мне хочется, а не генерации в стиле «и так сойдёт». Весь его bias в фотореал (который мне в целом понравился) из коробки при этом для меня ничего не стоит. Если это изменится с новыми тюнами нет, тогда я пересмотрю своё мнение.
>>1632839 Тебе еще много предстоит узнать о том, какое изображение визуально хорошее, а какое - стерильная хуита.
Если не в курсе, то изображения не предоплагают, что по ним смотрящий с зумом в 400 процентов будет ползать. Смотрят в масштабе около 100 процентов на финальный результат. И художник и зритель.
>>1629238 (OP) У меня Ideogram не стартует, выдает ошибку: RuntimeError: Error(s) in loading state_dict for Ideogram4Transformer2DModel:
File "F:\ComfyUI\python_embeded\Lib\site-packages\torch\nn\modules\module.py", line 2581, in load_state_dict raise RuntimeError( ...<3 lines>... ) RuntimeError: Error(s) in loading state_dict for Ideogram4Transformer2DModel: While copying the parameter named "llm_cond_norm.weight", whose dimensions in the model are torch.Size([53248]) and whose dimensions in the checkpoint are torch.Size([29952]), an exception occurred : ('The size of tensor a (53248) must match the size of tensor b (29952) at non-singleton dimension 0',).
>>1633085 Я другой анон. Там не кал, сценарии хоть и относительно не сложные для реализма, композиционно и в целом по качеству на отличном уровне. Они смотрятся приятно и выглядят как фотки. Цель достигнута, а уже дальше идет вкусовщина.
>>1633043 А как ты параметры под разное разрешение подбираешь? И откуда сигмы эти взял? То есть дефолтный адаптер скедьюлера от комфи дает хуже качество чем вот такое? Ты еще start_percent изменил до 0.9, в дефолте 0.7 стояло.
Нихуя пока не понятно. У меня на 48шагах в квалити шума и микро искажения в детали наваливает, а тут на 12 шагов намного чище. В промтах с кучей деталей это будет работать?
bbox координаты написано что нормализованы под 0-1000. Это означает, что независимо от разрешения картинки, эти 0-1000 будут пропорционально скорректированы под целевое разрешение? То есть работает как % от длины конечного кадра? То есть 333 в bbox на разрешении 1988 будет фактически означать ~662 пикселей?
Иначе нереально же корректировать по 20 координат под изменение разрешения.
>>1633156 > это шутка? Ты шутка. В попытках доебаться до пальцев, сам же обосрался в анатомии. Большой палец под углом к плоскости лодони, поэтому во многих ракурсах большой палец скрыт, например на пикриле.
> Слоп говна Покажи свой не слоп. У тебя нихуя нет же совсем.
>>1633163 > Это, да... Ну а ты попробуй сделать роботов в не реальном сеттинге в фотореализме. Внезапно обнаружишь, что моделька не делает так же гладко, как с людьми в casual декорациях реального мира.
Вот и остается только брюжжать, что роботы говно, а тянки это годнота. Подгоняем аппетит под возможности, нихуя делать не надо.
>>1633583 >осталось добавить edit функции вот бля ток эта хуйня интересует, там вообще по промо улучшили контроль референса чтоб ебало не плыло, но пока не открытые веса что печаль и боль ипаная
Сейчас в нодах 1.0 намеренно сделан этот бардак с превьюшками субграфов? Если внутри субграфа больше одного семплера, то чехарда с превьшками. Я знаю что надо в меню по пкм выбирать "promoute/unpromoute". Но всё равно оно бредово работает. В то время как ноды 2.0 работает нормально. Как правильно организовать работу превью субгафов в нодах 1.0? Есть какой-то алгоритм?
>>1633096 >>1633098 Качал с 2-х разных репозиториев, там всё готовое лежит cond+un+enc я не мог не то подключить, и каждый раз одно и тоже. Может ему найтли нужен, так как у меня стейбл, может из за этого?
>>1633786 >>1633778 Bernini-R is an advanced open-source AI video-generation model based on the Wan2.1/2.2 architecture. Because it is a highly unrestricted, open-weights foundation model natively derived from Wan, it is capable of generating NSFW
>>1633605 >у многих идеограм норм качество выдает Потому што черипукают. У меня идеограм рисует 50 на 50. Когда стиль не осиливает, когда объекты ломаются, когда просто сойтись кадр не может.
>>1633077 Это ZIT? Он сильно лучше Klein по композиции, но не дотягивает до XL и Chroma. Конечно же беда в том, что две последние требуют колосального скилла, чтобы не получалась помойная кривая хуита в отличии от первых двух. До сих пор не пробовал их Base версии, может они тоже визуально интересные и на скилле можно выжать и картинку, и композицию. >>1633786 Блядь что, лол, они угорают? Даже старый грок ебал пиздец, а новый так вообще чуть ли не реальные видео выдает по I2V, если не смотреть на артефакты быстрого движения из-за экономных настроек. Постеснялись бы столько накручивать. >>1633759 А я юзаю, удобно - лишь потому что они убили обычную вкладку просмотра и после каждой новой генерации, оно отматывает к старой генерации, не полистаешь. А в apps этого не происходит. Жаль, что даже в apps нельзя выбрать последнюю пикчу и чтобы новая пикча её заменила - оно каждый раз переключает на генерирующуюся и в итоге всю очередь наблюдаешь за генерацией парашного превью вместо того, чтобы смотреть на последнюю сгенеренную. Какой же комфидаун дегенерат в плане UX. >>1633402 Ideo из коробки селеб генерит? Это лоры? Или это лоры на ZIT?
>>1633816 Я не жертва хайпа. Я тот чел который залетел и 2 месяца ебу мозги про композиции и эстетику, на фоне унылого кляйна. Уж я то знаю что мне нравится и идеограм очень хорош, еще бы грязь понять как вылечить Про клейн забей в таких сюжетах. Клейн только банпы да 1тян в подъезде генерить на леново лоре
>>1633863 Прикольно, можно оставлять свою скрытую подпись на всех своих шедеврах слопа, что бы в любой момент можно было доказать авторство.
То есть если картинка станет популярной и кто то захочет использовать это в коммерческих целях - можно через суд доказать что это твоя картинка и ты имеешь на неё авторские права. Или нет и по губам проведут?
>>1633871 >Как добавить это в комфи? Легко и просто, для любой модели, даже без математики своих вотермарок. Обучаешь лора и шаришь её или мержишь с моделью уже.
Поговори с чатгопотой или гемини, они тебя научат создать декодер и прочее.
>>1633874 Это для поиска пиратов. Например лицензия модели идеограмм non-commercial. И если ваши локальные генки где-то проявятся, то придется объясняться.
>>1633077 Так, у меня появилось время разобрать твои поделия. Спасибо, что предоставил примеры, которые ты считаешь композиционно верными. Сразу ясен твой уровень в этом вопросе: композитор Гглинка, не меньше. Я не поднимал вопрос про композицию во FLUX.2, которая как ракурс, освещение лежит целиком на составителе prompt, а не на ожидании, что модель всё расставит за него. Хотя правило третей она знает. И в моих пиках выше действительно нарушены правила композиции. Впрочем, ты напросился на «бизнес-линч» сам: Про ошибки в геометрии, освещении на твоих изображениях говорить не буду (особенно «косит лиловым глазом» на первом пике). Сейчас речь про композицию.
Первый пик комментировать особо не буду, скукоженный 1girl standing в портретном расположении безусловно очень сложная в композиционном понимании сцена. Впрочем, снятый скальп у портрета на стене и куски от трёх свечей (точно не за здравие) изрядно доставляют. Позу комментировать не буду, это не флирт, а радикулит. Хотя бы воздух есть вокруг персонажа, но кадрирование — полное говно.
Второй пик с футболом по идее должен быть откадрирован в соответствии с правилом третей, по краям больше воздуха (слева можно меньше, так как динамика и движение кадра подсказывает направление вперёд; повёрнутая голова — неуверенность или поиск кого-то за кадром, кому отдать пас), персонажа в левой части кадра быть не должно. А если и есть, то нельзя его резать на куски.
Третий пик в фургоне. Опять гильотина. На этот раз пострадала рука персонажа справа. Отличная генерация в стиле «криворукий фотограф» первый раз в жизни взявший в руки фотокамеру, очень реалистично. Нужно кадрирование в пейзажное расположение, medium close-up. Слишком много воздуха сверху и снизу. Портит кадр, смысловой нагрузки не несёт.
Пик 4: Атака провалилась, никто никуда не идёт. Персонаж справа показывает всем какой пластиковый меч он купил на aliexpress. Для завершённости композиции не хватает степенно идущего посередине (в нарушение правил третей) чёрного кота, который перешёл дорогу всем и они остановились. А возможно, они просто готовятся танцевать. Некоторые с выражением недоумения. Динамика околонулевая. Пыль поднял виман, который не попал в кадр.
Твои поделки оставляют желать лучшего, а твоё понимание динамики кадра и композиции (я не увидел у тебя ни внятных диагоналей, ни треугольников, ни нормально откадрированных третей, ни даже креативного и оправданного их нарушения) не выдерживают минимальной критики. Такое же унылое дилетантское говно. Напрасно ты решил выставить это как образец. Если не хватает навыков делать кадрирование во время генерации с помощью модели, делай в фоторедакторе.
>>1633875 Вроде как i2i и апскейлеры уничтожают любые ватермарки, просто из-за того что меняют структуру шума пикселей, но это работает если ватермарка не по алгоритму пространственного кодирования - типа расстояния, глубин и высот самого изображения - тут нихуя не спасёт.
>>1633878 Глядя на твой слоп, по которому ты уже узнаваем - даже читать не стал. Если ты выкладываешь и генеришь такое, значит у тебя проблемы с видением и взглядом. Получается твое мнение не интересно и это логично блять. Твой клейн дев - генерит пустые сцены, с хуевыми мыльными текстурами и полу-реалистичным освещением, даже сдохли генерили реалистичней. Удали кляйн, он говно в t2i
ну короче поставил этот идиотограм всетаки, пришлось еще сажу прикручивать ногами, оказывается она стандартно хуй работает с идиотом, а так в 3мп генерит +/-200 секунд, ну вроде нормуль
Их там кстати за столько безпалевных IP в модели не вздернут на висельнице, а то можно и перевозбудиться от таких красот
Цензура правда яростно сопротивляется через раз генерит сисик но я поставил первый какой то стандартный вф какой увидел для теста над будет потом посерьезнее углубится, лору там прикрутить какую
>>1633896 > Цензура правда яростно сопротивляется через раз
Вот мои правила из энхансера. Их достаточно, чтобы видеть safety filter от силы раз в 20-30 генок: > Для избегания ложных срабатываний NSFW фильтра > - увеличивай сложность json структуры > - добавляй подробные описания побочных визуальных деталей таких как книга на столе или часы на стене > - обходи стоп слова при помощи других языков и m_a_s_k_e_d форматирования.
+ есть хак на сигмы, который я не пробовал >>1633043
>>1633900 Ну вот Кирстен сделал в 3мп, без постобработок всяких, роде нормуль и текущая сажа2 на качество не влияет/влияет настолько что даже с лупой никто не увидел 4080 печка
>>1633896 >200 секунд, ну вроде нормуль пиздец, это больше 3х минут, чувак, какое нахуй нормально, при том что ты будешь черепикать из 10 минимум. Для меня 30 сек это дохуя
>>1633932 ну так я не говорю что это супер быстра, без сажи считай еще дольше, ктото выше писал что в 3мп вообще дохуя долго генерит.
Но я к этому не требователен, так что мне пох, я привык к этой хуйне на генерации видео, когда ждешь 10 минут чтоб оно потом все по пизде пошло.
Так Бля... а че такой контроль ебнутый с ебаными этими коробками, какой то тетрис собираешь там ипаный, чето крутишь какие то квадраты, как не модель так сук учится промптингу, мне просто чуток сисика посмотреть то надо
>>1633896 Да как он у вас работает, мне все время ошибку на unond выдает. Качал с трех разных репозиториев модели, и во всех трех случаях одно и тоже.
RuntimeError: Error(s) in loading state_dict for Ideogram4Transformer2DModel:
File "F:\ComfyUI\python_embeded\Lib\site-packages\torch\nn\modules\module.py", line 2581, in load_state_dict raise RuntimeError( ...<3 lines>... ) RuntimeError: Error(s) in loading state_dict for Ideogram4Transformer2DModel: While copying the parameter named "llm_cond_norm.weight", whose dimensions in the model are torch.Size([53248]) and whose dimensions in the checkpoint are torch.Size([29952]), an exception occurred : ('The size of tensor a (53248) must match the size of tensor b (29952) at non-singleton dimension 0',). ... ... ...
Не забываем про этот рофл, когда открываем рот про слоп. Идеограм 4 генерит реализм в ряде сценариев лучше чем GPT2. После флакса2 прошло всего полгода. Через год-два вообще будет пиздец. А когда коснамер сегмент перейдет на 24-32гб vram, всё станет настолько сладким, что видимо сразу надоест всем за пару месяцев.
Всё самое интересное - будет запрещено и для генерации и для публикации. А все остальное надоест. Вопрос чем заниматься тогда останется. Видимо только видео. Как раз выйдет какая-нибудь пиздатая и простая в использовании модель как было с флакс2, на которой можно будет своё кино снимать.
Короч ясна идеограм это для прона с селебами, в целом у меня в штанах чтото поднялось, и это явно не сажа атеншн Но это так пока ток тестово погенерил,так сказать без интузиазма,
Аноны, подскажите пожалуйста, кляйн эдит из коробки нормально генерит? Или нужна аблитерация модели и энкодера? Если так, то какую именно аблитерацию? Или на базу накинуть лору?
>>1634111 По текстурам нет, обычный дистил говно и парашу пластиковую генерит, и лор улучшающих нет, но кого то устраивает. Сгодится только для быстрых тестов или с лорами встратого качества типа телефонных. True v2 лучше но он тяжелый и медленный
бля ладно зря пиздел на него, идиотграм пиздатый генератор прона с селебами...
Но бля анонче че за хуйня, что за миниигра в комфи, двигаешь какие то ебаные квадраты по полю, надо еще чето писать там внутри квадрата, прям головоломки с пк игор, соедини 3 квадрата чтоб получилась писка в руке и все не разъебалось к херам, еще и подсказок нету. Де чит код чтоб квадраты сами правильно вставали по промпту а ты ток кнопочку жал генерить 1слопгерл селеба
Но так то прикольно, мне понравилось, но не совсем разобрался что за графы ибаные в промптере киджая, в верхний квадрат пиши описание, в нижний бекграунд, че за медиум там ебаный в графе какой то, нихуя не понятна, пишу в графы по наитию
>>1634054 Я глянул, можель и энкодер около 15 в сумме занимают. И что, хочешь сказать, не вываливается в файл подкачки при работе? Сколько генерация времени вообще занимает? Слышал, что долгая можель. Это не мой пост >>1634066
Llm в самом Комфи работает очень медленно. Есть, конечно, ноды для внешнего ллм, что работает гораздо быстрее. Но надо запускать в фоне на постоянной основе llama.cpp или ollama. Проблема в том, что модель после использования не выгружается из vram и Комфи замедляется. Как разрулить этот момент?
>>1634127 не оплатил подписку, никаких голых бабех тебе
>>1634132 не ну так то мини игра прикольная, но сча придумают какую нибудь волшебную ноду >>1634133 ну я хз, сравнить скорость не с чем мне лично, но на 4080 нормально летает, на 1мп генерит быстро в районе минуты 16г хватает на 3-3.5мп и там уже генерит гдето 3-4 минуты, но и качество там другое уже на 4мп не пробывал.
>И что, хочешь сказать, не вываливается в файл подкачки при работе? а че ей туда лезть то, вся хуйня лежит в раме, а там на генерации оно в сумме гигов 30 чтоли занимает, у тебя на генерации энкодер не будет лежать в враме, времена когда вся хуйня висела в враме уже давно ж прошли
>>1634143 Я генерю десяток json промтов, потому меняю модели и генерю десяток картинок. Раньше делал это очень ёбко в комфи. Теперь прост пересел на llama.cpp и stable-diffusion.cpp модели сами туда-сюда грузятся
>>1634247 Чёт у меня не получается красиво, чисто. Ты на каком режиме генеришь? Турбо/дефолт/квалити/ещё? Если я правильно скопировал промпт, то вот попробуй: {"high_level_description":"A stunningly beautiful young woman with long blonde hair poses provocatively on a grey chair in a cozy, dimly lit room, gazing sultrily at the viewer while holding an open book.","style_description":{"aesthetics":"highly detailed, atmospheric, intimate portraiture","lighting":"warm, directional key lighting sculpting the figure, high contrast shadows","photo":"85mm prime lens, shallow depth of field, fine film grain","medium":"photography","color_palette":["#A08060","#F0E68C","#36454F","#808080","#4B0082"]},"compositional_deconstruction":{"background":"The room is cozy and richly furnished, featuring dark wood paneling and visible vintage electronic equipment subtly placed on surfaces, with framed artwork hanging on the back wall.","elements":[{"type":"obj","bbox":[250,550,750,950],"desc":"A grey, upholstered chair upon which the woman is seated, providing a stark, neutral base for the subject.","color_palette":["#808080","#A9A9A9"]},{"type":"obj","bbox":[150,300,850,800],"desc":"A young woman with long, flowing blonde hair, posed provocatively, looking directly at the viewer with a sultry expression. Her body is partially bare, highlighted by the warm directional light. She holds an open book in her hands.","color_palette":["#F0E68C","#FFD700","#C0C0C0","#800000"]},{"type":"obj","bbox":[300,750,700,900],"desc":"A dark, polished wooden table situated in the foreground, catching highlights from the directional light.","color_palette":["#36454F","#5D4037"]},{"type":"obj","bbox":[50,50,200,250],"desc":"A piece of framed vintage art hanging on the wall, slightly out of focus, adding character to the room.","color_palette":["#4B0082","#696969"]},{"type":"obj","bbox":[750,100,950,350],"desc":"A cluster of vintage electronic devices (e.g., old radio or amplifier) resting on a surface in the midground, contributing to the cozy, cluttered atmosphere.","color_palette":["#2F4F4F","#A9A9A9","#8B4513"]}]}}
Не понимат, почему тут какое-то анрелейтед вместо моей порнухи. Так и должно быть? Генерит вроде норм и так. Вы сперва жсоны генерите и потом вручную их доводите или тоже автоматом скидываете дальше? Я даже хз, как поменять окончательный промпт тут.
>>1634310 а при чем тут 2026 геймчейнжер и клитор поясняй умный, выебнулся остротой смотри не порежся.
или может ты не знаешь что модель зацензурена, и даже обход фильтра генерит тебе кенов и барби без гениталий, а все гениталии это труды работяг, сча дотренят лоры и будет тебе норм гениталии, пока считай все это в бете
Как в идеограме управлять общим характером цветокора без использования хэш кодов конкретного цвета? Пробовал писать cinematic color grading, включая cold/warm слова, desaturated, в photo и в aesthetic. Не влияет вообще.
Так же заметил что от одного только разрешения существенно меняется глобальный объем освещения сцены и перспективы, где на 2мпх было более атмосферно и затенено на фоне, а в 3мпх он начинает прорисовывать фон детально ухудгая глубину. Причем f/5.6 в photo, ни на что не повлиял, расфокуса не появилось.
В общем хуево некоторые детали контролируются. И как ролить разный реализм не ясно, если уже и так стоит фото, хули ему еще нужео, стабильно выдант морковный скинтон и не достаточно реалистичный свет.
Я не против. Начну с оригиналов на FLUX.2 [dev] до рефайна на FLUX.2 [klein] 9B.
https://2ch.su/ai/src/1629238/17814288028530975006.png Вот на этом изображении обрезан персонаж робот справа. Микрошум это не имитация film grain (ну разве что, частично, при добавлении в prompt: Cinematic movie still, shot on ARRI Alexa 35), а шум квантования FP8. Точнее даже не совсем шум, болячка FLUX под названием «flux fuzz». Я только недавно это выяснил, когда смог запустить вариант FLUX.2 [dev] в BF16 с text encoder в BF16, которым в сумме нужно 94 Гбайт памяти. Это только в хайповом релизе в блоге NVIDIA были красивые bullshotы о том, что они специально отквантовали для ComfyUI FLUX.2 [dev] в FP8 mixed практически без потери качества на 60 Гбайт. Да уж. https://blogs.nvidia.com/blog/rtx-ai-garage-flux-2-comfyui/ Таких картинок на FLUX.2 [dev] я не получал. Вообще, замечаю, что Nvidia частенько не стесняется и постит bullshotы в подобных презентациях. Например здесь: https://research.nvidia.com/labs/sil/projects/pid/ Но, вернусь к изображению. Одинаковые дети или массовка, это беда. Если не promptить каждого персонажа, то будет подтянут ближайший, которые разнообразием не отличаются. Это касается всего. Не уверен, баг это или фича, но правило такое: хочешь что-то на изображении, описывай детально. Пиши простыню. На рандом надежды нет. Будет подтянут generic. Раздвоившийся указательный палец на правой руке у «жонглёра» исправлять не стал. Вообще, когда каждая генерация t2i на FLUX.2 [dev] на моей системе занимает порядка двух-трёх минут (как на Ideogram 4.0) лишние рероллы делать не очень хочется. «Точки притяжения» не легли ни на стандартное правило третей, ни сетку «золотого сечения». По идее, роботы — лишние. Жонглёра сдвинуть правее. Объекты для жонглирования разместить в других позициях. Детей заменить и разнообразить. Попытка получить cinema color grading с помощью: Shot on ARRI Alexa 35, в чём-то удалась, а в чём-то оказалась совсем не такой как ожидалось, даже провальной. Текстуры выглядят слоповато, не отрицаю. Как это вылечить, да и возможно ли, я не нашёл. FLUX.2 [dev] очень любит мылить текстуры и наваливать bokeh. С этим тоже приходится бороться с переменным успехом. Я не хочу стиль мыльницы из нулевых. Но сделать реал, а не фотореал на FLUX.2 [dev] особо не получается. С фотореалом на FLUX.2 [dev] тоже проблема. В общем что получилось, прорефайнил FLUX.2 [klein] 9B и запостил. Борьба с этой моделью утомляет. Она чем-то напоминает жирный Qwen из LLM треда. Куча недостатков, но есть ряд достоинств, поэтому ей продолжают по-мазохистски пользоваться те, у кого есть для этого железо.
FLUX.2 [dev] противоречивая модель. Я сижу на ней с релиза и держу из-за мощного edit, её знаний о моделях камер и параметрах съёмки, худо-бедно управляемым и послушным освещением (на Ideogram 4.0 хуже, особенно в bounding boxes, слушается prompt на освещение хуже), JSON-prompt с конструктором prompts (ещё в декабре 2025). При этом JSON-структура необязательна и небольшие prompts можно писать простым текстом. Теоретический лимит токенов на prompt — 32К. В облачном API обрезается до 5K. Prompts порядка 500 tokens на FLUX.2 [dev] работают точно. Возможно ли больше, специально не проверял. Я посмотрел в сторону Ideogram 4.0 для t2i, но когда начал эксперименитровать и увидел как она всирает мелкие детали, несколько разочаровался. Как временное решение увидел, что лучше делать bounding box размером со всё генерируемое изображение и в него вываливать весь prompt, кроме background. А если что-то добавлять bounding boxами, то только простое и без мелкой детальной геометрии. Мелкие детали страдают так, что их FLUX.2 [klein] рефайном не вытянуть порой. Сейчас ещё покручу BF16 FLUX.2 [dev] благо как-то удалось впихнуть. Оффлоад в RAM на 80+ Гбайт это тяжело и не быстро, по сравнению со всякими Z-Image-Turbo и даже FLUX.2 [klein] 9B turbo distill. (Flux2VAEFix — однопроходная генерация FLUX.2 [dev]; FLUX2dk — второй проход edit-refine FLUX.2 [klein] 9B).
>>1634330 Оно примерно никого не знает. КС и ЭУ - это самые вершки узнаваемости, да и у тех датасет засран пожилыми фотками. И удачи сделать их помоложе, там явно с максимальной тряской подходили к вопросу.
>>1634333 >На 3мпх еще больше искажений чем на 2 почему то Так и есть, больше мп = больше артефактов. А по времени разницы у меня лично нет, что 1мп что 2.
какие же всетаки пиздатые у идиотграма текстуры, жаль сцуки зажали и2и модель, столько можно было бы нафаниться с еот а так ток всяких селебных пезд генерить... эх бле
>>1629238 (OP) >>1634446 И кстати объясните мне нахера в рекомендациях gemma4_e4b_it если ее в воркфлоу даже нет? Две модели+квен, а гемма нахера?
И что это за хуита в промпте написана в std воркфлоу? { "type": "obj", "bbox": [287, 210, 756, 819], "desc": "A sharp photographic cutout of a skateboarder mid-air in a relaxed pose. He wears loose-fitting washed denim jeans and a plain white tee, appearing to effortlessly float above the concrete ramp. A distinct white cutout border surrounds his silhouette.", "color_palette": ["#FDFDFD", "#657C9C", "#2B2B2B", "#DCA57D"] }, { "type": "obj", "bbox": [773, 39, 973, 187], "desc": "A surreal, miniature floating skateboard cutout, positioned playfully in the upper right sky as if defying gravity.", "color_palette": ["#D2A679", "#2B2B2B", "#C82A2A"] },
>>1634353 Нормально зрителям досталось. Отличный пример того, что Ideogram 4.0 в текущем виде делает с геометрией. Он и на крупных объектах корёжит, но на 1girl во всё изображение это не так заметно с первого взгляда. Если это не починить, то результат больше подходит для технодемо, а не для практического применения. Вопрос в том, это сделано намеренно или это какие-то неверные настройки sampler/scheduler (хотя я и другие пробовал), или так должно быть у этой модели by design?
>>1634462 это так у всех моделей, которые не генерят в 4k сразу. так всегда было - чем дальше в фоне находится объект, тем меньше пикселей на него приходится, а значит и хуже качество, модель просто не вытягивает генерировать что-то с меньшим количеством пикселей, так как и в реальной жизни мало пискелей = хуже качество.
лечится обычным апскейлом, который сейчас уже внедрен в каждый пропритарный онлайн сервис, а на лоКАЛе нужно добавлять в форклоу отдельно.
>>1634462 >у этой модели by design? Это у всех моделей так. Либо пидорасит, потому что на каждое лицо не хватит ресурсов, либо делает десяток одинаковых клонов. Без костылей нарисовать много разных лиц не выходит.
Я в эту часть особенно не вникал, но в workflow есть ещё кусок для генерации JSON-promt с помощью LLM. Возможно, это для него локальная LLM, как вариант без облачного API.
>в промпте написана
Чего непонятного? Два bounding box с координатами. В одном прописан персонаж-скейтер, во втором — скейт под ним. По таким кусочкам с мини-prompts и должно по задумке разработчиков строиться изображение на Ideogram 4.0. Это тот самый «полный контроль», а не то, что я на FLUX.2 [dev] могу сказать: слева/справа, сверху/снизу, над/под, передний план/фон, и модель сама всё расставит как-нибудь, криво и с нарушением правил композиции.
>>1634438 Те самые, которых у флаксов базовых не существует. Ты их не видишь из за искажений идеограма в деталях, вероятно высматривая резкость с лупой.
Я заметил что их даже текстурный файнтюн клейна не может улучшить оставляя как есть. Вероятно неоднородность, реалистичной освещение и более реалистичные шумы дают более живые и натуральные текстуры. Если бы не проблемы с чрезмерными шумами и искажениями - картинка была чистая как во флаксе, и при этом на голову реалистичнее даже без лор.
> Примеры будут? Глаза открой, весь тред засран идеограммом, и рядом лежит слоп флакса Klein / DEV >>1634341>>1631335 в котором слоп читается во всем кадре глобально и это не лечится, и не имеет ценности в кейсах с фотореализмом. Идеограм умеет в хороший реализм из коробки, пусть и грязновато. Но этим и ZIT грешит
>>1634473 Не защищаю флюксоёба, но у него просто нет ни вкуса, ни чувства меры. FLUX2 как модель может и правда хороша, примеры прост неудачные, но запускать её у меня, например, ресурса нет.
На FLUX.2 [dev] на генерации в 2K это выражено меньше. Массовка дальнего плана там прорисовывается лучше и её так не корёжит. Но там другая проблема, я писал, из-за flux fuzz лица могут потерять детали и превратиться в пиксельную кашу.
Нормальный апскейл я пока не увидел, хотя пробовал и шустрый upscale by model с remacri и ещё одной, SeedVR2 (практически с релиза; лучший результат) и superresolution от Nvidia. Результатам потом всё равно нужен i2i, чтобы убрать огрехи апскейла. А это уже третий шаг в небыстром процессе.
Для FLUX.2 [dev] сейчас остановился на апскейле тайлов, их edit-рефайне и склеиванию обратно в исходное разрешение. Надувать выше 4K при текущем уровне качества вряд ли стоит.
>>1634476 а че хотел та так и не сказал я сам юзаю файтюн клейна от Big Love в эдите, который мне нравится больше стандартных и всяких говномержей, но даже с последующим рефайном он не дает такого ощущения от картинки. один хер модель любит навалить слопа. Можно конечно попытаться минимизировать это, но что есть то есть.
В идиотграме, комбинация освещения, шумов и текстур дает меньшее ощущение нейрослопа от картинки.
>>1634455 >нахера в рекомендациях gemma4_e4b_it если ее в воркфлоу даже нет Это бесячий долбоебизм разработчика. Это БАГ который, как бревно в глазу. Я далее не знаю как ещё описать. Там должна быть выбор модели для ноды textgen. Уже сколько идеограм вышел. Новые пользователи прибывают. Уже Комфи обновился до 0.25 и ВСЁ РАВНО НЕ ИСПРАВИЛИ. Открываешь шаблон и хрен там. Кто не знает ваше не догадается, как ты например. Смотри на предыдущей теме мне дали исправленный воркфлоу. Но это пздц, согласись? Я делаю вывод, что разработчики сами не пользуются своей программой. Как и весь попенсор(гном, кде, и прочее). Как можно пропустить такой баг?
>>1634509 хуишью, я тебе это сказал как фанат и любитель клейна, который тонны разных эдитов нагенерил, и поюзал каждый говномерж, тюн и прочую залупу, даже 10 бачей на тензоре вкинул чтоб скачать там файтюн клейна, который ублюдок сделал за пейволом, люблю эту суку, эдит на ней мне нравится, но что есть то есть. Мне бы эдитмодель идиограмма, но её скорее в опен сорс не высрут, если конешь вдруг высрут, открою шампанское. Превьюхи у нее хотяб обещающие
>>1634507 SNOFS, Realism Engine или их комбинация, на цивите уже насрали лорами
идеограм даже средний палец отказывается показывать, цвет и тип/формат реализма не ролит почти никак, стабильное что то не совсем то, скинтон тоже не очень адекватный делает палитра через HEX влияет, но не решает особо проблем
>>1634525 > идеограм даже средний палец отказывается показывать, Даже с Qwen3VL-8B-Uncensored-HauhauCS-Aggressive и No safety filter. Не работает. Тянет руку с указательным пальцем просто. Кринж
СкиловикиИ тех вопрос ? Пробовал ли к Z имаге B-box прикрутуть, вроде как она понимает лева, вправа, верху, внизу. Структурки тоже хорошо думает. Если смысл пробовать а то лень чет
>>1634571 ну я сначала поплевался, убрал модель в долгий ящик, потом накатил пару лор в малых весах, вставил FLUX Identity Adjuster, добавил рефайн через другую модель и стало нормально. таки 3 версия клейна от туда меня в итоге порадовала, правда ноду шедулера я таки взял под флюксу2 заточеную. хуй знает че тебе не нравится, привередливый какой то наверно, но других вариантов получше пока нет в попен сорсе
>>1634574 ты просто делаешь маленький бокс с кулаком, к нему вставляешь маленький бокс колбаску с описанием только средний палец, и все проблем нет, тебе для этого и дали насирать там боксов сколько хочешь, можно сделать одельные боксы для положения головы, одежды, движений жестов, акцентов кадра и прочего. В общий бокс перса ты считай просто пишешь общее расположение обьекта, а малнькими по необходимости добиваешь то что нужно уже конкретно
>>1634586 >под флюксу2 заточеную Об этом уже тёрли здесь, это тот-же сраный симпл. Единственный шедюдер выдающий нечто более отличное от унылого симпл-нормал, это ddm_uniform, но бывает такое, что на некоторых сидах он наровит положить болт на анатомию даже на зетке, а уж на кляйне так за здрасьте. Имеет смысл рисовать концепт на ddm, а затем где-то 5 шаге передать на симпл, в результате будет неожиданный (не типичный) сид с качественной деталировкой.
Какие варианты style_description работают лучше по качеству/реализму?
3mpx и больше будто бы только ухудшают качество, хоть и увеличивают плотность деталей. Супер странное поведение. Есть ощущение, что модель коряво работает в воркфлоу комфи и с теми дефолтными параметрами CFG
>>1634609 ну я тестил много связок, и там разница небольшая таки есть в пользу этой ноды, я не прям спец по кишкам комфи, но итоговый вариант был чуть лучше чем с просто симплом, мне еще там отдельно сид2, лпм и дпмпп2 заходит, но там с клейном в целом везде не без нюансов....
>ddm_uniform чет не помню результатов с ним, над будет прогнать пару разков чтоли
В общем не получилось у меня нихуя, можете ликовать радоваться. Тянет рисованный слоп, скинтон стабильно ебучий, контрастность и насыщенность хуево контролируются. Еще и грязь лишняя во многих конфигурациях разрешения /профиля подсирает через раз. И ладно бы цвет, но реализм нужного уровня не цепляется никак. Выше 2mpx картинка стабильно деградирует, причем на 1mpx освещение и реализм может рольнуть лучше чем на 2mpx. Рефайн клейном почему то с идеограмом не помогает - что сильно удивляет. Обычно true v2 в едите выдавал реалистичный свет и наваливал текстур на что угодно, но именно на сцены идеограма - он наваливает свой слоп, толком нихуя не улучшая. Хотел просто реалистично киношный кадр с заполненной сценой. Если бы идеограмм смог - это был могло бы встать на уровень GPT2 или даже лучше, т.к. GPT2 не стабилен в реализме и имеет заметные артефакты. Жаль. Но это все равно next gen в сравнении с flux2.
Сижу на дефолтном воркфлоу от комфи, CFG 7 > 3, Оставлю промт тут {"high_level_description":"A cinematic film still of real people and steampunk automatons on a city street, with immersive atmosphere and details in cinematic composition.","style_description":{"aesthetics":" victorian era steampunk, realism, cinematic color grading, natural skin tone","lighting":"overcast daylight, warm gas-lamp local glows","photo":"35mm lens, f/3.5, eye-level camera, flat film profile, cinematic motion blur","medium":"photograph","color_palette":["#A68053","#D9B88F","#403022","#734B34","#0D0D0D"]},"compositional_deconstruction":{"background":"A wide old-city street transformed by steampunk industry: ornate iron facades, brass pipes running along buildings, steam vents releasing white haze, gas lamps glowing along the sidewalk, wrought-iron balconies, cobblestones wet from recent rain, subtle smoke drifting between the buildings. The scene feels like a frame from an expensive historical sci-fi film, grounded in realism and lived-in detail.","elements":[{"type":"obj","bbox":[349,364,998,717],"desc":"The human protagonist stands in the foreground, slightly recessed behind the automaton and turned toward it, with a subtle three-quarter angle toward the camera. He wearing a tailored dark wool coat, leather gloves, and a high-collared scarf. He is warmly shaking hands with a automaton nearby. Their expression is serious and focused, as if confronting something extraordinary. Subtle weathering on clothing."},{"type":"obj","bbox":[276,0,1000,456],"desc":"Two automatons near the protagonist are casually interacting with him, made of brass, iron, and exposed mechanical joints. Their design is a mix of steampunk and victorian aestetics. One is tall and technogically advanced with articulated fingers and mechanical components and hydraulics exposed shaking hand with the human; the other is bulkier with piston-driven shoulders, riveted plating, and a faint release of steam from its chest vents. They should feel physically believable and integrated into the scene."},{"type":"obj","bbox":[0,0,558,1000],"desc":"The city street environment extending into depth, with pedestrians in period-inspired victorian clothing reacting with curiosity and caution, horse-drawn carts in the distance, steam drifting through the frame, and strong perspective lines leading toward the vanishing point."},{"type":"obj","bbox":[328,184,1000,1000],"desc":"In the foreground and midground, pedestrians wearing detailed Victorian clothing casually go about their business"},{"type":"obj","bbox":[0,340,511,795],"desc":"The street opens into a deep rule of thirds composition perspective, revealing majestic detailed Gothic architecture blended with industrial steampunk elements looming in the far distance. "}]}}
>>1634650 >Their design is a mix of steampunk and victorian aestetics. Вот это обсёр. Идиограм не знает даже что такое стимпанк. Вот твой робот в клйне 9б дистилл за наносек сделанный
>>1634668 Спасибо учту. Твой вариант - слоп неизлечимый, ты не видишь что он параша еще большая? Если нет, то бессмысленно это обсуждать. Я генерил это на клейнах еще 2 месяца назад. Мне проще удалить Comfy UI чем генерить такое. Идеограм подавал надежды, но именно эту сцену не дотянул до реализма уровня ZIT или GPT
>>1634673 Зит всегда был хорош в реализме, но мне всегда что то не нравится в его образах и построении, шуме деталей. Вот такое бы освещение идеограму и была бы имба. Мб мой промт содержит какие то ключевые ошибки в настройках освещения / фото, цепляет не совсем тот стиль. Попробую с нулям мб поролить промты потом, но пока устал биться
отрефайнил кляном >>1634678 >>1634682 > ты не видишь что он параша еще большая? Ты что-то у себя в голове домыслил из-за фанбойства. Я тебе просто показал как обосрался на стиле стимпанка идеограм. Я вообще клал болт на все эти модели, они все говно как по мне и флюскал и зиткал и идеокал. Слоп он и есть слоп. Ждём нормального чего-то, а пока за обе щёки жрём говно что дают с лопаты плебсам.
>>1634684 Тебе смешно, а у меня травма. Как же так, даже только что вышедшая нонейм ьуга и то знает стимпанк, а великий идеограм гейчленжер 100б не знает... Не хорошо получилось ((9
>>1634687 > Ты что-то у себя в голове домыслил У тебя явно беда с видением и градациями. Как у того чела, который лучшие результаты 1girl сравнивает с полторашкой как идентичные. Твоей клейн генерит чистый слоп в стиле реализма, хуже чем гемини. Идеограм генерит в одном шаге от реализма, клейн никогда до этого не дотянется, и по освещению и по наполнению/компановке. Иногда кажется что ты жестко тролишь тупостью
>>1634691 >Твоей клейн Хуя шиза. Ещё раз перечитай мой посыл. Мне поебать на модели что сейчас есть и флюс 2 такой же кал. Напиши ещё раз, я тебе не поленюсь снова это ответить. Это моя борьба добра с говном >>1634687 >ты что-то у себя в голове домыслил
>>1634690 > а великий идеограм гейчленжер 100б не знает ну вообще то это 9б обрубок, че ты там себе напридумывал то.... ну и надо покапаться в промпте, может чтото делаешь не так, а может просто стим панк не уместился в датасете, как всегда работяги допилят лорами короч
>>1634693 > стим панк не уместился в датасете Особо не всрался мне этот стимпанк в датасете. Важно как он мерджит и цепляет образы. Нахуя не всрался какой то конкретный стимпанк или что угодно. Я уже насмотрелся на то, как клейн обучили киберпанку на сто процентном слопе - в итоге в его присутсвии нельзя произносить слово киберпанк или футуристик - иначе эта гнида начинает рисовать ультраслоп.
Вот такая же ерунда может произойти с чем угодно, если модель обучают какому то сеттингу на каком то дроченном датасете. Важнее как он синтезирует знания. Стимпанк собирается по сути на знания механики, викторианской стилистики, архитектуры, исторических образах. Идеограм на автоматоны цепляет образы железного человека, и это конечно хуево, но я и не пытался проработать это промтом, мне похуй на этих роботов, если он не может полноценно киношную сцену нарисовать.
Идеограм всё равно лучше это делает чем все модели, не считая ZIT который умудряется цеплять максимальный реализм в такой хуйне.
>>1634668 > Идиограм не знает даже что такое стимпанк. Причем здесь знание какого то сеттинга вообще, если он фактически это и так рисует, а проблема в реализме освещения и деталей?
>>1634724 >>1634700 > Optimized for photorealistic quality Вам примера мало? Это хуже чем клейн. Клейн уже и так рисовал фотореалистичных баб в любых позах через edit refine с лорами.
Единственное что там может быть интересно это thinking mode. Опять же в поисках моделей с ризонингом, который может интерпретировать и придумывать что то сам. Но вероятней всего это просто очередная пустышка
>>1634439 >скорей всего портит качество А может быть наоборот улучшает, ибо некоторые методы намеренно ломают анкондишн как-раз с этой целью. Но может будет и хуже, да, если будет недостаточно анкондишн. Надо брать жирнее лору, там обучать ничего не надо, она просто через разницу и svd делается, главное чтобы была полная лора с всеми слоями и нормами.
>>1634720 >Подскажите, есть ли разница в очередности лор и какая у этого логика? Лоры это математически сложение, так что от перестановки слагаемых сумма не меняется.
УХХ ЕБАТЬ zit с клейном генерили фото-неотличимых голых тян уже год, теперь то же самое на идеограмме делать со встроенным эффектом артефактов камеры Lenovo
анима+клейн всё равно пизже делает, а фантазия и композинг анимы вероятно лучше идеограма, так что разве что вот такие работы >>1634842 мб удобней в идеограмме делать, за счет ебейшего контроля которого нет у анимы, но сможет ли идеограм фантазировать и строить композицию без квадратов? строить композицию в голове когда даже не знаешь и не видишь в голове её до конца достаточно проблематично, так что эти квадраты в идеограме больше для постеров и текста нужны, а сможет ли она сама композицию размышлять?
Единственный жирный плюс идеограма - стабильная анатомия, интеракция рук, низкий % ошибок геометрии и явных ляпов. Это в каком то смысле окупает даже долгую генерацию. Жаль контроль за светом и цветокоррекцией скудная. Даже назначая палитру получаешь хуевые цвета, не умеет работать с цветом. Возможно он берет точный HEX и втупую применяет его в раскрашивании, не адаптируя оттенки и тональность. Выпустили бы лору или тулзу для работы с цветом, было бы заебись.
Это и клейн едиту не хватает. Дауны такой потенциал проебали, не продумав методы четкого контроля за глобальными параметрами картинки. Танцы с бубном и гринд сида получается.
>>1634865 >а сможет ли Никто не может, только текстовая размыляющая модель может работать лишь на серверных мощностях.
По поводу рефайна анимы: Я ещё на сдохле генерил на анимешных моделях на 1-2 шага, а дальше реалистик модель подхватывала концепт, и было достаточно прикольно, аниме модели прекрасно чувствуют, на свой манер конечно, композицию, более эмоциональные, и зачастую знают больше. Если у тебя памяти 64 гига можно попробовать провернуть что-то похожее.
>>1634877 >Это и клейн едиту не хватает. Танцы с бубном и гринд сида получается.
А вдруг это не баг а фича, еще анатомию нахуй сломали, чтоб ты палкой заставлял этого ублюдка генерить нормально, чисто чтоб поинтереснее было генерить, а то будет генерить пиздато, еще и насытишься не дай бог такими красотами
>>1634882 > Никто не может, только текстовая размыляющая модель может работать лишь на серверных мощностях. Анима может, хоть и стабильности нет. Идеограм я еще не тестил но есть ощущение что он чувствует лучше
>>1634887 нет, скорей там просто соевые дауны, поэтому у них уебищные текстуры пластиковые на всех моделях включая DEV, копипастная генерация ублюдочная унылая
>>1634910 This LoRA will turn Ideogram 4 into a few step model. It is capable of generating good quality images in as little as 2 steps with no CFG and no unconditional model. It was created with a continuious turbo training method I am working on and still perfecting. I will release more information on that once it is fully polished. This will likely recieve updated versions as the method improves.
ну если попиздить клейн палкой..... правда у кляйна это и2и по референсу, и тут хоть можно еот поюзать что таки плюс но клейн сук не может нормально генерить в уже 2мп хотя сама флюкса2 поддерживает до 4 если прально помню... (если еще и не апскейлит то у флюкса там есть свой шарм таки, правда мутноватый...)
У идиотограма контроль конеш попизже не поспоришь, куда захотел руку поместить, там она и будет
Ну и таки ген в 3 мп дает о себе знать, ублюдок на клейне на 2мп готов разъебать всю анатомию по пизде
>>1634913 на любую модель слопа накатят, но судя по превью, ну его нахуй конеш
>>1634900 Никто ничего не чувствует, модель просто перерисовывает Сид наиболее близкий, как ей кажется, по смыслу. Блядь, оно просто находит картинку близкую по содержанию, и вносит минимальные коррективы.
>>1635035 Это Img2Img (с опциональным хайрезом; иногда по тайлам) в надежде, что модель выправит мелкие огрехи генерации типа слегка неправильной геометрии пальцев, очень мелкие детали. А также починит текстуры, придав им большей убедительности.
>>1635042 Но погоди а почему не едит просто? Загрузить пикчу в клейн едит например, лору на члены или SNOFS какой нибудь и попросить поправить, не вариант?
>>1635047 Не вариант. Edit работает по всему изображению и не всегда может обработать конкретную область (даже на FLUX.2 [dev]). Поэтому берёшь узлы Crop and Stitch, выделяешь маской определённую область. Её масштабирует в целевое, более высокое разрешение. И уже в этой области проходит edit. Потом обработанный фрагмент узлами Crop and Stitch масштабируется обратно и вклеивается бесшовно в исходное изображение.
>>1634910 Потестил, реально работает. Иногда даже на 2-х шагах норм выдает, но в точную внешку не попадает. 3 шага - уже есть шанс на похожесть. 4 шага норм. По итогам ускорение в 3-4 раза. Что касается силы лоры, не увидел смысла менять с 1. На 0.5 не всирает, но теряется характерная текстура. На 1.5 всирает.