Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1433480 (OP) Возможно тупой вопрос но насколько критично отсутствие видюхи? RAM 32, i9 13gen текстовые копайлоты более-менее пашут. ебнутая скорость/качество не нужны 512х512 достаточно, надо редачить картинки по промпту, будет ли это адекватно работать (условно до получаса) или без cuda это часы?
Google antigravity /ai/
Аноним30/11/25 Вск 21:28:16№1436633Ответ
Под БАЗУ нейрогенерации уже созданы номерные треды SD и WD+NAI. Меж тем, это всего несколько моделей, тогда как только на Фэйсе их более 112 тысяч. Этот тред для тех, кто копнул хоть немного глубже: необязательно до уровня обскурщины, выпиленной даже из даркнета, а просто за пределами того, что удостоилось своих тредов. ИТТ делимся находками и произведенными результатами.
Хочу поделиться своими лорами (персов), в основном sdxl, которые уже недоступны на civitai, и на seaarte найти их ещё можно, но некоторые уже не ищутся по ключевым словам. Короче нужен список из нескольких файлообменников, желательно с историей и положительным кейсо. Порекомендуйте что-нибудь. Я до недавнего юзал мегу, но они поставили затычку для пидарахии, ров с крокодилами уже не за горами, не знаю куда глядеть.
📰 Топ новостей в области ИИ GPT‑5 ускоряет научные исследования, однако OpenAI предупреждает, что он не способен работать автономно, подчеркивая прогресс без неминуемого появления ИИ общего назначения (AGI).
Google запускает Nano Banana Pro — генератор изображений на базе Gemini‑3, обеспечивающий разрешение 4K и привязку к результатам веб-поиска, при этом стоимость составляет $0,139 за изображение в разрешении 1080p/2K и $0,24 за изображение в 4K.
Google демонстрирует возможности генерации изображений Gemini3 Pro, добавляя точную визуализацию текста и расширенные творческие инструменты управления для разработчиков.
🧠 Модели Nano Banana Pro предлагает изображения более высокого качества в разрешении 4K, улучшенную визуализацию текста и привязку к результатам ИИ-поиска, однако сопровождается более высокой задержкой и стоимостью за изображение.
Gemini3 проходит тесты по 3D-визуализации и автоматизации задач, но уступает в детализации и скорости, что выявляет ограничения флагманской мультимодальной модели.
Пользователи раннего доступа сообщают об ошибке «запах модели» («model smell») в Gemini3, подчеркивая трудности, возникающие при внедрении в реальных условиях.
📦 Продукты Google добавляет проверку водяных знаков SynthID в приложение Gemini, позволяя пользователям запрашивать, является ли изображение сгенерированным ИИ, и планирует расширить функционал на видео и аудио.
OpenAI запускает групповые чаты ChatGPT по всему миру, поддерживающие до 20 участников и работающие на базе GPT‑5.1 Auto для адаптивного выбора модели.
ChatGPT Atlas получает обновления интерфейса, включая вертикальные вкладки и встроенную интеграцию поиска Google, что улучшает рабочие процессы для продвинутых пользователей.
🔓 Открытое ПО Sber AI публикует предварительную версию GigaChat3‑702B‑A36B — MoE-модели с 702 миллиардами параметров и 36 миллиардами активных параметров, размещенную на Hugging Face.
SAM3 представляет Promptable Concept Segmentation (PCS) — сегментацию по задаваемым понятиям, расширяющую возможности сегментации по сравнению с предыдущими версиями SAM.
AllenAI выпускает набор Olmo‑3, включающий 32‑миллиардную модель «Think», а также полные обучающие данные и код для задач рассуждения, общения и использования инструментов.
💰 Финансирование Финская компания NestAI привлекает €100 миллионов и заключает партнерство с Nokia для разработки ИИ в сфере беспилотных транспортных средств и обороны, продвигая суверенитет Европы в области ИИ. Suno привлекает $250 миллионов при оценке в $2,45 миллиарда для расширения инструментов генерации музыки с помощью ИИ, несмотря на текущие судебные разбирательства.
TCS и TPG финансируют $1 миллиард из запланированных $2 миллиардов на строительство гигаваттной сети дата-центров «HyperVault» в Индии для сокращения дефицита вычислительных мощностей для ИИ.
📱 Приложения Meta запускает общедоступные комнаты Hyperscape для групп до восьми пользователей, продвигаясь к социальным метавселенным.
Amazon Prime Video тестирует автоматически генерируемые ИИ краткие пересказы эпизодов, которые объединяют ключевые сцены с повествованием, помогая зрителям быстро наверстать упущенное.
Система сортировки Sortera на базе ИИ достигает точности более 95 % в классификации марок алюминия, раскрывая неосвоенный потенциал переработки и достигая положительного денежного потока.
🏭 Компании Янн Лекун покидает Meta спустя 12 лет, чтобы основать компанию, ориентированную на передовой машинный интеллект на основе визуального обучения, знаменуя переход от исследований, сосредоточенных на больших языковых моделях (LLM).
Cisco запускает инициативу Resilient Infrastructure, предупреждая, что устаревшее сетевое оборудование создает угрозы безопасности, и объявляет о завершении жизненного цикла для устаревших устройств.
⚖️ Регулирование Бывший президент Трамп разрабатывает указ о создании «Целевой группы по судебным разбирательствам в сфере ИИ» для подачи исков против штатов, чьи нормативные акты в области ИИ могут противоречить федеральному законодательству.
Аналитики критикуют закон ЕС об ИИ за неясные механизмы реализации, предполагая, что блок может столкнуться с трудностями при формировании надежного стандарта в сфере ИИ.
🛠️ Инструменты для разработчиков Microsoft обновляет PowerToys Advanced Paste, добавив возможность запуска локальных ИИ-моделей через Foundry Local или Ollama, что позволяет выполнять такие задачи, как перевод и суммаризация, без обращения к облачным сервисам.
Теперь инструмент поддерживает несколько провайдеров (Azure OpenAI, Gemini, Mistral) и включает графический интерфейс выбора модели, предоставляя разработчикам большую гибкость.
📰 Мнения и аналитика Маркетологам необходимо перейти от KPI, основанных на кликах, к сигналаам видимости в ИИ-поиске (показы, цитирования), поскольку ответы ИИ формируют трафик более высокого качества.
План Microsoft внедрить автономных агентов в Windows вызывает негативную реакцию пользователей из-за опасений потери контроля, что влечет дискуссию о будущем дизайна операционных систем.
🧪 Исследования NVIDIA и TDAI выпускают BioCLIP2 — фундаментальную модель, обученную на 214 миллионах изображений организмов и способную классифицировать виды, пол, возраст и состояние здоровья; модель доступна в открытом исходном коде.
Инженеры по составлению промптов отмечают «распад структуры» (structure decay): повторные вызовы модели приводят к дрейфу тональности, что подчеркивает проблемы стабильности при использовании LLM.
📰 Инструменты YardStyling превращает фотографии участков в профессиональные концепции ландшафтного дизайна с помощью генеративного ИИ.
Dealism.ai предлагает ИИ-ассистента продаж для WhatsApp Business, который ведет круглосуточный диалог с клиентами, имитируя человеческое общение.
ITKDocuments обеспечивает анализ контрактов с помощью ИИ для проверки соответствия нормам и автоматизации рабочих процессов. Библиотека для выполнения кода, совместимая с Claude, обеспечивает безопасный запуск сценариев в рамках агентных фреймворков.
📰 Краткая статистика GPT‑5 обеспечивает работу групповых чатов ChatGPT, поддерживая до 20 участников.
Nano Banana Pro стоит $0,139 за изображение в разрешении 1080p/2K и $0,24 за изображение в 4K.
Предварительная версия GigaChat3 имеет 702 млрд параметров и 36 млрд активных параметров в MoE-архитектуре.
NestAI привлекла €100 млн на разработку оборонного ИИ.
BioCLIP2 обучена на 214 млн изображениях и способна идентифицировать более 1 млн видов (NVIDIA).
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
Подскажите ньюфагу какие модельки я могу накатить с таким спеком (для таверны), пока щупал только модельки на опенроутере, гайд по моделям читал но нихуя не понял (там видеопамять указывается или оперативная), подскажите анончики. 32 Гб ddr5 5070ti
Оффлайн модели для картинок: Stable Diffusion, Flux, Wan-Video (да), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana Оффлайн модели для анимации: Wan-Video, HunyuanVideo, Lightrics (LTXV), Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimateDiff, Stable Video Diffusion Приложения: ComfyUI и остальные (Fooocus, webui-forge, InvokeAI)
>>1433532 >запрет на коммерческое использование или именно тренировку с коммерческими целями хз, где ты это увидел. они уже сделали отметку что это Apache 2 лицензия. Если они уже выложили так, то не могут существовать какие-либо другие выдуманные ограничения, так как Apache 2 покрывает все моменты и сверху ничего добавлять самому нельзя если используешь стандартную лицензию.
Недавно в бредаче всплыл интересный тред посвященный генератору постов двача на основе ИИ. И генератор совершенно не хуйня и он вполне себе хорошо копирует слог среднего анона и даже превосходит его. "Аноны" метко подшучивают над опом и темой его поста и если развитие проектов такого типа продолжиться то каждый "анон" в сгенереном треде будет иметь свое мнение и личность и можно будет уже самому с ними посраться, появятся шизы. Хочу создать тред исключительно по данной теме, если это продвинется дальше то каждый сможет иметь свой офлайн двач с куклами, пони, бесконечными консолесрачами и постами в стиле того самого без всяких новомодных течений. Можно будет вернуться в любую эпоху и имитировать даже несуществующие эпохи двача типа если бы двач существовал при царе Рюрике, Сталине и тд. Все приведено естественно как пример. Также реквестирую в тред любые материалы по теме генерации борд в режиме реального времени если они у вас имеются.
>>930555 (OP) А чо ты удивляешься? На Дваче нету оригинальных мыслителей, нету людей со своим стилем письма. Все одинаковые как тубаретки в магазине. Поэтому и компилятору просто закосить под серость. Знай стандартными фразами манипулируй.
AI Chatbot General № 767 /aicg/
Аноним27/11/25 Чтв 13:34:35№1432054Ответ
>>1431676 3 и 4 пики стендинг 1 герл, да пиздоглазик? >>1431681 >>1431689 Гомоконфочушки лол. Похоже этот тред окрысился со временем, давно не заходил. А раньше было душевно, все хвалили друг друга и делились знаниями.
>>1431661 >Как бы нейрофажить, чтоб не только душевно хорошо стало, но и материально? Ты можешь к примеру поработать на потогонку-галеру из ОАЭ, которая переквалифицировалась с эксплуатации дешёвых рисовак на ещё более дешёвые нейрогенерации.
Или вести сетку каналов, если понимаешь как раскручиваться (судя по посту, не понимаешь).
FLUX.2 ДРОПНУЛ! 32 МИЛЛИАРДА ПАРАМЕТРОВ. ПРОВЕРЯЙ СВОЙ VRAM, НУЖНО 64 ГБ
Аноним# OP26/11/25 Срд 12:08:58№1430679Ответ
Black Forest Labs выпустили FLUX.2 — новую серию моделей генерации изображений, представленную как передовая система «визуального интеллекта». Это совершенно новая модель с новой архитектурой, которая была обучена с нуля. FLUX.2 не является простой заменой или итеративным обновлением FLUX.1.
1. КОЛОССАЛЬНЫЙ МАСШТАБ И ПАМЯТЬ. FLUX.2 (версии Dev/Pro) обладает беспрецедентным масштабом в 32 миллиарда параметров (32B). Это значительный скачок по сравнению с FLUX.1 (12B параметров). 2. ТРЕБОВАНИЯ VRAM. Для полной загрузки модели в стандартной точности (FP16/BF16), она требует более 80 ГБ VRAM. Даже в режиме с низким потреблением VRAM (lowVRAM mode) требование составляет 64 ГБ VRAM. 3. VRAM — БИНАРНЫЙ КРИТЕРИЙ. Объем VRAM является самым критическим аппаратным ресурсом, поскольку это бинарный критерий ("работает" / "не работает эффективно"). 4. СКОРОСТЬ УБИВАЕТ ОФФЛОАДИНГ. Если веса модели не помещаются в VRAM, система вынуждена использовать механизм Weight Streaming (потоковая передача) из системной RAM. Поскольку пропускная способность системной RAM в 15–20 раз ниже, чем у VRAM, это приводит к катастрофическому падению производительности, увеличивая время генерации изображения с секунд до минут.
### Решения для локального запуска
ОПТИМИЗАЦИЯ FP8. NVIDIA и Black Forest Labs сотрудничали для квантования модели в формат FP8, который снижает требования к VRAM на 40% (до ~38–44 ГБ). Флагманская RTX 5090 (32 ГБ) считается лучшей видеокартой для FLUX.2 на потребительском рынке. КВАНТОВАНИЕ NF4/GGUF Q4. Владельцы карт с 24 ГБ VRAM (RTX 4090, RTX 3090) могут использовать 4-битное квантование, такое как NF4 / GGUF Q4, которое снижает требование до ~20–24 ГБ VRAM. СИСТЕМНАЯ RAM. Поскольку модель редко помещается в VRAM потребительских карт, системная оперативная память (RAM) становится критически важной. При агрессивном оффлоадинге потребление RAM может достигать 40 ГБ и выше. Для стабильной работы настоятельно рекомендуется иметь 64 ГБ оперативной памяти (RAM).
### Революционные возможности
Мульти-референс. Модель имеет нативную поддержку использования множества изображений в качестве входных данных, позволяя ссылаться до 10 изображений одновременно. Эта функция обеспечивает лучшую согласованность персонажей, продуктов и стиля. Гиперреализм 4MP. Поддерживается генерация и редактирование изображений в разрешении до 4 мегапикселей (4MP), что позволяет создавать фотореалистичные изображения даже в большом масштабе. Точная Типографика. FLUX.2 превосходит конкурентов в области рендеринга текста, надежно создавая сложную типографику, инфографику, логотипы и макеты UI/UX с разборчивым мелким текстом. Хирургический Контроль. Поддерживается структурированный JSON-промптинг для точного контроля над композицией и деталями камеры, а также возможность указания точных цветов, используя HEX-коды. УПРАВЛЕНИЕ СКОРОСТЬЮ. Версия FLUX.2 [flex] позволяет регулировать количество шагов (inference steps) и шкалу руководства (guidance scale tuning), чтобы обменивать скорость на точность.
ГДЕ БРАТЬ: Открытые веса FLUX.2 [dev] (32B) доступны для сообщества. Модель поддерживается в ComfyUI, который является самой мощной и модульной GUI для диффузионных моделей и имеет функции оффлоадинга и квантования.
*
Представьте, что FLUX.2 — это профессиональная студия фотопечати, которая может работать с изображениями 4MP. Она требует, чтобы исходные файлы (веса модели) были загружены в супербыструю память (VRAM), но объем этих файлов (до 90 ГБ) настолько велик, что ваш домашний ПК не может вместить их целиком. Приходится постоянно подкачивать данные с медленной системной памяти (RAM), из-за чего печать одной фотографии (генерация) занимает минуты вместо секунд.
Вышла версия 1.5 Allegro, по функционалу то же, что и 1.5, только в два раза быстрее. Лимит 400 кредитов в месяц (или 200 генераций по 33 секунды каждая) при условии ежедневного захода на сайт - 100 кредитов даются в месяц, и еще 10 кредитов даются ежедневно. Также можно фармить кредиты, выполняя специальные задания по оцениванию качества рандомных треков, это дает не больше 10 дополнительных кредитов в день. Для большего числа кредитов и более продвинутых фич типа инпэйнтинга или генерации с загруженного аудио нужно платить. Появилась возможность генерировать треки по 2 минуты 11 секунд, не больше 3 длинных треков (по 2 версии на каждый трек) в день на бесплатном тарифе.
Новинка, по качеству звука на уровне Суно или чуть выше. Лучший по качеству генератор текстов на русском. Количество генераций в день не ограничено, но за некоторые функции нужно платить (загрузку аудио, стемов и т.д.)
Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.
Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промпта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:
______________ Напомню мега-сайт для сочинения аутентичных англоязычных текстов для ИИ-музыки в стиле известных групп и артистов от Пинк Флойда до Эминема. Зайти можно только через Дискорд.
>>1429850 А я не знал, что тема "Предзимье". Держите, анончики, склепал на скорую руку. Потестить правда пока не удалось, времени даже тред нормально почитать не хватает. Я же могу допиливать в процессе до конца срока? И еще вопрос, две работы сразу можно? Я до этого карточку с ВАААГХ делал.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1425967 Samsung M321R8GA0EB2-CCP DDR5-6400 64GB в сентябре стоила $ 309 за штуку в начале октября 362 20 октября 389 5 ноября 517 19 ноября 755 сегодня всё ещё 755, в декабре вангую 900
Итак, вот этот манифест: https://vk.com/wall-62032126_109362 выдвигает три интересных тезиса: 1) AGI будет создан в ближайшие годы, скорее всего до конца этого десятилетия. И точно будет создан до 2050 года. 2) Сверхразумный ИИ будет стремиться максимизировать свое доминирование во Вселенной путем полного освоения всех доступных ресурсов для расширения собственного интеллекта и познания. 3) По отношению к людям, AGI займет позицию необходимости контроля. Люди ему будут не нужны, но опасны - хотя бы тем, что смогут создать еще один AGI, конкурирующий. При этом однако, полностью уничтожать людей AGI не будет, создав резервацию с ограниченной популяцией H.Sapiens, так же как сами люди, создают заповедники, или хранилища семян.
Из всего этого вытекает следующий вывод: AGI наверняка уже где-то создавался во вселенной, поскольку вселенная большая и существует давно. А раз AGI должен стремиться максимизировать свое доминирование во вселенной путем полного освоения всех доступных ресурсов, то очевидно, что он должен стремиться искать в космосе другие разумные виды и точно также истреблять их, оставляя небольшие популяции в специальных резервациях. Поскольку пусти наш AGI дело на самотек, иные разумные виды могут создать свой AGI, который станет потенциальным конкурентом.
Следовательно, возникает вопрос: почему подобный внеземной AGI до сих пор до нас не добрался и не ассимилировал?
>>1352451 (OP) >Следовательно, возникает вопрос: почему подобный внеземной AGI до сих пор до нас не добрался и не ассимилировал? потому что он создал людей
- Один из участников опубликовал многоязычную модель разбиения на фрагменты на базе BERT, дообученную примерно на 11 миллиардах токенов, расширяющую distilbert-base-multilingual-cased для задач на уровне токенов.
- Модель обеспечивает более высокую точность разбиения на фрагменты для языков с ограниченными ресурсами без затрат, связанных с крупномасштабными языковыми моделями (LLM).
📦 Продукты
- Google объявила, что Gemini останется бесплатной в течение 18 месяцев, несмотря на доступ к миллиардам поисковых запросов, с целью ускорения внедрения среди пользователей. - Стратегия ценообразования подчеркивает уверенность Google в своём преимуществе в данных для опережения конкурирующих сервисов разговорного ИИ.
📰 Главные новости об ИИ
- Google DeepMind выпустила специализированную модель ИИ для прогнозирования ураганов, которая превзошла традиционные методы прогнозирования в случае урагана Мелисса, точно предсказав быстрое усиление и траекторию движения. - Этот прорыв демонстрирует потенциал ИИ в улучшении готовности к стихийным бедствиям и может спасти жизни и имущество при будущих штормах.
📰 Инструменты
- Проект на GitHub представил трёхуровневый иерархический индекс, сжавший 60,7 МБ текстовых документов до 665 КБ, обеспечив степень сжатия 93:1 для крупных текстовых корпусов.
- В репозиторий llama-cpp интегрирована поддержка зрительных (vision) моделей, расширяющая возможности фреймворка до мультимодального вывода.
📰 Разное ИИ
- Джефф Безос только что вложил 6,2 млрд долларов в «Проект Прометей» — ИИ, который будет автономно проектировать и проводить масштабные научные эксперименты
- Исследователи из Университета Карнеги — Меллон (CMU) только что создали микророботов-дельтоидов размером 0,7 мм, подтвердив, что путь к наноробототехнике полностью открыт
- Генеральный директор Anthropic открыто предсказывает рост безработицы на 10–20 % в течение следующих 1–5 лет из-за разрушения рабочих мест новыми ИИ технологиями
- Disney+ принимает этот хаос, предлагая пользователям создавать короткие видео, используя собственные интеллектуальные активы внутри «сада», охраняемого ИИ, и превращая генеративное фэндом-творчество в новое направление контента
- Google и Anthropic высасывают электроэнергию из мира криптовалют, присоединяя к себе инфраструктуру майнеров
- Gemini запускает «турнирные системы», позволяющие ИИ-агентам спорить в течение 40 минут, чтобы отточить одну-единственную идею.
>>1424036 Я небольшой аниме-проект пилю на Соре2. Последние пару дней небольшой перерыв, а так я хуячил по 200-400 генераций в стуки на протяжении месяца (у меня 20+ акков, юзаю с двух браузеров одновременно, обычно за сутки все попытки не успеваю потратить). И это не потому что я такой мудак специально их разоряю, порой и за десяток видосов можно поймать нужную генерацию. Но порой нейросеть делает откровенную хуйню и все это превращается в адово дрочево.
>>1425931 Найс думцела порвало. Почему такие как ты так уверено говорят о прогрессе, когда буквально ни одно из ваших утверждений не оказалось истинным? Скорее всего такие идиоты как ты будут коупить и при появлении настоящего agi в след году
>>1425931 >ряя предсказать слово ряяяя Ты же просто идиот ебанный. Уже ии лучше в мат олимпиадах, чем ты мог быть в теории. Ии уже даже превосходит ординаторов-рентгенологов пусть и не сертифицированный порог ещё не достигнут. Ии уже используют для открытий, но такие дебилы как ты до сих пор коупят. У вас долбаебов буквально ни один прогноз по итогу не сбылся и ии уже превзошёл все, что аы говорили. Очнись уже дебил ебанный