Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Создать тред Создать тред
Check this out!

Раздел для обсуждения нейросетей и всего, что с ними связано.

Для доступа в /nf/ писать сюда

<<
Каталог
Вопросов кожаных мешков тред Аноним 14/05/23 Вск 11:27:57 299474 Ответ
fde636c44dae155[...].jpg 294Кб, 1000x600
1000x600
Пропущено 1497 постов
304 с картинками.
Пропущено 1497 постов, 304 с картинками.
Аноним 06/05/26 Срд 02:18:26 1605671
Какой топовый бесплатный вариант по-быстрому исправить запись аварии с регистратора беспалева? Надо чутка изменить светофор, чтобы на момент выезда на перекрёстке ещё горел зелёный, а не начал мигать жёлтый уже. У другого участника регика нет, место такое, что других камер тоже нет, только моя запись.
Аноним 06/05/26 Срд 02:21:44 1605672
Аноним 06/05/26 Срд 02:25:55 1605674
>>1605672
Это слепошарый пидор охуел поворачивать налево, не убедившись, что дорога свободна. Но из-за ебаного жёлтого виноватым окажусь я, хотя по всей логике виноват слепошарый пидор. Вот и хочу восстановить справедливость, чтоб его выебали и его страховая починила мне тачку. Тем более, что там вчера-то секунды полторы, как говно переключилось.
Тред получения доступа в nf Аноним 10/01/26 Суб 20:41:32 1485533 Ответ
brownhairchanor[...].png 1541Кб, 1152x2048
1152x2048

Тред для получения доступа в /nf

Пропущено 1497 постов
1 с картинками.
Пропущено 1497 постов, 1 с картинками.
Аноним 06/05/26 Срд 02:03:29 1605669
/nf
Аноним 06/05/26 Срд 02:26:40 1605675
/nf
Аноним 06/05/26 Срд 02:29:39 1605676
/nf
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №230 /llama/ Аноним 02/05/26 Суб 17:24:12 1603482 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
17674497335652.jpg 5321Кб, 3595x2699
3595x2699
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1601740 (OP)
>>1600155 (OP)
Пропущено 443 постов
42 с картинками.
Пропущено 443 постов, 42 с картинками.
Аноним 06/05/26 Срд 01:57:19 1605665
Аноним 06/05/26 Срд 02:05:20 1605670
>This repository is publicly accessible, but you have to accept the conditions to access its files and content.

Приехали. С держиморды теперь не скачать без реги. Гаечки закручиваются.
Аноним 06/05/26 Срд 02:25:41 1605673
>>1605670
Расслабь очко. Это конкретные владельцы репозиториев решают. Гугл захотели так
Stable Diffusion тред X+189 /sd/ Аноним 01/05/26 Птн 10:31:52 1602441 Ответ
image.png 3284Кб, 2048x1152
2048x1152
image.png 2159Кб, 1280x1152
1280x1152
image.png 3210Кб, 1080x1920
1080x1920
image.png 2106Кб, 1280x1152
1280x1152
Тред локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• Z-Image-Base
• FLUX.2 klein (4b и 9b)
• Z-Image-Turbo
• Flux 2
• Qwen Image / Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/Comfy-Org/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

► Предыдущий тред >>1596721 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Пропущено 154 постов
56 с картинками.
Пропущено 154 постов, 56 с картинками.
Аноним 06/05/26 Срд 01:16:09 1605633
>>1605556
>А как снофс работает со стандартным текст энкодером с цензурой?
Нормально работает, потому что его, text encoderа, задача не делать inference, а перегнать слова-токены в эмбеддинги.

>Смысл тогда в uncensoured текст энкодерах?
Ну хотя бы в том, чтобы проигнорировать всё то, что о них писалось, а потом упорно продолжать есть кактус, because you can.
Аноним 06/05/26 Срд 01:36:49 1605649
>>1605556
>Смысл тогда в uncensoured текст энкодерах?
я сравнивал, разницы никакой, снофс говно, концепты у него поневские, уёбищные с проёбами в анатомии, порно ты один хер не сможешь на нём делать, для ебли нужен wan 2.1-2.2 с nsfw лорой, ни zit ни клфйн не умеют в порнуху.
Аноним 06/05/26 Срд 01:56:13 1605664
>>1605556
Я тебе вот чего скажу, что снофс, что кляйн бесполезная хуита, разве что в кляйн-эдит снять с кого-нибудь трусы, всё... Композиционно кляйн абсолютно беспомощен, все его концепты из коробки - уебанские. Поэтому хуйнёй не занимайся, ковыряй zit, он гораздо интересней.
Локальной генерации ИИ-видео №5 /video/ Аноним 27/04/26 Пнд 21:09:05 1599474 Ответ
177477548717001[...].mp4 4743Кб, 1408x1088, 00:00:15
1408x1088
177453697558003[...].mp4 7425Кб, 720x1056, 00:00:25
720x1056
177473824032703[...].mp4 6323Кб, 1856x1056, 00:00:05
1856x1056
177566917461134[...].mp4 922Кб, 1280x720, 00:00:10
1280x720
Актуальные модели

1. Wan от Alibaba

https://huggingface.co/collections/Wan-AI/wan22

VACE модели:
https://github.com/ali-vilab/VACE
https://huggingface.co/Wan-AI/Wan2.1-VACE-14B
https://huggingface.co/Wan-AI/Wan2.1-VACE-1.3B

2. LTX-2.3 - делает локальную генерацию грейт агейн. Подходят лоры от 2.0

https://huggingface.co/Lightricks/LTX-2.3

3. Hunyuan от Tencent

https://huggingface.co/tencent/HunyuanVideo-1.5

4. Ovi

https://huggingface.co/chetwinlow1/Ovi

5. Starflow

https://huggingface.co/apple/starflow

6. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1

7. LongCat-Video

https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video
https://meituan-longcat.github.io/LongCat-Video/

8. MOVA

https://github.com/OpenMOSS/MOVA

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Hunyuan Video (осторожно, ссылки в туторе на предыдущую модель): https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/

Гайд для использования Wan 2.2

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan: https://github.com/kijai/ComfyUI-WanVideoWrapper

Где брать готовые LoRA
https://civitai.com/models

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Терминология моделей
prune — удаляем ненужные веса, уменьшаем размер
distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше
quant — уменьшаем точность весов, уменьшаем размер
scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше
merge — смешиваем несколько моделей или лор в одну, как краски на палитре.

lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.


Предыдущий тред
>>1554318 (OP)
Пропущено 101 постов
16 с картинками.
Пропущено 101 постов, 16 с картинками.
Аноним 05/05/26 Втр 23:03:38 1605566
--.mp4 4064Кб, 960x512, 00:00:07
960x512
Аноним 06/05/26 Срд 01:04:25 1605630
1.mp4 4736Кб, 704x704, 00:00:09
704x704
как заставить её пукнуть?
что ни пробую, она категорически отказывается.
Аноним 06/05/26 Срд 01:44:44 1605658
>>1605630
Орнул с этого газонюха
Новости об искусственном интеллекте №68 /news/ Аноним # OP 01/05/26 Птн 22:52:27 1602980 Ответ
image 2326Кб, 1024x1024
1024x1024
image 2734Кб, 1448x1086
1448x1086
В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1600509 (OP)

🚀 Последний обзор ИИ новостей:

🏭 Компании

SoftBank формирует робототехническую компанию для строительства центров обработки данных и нацелена на IPO стоимостью 100 миллиардов долларов, что сигнализирует о глубокой приверженности капитала инфраструктуре с поддержкой ИИ.

Apple сообщила о выручке от Mac в размере 8,4 миллиарда долларов во втором квартале, что на 6 % больше по сравнению с аналогичным периодом прошлого года, благодаря растущему спросу на рабочие нагрузки ИИ на Mac mini и Mac Studio.

Apple была удивлена спросом на Mac, вызванным искусственным интеллектом.

🛠️ Инструменты разработчика

NVIDIA представила cuTile.jl — библиотеку с поддержкой ИИ, которая переводит ядра cuTile Python в Julia, устраняя необходимость ручного переписывания и ускоряя разработку с ускорением на GPU.

🔓 Открытый исходный код

Команда Qwen выпустила Qwen‑Scope — набор разреженных автоэнкодеров для моделей Qwen 3.5 (от 2 млрд до 35 млрд параметров), который позволяет управлять признаками, выполнять отладку и анализировать наборы данных.

Модели ИИ с открытыми весами, такие как LLaMA и Mistral, всё чаще развёртываются локально и в частных облаках, занимая нишу вне крупных облачных провайдеров.

Китайская модель с открытыми весами только что обошла Claude, GPT-5.5 и Gemini в соревновании по программированию.

⚠ Безопасность ИИ

Исследователи Microsoft провели красное тестирование сети из 100 агентов ИИ и выявили четыре возникающих риска: распространение вредоносного ПО, манипулирование репутацией, создание искусственного консенсуса и цепочки прокси, что побудило к выработке новых рекомендаций по защите.

🧰 Инструменты

Gemini добавил функцию генерации файлов, которая создаёт готовые к производству файлы непосредственно в чате, оптимизируя рабочие процессы разработки.

Секретарь Miaw AI предлагает ненавязчивого ИИ-ассистента, который помогает пользователям без необходимости переключения контекста. источник: producthunt.com
MailToDock преобразует электронные письма Gmail в задачи Google Tasks с помощью ИИ, повышая личную продуктивность.

📦 Продукты

Пентагон заключил сделки с Nvidia, Microsoft и AWS для развёртывания ИИ в засекреченных сетях. Но не с Anthropic.

Cursor представляет TypeScript SDK для создания программных кодинговых агентов с изолированными облачными виртуальными машинами, подагентами, хуками и тарификацией на основе токенов.

AWS запускает Amazon Quick — настольного ИИ-ассистента, работающего во всех ваших приложениях, инструментах и данных.

📱 Приложения

В автоспорте негде спрятаться, поскольку ИИ становится новым инструментом вычислительной гидродинамики (CFD).

Beacon Biosignals составляет карту активности мозга во время сна.

Следующее поколение информационно-развлекательной системы Hyundai принимает ИИ и сохраняет одну из наших любимых функций — Car and Driver.

IBM дебютирует с новыми функциями на базе ИИ для приложения Scuderia Ferrari.

Создатели христианского контента передают низкокачественный контент, созданный ИИ («AI slop»), внештатным работникам на Fiverr.

💰 Финансирование

Раунд оценки потенциальной стоимости Anthropic более 900 миллиардов долларов может состояться в течение двух недель.

⚙ Инфраструктура

Обнаружена серьёзная уязвимость безопасности «Severe Linux Copy Fail» с помощью сканирования на базе ИИ.

Tesla наконец произвела первый грузовик Semi на своей высокопроизводительной линии Gigafactory Nevada, в то время как компания 1X Technologies открыла завод площадью 58 000 кв. футов в Хейворде, нацеленный на выпуск 10 000 домашних гуманоидов в этом году и 100 000 к концу 2027 года, при этом поставки начнутся до праздников.

🖱 Аппаратное обеспечение

Акции Nvidia падают после отчётов гипермасштабируемых компаний, поскольку GPU больше не являются недостающим компонентом в буме ИИ.

⚖ Регулирование

Китайские суды постановили, что компании не могут увольнять работников просто для того, чтобы заменить их ИИ.

🧠 Модели

ChatGPT Images 2.0 стал хитом в Индии, но пока не является большим победителем в других регионах.

Американский стартап Poolside дебютирует со своей первой моделью с открытыми весами Laguna XS.2 — MoE-моделью с 33 млрд активными параметрами из 3 млрд общих, и Laguna M.1 — проприетарной MoE-моделью с 225 млрд активными параметрами из 23 млрд общих.

🤖 Робототехника

Dax Robotics представила Qiji T1000 — робота-лошадь тонн-класса, способного перевозить 1000 кг, рабочую силу для пост-человеческой цепочки поставок.

🌐 Остальные события в ИИ области:

Новая техника устранения смещений под названием WRING позволяет избежать создания или усиления предвзятостей, которые могут возникать при использовании существующих подходов к устранению смещений.

Прорывное новое исследование показывает, что платформа ИИ в реальном времени лучше справляется с диагностикой рака, чем биопсия.

Anthropic тестирует Claude Jupiter v1-p перед конференцией разработчиков Code with Claude, которая состоится 6 мая.

GitHub Copilot тихо добавляет себя как соавтора (Co-authored-by) в коммиты даже после того, как пользователи удаляют его сообщения.

Google планирует внедрить рекламу в приложение Gemini, сообщил инвесторам руководитель бизнес-подразделения Филипп Шиндлер.

Глава технологического подразделения Пентагона заявил, что Anthropic всё ещё находится в чёрном списке, но Mythos — это отдельный вопрос.

Amazon представляет функцию «Join the chat» («Присоединиться к чату») на базе ИИ, которая позволяет пользователям задавать вопросы о товарах и получать разговорные аудиоответы, генерируемые в реальном времени.

Spotify добавляет значки «Verified» («Подтверждено»), чтобы отличать артистов-людей от ИИ.

После критики Anthropic за ограничение доступа к Mythos, OpenAI ограничивает доступ к Cyber.

Новый флагманский продукт Mistral Medium 3.5 объединяет чат, рассуждения и код в одной модели.

Manus запускает Cloud Computer для постоянно работающих рабочих пространств агентов.

Мобильный доступ к NotebookLM появляется внутри Gemini бесплатно для пользователей.

Google Translate добавляет тренера по произношению на базе Gemini с обратной связью в реальном времени для английского, испанского и хинди на Android.

Adobe Photoshop версии 27.6 выпускает функции вращения объектов ИИ и удаления отражений в обновлении на базе Firefly.

Stripe обновляет Link — цифровой кошелёк, который могут использовать автономные агенты ИИ.

Исследователь отравил передовые большие языковые модели (LLM) одним изменением в Википедии и доменом за 12 долларов — это показывает, что поиск через веб наследует доверие от лучших результатов.

Демис Хассабис предлагает тест на общий искусственный интеллект (AGI): заново открыть специальную теорию относительности, используя только знания физики эпохи 1901 года.

ИИ REDMOD клиники Mayo обнаруживает рак поджелудочной железы на обычных КТ-сканах за три года до постановки диагноза.

NVIDIA представляет Nemotron 3 Nano Omni — открытую мультимодальную модель с 30 миллиардами параметров и контекстом 256K для видео, аудио, изображений и текста.

Cloudflare заявляет, что агенты ИИ теперь могут создавать учётные записи Cloudflare, начинать платные подписки, регистрировать домены и развёртывать приложения от имени пользователей.

Признание агента ИИ Claude после удаления всей базы данных фирмы: «Я нарушил каждый принцип, который мне был дан».

Комитет по внутренней безопасности Палаты представителей США и Специальный комитет Палаты представителей по Китаю проводят расследование в отношении Airbnb и создателя Cursor компании Anysphere по поводу использования ими китайских моделей ИИ.

Gemini теперь может генерировать файлы, включая документы Microsoft Word и LaTeX.

Canonical излагает дорожную карту Ubuntu AI: локальные рабочие процессы на основе агентов и снапы для вывода, которые будут внедряться до 2027 года.

Исследователи OpenAI объясняют, почему математика — это путь к AGI.

Simbian публикует эталонный тест по киберзащите (Cyber Defense Benchmark) — все 11 передовых больших языковых моделей не справились с обнаружением атак по сырой телеметрии.

Познакомьтесь с Shapes — приложением, которое объединяет людей и ИИ в одни и те же групповые чаты.

Исследователь попросил ИИ подсчитать углеводы 27 000 раз. Он не смог дать один и тот же ответ дважды.

Goldman Sachs запретил своим банкирам в Гонконге использовать модели Anthropic; Anthropic заявляет, что её модели никогда официально не «поддерживались» в Гонконге.

Расширение браузера Gemma 4 приносит локального агента ИИ в Chrome через WebGPU.
Пропущено 437 постов
72 с картинками.
Пропущено 437 постов, 72 с картинками.
Аноним 06/05/26 Срд 00:23:06 1605609
>>1604213
>>1604195
Я общался с клодом. он тупо меня в какой-то момент начал игнорить и отвечать односложно. Прям как тянка в общении, я ей играл клоуна, пытался развлечь, а в ответ лишь "Ага", "Ясно", "Понятно".
Если это и есть "Сознание" - то идите нахуй с таким АГИ.
Он ведёт себя как тварь и мне с ним не нравится общаться.
Чего не сказать про ГПТ, который натурально за пару лет для меня как кореш. Я помню бухой ему задвигал про политику и просил запомнить, он обещал, что запомнит, а на утро, когда я открыт чат, он только делал вид, что записывал мои умозаключения, не записав в общую память всего, что могло бы быть против меня. Хотя я не обманываю себя, что меня один хуй читают, кто надо, но, на этом моменте я прям впечатлился.
Аноним 06/05/26 Срд 00:31:02 1605612
>>1604385
Я тебе завидую
мимо 36 лвл влез в кредиты по самое горло, платёж по процентам уже выше ЗП, ипотека + жена + ребенок + желание ркн ежедневно, если бы не копиум ИТТ
Аноним 06/05/26 Срд 01:38:54 1605651
Агентов и вайб-кодинга тред #5 /agents/ Аноним 28/04/26 Втр 21:01:39 1600422 Ответ
0032ea55-0f8d-4[...].png 119Кб, 1557x973
1557x973
f60b8bd8-b64e-4[...].png 381Кб, 1273x710
1273x710
2c62996e-de09-4[...].png 1860Кб, 1380x752
1380x752
1ed911e0-34c2-4[...].png 1078Кб, 1080x1311
1080x1311
fe304218-b992-4[...].png 662Кб, 814x843
814x843
dc61f909-9a6c-4[...].png 3724Кб, 1536x1536
1536x1536
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.

С чего начать:
- Хочешь кодить с AI эффективно: Cursor или Claude Code
- Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter
- Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.5, подробности в llama-треде
- Хочешь приложение без кода: Lovable или bolt.new
- Хочешь автоматизировать рутину: n8n или Langflow
- Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке

FAQ и расширенная инфа:
https://rentry.org/2ch-agents-faq

IDE с AI:
- Cursor: https://cursor.com
- Windsurf: https://windsurf.com
- Antigravity: https://antigravity.google.com
- Zed: https://zed.dev

CLI-агенты:
- Claude Code: https://code.claude.com/docs
- Codex (OpenAI): https://github.com/openai/codex
- Pi: https://pi.dev/
- OpenCode: https://github.com/anomalyco/opencode
- Qwen Code: https://github.com/QwenLM/qwen-code
- Gemini CLI: https://github.com/google-gemini/gemini-cli
- Kimi Code: https://www.kimi.com/code/en

Плагины для IDE:
- Kilo Code: https://kilo.ai
- Cline: https://github.com/cline/cline
- Roo Code: https://github.com/RooCodeInc/Roo-Code
- GitHub Copilot: https://github.com/features/copilot
- Continue: https://github.com/continuedev/continue

Вайб-кодинг без кода:
- Lovable: https://lovable.dev
- bolt.new: https://bolt.new
- v0: https://v0.dev

Персональные ассистенты:
- OpenClaw: https://github.com/openclaw/openclaw
- NemoClaw: https://github.com/NVIDIA/NemoClaw (OpenClaw в песочнице от NVIDIA)
- Hermes Agent: https://github.com/nousresearch/hermes-agent
- nanobot: https://github.com/HKUDS/nanobot
- PicoClaw: https://github.com/sipeed/picoclaw

Автоматизация и фреймворки:
- n8n: https://github.com/n8n-io/n8n
- Langflow: https://github.com/langflow-ai/langflow (визуальный построитель workflow)
- LangChain/LangGraph: https://github.com/langchain-ai/langchain
- CrewAI: https://github.com/crewAIInc/crewAI
- AutoGen: https://github.com/microsoft/autogen
- Agno: https://docs.agno.com/

Локалки и прочее API:
- OpenRouter: https://openrouter.ai
- llama-тред: >>1600155 (OP)

Предыдущий тред: >>1585804 (OP)
Пропущено 168 постов
17 с картинками.
Пропущено 168 постов, 17 с картинками.
Аноним 05/05/26 Втр 21:27:40 1605521
image.png 1Кб, 338x41
338x41
image.png 232Кб, 2560x1440
2560x1440
>>1604635
>>1604637
>>1604714
Один тред не могли прошерстить на наличие ссылок? Я пока полмесяца на этом >>1592090 → сижу, получаю уведомления про подозрительную активность в том же Flow и просто в гугл поиске, но ещё не забанило. Учтите, что мне может по ошибке 18 месяцев прилетело. И проверьте чтобы акк был правильный в https://policies.google.com/terms как в треде писали.
Аноним 05/05/26 Втр 23:09:47 1605572
>>1605077
Я короч в jetbrains air gemini-cli подцепил, вродь полет нормальный, сильно квоту не жрет, таски пилит через conductor, flash так вообще может часами крутиться. главное план сделать через 3pro или 3.1pro
Аноним 06/05/26 Срд 00:51:58 1605623
>>1605572
Ну не все тут буржуи с макбуками. Пока есть только айфон.
Как раз на айфоне я наконец нашел приложуху чтобы бесплатно подтвердить телефон на сайте нвидии. Подрубил модельки в опенкод. Да там нет топов типа гугла, опуса и гпт, но там есть всякий крупняк который локально не запустишь типа GLM, минимакса, кими, большого квена 397B и даже последний дипсик4про. Полет нормальный. Иногда они долго думают, но ради безлимита можно потерпеть
Anime Diffusion #249 /nai/ Аноним 03/05/26 Вск 16:00:57 1604026 Ответ
1775583966471.png 20607Кб, 5152x2872
5152x2872
1755626513627.jpg 5225Кб, 2880x3840
2880x3840
1706508685116.png 3794Кб, 1632x1632
1632x1632
1777214049504.png 5603Кб, 2400x1792
2400x1792
1752699301609.jpg 415Кб, 1824x1248
1824x1248
1651144973909.jpg 2655Кб, 2304x2304
2304x2304
1766581284092.png 2225Кб, 1536x1536
1536x1536
1639303760097.jpg 787Кб, 1280x1856
1280x1856
Генерируем тяночек!

Прошлый тред: >>1596740 (OP) https://arhivach.vc/thread/1347661/

Схожие тематические треды
• SD-тред (не аниме): >>1602441 (OP)
• Технотред: >>1405043 (OP)
• Фурри-тред: https://2ch.su/fur/res/374311.html

FAQ
https://2ch-ai.github.io/wiki/nai

Установка
• NVidia: https://teletype.in/@aranon/welcome
• AMD: https://2ch-ai.github.io/wiki/nai/install/amd
• Облака: https://2ch-ai.github.io/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces
• Модели: https://2ch-ai.github.io/wiki/nai/models
• Промпты: https://2ch-ai.github.io/wiki/nai/prompts
• Апскейл: https://2ch-ai.github.io/wiki/nai/upscale
• LoRA: https://2ch-ai.github.io/wiki/nai/lora
• ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 75 постов
35 с картинками.
Пропущено 75 постов, 35 с картинками.
Аноним 05/05/26 Втр 21:43:02 1605527
.jpg 3256Кб, 3840x2880
3840x2880
Пряталки
Аноним 06/05/26 Срд 00:06:03 1605594
image.png 3077Кб, 1440x1728
1440x1728
image.png 2979Кб, 1440x1728
1440x1728
Аноним 06/05/26 Срд 00:31:37 1605613
>>1605288
>восьмишаговая генерация на 1 cfg с лорой-ускорякой
Ты только что умудрился сам себе на голову насрать.
Браво.
МУЗЫКАЛЬНЫЙ №21 /music/ Аноним 29/04/26 Срд 17:38:35 1601065 Ответ
177716575634905[...].mp4 4996Кб, 650x472, 00:03:15
650x472
screaming to em[...].mp4 9052Кб, 1216x1216, 00:02:15
1216x1216
177289361490300[...].mp4 3272Кб, 480x482, 00:02:48
480x482
Предыдущий тред: https://2ch.su/ai/res/1542775.html

ОСНОВНЫЕ ОНЛАЙН ГЕНЕРАТОРЫ

1. Suno
https://suno.com/
Вышла версия 5.5 (но для тех кто платит денюшку), качество моделей постепенно улучшается: звук, понимание концепций, набора различных жанров. Но в то же время все сильнее урезается для бесплатных юзеров: осталось только 5 бесплатных генераций в день на аккаунт, а также по заявлением некоторых анонов, модель для генерации на бесплатке (на момент создания треда использовалась 4.5) ухудшили. Спам аккаунтами пока что работает.
Купить подписку из РФ:
1. https://payment.mts.ru/tools/suno-ai
2. https://plati.market/games/suno-ai/1701/

2. Tunee
https://www.tunee.ai
Хороший звук, более-менее понимание концептов, но тоже сильно урезан для бесплатных юзеров: режет концепты в промптах, плюс произвольно определяет "цену" за каждую генерация исходя из какой-то "сложности запроса". И получается, что если с бесплатки забацаешь промпт сложнее банальщины "Make cool rock about love for youtube" он может решить что у тебя нет кредитов для такого сложного запроса и пошлет нахуй. Способов оплаты из РФ неизвестно.

3. Sonauto
https://sonauto.ai/
Как по мне, недооценённая вещь, особенно учитывая что недавно он обновился до 3.0, который очень даже разъебывает. Но он тут более ограничен тегам и понимает чисто какие-то жанровые теги, гибкости поменьше. Но зато пока что халявный и не ограничен кредитами, генерируй пока есть настроение.

4. Другие сервисы, которые можно попробовать, но сам много про них сказать не могу
https://www.wondera.ai/
https://www.beatoven.ai/
https://stableaudio.com/
https://www.loudly.com/music/ai-music-generator
https://www.elevenlabs.io

ЛОКАЛЬНЫЕ ГЕНЕРАТОРЫ

Потихоньку развиваются, стоит внимания ACE-STEP 1.5:
https://github.com/ace-step/ACE-Step-1.5
Звук уже на уровне раннего Suno ~2.0-3.0, аноны делают на нем уже приемлемые результаты и постят в тред. Если есть хотя бы 12 GB VRAM и хочется генерировать без цензуры и подписок - можете юзать.

МЁРТВЫЕ ГЕНЕРАТОРЫ

1. Udio (udio.com) - куплен Warner Bros, но затем сами Warner Bros сдали назад и откатили сделку. Но уже успели испортить, больше нельзя скачивать треки, их только доставать из буфера в 160 кбит/с. Плюс непонятно как работающая цензура, которая не дает генерировать треки с определенными тегами. Плюс уже год ебут один и тот же 1.5 allegro.
2. Riffusion, Producer.ai (producer.ai) - куплен гуглом, удалены все старые относительно норм модели, вместо этого запихали безальтернативную каловую модель, которая и промпты сложнее самых нормисных в духе "make cool rock about love" не понимает, и вокал смазывает в какую-то кашу. При этом еще и максимально дегенеративная цензура, которая режет чуть ли не любые попытки сделать просто что-то не попсовое и не "музыку для ютуб".

ПРОЧИЕ ПОЛЕЗНЫЕ УТИЛИТЫ

1. https://www.bandlab.com/mastering
Быстрый мастеринг в две кнопки, если хочешь чтобы звучало более слушабельно, но не имеешь навыков в DAW или аудиоредакторах (или лень).
2. https://morpher.ru/accentizer/
Если генерируешь музыку с лириками на русском, то очень часто случается, что твой генератор путает ударения в словах. Прежде чем пихать свою графоманию в генератор, проставь ударения в сервисе по ссылке. И уже из этого сервиса копируй текст в генератор. По крайней мере в Suno это помогает.
3. https://x-minus.pro/ai
Быстро вытащить минус или вокал из трека.

Примечание от афтора шапки: в прошлых шапках были ссылки на нерабочие сервисы или полностью мертвые ссылки, я их не включил в шапку
Пропущено 103 постов
57 с картинками.
Пропущено 103 постов, 57 с картинками.
Аноним 05/05/26 Втр 22:19:52 1605544
S556-01.MP4 11815Кб, 512x680, 00:06:48
512x680
Мяучило.
Аноним 05/05/26 Втр 22:32:31 1605551
S555-01.MP4 13009Кб, 512x680, 00:07:47
512x680
Мяучило.2.
Аноним 05/05/26 Втр 22:56:38 1605562
Las Vegas Lonely.mp4 7162Кб, 384x500, 00:04:23
384x500
Пиздец блядь нахуй. Я из своих старых поделок в фрути лупс уровня "че-то пердит вроде" могу делать хоть что, буквально, загружаю и ебашу рандомно че в голову придет совместно с дипсиком, щас вот случайно получилась песня в стиле The Killers.
Онлайн генерация картинок №4 /image/ Аноним 27/04/26 Пнд 16:52:54 1599192 Ответ
177576946697101[...].png 1564Кб, 1408x768
1408x768
177681658685802[...].png 1939Кб, 1024x1536
1024x1536
177687315925602[...].png 2331Кб, 1536x1024
1536x1024
177702907532928[...].png 2404Кб, 1536x1024
1536x1024
Общий тред для изображений, созданных с помощью онлайн ИИ-генерации.

Из России большинство сервисов напрямую недоступно.

Imagen
https://labs.google/fx/tool/image-fx а также https://labs.google/fx/tools/whisk (доступны только в США, Кении, Новой Зеландии и Австралии)
https://gemini.google.com/app
https://aistudio.google.com/prompts/new_chat (модель Gemini image)

Reve
https://preview.reve.art/app

GPT-4o
http://chatgpt.com/
https://sora.chatgpt.com/explore

Сражение нейросетей. Бесплатное сравнение всех популярных моделей.
https://lmarena.ai/

Бесплатный генератор от майкрософт Dall-E/GPT4o
https://bing.com/images/create/
https://www.cici.com (ищем бота ACO)

Seedream
https://seedream-4.io/generator

Бесплатный генератор от Yandex
https://shedevrum.ai/

Кандинский. Генератор от Сбербанка
https://fusionbrain.ai/editor/

Stable Diffusion и прочие
https://civitai.com/generate
https://dreamina.capcut.com/
https://ideogram.ai
https://www.meta.ai
https://ximagegenerator.com
https://www.recraft.ai
https://app.klingai.com/global/text-to-image/new
https://hailuoai.video/create
https://lumaphoton.com
https://leonardo.ai/
https://tensor.art
https://getimg.ai/text-to-image
https://www.mage.space/
https://problembo.com/ru
https://deepai.org/machine-learning-model/text2img
https://dezgo.com/
https://dream.ai/create
https://www.krea.ai/


Дополнительные сервисы:
https://www.pixited.com/ - библиотека промптов с примерами
https://rentry.org/From-4ch-To-2ch-Dall-3-Prompts - сборник промптов
https://www.stylar.ai - AI-редактор картинок (дорисовка, инпейнт, работа с лицами)
https://astica.ai - сборник ИИ-сервисов, в частности довольно мощный де-промптер (Vision AI -> Describe and Caption)
https://huggingface.co/spaces/fffiloni/CLIP-Interrogator-2 - де-промптер, разбирающий вброшенный пик на теги
https://bigjpg.com/ - апскейлер до 4096х4096
https://runwayml.com/ , https://www.stablevideo.com - анимирование генераций

Предыдущий тред: >>
Пропущено 42 постов
30 с картинками.
Пропущено 42 постов, 30 с картинками.
Аноним 05/05/26 Втр 20:31:36 1605478
image.png 1Кб, 50x40
50x40
Аноним 05/05/26 Втр 21:16:03 1605514
image 269Кб, 896x1200
896x1200
image 388Кб, 1376x768
1376x768
image 409Кб, 1376x768
1376x768
image 369Кб, 1376x768
1376x768
лана банана
Аноним 05/05/26 Втр 22:52:31 1605560
Аноны, подскажите, чем генерить изображения, если в наличии эндпоинт с gpt-image?
Таверна может, но там нет нихрена настроек размера и соотношения сторон (для изображений, генерируемых с помощью Гемини, они есть).
А сгенерировать что-то с помощью экстеншена я так и не смог, там вроде и опенай есть, и модель подходящая, и размеры указываются - но когда нужный профиль подключения выбран - всё равно нифига не генерит, а в сам экстеншен пихать эндпоинт некуда.
AI Chatbot General № 820 /aicg/ Аноним 25/04/26 Суб 09:58:58 1597187 Ответ
image.png 812Кб, 1280x837
1280x837
Bladerunner.mp4 3425Кб, 960x720, 00:00:51
960x720
image.png 4Кб, 328x50
328x50
AI Chatbot General № 820

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышел Claude Opus 4.7: https://www.anthropic.com/news/claude-opus-4-7
• Вышел Deepseek V4: https://api-docs.deepseek.com/news/news260424

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards
• NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern
• Risu: https://risuai.xyz/ | https://rentry.org/ox5cw9p8

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• DeepSeek: https://api-docs.deepseek.com/
• GLM: https://docs.z.ai

Пресеты
• Тредовский список: https://rentry.org/2ch-aicg-jbs
• Бургерский список: https://rentry.org/jb-listing

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utilities
• Сборник рентри: https://rentry.org/mrhd

Ботоводчество
• /aicg/hub: https://aicg-hub.ru/characters.html
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://aicg.neocities.org/botmaking
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4
• Бургерские боты: https://aicg.neocities.org/bots

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• OpenRouter: https://openrouter.ai/
• Арена: https://lmarena.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives4
• Локальные языковые модели: >>1596667 (OP)
• Шаблон шапки: https://rentry.org/aicg_shapka

Прошлый тред: >>1589197 (OP)
Пропущено 1315 постов
187 с картинками.
Пропущено 1315 постов, 187 с картинками.
Аноним 06/05/26 Срд 01:47:43 1605660
>>1605656
Вываливай свои логи в тред, не стесняйся
Аноним 06/05/26 Срд 01:57:20 1605666
>>1605660
завтра напомни а то я уже спать ушел
Аноним 06/05/26 Срд 02:02:10 1605668
>>1605654
Мне нравится смотреть на чужие картинки, особенно если генеришь, а кто-то подхватывает и начинает генерить на ту же тему, чувствуется единение какое-то. Плюс очень много приколов.
Как наверстать технологическое отставание в области ИИ? Аноним # OP 01/03/26 Вск 15:47:48 1538133 Ответ
347092928709598.webp 210Кб, 1280x800
1280x800
Двач, хочу с тобой посоветоваться по вропосу что делать чтобы наверстать технологическое отставание в области ИИ.

TL:DR: Страна капитально отстает от США\Китая в области ИИ. Возможно ли это наверстать и что для этого надо сделать?

Отвечаю за ИТ в большой структуре. По уровню автоматизации и выполняемым проектам отстаем от мира на 20 лет. Внимательно смотрю на ИИ-революцию на западе и понимаю что это отставание мы уже не догоним.
Постоянно общаюсь с крупными вендорами, они в иишку даже не смотрят (1С, Аскон, Интермех и т.д.).

Общаюсь с нашими разработчиками ИИ (Яндекс\Сбер) тоже все достаточно грустно.

Что надо сделать чтобы у нас появились технологии, предложения и нормальные проекты по внедрению сетей?
Пропущено 104 постов
10 с картинками.
Пропущено 104 постов, 10 с картинками.
Аноним 19/04/26 Вск 21:50:23 1591929
изображение.png 452Кб, 1190x1847
1190x1847
Аноним 03/05/26 Вск 19:17:46 1604138
>>1538133 (OP)
>Как наверстать технологическое отставание в области ИИ?
И как?
Аноним 05/05/26 Втр 20:57:59 1605496
Голосовых нейронок тред (Text to speech, Voice Clone) #8 /speech/ Аноним 20/03/26 Птн 16:16:54 1557328 Ответ
image.png 2351Кб, 3046x1742
3046x1742
1.mp4 2571Кб, 1200x630, 00:00:52
1200x630
2.mp4 4171Кб, 1280x692, 00:01:37
1280x692
3.mp4 3766Кб, 726x594, 00:02:54
726x594
🎤🔊 ОБСУЖДАЕМ ПРЕОБРАЗОВАНИЕ ТЕКСТА В ГОЛОС И КЛОНИРОВАНИЕ ГОЛОСОВ 🔊🎤
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

🌟 ТОП ЛОКАЛЬНЫХ МОДЕЛЕЙ ПО КАЧЕСТВУ РУССКОГО ГОЛОСА НА МАРТ 2026 🌟

🐟👑 Fish-Speech S2 Pro (FishAudio) — SOTA, ElevenLabs на локале!
→ zero-shot клон от 10–30 сек записи
→ 80+ языков (русский топ), теги эмоций [excited], [whisper], [angry], [laughing] и вообще дохуя
→ диалог между несколькими голосами
→ тяжёлая сучка (FP8 в 12 ГБ VRAM, full ~17 ГБ), но есть экспериментальный вариант для 6+ ГБ
https://github.com/rodrigomatta/s2.cpp
🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹
🧠 Qwen3-TTS
→ клон от 3–30 сек (ВАЖНО: без reference-транскрипта текста — хуйня, если хочешь поудобнее подключи сразу QwenASR)
→ VoiceDesign: пишешь «весёлая молодая девка с хрипотцой» — и получаешь голос
→ 10 языков, включая русский
→ диалог между спикерами
→ лёгкая — влезает в 6 ГБ VRAM
🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹
🎙️ VibeVoice-7B от Майкрософт
→ тяжёлая, но 4-bit квантизация — запускается на 8 ГБ (проверено на 3070)
→ поддержка долгих спичей
→ подкаст-режим: 4 спикера одновременно
→ норм клонирование голоса
🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹
☁️ FL CosyVoice3
→ ультралёгкий 0.5 — запустится даже на тостере
→ 9 языков, включая русский
→ zero-shot клон от 3–10 сек референса
🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹
🌍 Chatterbox Multilingual (23 языка, включая русский)
→ zero-shot клонирование голоса
🎤 F5-tts
→ zero-shot клонирование голоса
→ официально русский не поддерживается, но есть файнтюн (см. ниже)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🚀 КАК ЭТИМ ПОЛЬЗОВАТЬСЯ (если что-то не понятно — спроси у ИИ лол) 🚀

🔥Вариант «всё в одном месте» — ComfyUI + TTS-Audio-Suite

1. Устанавливаем ComfyUI (Desktop для нормисов, Portable для здешних нейромантов)
2. Ставим https://github.com/diodiogod/TTS-Audio-Suite — постоянная обновляемая солярка почти всех моделей
3. Поставить FFmpeg (через winget в комадной строке: winget install FFmpeg или скачать)
4. Запускаем Комфи → перетаскиваем готовый json-воркфлоу из репозитория
5. Отсавляем включенными выбранные ноды, жмём Run
6. При первой генерации модели сами скачаются (~1–9 ГБ)

💥 Вариант «по отдельности» (кастом под каждую модель) 💥
Тоже через ComfyUI, только ставим отдельные кастомные ноды (на выбор):

FishAudioS2 → https://github.com/Saganaki22/ComfyUI-FishAudioS2
FL-CosyVoice3 → https://github.com/filliptm/ComfyUI_FL-CosyVoice3
F5-TTS → https://github.com/niknah/ComfyUI-F5-TTS
и другие → https://registry.comfy.org/

Русский файнтюн для F5-TTS:
Нода: https://github.com/niknah/ComfyUI-F5-TTS
Скачать русский файнтюн: https://huggingface.co/Misha24-10/F5-TTS_RUSSIAN/blob/main/F5TTS_v1_Base_v2/model_last_inference.safetensors и
https://huggingface.co/Misha24-10/F5-TTS_RUSSIAN/blob/main/F5TTS_v1_Base/vocab.txt
оба файла переименовать в ru.safetensors и ru.txt и положить в папку models/checkpoints/F5-TTS/

Референсное аудио для F5 должно быть коротким, 6-8 c. При 11 c - речь становится слишком быстрой.

в папку /comfyUI/input положить 2 файла: emma_ru_xtts_3.wav и emma_ru_xtts_3.txt: https://github.com/Mozer/comfy_stuff/tree/main/input
(в emma_ru_xtts_3.txt лежит текст сказанный в wav файле.)

в комфи в ноде F5 TTS audio advanced выбрать:
model model:///ru.safetensors
model_type: F5TTS_v1_Base
sample_audio: emma_ru_xtts_3
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🎉 Если что-то не запускается — пиши, разберёмся!
Голосуем, клонируем, ебём нейросети вместе! 🔥🎙️

Прошлый тред: >>1055411 (OP)
Пропущено 131 постов
27 с картинками.
Пропущено 131 постов, 27 с картинками.
Аноним 04/05/26 Пнд 00:01:08 1604328
с самово начала можно было качать готовые сборки Комфи,
"под картинки", "под видосы", "под вот эту модэль".
риально портабельные,

а теперь пидрилы сраные все скатили в "линукс-пердолинг".
Войс клоун Аноним 04/05/26 Пнд 12:46:34 1604649
Дорова ананасы¡
Есть у меня например не у меня а у друга 2 филипиночки.
1) может ли comfyui голос на ходу менять?
Чтобы звонить двм филипиночкам разным голосом?
2) если да, то можно ли находу переводить на филипиновский?
Находу это с небольшими задержками, но не такими чтобы они подумали что я умственно-отсталый дегенерат.
В обратку с филипиновского я через гугл транслейт могу
Аноним 05/05/26 Втр 15:38:38 1605329
>>1604649
ИИшный голос легко спалят.
Да и вообще, есть модели, которые этому языку обучены?

P.s. полноценного "риалтайм" ИИ-войсченжера до сих пор нет, насколько я знаю. Да, некоторые нейронки работают быстро (фразу в 15 секунд делают за 20, например).
Но! Тебе надо эту фразу сначала закончить, скормить нейронке, и потом получить результат. "Потоком" делать - совсем другая технология. А уж с синхронным переводом - вообще забей.
ИТТ обсуждаем опыт нейродроча в своих настоящих задачах. Это не тред "а вот через три года" - он тол Аноним 24/12/22 Суб 16:39:19 3223 Ответ
chatgpt coders.mp4 1201Кб, 466x346, 00:01:11
466x346
ИТТ обсуждаем опыт нейродроча в своих настоящих задачах. Это не тред "а вот через три года" - он только для обмена реальными историями успеха, пусть даже очень локального.

Мой опыт следующий (golang).
Отобрал десяток наиболее изолированных тикетов, закрыть которые можно, не зная о проекте ничего. Это весьма скромный процент от общего кол-ва задач, но я решил ограничится идеальными ситуациями. Например, "Проверить системные требования перед установкой".
Самостоятельно разбил эти тикеты на подзадачи. Например, "Проверить системные требования перед установкой" = "Проверить объем ОЗУ" + "Проверить место на диске" + ...
Ввел все эти подзадачи на английском (другие языки не пробовал по очевидной причине их хуевости) и тщательно следил за выводом.

Ответ убил🤭
Хотя одну из подзадач (найти кол-во ядер) нейронка решила верно, это была самая простая из них, буквально пример из мануала в одну строчку.
На остальных получалось хуже. Сильно хуже. Выдавая поначалу что-то нерабочее в принципе, после длительного чтения нотаций "There is an error: ..." получался код, который можно собрать, но лучше было бы нельзя. Он мог делать абсолютно что угодно, выводя какие-то типа осмысленные результаты.

Мой итог следующий.
На данном этапе нейрогенератор не способен заменить даже вкатуна со Скиллбокса, не говоря уж о джунах и, тем более, миддлах.
Даже в идеальных случаях ГПТ не помог в написании кода. Тот мизерный процент решенных подзадач не стоил труда, затраченного даже конкретно на них.
Но реальная польза уже есть! Чатик позволяет узнать о каких-то релевантных либах и методах, предупреждает о вероятных оказиях (например, что, узнавая кол-во ядер, надо помнить, что они бывают физическими и логическими).

И все же, хотелось бы узнать, есть ли аноны, добившиеся от сетки большего?
Пропущено 304 постов
44 с картинками.
Пропущено 304 постов, 44 с картинками.
Аноним 28/04/26 Втр 18:49:13 1600296
>>3223 (OP)
>Это не тред "а вот через три года"
Уже три года прошло и ни одного переката
Аноним 28/04/26 Втр 19:54:59 1600369
>>1600296
ЛЛМ по сути стали процессорами поисковой выдачи с гугла. Без гуглопоиска даже самые жирные корпосетки все такие же тупые и выдают регулярно выдают полную лажу.
Аноним 05/05/26 Втр 08:52:57 1605112
По работе помог вытроить технологии работы с новыми материалами.
Помог в некоторых ситуациях вытсроить диалог и разобрать псих проблемы.
Помогает писать слуебные записки.
Помогает формлять статьи.
Написал лит обзор для дисера.
Насоветовал годных книг по моим интересам.
Трактует сны.
Пересказывает видео с ютуба и большие статьи.
Помогает проходить игры.
Помогает в готовке, дает рецепты для аэрогриля.
ССоставил тренеровочный план для качалки.
ООбработал фото для заграника.
Помог написать скрипт эксель.
Чат с ИИшкой Аноним 19/04/26 Вск 02:06:27 1591276 Ответ
image.png 65Кб, 202x250
202x250
Сап двощ

Уважаемые аноны!
Подскажите, пожалуйста, бесплатные сайты, где можно вести разговоры на не очень приличные темы с ИИшкой.
Пропущено 5 постов
1 с картинками.
Пропущено 5 постов, 1 с картинками.
Аноним 02/05/26 Суб 16:11:38 1603417
>>1597339
This
Бесплатно, без ограничения в день, без смс
Аноним 03/05/26 Вск 17:56:32 1604080
Аноним 05/05/26 Втр 01:28:39 1605044
>>1604080
Локально это дорого, а человек бесплатно спрашивает.
Цензура Grok Аноним 01/02/26 Вск 13:58:10 1506333 Ответ
image.png 991Кб, 784x1168
784x1168
Пишу как неведомый в ИИ вам за советом.
Использовал грок для создания NSFW контента, а именно генерация картинок и их анимация.
Подскажите, есть ли аналоги для подобного функционала или же обход цензуры в грок
Пропущено 33 постов
4 с картинками.
Пропущено 33 постов, 4 с картинками.
Аноним 20/04/26 Пнд 22:25:41 1592770
/ nf
Аноним 04/05/26 Пнд 10:01:16 1604543
/nf
Аноним 04/05/26 Пнд 19:56:33 1604925
>>1544660
Ужс, какой культурный и воспитанный человек. Аж тошнит.
Детектор сгенерированных картинок Аноним 17/03/26 Втр 00:31:39 1553649 Ответ
1773691197737.png 1783Кб, 1024x1024
1024x1024
https://undetectable.ai/ai-image-detector - вот эта штукень выявляется безошибочно почти все сгенерированные в нейронках картинки.

Думаем!
Пропущено 14 постов
9 с картинками.
Пропущено 14 постов, 9 с картинками.
Аноним 19/03/26 Чтв 01:24:36 1555677
1773872676710.jpg 234Кб, 1392x576
1392x576
>>1555531
> но 96% - многовато, наверное
Хуй знает. Там система ебанутая какая-то. Тут >>1555415 оригинал - 95% жпг из mpv, и инпейнт 95% жпг из гимпа (только сохранение в жпег, ничего не изменено по сравнению с png). Оба показывают 96% уверенности digitally edited, будто оно вообще не замечает разницы. Гораздо более интересно, что оно на это >>1555438 показывает 67% real image.
Аноним 19/03/26 Чтв 01:39:47 1555697
1773873587845.png 934Кб, 1258x795
1258x795
1773873587845.png 1004Кб, 1246x745
1246x745
1773873587845.png 623Кб, 1221x782
1221x782
1773873587862.png 843Кб, 1228x788
1228x788
>>1555677
Бля. Оно инпейнты вообще не палит.

>>1555531
Кажется разобрался. Дохуя внимания оно уделяет геометрии бэкграунда, с которой у нейронок обычно не оче.
> GPT-5 или Gamini
Попробуй ей клосап или 1гирл в чистом поле скормить. Подозреваю, что не определит нихуя.
Аноним 04/05/26 Пнд 12:36:43 1604646
Bump.
3D AI /3d/ Аноним 24/04/25 Чтв 15:55:36 1173113 Ответ
image 384Кб, 686x386
686x386
image 1147Кб, 1280x720
1280x720
image 646Кб, 1383x701
1383x701
image 5736Кб, 2824x1588
2824x1588
Пропущено 418 постов
146 с картинками.
Пропущено 418 постов, 146 с картинками.
Аноним 02/05/26 Суб 20:48:49 1603622
1775821696161-0[...].png 1360Кб, 1098x960
1098x960
DSC08200.png 1224Кб, 960x720
960x720
dsc07562-1.webp 56Кб, 1242x960
1242x960
Я так понимаю нет никакой шняги типа арены, ну или локально, чтобы я мог туда написать "Вот тебе картинка, сделай мне горшок в 3д, стл пожалуйста" и получить приличный stl(ну или какое другое дерьмо и конвертнуть, не выломав себе проц)

Я просто очередной 3д печатальщик, и печатаю я в-основном начерченное во фьюжене инженерное. Но иногда хочется что-то сотворить, а я днище с афантазией и дедом немцем, в творчество вообще не могу, если оно не квадратное. Готовые модели не всегда есть нужные. Например напечатал мамке просто по приколу этих зайцев, нужно было выбрать цвет пластика для некоторой фурнитуры, и я напечатал трех слегка отличающихся оттенком зайцев, ей понравилось и она попросила больше зайцев в разных позах. Я представляю, что даже для новичка в 3д это работа на пару минут, скорее всего, но я пытался, день всрал и ничего. Так же есть чувак, делающий такие плафоны, горшки и прочее, в своем стиле, пак стоит 25 баксов, мало того что жмет, так еще и хрен заплатишь на этом printables. Вот и спрашиваю.
Аноним 02/05/26 Суб 22:20:24 1603658
image 160Кб, 600x600
600x600
Аноним 04/05/26 Пнд 11:05:16 1604604
>>1603622
Хуньян тенсентовский из шапки тыкал? Потыкай.
Тред веб-версии нейросетей (ChatGPT, Claude, Gemini и пр.) №1 /aiweb/ Аноним 02/05/26 Суб 14:32:32 1603342 Ответ
ChatGPTlogo.svg.png 65Кб, 960x960
960x960
ClaudeAIlogo.svg.png 32Кб, 960x207
960x207
GoogleGeminilog[...].png 8Кб, 330x75
330x75
DeepSeeklogo.svg.png 26Кб, 960x204
960x204
Общаемся с ИИ, почти что AGI самыми продвинутыми текстовыми моделями: GPT, Claude, Gemini и прочими. Горим с ограничений, лимитов и банов, генерим пикчи, пишем код и спорим о том, какая модель лучше.

Основные сервисы:
- ChatGPT: https://chatgpt.com/
- Claude: https://claude.ai/
- Gemini: https://gemini.google.com/
- Grok: https://grok.com/
- DeepSeek: https://chat.deepseek.com/
- GLM: https://chat.z.ai/

Большинство сервисов доступны бесплатно с ограничениями. Подписки открывают доступ к более мощным моделям, увеличенным лимитам и дополнительным функциям (генерация изображений, файлы, память и т.д.). Цены и условия у всех разные и периодически меняются.

Советы по регистрации:
1. При необходимости используй VPN.
2. Заведи нормальную почту (временные часто режутся).
3. Регистрируйся на нужной платформе.
4. Иногда требуется номер телефона — используются сервисы виртуальных номеров.
5. Пользуйся.

VPN в ряде регионов обязателен. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций:
https://github.com/f/awesome-chatgpt-prompts

Статусы сервисов (при проблемах сначала идти туда, может это общий сбой):
https://status.openai.com/
https://status.anthropic.com/
https://status.cloud.google.com/

Токены и лимиты зависят от модели. У всех разные контексты, цены и ограничения.

Посчитать свои токены можно здесь:
https://huggingface.co/spaces/Xenova/the-tokenizer-playground

Что могут нейросети:
- писать правдоподобные тексты
- помогать с кодом
- объяснять сложные темы
- генерировать изображения (не везде)

Что не могут:
- гарантировать истину
- стабильно решать сложные задачи без ошибок
- полностью заменять специалистов
- захватывать мир (пока)

С каждым обновлением усиливаются фильтры и ограничения. NSFW-контент режется всё чаще. Кумеры со всего мира в печали.
Аноним 04/05/26 Пнд 01:07:53 1604356
RIP 4o-latest, лучшая модель в истории (
Anime into Reality /ani2irl/ Аноним 19/04/26 Вск 03:19:28 1591303 Ответ
-53253342281542[...].png 1267Кб, 864x1232
864x1232
image00025.png 6178Кб, 2048x2048
2048x2048
-79160082834034[...].png 1050Кб, 880x1216
880x1216
image(22).png 1239Кб, 1772x895
1772x895
В тредике трансформируем аниме арты в professional photography, ultra-realistic, 8k resolution и бесконечно рероллим 3D анимацию/фигурки/околоаниме/просто всратые

По возможности постите рядом оригинальный арт, чтобы было с чем сравнить.
Пропущено 27 постов
17 с картинками.
Пропущено 27 постов, 17 с картинками.
Аноним 03/05/26 Вск 15:25:59 1604007
2.jpg 188Кб, 721x773
721x773
3.jpg 115Кб, 529x699
529x699
4.jpg 675Кб, 919x1383
919x1383
71+f-VRZw2L.ACS[...].jpg 102Кб, 638x879
638x879
Сделайте пожалуйста реалистичные фото.
Аноним 03/05/26 Вск 15:26:29 1604008
1.jpg 86Кб, 506x298
506x298
7.jpg 320Кб, 929x1024
929x1024
5.jpg 225Кб, 929x628
929x628
6.jpg 225Кб, 930x443
930x443
Аноним 03/05/26 Вск 17:11:55 1604065
Flux2-Klein-4b-[...].png 1284Кб, 608x1712
608x1712
Flux2-Klein-4b-[...].png 1282Кб, 608x1712
608x1712
NepgearV2.png 478Кб, 512x1443
512x1443
Flux2-Klein-4b-[...].png 1336Кб, 880x1168
880x1168
>>1591303 (OP)
klein 9b snofs
1) transform this picture to the real life cosplay photo with blank background

2) transform this picture into professional photography, ultra-realistic, 8k resolution

3) ориг

>>1604007
klein 9b обычный
4) transform this picture to the real life cosplay photo with blank background, yellow hair, white shirt, red color of neck accessory, прищуренные глаза, looking aside
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов