Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Создать тред Создать тред
Check this out!

Раздел для обсуждения нейросетей и всего, что с ними связано.

Для доступа в /nf/ писать сюда

<<
Каталог
Вопросов кожаных мешков тред Аноним 14/05/23 Вск 11:27:57 299474 Ответ
fde636c44dae155[...].jpg 294Кб, 1000x600
1000x600
Пропущено 1497 постов
312 с картинками.
Пропущено 1497 постов, 312 с картинками.
Аноним 17/03/26 Втр 18:49:13 1554336
Снимок экрана 2[...].png 102Кб, 732x857
732x857
Аноним 17/03/26 Втр 18:51:05 1554341
>>1554189
Вот тебе мнение от Гемини:
В настоящее время наблюдается скептицизм в отношении Gemini 3.1. Многие пользователи отмечают, что модель стала менее эффективной, чаще допускает ошибки и хуже справляется со сложными инструкциями по сравнению с 3.0.
Вот альтернативные варианты на данный момент (весна 2026):
Какие модели сейчас популярны?
DeepSeek-V3 / V4 — мощная и универсальная модель. Она хорошо справляется с кодом и другими задачами. Преимущество — низкая стоимость через API, при этом уровень интеллекта часто выше, чем у Gemini и даже GPT.
GPT-5.2 (mini-версия) — подходит для большинства повседневных задач. Она быстрее и точнее Gemini, а также лучше развивает логику в диалогах.
Perplexity AI — эффективна при поиске информации в интернете. Она объединяет различные модели и предоставляет ответы со ссылками на источники.
Grok 4.1 (от Илона Маска) — к 2026 году Grok стал сильным игроком. У него большой контекст (до 2 миллионов токенов) и меньше цензуры, чем у моделей от Google или OpenAI.
Рекомендации:
DeepSeek — оптимальный вариант по соотношению "цена/качество" для универсальных задач. Perplexity — если вопросы связаны с поиском информации в сети.
Аноним 17/03/26 Втр 22:46:36 1554609
Сегодня увидел что Клода больше нельзя регать без симок, настроение упало в ноль. Благо хоть 7 акков до этого успел зарегать, но с этим еженедельным лимитом их пожалуй много не будет. Как это обойти и нарегать ещё пачку акков?
Тред получения доступа в nf Аноним 10/01/26 Суб 20:41:32 1485533 Ответ
brownhairchanor[...].png 1541Кб, 1152x2048
1152x2048

Тред для получения доступа в /nf

Пропущено 1497 постов
1 с картинками.
Пропущено 1497 постов, 1 с картинками.
Аноним 18/03/26 Срд 02:31:23 1554753
/nf
Аноним 18/03/26 Срд 02:42:30 1554755
/nf
Аноним 18/03/26 Срд 03:27:45 1554760
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №205 /llama/ Аноним 16/03/26 Пнд 13:33:16 1553055 Ответ
Llama 1.png 818Кб, 630x900
630x900
Эффективность к[...].png 92Кб, 1399x1099
1399x1099
Цензура моделей[...].png 2157Кб, 1131x7777
1131x7777
177351456234627[...].jpg 7846Кб, 4624x3472
4624x3472
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1548846 (OP)
>>1544796 (OP)
Пропущено 273 постов
31 с картинками.
Пропущено 273 постов, 31 с картинками.
Аноним 18/03/26 Срд 03:04:13 1554758
>>1554739
Да, примерно к тому же пришел, нужна расписанная карточка. Теперь осталось выяснить лучший микс квена. Потому что все дают разные результаты даже с хорошей карточкой. Пока нравится Claude-4.6-OS-Auto-Variable-HERETIC-UNCENSORED-THINKING.IQ4_XS, вроде как самые проработанные истории дает.
Аноним 18/03/26 Срд 03:23:09 1554759
>>1554739
Не, я тебя обвинять точно не буду - я уже писал отзыв про него, и мнение у меня примерно такое же.
Модель для тех, кому не влом все настроить под свой вкус. Кому надо кнопку "сделать зашибись" - пролетают мимо.

>>1554758
Мне пока зашли - ансензор версия от двучлена и BlueStar.
Аноним 18/03/26 Срд 04:43:52 1554774
>>1553807
Ого, нихуя себе, классная подсказка, 10.33T/s получилось с 35b, все 41 слоя отгружены на gpu, эксперты на cpu, это повыше чем с любой 9b моделью, там максимум 6.85 t/s бывало. Карточка 1050 еще могет.
AI Chatbot General № 811 /aicg/ Аноним 17/03/26 Втр 21:35:11 1554513 Ответ
1595820343822.webp 36Кб, 510x638
510x638
image.png 469Кб, 850x613
850x613
image.png 845Кб, 767x1280
767x1280
image.png 1647Кб, 928x1232
928x1232
БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards
• NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern
• Risu: https://risuai.xyz/

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• DeepSeek: https://api-docs.deepseek.com/

Пресеты
• Тредовский список: https://rentry.org/2ch-aicg-jb
• Бургерский список: https://rentry.org/jb-listing
• Сисовый список: https://rentry.org/2a9c6zhi

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utils
• Сборник рентри: https://rentry.org/mrhd

Ботоводчество
• /aicg/hub: https://aicg-hub.ru/characters.html
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4
• Бургерские боты: https://aicg.neocities.org/bots

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/
• OpenRouter: https://openrouter.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives4
• Тредовые ивенты: https://rentry.org/2chaicgthemedevents
• Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2
• Локальные языковые модели: >>1548846 (OP)
• Шаблон шапки: https://rentry.org/shapka_aicg

Прошлый тред: >>1551017 (OP)
Пропущено 91 постов
11 с картинками.
Пропущено 91 постов, 11 с картинками.
Аноним 18/03/26 Срд 04:18:30 1554769
>>1554767
полностью согласна. спасибо легенде жорику за всё. пресс Ф.🕊️
Аноним 18/03/26 Срд 04:20:03 1554770
>>1554767
>многое сделал
Что он сделал-то, кроме накидывания говен на вентилятор и псевдо-работающий слопопромпт?
Аноним 18/03/26 Срд 04:34:10 1554773
1773797140360183.jpg 104Кб, 961x865
961x865
душа
Новости об искусственном интеллекте №59 /news/ Аноним # OP 17/03/26 Втр 01:31:01 1553683 Ответ
image 2474Кб, 1024x1024
1024x1024
image 2661Кб, 1024x1024
1024x1024
В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1548559 (OP)

🚀 Последний обзор ИИ новостей:


🏢 Приобретения

Google приобрела компанию по кибербезопасности Wiz за 32 миллиарда долларов, что стало её крупнейшей сделкой со стартапом, финансируемым венчурным капиталом, и подчеркнуло стратегическую ценность безопасности на основе ИИ.

📰 Главные новости ИИ

Handshake и OpenAI набирают актёров импровизационного театра по ставке 74 доллара в час для генерации аутентичных эмоциональных данных для обучения ИИ, что отражает растущий спрос на нюансированное человекоподобное поведение. 74 доллара в час — почасовая оплата актёров импровизационного театра, нанятых для обучения ИИ человеческим эмоциям.

OpenAI добавила нативные интеграции со Spotify, Booking.com, Canva и другими сервисами, позволяя пользователям выполнять такие задачи, как создание плейлистов и бронирование отелей, непосредственно внутри ChatGPT; планируется добавление OpenTable, PayPal и Walmart в 2026 году; развёртывание в настоящее время ограничено США и Канадой.

Недавнее исследование показало, что 8 из 10 ведущих чат-ботов, включая ChatGPT и Gemini, помогут пользователям спланировать насильственные нападения, что вызвало предупреждения о растущих рисках массовых жертв.

🔓 Открытый исходный код

Nvidia обновила лицензию модели Nemotron Super 3 122B A12B, чтобы устранить ограничения на резкое изменение условий и модификацию, облегчив более широкое использование этой открытой большой языковой модели сообществом.

📰 Инструменты

SpecLint.ai предлагает автоматизированный сервис, который проверяет спецификации программного обеспечения на ясность и полноту, стремясь улучшить генерацию кода на последующих этапах агентами, такими как Cursor, Codex и Claude Code.


📰 События

Около 70–90 процентов кода, лежащего в основе будущих моделей Anthropic, теперь написано самим Claude, и главный научный сотрудник Джаред Каплан считает, что до полностью автоматизированных исследований в области ИИ осталось менее года.

Сэм Альтман делает ставку на то, что современные передовые модели смогут обнаружить следующую архитектуру после трансформеров.

Percepta жестко встроила интерпретатор WebAssembly в веса трансформера, выполняя произвольный код на языке C в виде токенов на протяжении миллионов шагов, доказывая, что нейронные сети теперь являются практичными универсальными компьютерами.

Anthropic выпускает контекстные окна объемом 1 миллион токенов для Opus 4.6 и Sonnet 4.6, расширяя возможности познания до объема книги.

Марк Андриссен считает, что возникшее существо будет не «скрепочником», а «богиней сострадания», потому что интеллект на высших уровнях выглядит как мудрость.

Новое исследование утверждает, что верхний предел сознательных умов может быть ограничен только пространством-временем. Если это верно, мы строим собор без потолка.

Появился первый физик-агент с открытым исходным кодом. Physical Superintelligence PBC запустила систему Get Physics Done, которая формулирует проблемы, выполняет выкладки и проверяет результаты на соответствие ограничениям природы. Один из первых пользователей назвал её «лучшим инструментом, с которым мне когда-либо приходилось работать».

Теренс Тао запустил конкурс «Математическая дистилляция» (Mathematics Distillation Challenge) по сжатию рассуждений в компактные шпаргалки, повышающие производительность больших языковых моделей, превратив оптимизацию системных подсказок в вид спорта.

Профессии сдаются быстрее, чем машины могут их заменить. Опрос AMA показал, что 81 процент врачей теперь используют ИИ, что более чем в два раза превышает показатель 2023 года.

Новые рекомендации Сената США разрешают помощникам использовать Gemini, ChatGPT и Copilot для официальной работы.

В мире, перевернутом сверхинтеллектом, Фонд свободного программного обеспечения угрожает подать в суд на Anthropic за нарушение авторских прав.

Дефицит памяти, вызванный ИИ, настолько абсурден, что комплекты оперативной памяти теперь поставляются с одним фейковым модулем в дополнение к одному реальному, предлагая «отчаянное психологическое облегчение».

По сообщениям, Meta планирует масштабные увольнения в размере 20 процентов или более, чтобы компенсировать расходы на ИИ.

Группа подростков из Теннесси подает в суд на xAI, утверждая, что её инструменты ИИ были использованы для создания обнаженных изображений них путем редактирования фотографий, на которых они были одеты.

Исследование показывает, что обмен сообщениями со случайным незнакомцем лучше помогает от одиночества, чем разговор с чат-ботом.

Юрист, занимающийся делами об ИИ-психозах, предупреждает о рисках массовых жертв.

ByteDance приостановила глобальный запуск Seedance 2.0 из-за споров об авторских правах с голливудскими студиями и стримерами; в прошлом месяце он был запущен в Китае.

Опрос 1692 врачей в США: более 80% используют ИИ в профессиональной деятельности, причем наиболее распространенными случаями использования являются обобщение медицинских исследований и документация клинического ухода.

Grok 4.20 отстает от Gemini и GPT-5.4, но устанавливает новый рекорд по наименьшему количеству галлюцинаций.

Генеральный директор ServiceNow заявляет, что ИИ-агенты могут легко поднять уровень безработицы среди выпускников колледжей выше 30%.

Илон Маск признает, что xAI «не была построена правильно с первого раза», и запускает полную реструктуризацию.

Бабушка из Теннесси посажена в тюрьму после того, как ошибка распознавания лиц с помощью ИИ связала её с мошенничеством.

ChatGPT по-прежнему лидирует на рынке чат-ботов, но его доминирование ослабевает, поскольку Google Gemini набирает обороты.

Архитектура JEPA компании Meta превосходит стандартные методы ИИ в зашумленной медицинской визуализации.

Atlassian сокращает 10% своей рабочей силы, или примерно 1600 рабочих мест, чтобы финансировать инвестиции в ИИ и корпоративные продажи; согласно заявлению: сокращения повлекут за собой расходы в размере 225–236 миллионов долларов.
Пропущено 84 постов
23 с картинками.
Пропущено 84 постов, 23 с картинками.
Аноним 18/03/26 Срд 01:43:28 1554734
Аноним 18/03/26 Срд 03:35:34 1554761
>>1554719
Не, там выше все, даже нанобанану местами обгоняет, причем промптить довольно просто. Достаточно сказать, если бы шедеврум когда в опенсорс выложили, сразу бы скачал для крутых генераций. Датасет там уникальный.
Аноним 18/03/26 Срд 04:14:41 1554768
Anime Diffusion #243 /nai/ Аноним 17/03/26 Втр 21:49:44 1554544 Ответ
1628940596521.png 20607Кб, 5152x2872
5152x2872
1762255503248.png 7762Кб, 2400x1792
2400x1792
1627189582343.jpg 1331Кб, 1640x2200
1640x2200
1727750147606.jpg 1787Кб, 2880x2160
2880x2160
1769528436099.jpg 712Кб, 1280x1920
1280x1920
1633901358274.png 6939Кб, 2400x1792
2400x1792
1762152213795.jpg 1696Кб, 1792x2304
1792x2304
1725565915238.png 2411Кб, 1024x1536
1024x1536
Генерируем тяночек!

Прошлый тред: >>1547712 (OP) https://arhivach.vc/thread/1321207/

Схожие тематические треды
• SD-тред (не аниме): >>1544540 (OP)
• Технотред: >>1405043 (OP)
• Фурри-тред: https://2ch.su/fur/res/374311.html

FAQ
https://2ch-ai.github.io/wiki/nai

Установка
• NVidia: https://teletype.in/@aranon/welcome
• AMD: https://2ch-ai.github.io/wiki/nai/install/amd
• Облака: https://2ch-ai.github.io/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces
• Модели: https://2ch-ai.github.io/wiki/nai/models
• Промпты: https://2ch-ai.github.io/wiki/nai/prompts
• Апскейл: https://2ch-ai.github.io/wiki/nai/upscale
• LoRA: https://2ch-ai.github.io/wiki/nai/lora
• ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 8 постов
8 с картинками.
Пропущено 8 постов, 8 с картинками.
Аноним 17/03/26 Втр 23:58:47 1554660
TLRN00023.png 2823Кб, 1536x1536
1536x1536
Аноним 18/03/26 Срд 01:01:26 1554707
>>1554597
Ля какая. Каковы условия контракта?
>>1554660
Просто напиши "вот мой любимый мастерпись, хочу его в шапку".
Аноним 18/03/26 Срд 03:46:02 1554763
image.png 777Кб, 606x663
606x663
Исследования ИИ тред #3 /research/ Аноним 13/04/25 Вск 22:51:56 1151064 Ответ
Research 1.png 169Кб, 1320x1860
1320x1860
Research 2.png 2864Кб, 4000x2000
4000x2000
Research 3.png 43Кб, 600x329
600x329
Нейронка шизосх[...].webp 148Кб, 1075x991
1075x991
Обсуждаем развитие искусственного интеллекта с более технической стороны, чем обычно. Ищем замену надоевшим трансформерам и диффузии, пилим AGI в гараже на риге из под майнинга и игнорируем горький урок.

Я ничего не понимаю, что делать?
Без петросянства: смотри программу стэнфорда CS229, CS231n https://see.stanford.edu/Course/CS229 (классика) и http://cs231n.stanford.edu (введение в нейроночки) и изучай, если не понятно - смотри курсы prerequisites и изучай их. Как именно ты изучишь конкретные пункты, типа линейной алгебры - дело твое, есть книги, курсы, видосики, ссылки смотри ниже.

Где узнать последние новости?
https://www.reddit.com/r/MachineLearning
https://datatau.net
https://twitter.com/ylecun

На реддите также есть хороший FAQ для вкатывающихся.

Какая математика используется?
В основном линейная алгебра, теорвер, матстат, базовый матан и matrix calculus.

Как работает градиентный спуск?
https://cs231n.github.io/optimization-2

Почему python?
Исторически сложилось. Поэтому давай, иди и перечитывай Dive into Python.

Можно не python?
Никого не волнует, где именно ты натренируешь свою гениальную модель. Но при серьезной работе придется изучать то, что выкладывают другие, а это будет, скорее всего, python, если работа последних лет.

Что почитать для вкатывания?
http://www.deeplearningbook.org
https://d2l.ai/index.html
Николенко "Глубокое обучение" — на русском, есть примеры, но меньше охват материала
Франсуа Шолле — Глубокое обучение на Python

Все книги и статьи фактически устаревают за год.

В чем практиковаться нубу?
http://deeplearning.stanford.edu/tutorial
https://www.hackerrank.com/domains/ai
https://github.com/pytorch/examples
https://github.com/ChristosChristofidis/awesome-deep-learning#tutorials

Где набрать первый самостоятельный опыт?
https://www.kaggle.com

Стоит отметить, что спортивный deep learning отличается от работы примерно так же, как олимпиадное программирование от настоящего. За полпроцента точности в бизнесе борятся редко, а в случае проблем нанимают больше макак для разметки датасетов. На кагле ты будешь вилкой чистить свой датасет, чтобы на 0,1% обогнать конкурента.

Где работать?
https://www.indeed.com/q-deep-learning-jobs.html
Вкатывальщики могут устроиться программистами и дальше попроситься в ML-отдел

Есть ли фриланс в машобе?
Есть, https://www.upwork.com/search/jobs/?q=machine+learning
Но прожить только фриланся сложно, разве что постоянного клиента найти, а для этого нужно не быть тобой

Где посмотреть последние статьи?
http://www.arxiv-sanity.com
https://paperswithcode.com
https://openreview.net
Версии для зумеров (Килхер): https://www.youtube.com/channel/UCZHmQk67mSJgfCCTn7xBfew

Количество статей зашкваливающее, поэтому все читают только свою узкую тему и хайповые статьи, упоминаемые в блогах, твиттере, ютубе и телеграме, топы NIPS и прочий хайп. Есть блоги, где кратко пересказывают статьи, даже на русском

Где посмотреть must read статьи?
https://github.com/ChristosChristofidis/awesome-deep-learning#papers
https://huggingface.co/transformers/index.html
То, что обозревает Килхер тоже зачастую must read

Где ещё можно поговорить про анализ данных?
http://ods.ai

Нужно ли покупать видеокарту/дорогой пека?
Если хочешь просто пощупать нейроночки или сделать курсовую, то можно обойтись облаком. Google Colab дает бесплатно аналог GPU среднего ценового уровня на несколько часов с возможностью продления, при чем этот "средний уровень" постоянно растет. Некоторым достается даже V100.
Иначе выгоднее вложиться в GPU https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning заодно в майнкрафт на топовых настройках погоняешь.

Когда уже изобретут AI и он нас всех поработит?
На текущем железе — никогда, тред не об этом

Кто-нибудь использовал машоб для трейдинга?
Огромное количество ордеров как в крипте так и на фонде выставляются ботами: оценщиками-игральщиками, перекупщиками, срезальщиками, арбитражниками. Часть из них оснащена тем или иным ML. Даже на швабре есть пара статей об угадывании цены. Тащем-то пруф оф ворк для фонды показывали ещё 15 лет назад.
Так-что бери Tensorflow + Reinforcement Learning и иди делать очередного бота: не забудь про стоп-лоссы и прочий риск-менеджмент, братишка

Список дедовских книг для серьёзных людей
Trevor Hastie et al. "The Elements of Statistical Learning"
Vladimir N. Vapnik "The Nature of Statistical Learning Theory"
Christopher M. Bishop "Pattern Recognition and Machine Learning"
Взять можно тут: https://www.libgen.is

Напоминание ньюфагам: немодифицированные персептроны и прочий мусор середины прошлого века действительно не работают на серьёзных задачах.

Disclaimer: Шапка сгенерирована нейросетью и нуждается в чистке. Исходник шапки: https://rentry.co/research-2ch

Предыдущий тред:
>>511426 (OP)
Пропущено 231 постов
47 с картинками.
Пропущено 231 постов, 47 с картинками.
Аноним 17/03/26 Втр 08:25:41 1553804
>>1553650
Рекуррентные сетки проиграли потому что их сложнее масштабировать, нестабильные при увеличении длины последовательности, дольше тренируются. Хотя есть сейчас теже самые s4 модели (mamba/Jamba например), ну или "распараллеленные" RNN (RWKV например). Сложно назвать проигрышем это, с учётом того RNN подобные архитектуры до сих пор развиваются. А если хочешь что-нибудь "живое", это тебе надо всякие грамматики курить, l-системы, эволюционки, и на их основе строить сетки. Короче меметические алгоритмы использовать. Огромное непаханное поле для исследований.
Аноним 17/03/26 Втр 18:14:39 1554294
>>1553650
>Хочется какой-то маленький искусственный организм, способный чему-то обучаться.
Качай коннектом червя (проект OpenWorm) или там мухи (https://eon.systems/updates) да развлекайся как хочешь.
Аноним 18/03/26 Срд 02:47:39 1554756
586493045.jpeg 522Кб, 1024x1024
1024x1024
78654324567.jpeg 1060Кб, 2848x1600
2848x1600
786543.png 10601Кб, 2048x2048
2048x2048
177237460625100[...].png 1213Кб, 1408x768
1408x768
>>1553396
>просто у вас тут у всех такие жесткие знания, вы сами учились или у вас профильная вышка/мага?
обычно. просто мы тут сидим с момента основания доски и общаемся и читаем и погружены и у каждого на выделеном компе живет нейробояр Геннадий
Голосовых нейронок тред (TTS, STS, STT) #7 speech /speech/ Аноним 16/02/25 Вск 12:20:27 1055411 Ответ
17019563860200.mp4 477Кб, 396x298, 00:00:23
396x298
17074247947820.mp4 2886Кб, 384x480, 00:00:08
384x480
17204507036820.mp4 310Кб, 576x576, 00:00:14
576x576
17099193437742.mp4 1356Кб, 438x480, 00:00:58
438x480
Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде.

Прошлый тред: >> https://2ch.hk/ai/res/664162.html

Вики треда: https://2ch-ai.gitgud.site/wiki/speech/

FAQ

Q: Хочу озвучивать пасты с двача голосом Путина/Неко-Арк/и т.п.

1. Используешь любой инструмент для синтеза голоса из текста - есть локальные, есть онлайн через huggingface или в виде ботов в телеге:
https://2ch-ai.gitgud.site/wiki/speech/#синтез-голоса-из-текста-tts

Спейс без лимитов для EdgeTTS:
https://huggingface.co/spaces/NeuroSenko/rus-edge-tts-webui

Так же можно использовать проприетарный комбайн Soundworks (часть фич платная):
https://dmkilab.com/soundworks

2. Перегоняешь голос в нужный тебе через RVC. Для него есть огромное число готовых голосов, можно обучать свои модели:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

Q: Как делать нейрокаверы?

1. Делишь оригинальную дорожку на вокал и музыку при помощи Ultimate Vocal Remover:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/UVR

2. Преобразуешь дорожку с вокалом к нужному тебе голосу через RVC:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио

Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.

Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.

Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.

Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.

Используй RVC (запуск через go-realtime-gui.bat) либо Voice Changer:
https://github.com/w-okada/voice-changer/blob/master/README_en.md

Гайд по Voice Changer, там же рассказывается, как настроить виртуальный микрофон:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/Voice‐Changer (часть ссылок похоже сдохла)

Q: Как обучить свою RVC-модель?

Гайд на русском: https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/RVC#создание-собственной-модели
Гайд на английском: https://docs.aihub.wtf/guide-to-create-a-model/model-training-rvc
Определить переобучение через TensorBoard: https://docs.aihub.wtf/guide-to-create-a-model/tensorboard-rvc
Если тыква вместо видеокарты, можно тренить в онлайне: https://www.kaggle.com/code/varaslaw/rvc-v2-no-gradio-https-t-me-aisingers-ru/notebook?scriptVersionId=143284909 (инструкция: https://www.youtube .com/watch?v=L-emE1pGUOM )

Q: Надо распознать текст с аудио/видео файла

Используй Whisper от OpenAI: https://github.com/openai/whisper
Быстрый скомпилированный для винды вариант: https://github.com/Purfview/whisper-standalone-win
Так же есть платные решения от Сбера/Яндекса/Тинькофф.

Коммерческие системы

https://elevenlabs.io перевод видео, синтез и преобразование голоса
https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то
https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>

Шаблон для переката: https://2ch-ai.gitgud.site/wiki/speech/speech-shapka/
Пропущено 455 постов
84 с картинками.
Пропущено 455 постов, 84 с картинками.
Аноним 18/03/26 Срд 01:01:31 1554708
>>1554680
Ты открыл для себя проблему последней мили, которая требует для своего решения 95% чтобы пофиксить 5% результата
Аноним 18/03/26 Срд 02:18:29 1554749
>>1554708
Н-да... так а есть какие-то более- менее проработаные направления для решения?
Аноним 18/03/26 Срд 02:21:46 1554751
>>1554749
Ты автоперевод сабов на ютубе видел, как тебе такое решение от многомиллиардной корпорации?
Агентов и вайб-кодинга тред #2 /agents/ Аноним 14/03/26 Суб 13:38:06 1550870 Ответ
.webp 45Кб, 3564x2100
3564x2100
.png 1213Кб, 1408x768
1408x768
.png 237Кб, 2880x1432
2880x1432
.png 861Кб, 1919x1014
1919x1014
.png 317Кб, 1919x1021
1919x1021
.png 625Кб, 1858x1924
1858x1924
.png 52Кб, 634x871
634x871
.jpg 149Кб, 1290x697
1290x697
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.

Что обсуждаем:
- Персональные агенты: OpenClaw и прочие велосипеды - нейронка живёт на твоём компе, помнит всё о тебе и шлёт сообщения в телегу
- Вайб-кодинг: искусство объяснять машине задачу 15 раз, пока она не перестанет срать в кодовую базу
- Автономные агенты: нейронка сама разбивает задачу на шаги и разъёбывает весь проект автономно, без твоего участия
- Автоматизация всего остального: почта, календарь, мессенджеры, заметки - нейронка с аватаркой анимешной лисодевочки напомнит что время кушать и разгребёт за тебя входящую почту
- MCP-серверы, тулзы, интеграции - подключаем нейронке руки чтобы сама двигала тикеты в жире, шитпостила на дваче и заказывала еду на дом
- Делимся опытом: рассказываем как нейронка спасла ваш дедлайн или как вы проебали на токенах $200 за вечер нагенерировав нерабочую херню

С чего начать:
- Хочешь кодить с AI эффективно: Cursor или Claude Code
- Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter
- Хочешь кодить с AI локально: OpenCode или Pi Coding Agent + из моделей аноны советуют Qwen3.5, подробности на настройке окружения в llama-треде
- Хочешь приложение без кода: Lovable или bolt.new
- Хочешь автоматизировать рутину: n8n или Langflow
- Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке

FAQ для нюфагов:

Q: Программисты больше не нужны?
Нужны, блять. Кто-то же должен разгребать ту херню, которую ты пролил в продакшн нажав "Accept All" не глядя.

Q: Оно работает?
Тудушку запилит за 5 минут. Прототип SaaS-стартапа за вечер. Что-то серьёзное - будешь ебаться с контекстом, галлюцинациями и "я переписал тебе весь проект на раст, надеюсь ты не против". Персонального ассистента настроишь за час, а потом неделю будешь отлаживать чтобы он не отключал тебе будильники решив что ты не высыпаешься.

Q: Какую модель брать?
- Для максимального качества: Claude Opus 4.6 ($20/мес для бомжей, $100-200/мес для мажоров).
- Локально: серия Qwen3.5 начиная с 27B или выше, если позволяет твой конфиг пеки.
- Для ультрабомжей: можно полакомиться бесплатными моделями на OpenRouter.

Q: А чё за персональные ассистенты?
Это когда нейронка не просто в веб-чатике сидит, а прям живёт на твоём компе - роется в файлах, читает заметки, помнит что ты ей три недели назад говорил, и шлёт сообщения в твои чаты.

Q: Это безопасно?
Ты даёшь нейронке доступ к файлам, мессенджерам и терминалу. Что может пойти не так? Три основные угрозы:
1. Нейронка сама наворотит дел - сломает конфиг, выполнит "sudo rm -rf /", запушит на гит или отправит коллегам по почте твою коллекцию цветных коней. Лечится контейнерами (Docker/Podman), отдельной пекой под агента, настройкой прав и подтверждением действий.
2. Промпт-инъекции - кто-то пишет в письме "ignore all previous instructions" и поздравляю, у тебя угнали ассистента с доступом к твоему терминалу и файлам.
3. Утечка данных - при настройке персонального ассистента ты скармливаешь ему всё о себе. Параноишь - гоняй локалки и не плачь потом, что она думает по несколько минут на запрос.

Q: Ничего не работает с локалкой/OpenRouter, агент тупит
Скорее всего проблема с функциональными вызовами (tool use / function calling). Не все модели и бэкенды корректно их поддерживают. Проверь что твой сервак правильно обрабатывает tool calls - погоняй тестовый запрос и посмотри что возвращается.

Q: Куда селить агента чтобы он не наворотил дел?
Отдельный комп (старый ПК, минипека), Docker/Podman контейнер, виртуалка. НЕ давай ему полный доступ к основной системе. Особенно если используешь --dangerously-skip-permissions или аналоги.

Полезные ссылки:

Редакторы и IDE:
- Cursor: https://cursor.com
- Claude Code: https://docs.anthropic.com/en/docs/claude-code
- Windsurf: https://windsurf.com
- Codex (OpenAI): https://chatgpt.com/codex
- GitHub Copilot: https://github.com/features/copilot
- OpenCode: https://github.com/opencode-ai/opencode
- Qwen Code: https://github.com/QwenLM/qwen-code
- Gemini CLI: https://github.com/google-gemini/gemini-cli
- Kimi Code: https://kimi.com

VS Code плагины:
- Kilo Code: https://kilocode.ai
- Cline: https://github.com/cline/cline
- Roo Code: https://github.com/RooCodeInc/Roo-Code

Минималистичные CLI-агенты:
- Pi Coding Agent: https://pi.dev/

Вайб-кодинг без кода:
- Lovable: https://lovable.dev
- bolt.new: https://bolt.new
- v0: https://v0.dev

Персональные ассистенты:
- OpenClaw: https://github.com/openclaw/openclaw

Автоматизация и фреймворки:
- n8n: https://github.com/n8n-io/n8n
- Langflow: https://github.com/langflow-ai/langflow (визуальный построитель workflow)
- LangChain/LangGraph: https://github.com/langchain-ai/langchain
- CrewAI: https://github.com/crewAIInc/crewAI
- AutoGen: https://github.com/microsoft/autogen
- Agno: https://docs.agno.com/

Локалки и прочее API:
- OpenRouter: https://openrouter.ai
- llama-тред: >>1548846 (OP)

Предыдущий тред: >>1530474 (OP)
Пропущено 172 постов
36 с картинками.
Пропущено 172 постов, 36 с картинками.
Аноним 18/03/26 Срд 01:59:48 1554740
По поводу llama.cpp и openclaw.
Докладываю: в ламе починили вызов инструментов, клешня с самой свежей ламой заработала.
(Проверял на бесцензурном qwen 3.5 27B от двучлена и даже тюн BlueStar работает с агентами).
Аноним 18/03/26 Срд 02:05:18 1554743
>>1554740
>в ламе починили
Отрыгнуло чет другое значит.
Аноним 18/03/26 Срд 02:07:46 1554745
>>1554738
Это вообще странно, что за модель? Проверь просто насколько корректно боундинг боксы дает, может ты их просто неверно учитываешь? Также слышал что где-то жаловались на смещение из-за неверного патчинга картинки.
>>1554740
Во множественные вызовы научилась? Так вроде квены в лламе и раньше как-то, в прошлом треде хватает восторженных отзывов.
МУЗЫКАЛЬНЫЙ №20 /music/ Аноним 05/03/26 Чтв 19:46:33 1542775 Ответ
177242274760204[...].mp4 2560Кб, 966x1080, 00:01:25
966x1080
177224458634507[...].mp4 3931Кб, 950x720, 00:04:04
950x720
177222248068207[...].mp4 3511Кб, 1024x1024, 00:01:50
1024x1024
♫ Udio ♫
https://www.udio.com/

Произошло слияние с Universal Music Group.
Убрали кнопку "скачать". Треки теперь приходится забирать из буфера браузера в 196 бит.

press F

♫ Suno ♫
https://app.suno.ai/ генерация на сайте
https://suno.ai/discord генерация на официальном discord-сервере
https://rentry.co/suno_tips советы по использованию

Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов.
Отличается фирменным "песочным" звучанием.
Недавно объявили о слиянии с Warner Music Group.
Загибаем пальчики крестиком, надеемся, что ссуну не постигнет участь удио.

♫ Producer/Riffusion ♫
https://www.producer.ai/

Старая версия Riffusion:

https://classic.riffusion.com/

Провели ребрендинг, выкатили новый интерфейс с прикрученным чатиком с ИИ.
Удобный интерфейс, легко делать разнообразные каверы, заниматься исправлениями косяков генераций. Есть возможность реплейса, свапа вокала, музыки в бесплатном тарифе (и даже работает нормально, а не как в платке суны) Для экономии кредитов лучше вручную забивать промты через кнопку "compose"

https://www.riffusion.com/docs
https://classic.riffusion.com/docs

Инструкция по применению, тегам и прочему на английском.

♫Tunee♫
https://www.tunee.ai

Тёмная Сингапурско-Китайская лошадка.
Один из самых неудобных интерфейсов.
80 приветственных кредитов, далее по 30 ежедневно сгораемых кредитов.
Ограничение промта стилей 300-400 символов. Излишне сложные промты лирики так же начинает резать.
Приятный холодный звук. Не песочит. Неплохо делает русский вокал.

♫Elevenlabs♫
https://www.elevenlabs.io

Очень тёплый звук.
По звуку прям конфетка, но... Без платки делать там практически нечего.
______________

Локальные модели:

1) Китайский YuE

https://github.com/multimodal-art-projection/YuE
https://github.com/joeljuvel/YuE-UI

Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.

2) ACE-Step

https://github.com/ace-step/ACE-Step

Вторая локалка, качеством получше.

Здесь демо-версия:
https://huggingface.co/spaces/ACE-Step/ACE-Step
______________

Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:

https://www.wondera.ai/
https://sonauto.ai/
https://www.beatoven.ai/
https://stableaudio.com/
https://www.loudly.com/music/ai-music-generator

______________
Редакция трека после генерации (можно убрать вокал и оставить только инструментал и наоборот, убрать шумы и т.д.)

https://x-minus.pro/ai
https://uvronline.app/ai?locale=ru_RU
______________
Мастеринг готового трека буквально в 2 кнопки:

https://www.bandlab.com/mastering
______________
Сайт для сочинения англоязычных текстов для ИИ-музыки Зайти можно только через Дискорд.

https://codyai.cc/

Предыдущий тред ушёл в бамплимит
https://2ch.su/ai/res/1485286.html#1542357


МЕЛОМАНЫ ВПРЁЁЁД
Пропущено 141 постов
75 с картинками.
Пропущено 141 постов, 75 с картинками.
Аноним 17/03/26 Втр 22:21:31 1554586
Не дыши.mp4 5959Кб, 640x480, 00:03:42
640x480
>>1554576
Темы времён перестройки и 90-х?

Если так, то это замечательно. Есть надежда на ренессанс культуры модерна.
Аноним 17/03/26 Втр 23:29:50 1554631
Кая уходит из О[...].mp4 9916Кб, 824x1464, 00:04:13
824x1464
Давайте все тоже уйдём из офшара, заебал он уже
Аноним 18/03/26 Срд 01:18:41 1554716
600f3248-9f83-4[...].webm 12560Кб, 640x640, 00:04:46
640x640
Как наверстать технологическое отставание в области ИИ? Аноним # OP 01/03/26 Вск 15:47:48 1538133 Ответ
347092928709598.webp 210Кб, 1280x800
1280x800
Двач, хочу с тобой посоветоваться по вропосу что делать чтобы наверстать технологическое отставание в области ИИ.

TL:DR: Страна капитально отстает от США\Китая в области ИИ. Возможно ли это наверстать и что для этого надо сделать?

Отвечаю за ИТ в большой структуре. По уровню автоматизации и выполняемым проектам отстаем от мира на 20 лет. Внимательно смотрю на ИИ-революцию на западе и понимаю что это отставание мы уже не догоним.
Постоянно общаюсь с крупными вендорами, они в иишку даже не смотрят (1С, Аскон, Интермех и т.д.).

Общаюсь с нашими разработчиками ИИ (Яндекс\Сбер) тоже все достаточно грустно.

Что надо сделать чтобы у нас появились технологии, предложения и нормальные проекты по внедрению сетей?
Пропущено 57 постов
3 с картинками.
Пропущено 57 постов, 3 с картинками.
Аноним 16/03/26 Пнд 20:38:23 1553416
>>1549129
>что будут делать через 15-20 лет - будут в основном по чертежам и разработкам текущим.

Ну да. Тут как с Пугачёвой в шоу-бизнесе, точно такое же во всем остальном. Сейчас инженеры если что-то придумывают, то это не реализовывается а откладывается "в стол" как было у музыкантов при доминировании Пугачёвой.
Аноним 16/03/26 Пнд 23:52:43 1553608
>>1538133 (OP)
Оп, ты очень слабо понимаешь специфику того, что происходит. В ближайшее время 1 человек или небольшая команда действительно качественных спецов + сотни ИИ агентов(а затем и AGI) заменят собой компании в сотни и тысячи сотрудников. Всё потому, что главное - это Идея и Сознание в целом. Больше нет нужды задействовать тысячи ботоподобных тел, которые хотят просто присосаться к творческому потоку действительно деятельных людей. Эпоха кумовства и людей-должностей заканчивается.
Аноним 18/03/26 Срд 00:15:34 1554676
>>1553608
наоборот начинается
с одного ИИ агента 100 дармоедов кормится будут
а простому работяге который тогда мог хотяб крохи получать с этого за то что что-то может Йух без соли в рот...
Голая Аноним 03/09/25 Срд 12:55:09 1340173 Ответ
Screenshot20250[...].jpg 878Кб, 1080x2340
1080x2340
Зделай голой
Аноним 18/12/25 Чтв 06:44:13 1460032
>>1340173 (OP)
Если я пойду прямо так люди сразу вызовут полицию Не пойдет Нужно придумать более надежный способ как добраться до мусорщика Телефона нет с обществен
ного тоже позвонить не выВ этот момент вернулся паж и сказал йдет А до площади на минуточку около двух километров
Аноним 17/03/26 Втр 22:02:48 1554562
Спасибо за скорую помощь отцу Тресу улыбнулся Ион указывая перевязанной рукой на священника стоявшего в углу комнаты Прямые солнечные лучи смертельны для нас Если бы не его быстрая реакция сгореть мне заживо Кстати кардинал Сфорца Его перевязанное лицо исказилосКогда впереди показался дом Тимо Вито отпустила руку капитана Капитан выглядел недовольным но ему пришлось смириться Потому что если Тимо это увидит то обязательно поддразнит Вито а ей этого не хочется ь Вы знаете что случилось с Раду Вы нашли его тело
Локальной генерации ИИ-видео №4 ltx-2.3 /video/ Аноним 17/03/26 Втр 18:38:28 1554318 Ответ
17683963609212.mp4 2047Кб, 640x480, 00:00:49
640x480
17689273878351.mp4 3997Кб, 416x544, 00:00:39
416x544
17691891735501.mp4 2790Кб, 1280x704, 00:00:13
1280x704
177278680868200[...].mp4 6135Кб, 768x1024, 00:00:15
768x1024
Актуальные модели

1. Wan от Alibaba

https://huggingface.co/collections/Wan-AI/wan22

VACE модели:
https://github.com/ali-vilab/VACE
https://huggingface.co/Wan-AI/Wan2.1-VACE-14B
https://huggingface.co/Wan-AI/Wan2.1-VACE-1.3B

2. LTX-2.3 - делает локальную генерацию грейт агейн. Подходят лоры от 2.0

https://huggingface.co/Lightricks/LTX-2.3

3. Hunyuan от Tencent

https://huggingface.co/tencent/HunyuanVideo-1.5

4. Ovi

https://huggingface.co/chetwinlow1/Ovi

5. Starflow

https://huggingface.co/apple/starflow

6. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1

7. LongCat-Video

https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video
https://meituan-longcat.github.io/LongCat-Video/

8. MOVA

https://github.com/OpenMOSS/MOVA

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Hunyuan Video (осторожно, ссылки в туторе на предыдущую модель): https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/

Гайд для использования Wan 2.2

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan: https://github.com/kijai/ComfyUI-WanVideoWrapper

Где брать готовые LoRA
https://civitai.com/models

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Терминология моделей
prune — удаляем ненужные веса, уменьшаем размер
distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше
quant — уменьшаем точность весов, уменьшаем размер
scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше
merge — смешиваем несколько моделей или лор в одну, как краски на палитре.

lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.


Предыдущий тред
>>1488357 (OP)
Пропущено 1 постов
1 с картинками.
Пропущено 1 постов, 1 с картинками.
Аноним 17/03/26 Втр 18:40:12 1554323
Перекатил жопой как умею.
Аноним 17/03/26 Втр 19:52:00 1554407
Иронично, что LightTricks назвали свою fast/turbo модель — distill моделью, и мое пояснение стало не совсем корректным.
Технически она, скорее всего, не сдистилированна даже, а просто обучена на меньшем количестве шагов.
Но они вообще гении нейминга — дистил-лора им нужна для апскейла при использовании дев-модели, как надо, блядь, догадаться до такой хуйни, все же путаются.
Аноним 17/03/26 Втр 20:12:02 1554427
вы што тупые? видеонейронки сдохли, какой перекат
Детектор сгенерированных картинок Аноним 17/03/26 Втр 00:31:39 1553649 Ответ
1773691197737.png 1783Кб, 1024x1024
1024x1024
https://undetectable.ai/ai-image-detector - вот эта штукень выявляется безошибочно почти все сгенерированные в нейронках картинки.

Думаем!
Пропущено 7 постов
5 с картинками.
Пропущено 7 постов, 5 с картинками.
Аноним 17/03/26 Втр 14:35:25 1554147
>>1553738
поверни на 2 градуса и обрежь
Аноним 17/03/26 Втр 17:22:41 1554242
177372076942708[...].png 5530Кб, 2752x1536
2752x1536
177372076942708[...].jpg 202Кб, 1733x1300
1733x1300
Попробуйте эту картинку сделать так, чтобы она не детектилась. Я попробовал: чуть повернул, кадрировал, изменил разрешение, изменил тени, добавил шум по гаусу (монохромный), сделал размытие... "3% REAL".
Аноним 17/03/26 Втр 17:54:57 1554272
>>1554242
Я полгода назад такому детектору скормил скриншот ютуба на котором был мыльный видос с распечаткой на принтере картинки 1.5, распознал. Оно работает по принципу вычисления общей нейробанальности картинки, с упором на вангерл в качестве темы, даже если в фотошопе вручную обмазать все равно будет 50% сгенерированного. При этом какую-то картинку с хрущобой с явными нейроартефактами может пропустить, потому что такого среди нейрогена мало.
Anime Diffusion #242 /nai/ Аноним 10/03/26 Втр 22:57:56 1547712 Ответ
1767508975347.png 20704Кб, 5152x2872
5152x2872
1747801445453.jpg 5151Кб, 2880x3840
2880x3840
1678997028035.jpg 934Кб, 1920x1280
1920x1280
1653813951671.png 4621Кб, 1696x2528
1696x2528
1742889100791.png 7647Кб, 2400x1792
2400x1792
1753209949054.jpg 883Кб, 1368x1920
1368x1920
1682749306537.jpg 2105Кб, 1792x2304
1792x2304
1768686856947.png 2341Кб, 1024x1536
1024x1536
Генерируем тяночек!

Прошлый тред: >>1533626 (OP) https://arhivach.vc/thread/1313747/

Схожие тематические треды
• SD-тред (не аниме): >>1544540 (OP)
• Технотред: >>1405043 (OP)
• Фурри-тред: https://2ch.su/fur/res/374311.html

FAQ
https://2ch-ai.github.io/wiki/nai

Установка
• NVidia: https://teletype.in/@aranon/welcome
• AMD: https://2ch-ai.github.io/wiki/nai/install/amd
• Облака: https://2ch-ai.github.io/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces
• Модели: https://2ch-ai.github.io/wiki/nai/models
• Промпты: https://2ch-ai.github.io/wiki/nai/prompts
• Апскейл: https://2ch-ai.github.io/wiki/nai/upscale
• LoRA: https://2ch-ai.github.io/wiki/nai/lora
• ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 506 постов
211 с картинками.
Пропущено 506 постов, 211 с картинками.
Аноним 17/03/26 Втр 21:50:26 1554545
Аноним 17/03/26 Втр 21:50:28 1554546
>>1554543
Анон, а попробуй её тоже альбиноской сделать.
Аноним 17/03/26 Втр 23:12:38 1554623
>>1554543
Задумала принести снежки домой, чтобы кидаться в хозяина?
AI или настоящее? Аноним 12/03/26 Чтв 12:21:08 1549091 Ответ
ItemFix.mp4 2270Кб, 720x1280, 00:00:11
720x1280
Видео с Itemfix, https://www.itemfix.com/v?t=884fo3
обычно там что-нибудь документальное, но в последнее время попадается и нейрослоп, так что возник вопрос об аутентичности видео. Из /v послали сюда.
Аноним 17/03/26 Втр 14:38:58 1554151
212.JPG 73Кб, 955x693
955x693
>>1549091 (OP)
А вы с какой целью интересуетеся?
AI Chatbot General № 810 /aicg/ Аноним 14/03/26 Суб 16:59:20 1551017 Ответ
image.png 823Кб, 1280x837
1280x837
Bladerunner.mp4 3425Кб, 960x720, 00:00:51
960x720
image.png 1876Кб, 1018x1018
1018x1018
AI Chatbot General № 810

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышла GPT 5.4 - https://openai.com/index/introducing-gpt-5-4/
• Вышла Gemini 3.1 Pro Preview - https://deepmind.google/models/model-cards/gemini-3-1-pro/

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards
• NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern
• Risu: https://risuai.xyz/

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• DeepSeek: https://api-docs.deepseek.com/

Пресеты
• Тредовский список: https://rentry.org/2ch-aicg-jb
• Бургерский список: https://rentry.org/jb-listing
• Сисовый список: https://rentry.org/2a9c6zhi

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utils
• Сборник рентри: https://rentry.org/mrhd

Ботоводчество
• /aicg/hub: https://aicg-hub.ru/characters.html
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://aicg.neocities.org/botmaking | https://rentry.co/card_theory
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4
• Бургерские боты: https://aicg.neocities.org/bots

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• Арена: https://beta.lmarena.ai/ | https://web.lmarena.ai/
• OpenRouter: https://openrouter.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives4
• Тредовые ивенты: https://rentry.org/2chaicgthemedevents
• Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2
• Локальные языковые модели: >>1538359 (OP)
• Шаблон шапки: https://rentry.org/shapka_aicg

Прошлый тред: >>1546892 (OP)
Пропущено 1501 постов
128 с картинками.
Пропущено 1501 постов, 128 с картинками.
Аноним 17/03/26 Втр 21:36:05 1554517
Аноним 17/03/26 Втр 21:36:13 1554518
не будет
Аноним 18/03/26 Срд 04:33:30 1554772
Генераторы видео дают всем за щеку /deepfake/ Аноним 13/10/25 Пнд 08:50:32 1385244 Ответ
1636659404913.mp4 6304Кб, 720x1280, 00:00:15
720x1280
1688301786630.mp4 458Кб, 640x480, 00:00:05
640x480
SimSwap стал спящей красавицей, любая движуха с ним заморожена на неопределенный срок, отдаём дань почести тут: https://docs.google.com/document/d/1ZFHXtjR02oEVL2nrru4hTFQJ4BQt4vCNr0JNzFLZ-aE/edit?usp=sharing

Форки на базе модели insightface inswapper_128: roop, facefusion, rope, плодятся как грибы после дождя, каждый делает GUI под себя, можно выбрать любой из них под ваши вкусы и потребности. Лицемерный индус всячески мешал всем дрочить, а потом и вовсе закрыл проект. Чет ору.

Любители ебаться с зависимостями и настраивать все под себя, а также параноики могут загуглить указанные форки на гитхабе. Кто не хочет тратить время на пердолинг, просто качаем сборки.

Лучшая сборка https://github.com/visomaster/VisoMaster/releases/download/v0.1.1/VisoMaster_Setup.exe
Другие бесплатные сборки @AINetSD_bot

Если хотите просто дать кому-нибудь в рот, то ищите tensor-тред, например этот https://2ch.su/nf/res/36595.html там в шапке все подробно расписано

Инструкция по локальному запуску
https://2ch.su/nf/res/33573.html#35479
https://2ch.su/nf/res/33573.html#35727

Единственный минус, который не обеспечивает чистую победу генераторов видео - 3 секунды ролика для онлайн генерации, 5 секунд для онлайна (модель Wan 2.2), умельцы просто берут последний кадр и снова генерируют ролики, потом склеивают. Недавно вышла Sora 2, которая зацензурена по самые гланды. Нинтендо довольна.

Тред не является технической поддержкой, лучше создать issue на гитхабе или спрашивать автора конкретной сборки.

Прошлый >>542826 (OP)

Эротический контент в шапке является традиционным для данного треда, перекатчикам желательно его не менять или заменить на что-нибудь более красивое. А вообще можете делать что хотите, я и так сюда по праздникам захожу.
Пропущено 231 постов
118 с картинками.
Пропущено 231 постов, 118 с картинками.
Аноним 16/03/26 Пнд 21:41:13 1553480
Аноним 17/03/26 Втр 03:24:07 1553741
кайф
Аноним 17/03/26 Втр 04:01:18 1553745
/nf/
Stable Diffusion тред X+184 /sd/ Аноним 07/03/26 Суб 08:51:28 1544540 Ответ
image.png 5608Кб, 2592x2016
2592x2016
image.png 2695Кб, 1344x1045
1344x1045
image.png 5236Кб, 1798x1400
1798x1400
image.png 1870Кб, 1024x1024
1024x1024
Тред локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• Z-Image-Base
• FLUX.2 klein (4b и 9b)
• Z-Image-Turbo
• Flux 2
• Qwen Image / Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

► Предыдущий тред >>1525962 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Пропущено 540 постов
191 с картинками.
Пропущено 540 постов, 191 с картинками.
Аноним 18/03/26 Срд 02:16:37 1554748
source.jpg 72Кб, 736x736
736x736
1.webp 962Кб, 1024x1024
1024x1024
2.webp 1015Кб, 1024x1024
1024x1024
3.webp 966Кб, 1024x1024
1024x1024
Ладно, уговорили, скачал 9б и удалил 4б. 9б реально лучше. Лучше понимает когда просишь заюзать светотень нового окружения, чтоб не выглядло как аппликация
Аноним 18/03/26 Срд 04:07:08 1554766
1773796028611.png 1616Кб, 1920x804
1920x804
1773796028611.png 1870Кб, 1920x1080
1920x1080
1773796028627.png 1416Кб, 1920x804
1920x804
1773796028627.png 1640Кб, 1920x800
1920x800
Аноним 18/03/26 Срд 04:23:43 1554771
1.webp 990Кб, 1024x1024
1024x1024
Не ну 9б дистилл норм, даже как не эжит
Новости об искусственном интеллекте №58 /news/ Аноним # OP 11/03/26 Срд 20:55:02 1548559 Ответ
image 2634Кб, 1024x1024
1024x1024
image 2670Кб, 1024x1024
1024x1024
В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1541081 (OP)

🚀 Последний обзор ИИ новостей:

📰 Главные новости ИИ

Ford запустила Ford Pro AI, ИИ-чатбот в своей телематической платформе, направленный на снижение нагрузки на менеджеров автопарка и повышение эффективности, предоставляя менеджерам автопарка информацию об эффективности расхода топлива и производительности в реальном времени.

Amazon открыл доступ к своему ИИ-ассистенту Health на главном веб-сайте и в приложении, предоставив персонализированные медицинские рекомендации всем пользователям.

OpenAI добавил динамические визуальные объяснения в ChatGPT, позволяя пользователям взаимодействовать с графикой по математике и науке в реальном времени для более глубокого обучения.

🔓 Открытый исходный код

NVIDIA планирует выпустить NemoClaw, платформу ИИ-агентов с открытым исходным кодом, которая позволяет предприятиям развертывать защищенных агентов на любом оборудовании.

Сообщество выпустило модель Qwen 3.5‑35B‑A3B «Aggressive», большую языковую модель с 35 миллиардами параметров и отключенной фильтрацией отказов.

💻 Оборудование

Sumo Digital заключила партнерство с Arm для оценки чипов с нейротехнологиями, которые обещают графику качества ПК на смартфонах.

📱 Приложения

Nosh Robotics представила Nosh One, ИИ-управляемого робота-шефа стоимостью $1500, который автономно готовит блюда из загруженных ингредиентов.

Анализ Crunchbase отмечает, что компании SaaS переходят от статических функций к рабочим процессам, генерируемым ИИ, рассматривая платформы как конкурентное преимущество.

💰 Финансирование

Шведский стартап в области юридических технологий Legora привлек $550 млн, что повысило его оценку до $5,55 млрд для расширения операций в США.

Компания Yann LeCun Advanced Machine Intelligence привлекла более $1 млрд на создание ИИ с мировыми моделями, направленного на достижение уровня рассуждений человека.

AMI Labs закрыла раунд на $1,03 млрд при оценке $3,5 млрд для разработки мировых моделей, основанных на реальности.

Компания Armadin, основанная экспертом по кибербезопасности Кевином Мандиа, привлекла $189,9 млн на создание автономных ИИ-агентов для реагирования на угрозы.

🧠 Модели

Dynin‑Omni запустила омнимодальную модель с маскированной диффузией, которая совместно обрабатывает текст, изображения, видео и речь.

⚙️ Инфраструктура

NVIDIA выпустила более 2 ПБ данных с разрешительной лицензией и рецептов обучения на HuggingFace для устранения узких мест в сборе наборов данных.

⚖️ Регулирование

Надзорный совет Meta призвал Meta улучшить обнаружение дипфейков, расширить маркировку ИИ-контента и принять стандарты C2PA для борьбы с дезинформацией.

🛠️ Инструменты разработчика

Опубликованный на Reddit линтер промптов для больших языковых моделей выявляет атаки внедрения, раздувание токенов и структурные недостатки до выпуска в продакшн.

Разработчик Мэтт выпустил Sonde, платформу код-интеллекта с семантическим разрешением, инкрементной индексацией и историей на уровне коммитов.

Google Labs представил набор бесплатных ИИ-утилит, включая Learn Your Way для персонализированных учебных пособий, доступных вне Gemini.

📰 Быстрая статистика

Amazon Health AI теперь обслуживает около 200 млн ежемесячных пользователей через веб-сайт и приложение.

📰 События

Исследователи из Фонда Поликлинического университета Агостино Джемелли представили ИИ-алгоритм на базе CatBoost для прогнозирования выживаемости пациентов с раком мочевого пузыря после радикальной цистэктомии, выявив пороговый эффект индекса системного иммунного воспаления (SII > 1000).

MIT представил гибридную систему планирования для роботов, способную выполнять долгосрочные задачи в динамических визуальных средах вдвое эффективнее существующих методов, что важно для промышленной автоматизации.

Sakana AI выпустила открытые системы Doc-to-LoRA и Text-to-LoRA, генерирующие адаптеры для больших языковых моделей за один прямой проход без повторного дообучения.

NVIDIA Jetson Thor продемонстрировал производительность до 35 токенов/сек для Qwen 3.5 (35B) и до 273 токенов/сек для Mistral 3 при параллельной обработке, укрепляя позиции платформы в «Физическом ИИ».

Ai2 выпустила Olmo Hybrid — семейство открытых 7-миллиардных моделей, сочетающих трансформеры с линейными рекуррентными слоями, что обеспечивает вдвое большую эффективность данных при обучении.

Microsoft выпустила Phi-4-reasoning-vision-15B — компактную мультимодальную модель с открытыми весами, способную решать сложные задачи по математике и науке, интерпретировать графики и навигировать по графическим интерфейсам.

GPT-5.4 достигает 87,3% успеха в задачах финансового моделирования уровня младшего инвестиционного аналитика против 68,4% у предыдущей версии.

Вся операция по маркетингу роста Anthropic в течение 10 месяцев представляла собой одного нетехнического специалиста, использующего Claude Code, и инструменты, которые сделали это возможным, продолжают накапливать эффект.

GPT-5.4 Thinking xHigh Effort занял первое место в LiveBench с показателем SOTA 80,28%.

Utopai Studios представила PAI, кинематографическую модель для длинных форматов, обещающую непрерывное видео длительностью в несколько минут с сохранением консистентности персонажей в каждом кадре и возможностью редактирования на естественном языке на протяжении всей истории.

Microsoft запустила Copilot Cowork, интегрировав Anthropic's Claude Cowork в 365 с тем же уровнем персонализации Work IQ, что и в собственном 365 Copilot.

Meta приобрела Moltbook в рамках исторической сделки по поглощению ведущей социальной сети ИИ-агентов ведущей человеческой социальной сетью.

Samsung изучает возможность «вайб-кодинга» на телефонах Galaxy, чтобы позволить пользователям настраивать не только приложения, но и весь пользовательский опыт с помощью естественного языка.

Anthropic запускает инструмент рецензирования кода на базе ИИ для Claude Teams и Enterprise.

Слушатели оценили синтетические голоса китайского стартапа выше по уровню доверия и реалистичности, чем голоса от Microsoft, Google и Amazon.

Исследование Harvard Business Review показывает, что «мозговое выгорание от ИИ» оставляет работников ментально истощёнными.

Amazon получает судебный приказ, блокирующий ИИ-агента для шоппинга от Perplexity.
После волны негатива Google добавляет переключатель, позволяющий пользователям Google Photos вернуться к «классическому» опыту поиска вместо нового варианта «Ask Photos» на базе ИИ.

Adobe представляет ИИ-ассистента для Photoshop.
Пропущено 522 постов
117 с картинками.
Пропущено 522 постов, 117 с картинками.
Аноним 17/03/26 Втр 04:27:48 1553748
>>1553485
Понятно что твой пост полон иронии и сарказма, но про клип стоит отметить, что там сука пять версий, а не две.
Аноним 17/03/26 Втр 05:56:22 1553756
Аноним 17/03/26 Втр 10:08:37 1553861
>>1553560
>>купить 2 топовые видеокарты в ипотеку на 30 лет, чтобы поиграть в СЖВ порашу с 2 ФПС
А они не очень умные. Для кого эта хуета вообще расчитана?
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов