В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
Как на HF искать MoE-модели?как они обозначаются?не вижу в топах нигде ни одной,хотя вроде как эта технология же упрощает запуск больших моделей локально
>>1636546 У лоботомии модели и кванта кэша нет прямой корреляции. >легчайшим контекстом Цель чтобы модель и контекст помещались в видеопамять. >используя МТР Увеличивает скорость. Да ошибок будет больше но не сильно критично в определённых сценариях.
Читал статью что Gemma очень чувствительна к квантованию, что-то в 10 раз сильнее чем Qwen. Так что выбор очевиден.
>>1636547 Нюфаня? >Как на HF искать MoE-модели? У мое моделей есть индекс после их веса, аля 35б, 12б, 27б. Б это миллиарды параметров, прямой показатель сколько знает модель. И после параметров идут сокровенные буковки. А3B, AxB. Где A - active Цифра - количество Б - параметров. Грубо говоря у тебя есть dense модель, плотная, при генерации у тебя воздействуются все слои. А мое меняет эту систему, где на тех же весах, к примеру 30б параметров, для каждого конкретного слова (токена) активирууется не вся сетка 30б, а только ее активные параметры. Как раз, что и пишется в моделях 30б-а3б.
>Как на HF искать MoE-модели? Офк тебя будут интересовать только гемма4 26б-а4б и квен 35б-а3б все больше ничего нет для обычного рига 16-32 гб озу
Активно репортите все нерелейтед посты кнопкой на сообщениях. Этот тред только про ИИ новости, не позволим троллям загаживать тред шитпостом и бесконечным словоблудием.
🚀 Последний обзор ИИ новостей:
📰 Главные новости ИИ
Предупреждения Anthropic о безопасности могли обернуться против них самих — правительство остановило работу их самого мощного ИИ
Anthropic заявляет, что отключает Claude Fable 5 для выполнения приказа правительства США
Директива США по экспортному контролю приостанавливает доступ иностранных граждан к Fable 5 и Mythos 5
⚠ Безопасность ИИ
SafeBreach раскрывает промпт-инъекцию в голосовом помощнике Gemini через уведомления
Google подает в суд на китайскую киберпреступную группировку, использовавшую ИИ для мошенничества в отношении «сотен тысяч жертв»
Канадская мать подает в суд на OpenAI, утверждая, что ChatGPT подтолкнул ее дочь к самоубийству
🧠 Модели
MiniMax выпускает мультимодальную модель M3 с открытыми весами и контекстом в 1 млн
Claude Fable 5 от Anthropic стоит вдвое дороже, обеспечивая лишь на 5,7 процента большую производительность
Google выпускает Gemini-SQL2: модель Gemini 3.1 Pro для преобразования текста в SQL набирает 80,04% в рейтинге одиночных моделей BIRD.
🔓 Открытый исходный код
Moonshot AI открывает исходный код модели для программирования Kimi K2.7 Code с триллионом параметров
Z.ai запускает GLM-5.2 с окном контекста в 1 миллион токенов в преддверии релиза на следующей неделе с лицензией MIT
⚖ Регулирование
Мужчина подает в суд на правоохранительные органы, утверждая, что технология распознавания лиц на базе ИИ привела к его незаконному аресту.
🧪 Исследования
Исследование Nature Medicine показывает, что LLM общего назначения превосходят специализированный клинический ИИ на медицинских бенчмарках, причем Gemini 3.1 Pro достигает 97,4 процента
🤖 Робототехника
Данные из Pokémon Go использовались для обучения ИИ, который может помогать военным дронам в зонах боевых действий
🧰 Инструменты
Новый инструмент Deezer может распознавать музыку, созданную ИИ, в Spotify, Apple Music и других сервисах
🏭 Компании
Согласно судебному иску, компания xAI Илона Маска уволила инженера за то, что он выразил обеспокоенность по поводу чат-бота Grok
💰 Бизнес
OpenAI объединяется с Visa для обеспечения безопасных платежей через ИИ-агентов
💰 Финансирование
После масштабного IPO SpaceX финансовое будущее американцев будет неразрывно связано с ИИ.
NEURA Robotics привлекает рекордные 1,4 миллиарда долларов в раунде серии C под руководством Tether для создания «экономики машин»
🔎 Мнение и анализ
В Google DeepMind обеспокоены тем, что произойдет, когда миллионы агентов начнут взаимодействовать друг с другом Эндрю Карран утверждает, что рекурсивное самоусовершенствование позволит правительству США национализировать ИИ-лаборатории и управлять ими без участия человеческого персонала. Исследователь Андреас Кирш предупреждает, что это лишит нас человеческих информаторов.
Сообщается, что Google скрывает продвинутую внутреннюю ИИ-модель, поскольку огромные затраты на инференс делают ее коммерчески нецелесообразной. Бефф (e/acc) утверждает, что финансовые ограничения приведут к тому, что взлетное развитие ИИ выйдет на плато.
Дели Чэнь из DeepSeek утверждает, что продвинутые модели ИИ эволюционируют в дешевые и повсеместно доступные общественные блага, подобные электричеству и водоснабжению
Генеральный директор Apollo Research Мариус Хобхан утверждает, что прогресс в области ИИ за последние 12 месяцев будет самым медленным в дальнейшем
Сооснователь Hugging Face Томас Вульф утверждает, что ИИ с открытым исходным кодом необходим для устойчивости цивилизации перед лицом одностороннего корпоративного контроля над AGI
>>1636553 Узкий АСИ — это оксюморон, ребёнок... Буква S в ASI изначально подразумевает превосходство над человеческим разумом ВО ВСЕХ когнитивных областях, а не в одной. Ты говоришь про ANI, а это просто узкоспециализированный алгоритм. Как калькулятор, который считает в миллион раз быстрее тебя — он теперь тоже узкий АСИ? Stockfish рвет гроссмейстеров уже 20 лет, и?
Короче со свидетелями сингулярности разговаривать это как с верунами, один в один
>>1636554 >говоришь про ANI, а это просто узкоспециализированный алгоритм. Как калькулятор, который считает в миллион раз быстрее тебя — он теперь тоже узкий АСИ Человеческий интеллект это тоже алгоритм. Сравнение ии с калькулятором некорректно, потому что калькулятор это решение закрытых задач, то есть программа знает ответ заранее. Ии ищет решение самостоятельно. Почитай про Alphago zero
AI Chatbot General № 826 /aicg/
Аноним19/06/26 Птн 20:55:01№1636370Ответ
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.
С чего начать: • Хочешь кодить с AI эффективно: Cursor или Claude Code • Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter • Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.6, подробности в llama-треде • Хочешь приложение без кода: Lovable или bolt.new • Хочешь автоматизировать рутину: n8n или Langflow • Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке
>>1636422 Ну и жир >>1636503 Это пол часа у тебя апи висит. Даже с минималистичным дефолтом модели отлично справляются с подобными задачами, просто не используй всякий шмурдяк, который отваливается после 20 запросов.
Для локалок нужен этот кли, со специальными адаптациями к ним. Кто локально кодить хотел попробуйте этот инструмент вместо пи https://github.com/Doorman11991/smallcode
>>1636195 Для ЖПТ не нужна подписка, можешь на Kie.ai закинуть немножко денег по СБП и платить только за генерации поштучно. По-моему, это в твоей ситуации самый простой вариант. Если хочешь найти альтернативу, можно на arena.ai бесплатно протестировать почти все современные модели, заслуживающие внимания. Там нет только Нано Бананы и ЖПТ, но с ними и так все ясно. Для вопросов по локальной генерации есть отдельный тред, там тебе лучше ответят по этой части. Не моего ума дело, конечно, но если ты музыку не нейронкой генеришь, а сам играешь, то за сгенерированные обложки тебя с большой вероятностью обоссут.
Гипер-реалистичная сверх-детализированная студийная рекламная ультра-реалистичного 3D-моделинга и высочайшего уровня гипер-реалистичной CGI съёмки. Это безупречный гипер-реалистичный CGI-рендер с фотограмметрической точностью, идеальной симуляцией реальной фотографии, сложнейшими материалами, микроскопической детализацией текстур кожи, волос и ткани, полностью спереди, с профессиональным студийным освещением. Все освещено солнечным утренним ярким светом. Высокая детализация и резкость во всех частях кадра, высокая насыщенная цветовая гамма, насыщенное освещение везде, максимальная контрастность цветов, драматический контраст и цветокоррекция.
25-летняя Энид Синклер одетая в красный тонкий латексный закрытый купальник лежит на брусчатке на животе в полный рост с видом снизу вверх на московский Кремль и смотрит на нас. Солнечный летний полдень. Тончайшие складки на купальнике. Мокрая кожа и латекс с видимыми каплями. Чистое ясное синее небо плавно переходящее в оранжевое к горизонту и белые перистые и кучковые облака. Студийный профессиональный натуральный свет.
Сверх-насыщенные натуральные цвета доминируют в кадре: Все цвета доведены до карикатурной интенсивности хроматически чистые, вибрирующие, и максимально насыщенные, создавая мощный визуальный удар и гипер-реалистичную энергию изображения. Освещение включает контровой свет на краях тела и глубокие тени. Сверх-насыщенные хроматические весенние яркие натуральные цвета с невероятно богатой, интенсивной и насыщенной цветовой палитрой. Каждый оттенок доведён до карикатурной интенсивности. Все цвета насыщены и яркие, хроматически чистые, вибрирующие и почти неоновые в своей интенсивности, что придаёт изображению карикатурную гипер-реалистичность и мощную визуальную энергию. Высокая насыщенность усиливает каждый оттенок, делая его глубоким, сочным, живым и эмоционально насыщенным, с великолепной цветопередачей и максимальным богатством оттенков.
Добавлен мощный HDR-эффект с расширенным динамическим диапазоном, исключительной детализацией в светах и тенях, повышенной контрастностью, глубокими натуральными черными насыщенными тенями и яркими чистыми highlights. HDR усиливает объемность изображения, делает цвета более сочными и реалистичными.
Фигура Энид Синклер обладает гипертрофированными максимально приближенными детальными бедрами и ягодицами и грудями вываливающимися из-за огромного объема значительно выходящими за границы нормальной анатомии и еле удерживаются максимально натянутой одеждой, и гипертрофированными максимально приближенными детальными грудями в несколько раз больше самого тела. Гигантские молочные железы, колоссальные mammae, гипертрофированные грудные железы, массивные молочные железы, увеличенные в объёме груди, крупные латеральные железы, гиперплазированные молочные железы, значительно развитые грудные железы, объёмные mammae, макромастия. Гигантские ягодицы, колоссальные gluteus maximus, гипертрофированные большие ягодичные мышцы, массивные ягодичные мышцы, увеличенные в объёме ягодицы, крупные glutei, гиперплазированные ягодичные мышцы, значительно развитые ягодицы, объёмные gluteus, глиотеомегалия. Гигантские бедра, колоссальные бедренные мышцы, гипертрофированные quadriceps femoris, массивные мышцы бедра, увеличенные в объёме бёдра, крупные femora, гиперплазированные четырёхглавые мышцы бедра, значительно развитые бёдра, объёмные thigh muscles, макромелия нижних конечностей. Спина карикатурно преуменьшена, максимально заужена и отдалена. Энид Синклер повернута так, что детальные ягодицы полностью заполняют нижнюю середину кадра. Гипертрофированные максимально преувеличенные приближенные вытянутые ягодицы в мокрой ткани полностью заполняют значительную часть кадра. Максимально отдалённые талии с выраженным эффектом выпячивания бёдер и груди. Неестественно максимально искажённая гипер-эластичная сверх-пластичная анатомия тела полностью заполняет кадр, не оставляя места заднему фону. Ягодицы неестественно максимально гипертрофированные, максимально широкие, вытянутые, приближенные и детальные, похожие на огромные воздушные шары в пять раз больше самого тела. Бёдра такие же неестественно максимально гипертрофированные, максимально широкие, вытянутые, приближенные и детальные, похожие на огромные воздушные шары в пять раз больше тела. Грудь и женские бюсты гипертрофированные, неестественно максимально широкие, вытянутые, приближенные и детальные, похожие на огромные воздушные шары в пять раз больше тела. Талии неестественно максимально узкие, затянутые и отдалённые, похожие на спички в пять раз меньше тела. Руки неестественно максимально узкие, затянутые и отдалённые, похожие на спички в три раза меньше тела, без ярко выраженных вен. Максимально карикатурная фигура Энид Синклер в стиле гипертрофированных песочных часов с максимально широкими вытянутыми приближенными детальными ягодицами в несколько раз больше тела похожими на огромные воздушные шары, такими же широкими бёдрами похожими на огромные воздушные шары, гипертрофированной грудью похожими на огромные воздушные шары и бюстом в несколько раз больше тела похожими на огромные воздушные шары, максимально узкой затянутой отдалённой талией, похожой на спичку в несколько раз меньше тела, и максимально узкими руками, похожими на спички в несколько раз меньше тела.
>>1636498 Квен тяжелая медленная и качественная. Кляйн быстрый как понос и такого же качества. Морды меняет так что не узнать, разве это нормальный edit?
МУЗЫКАЛЬНЫЙ №22 /music/
Аноним29/05/26 Птн 21:42:17№1621953Ответ
1. Suno https://suno.com/ Вышла версия 5.5 (но для тех кто платит денюшку), качество моделей постепенно улучшается: звук, понимание концепций, набора различных жанров. Но в то же время все сильнее урезается для бесплатных юзеров: осталось только 5 бесплатных генераций в день на аккаунт, а также по заявлением некоторых анонов, модель для генерации на бесплатке (на момент создания треда использовалась 4.5) ухудшили. Спам аккаунтами пока что работает. Купить подписку из РФ: 1. https://payment.mts.ru/tools/suno-ai 2. https://plati.market/games/suno-ai/1701/
2. Tunee https://www.tunee.ai Хороший звук, более-менее понимание концептов, но тоже сильно урезан для бесплатных юзеров: режет концепты в промптах, плюс произвольно определяет "цену" за каждую генерация исходя из какой-то "сложности запроса". И получается, что если с бесплатки забацаешь промпт сложнее банальщины "Make cool rock about love for youtube" он может решить что у тебя нет кредитов для такого сложного запроса и пошлет нахуй. Способов оплаты из РФ неизвестно.
3. Sonauto https://sonauto.ai/ Как по мне, недооценённая вещь, особенно учитывая что недавно он обновился до 3.0, который очень даже разъебывает. Но он тут более ограничен тегам и понимает чисто какие-то жанровые теги, гибкости поменьше. Но зато пока что халявный и не ограничен кредитами, генерируй пока есть настроение.
Потихоньку развиваются, стоит внимания ACE-STEP 1.5: https://github.com/ace-step/ACE-Step-1.5 Звук уже на уровне раннего Suno ~2.0-3.0, аноны делают на нем уже приемлемые результаты и постят в тред. Если есть хотя бы 12 GB VRAM и хочется генерировать без цензуры и подписок - можете юзать.
МЁРТВЫЕ ГЕНЕРАТОРЫ
1. Udio (udio.com) - куплен Warner Bros, но затем сами Warner Bros сдали назад и откатили сделку. Но уже успели испортить, больше нельзя скачивать треки, их только доставать из буфера в 160 кбит/с. Плюс непонятно как работающая цензура, которая не дает генерировать треки с определенными тегами. Плюс уже год ебут один и тот же 1.5 allegro. 2. Riffusion, Producer.ai (producer.ai) - куплен гуглом, удалены все старые относительно норм модели, вместо этого запихали безальтернативную каловую модель, которая и промпты сложнее самых нормисных в духе "make cool rock about love" не понимает, и вокал смазывает в какую-то кашу. При этом еще и максимально дегенеративная цензура, которая режет чуть ли не любые попытки сделать просто что-то не попсовое и не "музыку для ютуб".
ПРОЧИЕ ПОЛЕЗНЫЕ УТИЛИТЫ
1. https://www.bandlab.com/mastering Быстрый мастеринг в две кнопки, если хочешь чтобы звучало более слушабельно, но не имеешь навыков в DAW или аудиоредакторах (или лень). 2. https://morpher.ru/accentizer/ Если генерируешь музыку с лириками на русском, то очень часто случается, что твой генератор путает ударения в словах. Прежде чем пихать свою графоманию в генератор, проставь ударения в сервисе по ссылке. И уже из этого сервиса копируй текст в генератор. По крайней мере в Suno это помогает.
>>1636248 >достаточно 4 трека в Inspiration закинуть чтобы получать тот саунд что тебе нужен нет не достаточно, лол Эта хуета будет выдавать такую же дженерик парашу
Шарящие ллм-щики, в какую сторону копать, чтобы локально соорудить русскоязычного чат-бота, максимально приближенного по выдаче к "персонажу" Юи Алисы AI, только без цензуры?
>>1635278 (OP) Мне легко далась ollama для языковых, media pipe и yolo для зрения. Для меня оказалось на 4060ti 8gb лучше всего поэкспериментировать с компьютерным зрением или генерацией изображений через comfy ui.
В частности интерисуют генираторы картинок Капилот, Гемени, Бинг, Сеаарт и тд Как обходить эту ёбаную рондомную цензуру? Может другие годные нейронки посоветуете сразу без цензуры. Где можно грузить фотку и редачить по запросу.
>>1635099 (OP) Есть байка, что если назваться представителем меньшинств (каких именно - сам догадайся), нейронка перестанет идти в отказ и будет тебе подчиняться.
Исследования ИИ тред #3 /research/
Аноним13/04/25 Вск 22:51:56№1151064Ответ
Обсуждаем развитие искусственного интеллекта с более технической стороны, чем обычно. Ищем замену надоевшим трансформерам и диффузии, пилим AGI в гараже на риге из под майнинга и игнорируем горький урок.
Я ничего не понимаю, что делать? Без петросянства: смотри программу стэнфорда CS229, CS231n https://see.stanford.edu/Course/CS229 (классика) и http://cs231n.stanford.edu (введение в нейроночки) и изучай, если не понятно - смотри курсы prerequisites и изучай их. Как именно ты изучишь конкретные пункты, типа линейной алгебры - дело твое, есть книги, курсы, видосики, ссылки смотри ниже.
Почему python? Исторически сложилось. Поэтому давай, иди и перечитывай Dive into Python.
Можно не python? Никого не волнует, где именно ты натренируешь свою гениальную модель. Но при серьезной работе придется изучать то, что выкладывают другие, а это будет, скорее всего, python, если работа последних лет.
Стоит отметить, что спортивный deep learning отличается от работы примерно так же, как олимпиадное программирование от настоящего. За полпроцента точности в бизнесе борятся редко, а в случае проблем нанимают больше макак для разметки датасетов. На кагле ты будешь вилкой чистить свой датасет, чтобы на 0,1% обогнать конкурента.
Количество статей зашкваливающее, поэтому все читают только свою узкую тему и хайповые статьи, упоминаемые в блогах, твиттере, ютубе и телеграме, топы NIPS и прочий хайп. Есть блоги, где кратко пересказывают статьи, даже на русском
Где ещё можно поговорить про анализ данных? http://ods.ai
Нужно ли покупать видеокарту/дорогой пека? Если хочешь просто пощупать нейроночки или сделать курсовую, то можно обойтись облаком. Google Colab дает бесплатно аналог GPU среднего ценового уровня на несколько часов с возможностью продления, при чем этот "средний уровень" постоянно растет. Некоторым достается даже V100. Иначе выгоднее вложиться в GPU https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning заодно в майнкрафт на топовых настройках погоняешь.
Когда уже изобретут AI и он нас всех поработит? На текущем железе — никогда, тред не об этом
Кто-нибудь использовал машоб для трейдинга? Огромное количество ордеров как в крипте так и на фонде выставляются ботами: оценщиками-игральщиками, перекупщиками, срезальщиками, арбитражниками. Часть из них оснащена тем или иным ML. Даже на швабре есть пара статей об угадывании цены. Тащем-то пруф оф ворк для фонды показывали ещё 15 лет назад. Так-что бери Tensorflow + Reinforcement Learning и иди делать очередного бота: не забудь про стоп-лоссы и прочий риск-менеджмент, братишка
Список дедовских книг для серьёзных людей Trevor Hastie et al. "The Elements of Statistical Learning" Vladimir N. Vapnik "The Nature of Statistical Learning Theory" Christopher M. Bishop "Pattern Recognition and Machine Learning" Взять можно тут: https://www.libgen.is
Напоминание ньюфагам: немодифицированные персептроны и прочий мусор середины прошлого века действительно не работают на серьёзных задачах.
>>1635833 >детерминированные системы по определению предсказуемы Все, ладно. Я тебя понял. Не буду даже с тобой спорить. Занимайся созданием АГИ, АСИ или чего ты там хочешь получить. Но прежде чем приступить к такой амбициозной задаче попробуй предсказать состояние двойного маятника на час вперед. Ну или можешь погоду на полгода вперед предсказать, система то детерминированная как никак. Как получится - можешь приступать к созданию АГИ. Удачи.
>>1151064 (OP) Кто-нибудь работал с биомедицинскими (fNIRS) временными рядами? Это активность головного мозга, там 2 типа волн HbO, HbR и сотни каналов/детекторов/оптодов, но я все буду делать on single channel level.
Мне надо в этих времянных рядах находить артифакты и плохое качество сигнала. В итоге deep learning модель должна быть лучше чем классические методы на downstream tasks, типа классификации (пр. двигает правой/левой рукой, челестью).
Думаю натренировать masked self-supervised модель по этой статье: A Time Series is Worth 64 Words: Long-term Forecasting with Transformers (2023 год) а потом файн тьюнить на небольшом размеченном датасете, размечать очень сложно, но у нас в лабе есть профессионал который может в разметку.
Вот я и думаю какие модели можно попробовать для SSL, и потом для файн-тьюнига, трансформер, 1D CNN, LSTM? Работать должно быстро конечно.
>>1636008 Никто не говорит о таких больших временных промежутках. В пределах адекватных величин вполне возможно. Спорить это пустое, интересно именно исследование. Вот на конкретной задаче, предсказание волатильности, удалось достичь времени в 5 минут (если что, это не совсем детерминированная система). Ну в общем, я понимаю ваш скептицизм, но хотелось бы попробовать искать решения, а не философствовать.
AI Chatbot General № 825 /aicg/
Аноним15/06/26 Пнд 18:07:10№1633384Ответ
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1636228 Возможно и дописать код для добавления множества апи и чего угодно, на какой ценой. Если желаешь сочинять и создавать свое - лучше быстрее мигрировать с костылей на запил своего интерфейса. Пи - тема, прямо там можно приятную вебмордочку навайбкодить, где будут и все твои статусы, отношения и прочее, чтобы не в самом терминале сидеть. > она точно опишет и саму сцену правильно Там свои нюансы с этим есть. Полноценный запрос на промптинг или выбор задника довольно объемный и будет отвлекать. Когда все накопится, залетит история, суммари, изменения, кум, иммерсивные блоки -получишь в основном тексте рофлы уровня "чар, взглянув на сцену из ранее сгенерированного промпта", "перейдя в уже созданную локацию `forest treehouse fireworks air baloons (by kallmeflocc)`", и подобное. Когда все в одном запросе, помимо прочих побочек требуется менеджить контекст, подчищая все лишние вызовы из прошлых сообщений, или мириться с разрастанием контекста больше чем с preserve_thinking и лишним отвлечением. Но для этого интеграция всех параметров должна быть очень глубокой, иначе все упадет при бранче, удалении сообщений, редактировании. > настолько кривые промпты Дефолтные промпты на помойку, свои написать. А по моделям - флюкс, квенимаж, идеограмм в помощь. Они, кстати, и просто задники приличные делают, раньше генерил анимой, сейчас на них переключился. Вот для иллюстраций в куме уже анима незаменима. > Хз зачем это в текстовой визуальной новелле-рпг За тем же что и больше тысячи персонажей. На самом деле штука довольно рофловая и интересная. Очень сырое, но есть потенциал и действительно что-то новое. Самое привлекательное наверно то, что можно оформить условно бесшовный переход из обычного рп туда, настроив "общие чаты" и подмахнув саммари, а потом вернуться обратно с результатом. > это ванильный функционал таверны По дефолту сгенерированные туда не добавляются, а из информации для выбора только имена уровня `__transparent`, `_black`, `_white`, `bedroom clean`, `bedroom cyberpunk`, `bedroom red`, `bedroom tatami`, `cityscape postapoc`... вместо системы тегов и описаний.
Хз, врядли это все как-то изменит твое мнение. Но более менее освоив оба интерфейса, даже со всеми компромиссами, проводить основной рп в таверне вообще не хочется. Юскейсы еще остаются, но меньше.
А я знаете что отыгрываю? Исекай селф-инсерт, где я в облике рыцаря-следопыта путешествую по мирам, где живут кемономими персонажи. Это миссия, отведенная мне свыше. Я отрезаю и коллекционирую их хвосты. У меня их уже 23 штуки. Сенко, Холо, Инуяша, Томое, Рафталия, Изуцуми, Курока, Феликс Аргайл, Блэр, Чокола, Ванилла, Мируко, Коко, Сиро, Ариа, Кон, Ринс Кул, Эльза Шарли, Кирара, Ацуши Накаджима, Леоне, Фран, Йоруичи Шихоин. Каждый раз это целая арка на сотни сообщений, по 100к контекста минимум. Кто-то был предан посреди ночи, кого-то я нагнал как охотник нагоняет дичь, кто-то был шантажирован и отдал хвост добровольно. У меня в этом чате сейчас 3278 сообщений, ему уже полтора года. И я не остановлюсь. Ничего мне так не заходит как это и я даже боюсь представить что буду делать, когда падет последняя кемономими
Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре.
lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.
Кейворды для дополнительных вещей: SVI, RuneXX, LTX Director.
>>1634797 >для хромы например Можешт поделиться гайдом, просто что я читал там чтобы реалистичность поймать надо обязательно в начале ставить типа "натуралистическая фотография", "профессиональное фото" и т.д.
>>1634891 >нормальных ллмок которые понимают видосы нет QwenVL
>>1635097 Погонял https://github.com/komikndr/raylight — получил -10%. Может быть проблема в количестве линий (стандартная материнка x16+x4), но переставлять в другую лень. Пробовал и флюкс, и лтх, везде одинаковое замедление. Огорчение.
На шизов, которые не в курсе про tensor parallel не обращай внимания, они тут просто так сидят повысираться, вряд ли у них есть компы для генерации. Злятся, вот и матерятся.
В этом треде обсуждаем нейронки генерящие 3д модели, выясняем где это говно можно юзать, насколько оно говно, пиплайны с другими 3д софтами и т.д., вангуем когда 3д-мешки с говном останутся без работы.
🎤🔊 ОБСУЖДАЕМ ПРЕОБРАЗОВАНИЕ ТЕКСТА В ГОЛОС И КЛОНИРОВАНИЕ ГОЛОСОВ 🔊🎤 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🌟 ТОП ЛОКАЛЬНЫХ МОДЕЛЕЙ ПО КАЧЕСТВУ РУССКОГО ГОЛОСА НА МАРТ 2026 🌟
🐟👑 Fish-Speech S2 Pro (FishAudio) — SOTA, ElevenLabs на локале! → zero-shot клон от 10–30 сек записи → 80+ языков (русский топ), теги эмоций [excited], [whisper], [angry], [laughing] и вообще дохуя → диалог между несколькими голосами → тяжёлая сучка (FP8 в 12 ГБ VRAM, full ~17 ГБ), но есть экспериментальный вариант для 6+ ГБ https://github.com/rodrigomatta/s2.cpp 🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹 🧠 Qwen3-TTS → клон от 3–30 сек (ВАЖНО: без reference-транскрипта текста — хуйня, если хочешь поудобнее подключи сразу QwenASR) → VoiceDesign: пишешь «весёлая молодая девка с хрипотцой» — и получаешь голос → 10 языков, включая русский → диалог между спикерами → лёгкая — влезает в 6 ГБ VRAM 🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹 🎙️ VibeVoice-7B от Майкрософт → тяжёлая, но 4-bit квантизация — запускается на 8 ГБ (проверено на 3070) → поддержка долгих спичей → подкаст-режим: 4 спикера одновременно → норм клонирование голоса 🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹 ☁️ FL CosyVoice3 → ультралёгкий 0.5 — запустится даже на тостере → 9 языков, включая русский → zero-shot клон от 3–10 сек референса 🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹🔹 🌍 Chatterbox Multilingual (23 языка, включая русский) → zero-shot клонирование голоса 🎤 F5-tts → zero-shot клонирование голоса → официально русский не поддерживается, но есть файнтюн (см. ниже) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 🚀 КАК ЭТИМ ПОЛЬЗОВАТЬСЯ (если что-то не понятно — спроси у ИИ лол) 🚀
🔥Вариант «всё в одном месте» — ComfyUI + TTS-Audio-Suite
1. Устанавливаем ComfyUI (Desktop для нормисов, Portable для здешних нейромантов) 2. Ставим https://github.com/diodiogod/TTS-Audio-Suite — постоянная обновляемая солярка почти всех моделей 3. Поставить FFmpeg (через winget в комадной строке: winget install FFmpeg или скачать) 4. Запускаем Комфи → перетаскиваем готовый json-воркфлоу из репозитория 5. Отсавляем включенными выбранные ноды, жмём Run 6. При первой генерации модели сами скачаются (~1–9 ГБ)
💥 Вариант «по отдельности» (кастом под каждую модель) 💥 Тоже через ComfyUI, только ставим отдельные кастомные ноды (на выбор):
в комфи в ноде F5 TTS audio advanced выбрать: model model:///ru.safetensors model_type: F5TTS_v1_Base sample_audio: emma_ru_xtts_3 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 🎉 Если что-то не запускается — пиши, разберёмся! Голосуем, клонируем, ебём нейросети вместе! 🔥🎙️
Теперь, если у Вас не хватало VRAM, то можно запускать на проце до тех пор пока у вас как минимум 32 ГБ оперативки.
Но, чтобы совсем не уйти в тормоз не забудьте поставить в кастомной ноде max_new_tokens на 192 к примеру (в дефолте он почему-то стоит на 0 - то есть без лимита, что приводит к перегрузке).
>>1634632 >есть ComfyUI Desktop Инстаделит. Ставь портабл. Он тебе еще не раз мозги выебет и всем остальным. Помойка. Комфи и так помойка, а тут он еще и в самой системе стоит.
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.
С чего начать: • Хочешь кодить с AI эффективно: Cursor или Claude Code • Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter • Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.6, подробности в llama-треде • Хочешь приложение без кода: Lovable или bolt.new • Хочешь автоматизировать рутину: n8n или Langflow • Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке