Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Создать тред Создать тред

Раздел для обсуждения нейросетей и всего, что с ними связано.

Для доступа в /nf/ писать сюда

<<
Каталог
Рецепт идеального робота /mor3/ Аноним 26/05/26 Втр 20:17:51 1620063 Ответ
isaaclab.jpg 652Кб, 3840x1920
3840x1920
Не так давно я решил углубиться в робототехнику с применением RL. В связи с этим всё чаще сталкиваюсь с особенностями и стандартами области. Например штраф за скорость суставов, использование шумных сетей и важность планирования(Те алгоритмы, основанные на моделях).

Какие ещё особенности RL для робототехники вы знаете и имели ли вы подобный опыт с подобными приложениями?

>>610200
Пропущено 3 постов
2 с картинками.
Пропущено 3 постов, 2 с картинками.
Аноним 28/05/26 Чтв 16:25:09 1621102
>>1620063 (OP)
Да ну, идеальный робот и/или идеальная роботиха - это мифы!
Аноним 29/05/26 Птн 12:07:27 1621615
О, моя бакалаврская была об этом! Такая фигня по итогу получилась, даже в симуляторе двигается чёрт знает как. Какие только штрафы я не прописывал, всё было бесполезно. Я перепррбовал несколько библиотек для python, предназначенных как для rl вообще, так и предназначенных специально для роботов.
>>1621089
С Isaac sim есть очевидная проблема: требуется топовая комплектация компа. А ещё говорят, что возни много с его настройкой. MuJoCo шикарен, но у него свой особый формат хранения моделей: в других симуляторах используется urdf, а тут mjcf, причём mjcf нельзя нормально сконвертировать в urdf (да, решения есть, но фигня полная).
P.S. аттестационная комиссия несмотря на то, что задача была фактически не достигнута, поставила 5.
Аноним 29/05/26 Птн 12:09:05 1621616
ИИ для курсача Аноним 24/05/26 Вск 12:30:51 1618839 Ответ
изображение.png 4Кб, 266x95
266x95
изображение.png 2Кб, 197x60
197x60
изображение.png 105Кб, 442x293
442x293
Аноны подскажите пожалуйста есть ли на просторах интернета ИИ или может какая надстройка для Word которая может делать сноски автоматически?(Сноска пик3) Буду очень благодарен за подскаску и про инвестирую 3 чая в анона.
Аноним 28/05/26 Чтв 21:57:02 1621332
177799027951001[...].mp4 4890Кб, 576x1024, 00:00:49
576x1024
>>1618839 (OP)
мудила, для этого есть специальный тред https://2ch.org/ai/res/299474.html
Автоматические сноски можно делать как стандартными средствами Word, так и с помощью современных ИИ-плагинов и менеджеров источников.
------------------------------
## 🛠️ Встроенный метод в Microsoft Word
Word сам нумерует и переносит сноски вниз страницы. Вам не нужны сторонние программы для базовой автоматизации.

Горячие клавиши: Нажмите Alt + Ctrl + F (в Windows) или Cmd + Option + F (в Mac).
Через меню: Вкладка «Ссылки» ➡️ кнопка «Вставить сноску».
Результат: Номер сноски связывается с текстом автоматически. При добавлении новых сносок нумерация сама пересчитается.

------------------------------
## 🤖 ИИ-сервисы и плагины для автоматических цитат
Если вам нужно, чтобы ИИ сам находил источники, оформлял их по ГОСТу/конкретному стилю и превращал в сноски, используйте эти инструменты:
## 1. Специализированные ИИ-ассистенты

Jenni AI: Пишет текст вместе с вами. Автоматически ищет научные статьи. Генерирует правильные сноски в один клик.
SciSpace (Typeset.io): ИИ для работы с научными текстами. Подключается к Word. Сам оформляет цитаты и сноски по тысячам стандартов.

## 2. Умные плагины для Word (Менеджеры библиографии)
Это не чистый ИИ, но они полностью автоматизируют создание сносок из вашей базы источников.

Zotero + плагин Zotero Word Integration: Полностью бесплатный инструмент. Выделяете цитату ➡️ нажимаете кнопку ➡️ Zotero сам ставит сноску вниз страницы.
* Mendeley Cite: Официальная надстройка для Word от Elsevier. Работает аналогично Zotero.

------------------------------
Если вы хотите автоматизировать создание сносок для научной работы или диплома, напишите, какой стиль оформления (например, ГОСТ) вам нужен. Я подскажу, как лучше настроить Zotero или Jenni AI под эту задачу.
МУЗЫКАЛЬНЫЙ №21 /music/ Аноним 29/04/26 Срд 17:38:35 1601065 Ответ
177716575634905[...].mp4 4996Кб, 650x472, 00:03:15
650x472
screaming to em[...].mp4 9052Кб, 1216x1216, 00:02:15
1216x1216
177289361490300[...].mp4 3272Кб, 480x482, 00:02:48
480x482
Предыдущий тред: https://2ch.su/ai/res/1542775.html

ОСНОВНЫЕ ОНЛАЙН ГЕНЕРАТОРЫ

1. Suno
https://suno.com/
Вышла версия 5.5 (но для тех кто платит денюшку), качество моделей постепенно улучшается: звук, понимание концепций, набора различных жанров. Но в то же время все сильнее урезается для бесплатных юзеров: осталось только 5 бесплатных генераций в день на аккаунт, а также по заявлением некоторых анонов, модель для генерации на бесплатке (на момент создания треда использовалась 4.5) ухудшили. Спам аккаунтами пока что работает.
Купить подписку из РФ:
1. https://payment.mts.ru/tools/suno-ai
2. https://plati.market/games/suno-ai/1701/

2. Tunee
https://www.tunee.ai
Хороший звук, более-менее понимание концептов, но тоже сильно урезан для бесплатных юзеров: режет концепты в промптах, плюс произвольно определяет "цену" за каждую генерация исходя из какой-то "сложности запроса". И получается, что если с бесплатки забацаешь промпт сложнее банальщины "Make cool rock about love for youtube" он может решить что у тебя нет кредитов для такого сложного запроса и пошлет нахуй. Способов оплаты из РФ неизвестно.

3. Sonauto
https://sonauto.ai/
Как по мне, недооценённая вещь, особенно учитывая что недавно он обновился до 3.0, который очень даже разъебывает. Но он тут более ограничен тегам и понимает чисто какие-то жанровые теги, гибкости поменьше. Но зато пока что халявный и не ограничен кредитами, генерируй пока есть настроение.

4. Другие сервисы, которые можно попробовать, но сам много про них сказать не могу
https://www.wondera.ai/
https://www.beatoven.ai/
https://stableaudio.com/
https://www.loudly.com/music/ai-music-generator
https://www.elevenlabs.io

ЛОКАЛЬНЫЕ ГЕНЕРАТОРЫ

Потихоньку развиваются, стоит внимания ACE-STEP 1.5:
https://github.com/ace-step/ACE-Step-1.5
Звук уже на уровне раннего Suno ~2.0-3.0, аноны делают на нем уже приемлемые результаты и постят в тред. Если есть хотя бы 12 GB VRAM и хочется генерировать без цензуры и подписок - можете юзать.

МЁРТВЫЕ ГЕНЕРАТОРЫ

1. Udio (udio.com) - куплен Warner Bros, но затем сами Warner Bros сдали назад и откатили сделку. Но уже успели испортить, больше нельзя скачивать треки, их только доставать из буфера в 160 кбит/с. Плюс непонятно как работающая цензура, которая не дает генерировать треки с определенными тегами. Плюс уже год ебут один и тот же 1.5 allegro.
2. Riffusion, Producer.ai (producer.ai) - куплен гуглом, удалены все старые относительно норм модели, вместо этого запихали безальтернативную каловую модель, которая и промпты сложнее самых нормисных в духе "make cool rock about love" не понимает, и вокал смазывает в какую-то кашу. При этом еще и максимально дегенеративная цензура, которая режет чуть ли не любые попытки сделать просто что-то не попсовое и не "музыку для ютуб".

ПРОЧИЕ ПОЛЕЗНЫЕ УТИЛИТЫ

1. https://www.bandlab.com/mastering
Быстрый мастеринг в две кнопки, если хочешь чтобы звучало более слушабельно, но не имеешь навыков в DAW или аудиоредакторах (или лень).
2. https://morpher.ru/accentizer/
Если генерируешь музыку с лириками на русском, то очень часто случается, что твой генератор путает ударения в словах. Прежде чем пихать свою графоманию в генератор, проставь ударения в сервисе по ссылке. И уже из этого сервиса копируй текст в генератор. По крайней мере в Suno это помогает.
3. https://x-minus.pro/ai
Быстро вытащить минус или вокал из трека.

Примечание от афтора шапки: в прошлых шапках были ссылки на нерабочие сервисы или полностью мертвые ссылки, я их не включил в шапку
Пропущено 544 постов
263 с картинками.
Пропущено 544 постов, 263 с картинками.
Аноним 29/05/26 Птн 20:08:53 1621887
>>1621884
>только несколько раз на новом аккаунте
this
Аноним 29/05/26 Птн 20:43:33 1621910
2026-05-29 20-0[...].mp4 6499Кб, 1280x720, 00:04:06
1280x720
Аноним 29/05/26 Птн 21:46:03 1621961
AI Chatbot General № 822 /aicg/ Аноним 15/05/26 Птн 16:51:50 1613001 Ответ
image.png 812Кб, 1280x837
1280x837
Bladerunner.mp4 3425Кб, 960x720, 00:00:51
960x720
image.png 49Кб, 986x814
986x814
AI Chatbot General № 822

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышел Claude Opus 4.7: https://www.anthropic.com/news/claude-opus-4-7
• Вышел Deepseek V4: https://api-docs.deepseek.com/news/news260424

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards
• Risu: https://risuai.xyz/ | https://rentry.org/ox5cw9p8

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• DeepSeek: https://api-docs.deepseek.com/
• GLM: https://docs.z.ai

Ботоводчество
• /aicg/hub: https://aicg-hub.ru/characters.html
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://aicg.neocities.org/botmaking
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4
• Бургерские боты: https://aicg.neocities.org/bots

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• OpenRouter: https://openrouter.ai/
• Арена: https://lmarena.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives4
• Локальные языковые модели: >>1596667 (OP)
• Шаблон шапки: https://rentry.org/aicg_shapka

Прошлый тред: >>1606640 (OP)
Пропущено 1500 постов
183 с картинками.
Пропущено 1500 постов, 183 с картинками.
Аноним 28/05/26 Чтв 19:50:28 1621233
Аноним 28/05/26 Чтв 19:51:46 1621234
>>1621170
В треде не особо любят фуррей и ещё меньше мафиябоссов. Хотя, кто знает тот знает, я ещё с его Алексом рпшил и норм.
Аноним 04/06/26 Чтв 04:32:13 1625198
>>1621195
Кабанчик не закидывает ключи.
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №236 /llama/ Аноним 22/05/26 Птн 06:11:44 1617427 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
17642884406485.jpg 1911Кб, 1920x2560
1920x2560
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://web.archive.org/web/20241201232031/https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50, тесты производительности и прочее: https://arkprojects.space/wiki/AMD_GFX906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1615052 (OP)
>>1612868 (OP)
Пропущено 499 постов
46 с картинками.
Пропущено 499 постов, 46 с картинками.
Аноним 27/05/26 Срд 04:27:22 1620308
>>1620171
>Если не полностью во врам крутишь - только км кванты от бартовски.
можно подробнее, анон?
ПЕРЕКАТ Аноним # OP 27/05/26 Срд 05:00:54 1620319
Аноним 27/05/26 Срд 06:59:31 1620330
image.png 13Кб, 357x255
357x255
>>1620276
https://huggingface.co/bartowski/ArliAI_GLM-4.5-Air-Derestricted-GGUF
Серьезно, мне вот этот нравится гонять, нравится больше того же 122 квена, а 235 у меня уже не влезал, так что так и не потыкал его.
Еще лучше было бы плотного glm 4.6v, но у меня там полтора токена, так что не трогаю
Stable Diffusion тред X+190 /sd/ Аноним 15/05/26 Птн 17:38:21 1613048 Ответ
image.png 1421Кб, 1024x1024
1024x1024
image.png 3391Кб, 1216x1600
1216x1600
image.png 720Кб, 1015x677
1015x677
image.png 3504Кб, 1920x1088
1920x1088
Тред локальной генерации

ЧТО НОВОГО АКТУАЛЬНОГО

• Lens (3.8B) от Microsoft
• HiDream-O1-Image
• Z-Image-Base
• FLUX.2 klein (4b и 9b)
• Z-Image-Turbo
• Flux 2
• Qwen Image / Qwen Image Edit
• Wan 2.2 (подходит для генерации картинок).
• NAG (негативный промпт на моделях с 1 CFG)
• Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/
https://comfyui-wiki.com/ (откуда, куда, как)
→ Менеджер расширений https://github.com/Comfy-Org/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/

► Предыдущий тред >>1602441 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Пропущено 552 постов
166 с картинками.
Пропущено 552 постов, 166 с картинками.
Аноним 28/05/26 Чтв 16:18:30 1621098
>>1620852
>>1621073
Оно, емнип, как ВПН все равно работать не будет.
Да, блоки РКН обойдет, но если сайт с той стороны геоблок имеет - тебя на него не пустит.
Плюс будет нужно что-то типа zapret-discord-youtube, для "обманки" входного фильтра и коннекта к самому WARPу.

По крайней мере чистый WARP у меня именно так работает, через амнезию не пробовал его пускать ибо подписка на Амнезию есть.
Аноним 28/05/26 Чтв 16:32:14 1621108
Аноним 29/05/26 Птн 13:02:39 1621654
че за хуйня я полгода назад заходил в стейбл дифюжн треды и вы нереально пиздатые кратинки генерили, ща какая то хуита как будто технологии откатились на 5 лет назад, почему так?
Новости об искусственном интеллекте №71 /news/ Аноним # OP 19/05/26 Втр 19:41:08 1615659 Ответ
image 1096Кб, 1376x768
1376x768
image 2636Кб, 1448x1086
1448x1086
В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1611633 (OP)

🚀 Последний обзор ИИ новостей:

📰 Главные новости ИИ

Amazon представила Alexa Podcasts, позволяя пользователям в США создавать подкаст-эпизоды по запросу с помощью ИИ, расширяя возможности создания аудиоконтента на базе искусственного интеллекта.

LetinAR привлекла $18,5 млн на разработку оптики PinTILT для ИИ-очков, обещая более яркие, тонкие и энергоэффективные дисплеи и сигнализируя о растущих инвестициях в носимые устройства с ИИ.

Google DeepMind сигнализирует, что сцена готова к Google I/O, и направляет зрителей на прямую трансляцию в X в 10:00 по тихоокеанскому времени для новых прорывов в области ИИ и анонсов продуктов

🏢 Приобретения

Anthropic приобрела Stainless более чем за $300 млн, закрепив за собой инфраструктуру SDK и ограничив возможности таких конкурентов, как OpenAI и Google.

Cohere приобретает Reliant AI, добавляя исследователей с опытом работы в области корпоративных приложений ИИ для здравоохранения и биофармацевтики, и интегрируя операции в Берлине и Монреале

Mistral AI покупает стартап Emmi AI

📦 Продукты

Amazon представила Alexa Podcasts, позволяя пользователям в США создавать подкаст-эпизоды по запросу с помощью ИИ, что знаменует собой выход на рынок автоматизированного аудиоконтента.

Google Gemini 3.5 Flash появляется в интерфейсе квот Cloud Console под идентификатором gemini-3.5-flash по цене $1,5 за миллион входных токенов и $9 за миллион выходных токенов

💻 Оборудование

LetinAR привлекла финансирование в размере $18,5 млн для развития оптических модулей PinTILT для ИИ-очков, стремясь к созданию более ярких, тонких и энергоэффективных дисплеев и выходя на рынок, который вырос на 300% в 2025 году.

NVIDIA начинает распространение ранних блоков процессоров Vera для рабочих нагрузок агентного ИИ, поскольку Илон Маск получает один для оценки SpaceXAI, а Oracle планирует сотни тысяч развёртываний, начиная с 2026 года

ASML сотрудничает с Tata Electronics по строительству 300-миллиметровой фабрики в Гуджарате, стремясь сделать Индию равным игроком в области чипов к 2032 году, в то время как в Техасе солнечная энергия впервые в истории может превзойти угольную генерацию в рамках ERCOT.


📱 Приложения

SandboxAQ приносит свои модели для открытия лекарств в Claude — степень кандидата наук в области вычислительной техники не требуется

Deutsche Börse разработала инструмент генеративного ИИ для решения задачи масштабной миграции блокнотов Zeppelin в Databricks

В поставщике услуг по уходу за пожилыми людьми Regis ИИ берёт на себя бумажную работу, чтобы сотрудники могли сосредоточиться на подопечных

OpenAI обновила ChatGPT для поддержки разворачиваемых и сворачиваемых сообщений, позволяя пользователям скрывать или отображать длинные ответы одним касанием

Новое приложение Siri от Apple, похожее на ChatGPT, по сообщениям, будет автоматически удалять чаты.

🔓 Открытый исходный код

Qwen 3.7 появляется на Arena. Релиз скоро на хаггингфейсе.

Выпущен бесплатный многоязычный корпус Indic из 9,8 млн документов — хинди, бенгали, тамили, телугу + ещё 7 языков (CC0, HuggingFace). Многоязычный корпус для предобучения из 9 836 075 документов (~8,4 млрд оценочных токенов) на 10 языках Индии и английском языке, созданный на основе высококачественных данных веб-краулинга HPLT Monolingual v3.

PSA: Если вы не обновляли Llama.cpp пару дней и обнаруживаете, что MTP работает плохо, обновите llamacpp. Обновил его вчера и получил прирост скорости генерации токенов примерно в 1,5–1,8 раза. Они даже в значительной степени исправили проблему с pp.

Unsloth AI выпускает оптимизированные под MTP GGUF-файлы для Qwen3.6-27B и Qwen3.6-35B-A3B на Hugging Face, обеспечивая генерацию в 1,4–2,2 раза быстрее

Perplexity AI выпускает pplx-embed-v1-late-0.6b — модель эмбеддингов с поздним взаимодействием на 0,6 млрд параметров — на Hugging Face с оптимизацией MaxSim на уровне токенов и поддержкой нескольких языков

OpenAI открывает исходный код Symphony — спецификации SPEC.md для оркестрации автономных агентов для написания кода.

NVIDIA представляет SANA-WM: открытую мировую модель с 2,6 млрд параметров, которая генерирует видео разрешением 720p длительностью в минуту на одном графическом процессоре.


💰 Финансирование

Kin Health привлекает $9 млн на создание ИИ-ассистента для ведения заметок для пациентов

Viktor привлекает $75 млн в раунде серии А под руководством Accel — крупнейшее финансирование для компании, основанной в Польше, поскольку её ИИ-коллега работает внутри Slack и подключается к более чем 3000 инструментам

Leopold's Situational Awareness раскрывает новые длинные позиции в NVDA, AMD, TSM, MU и других названиях полупроводниковых компаний, а также корректировки владений, связанных с майнингом биткойнов, в своём последнем отчёте 13F

Капитал оценивает будущее до его наступления: акции SpaceX открылись для торговли на бессрочных фьючерсах Hyperliquid с оценкой в $2,4 трлн — крупнейшее размещение в истории, а Илон заявляет, что Starship создан для вывода на орбиту более мегатонны груза в год.

🏭 Компании

Бум ИИ не помешал компаниям США нанимать дешёвую офшорную рабочую силу, и занятость в зарубежных кол-центрах по-прежнему стремительно растёт

Присяжные выносят победу Сэму Альтману и OpenAI в споре с Илоном Маском

Андрей Карпати присоединяется к Anthropic для исследований передовых больших языковых моделей — Андрей Карпати объявил, что присоединился к Anthropic для работы над большими языковыми моделями на переднем крае исследований. Он выразил энтузиазм по поводу возвращения к практическим НИОКР и внесения вклада в усилия компании в ближайшие несколько лет. Карпати также отметил свою неизменную страсть к образованию и намерение возобновить соответствующие проекты в будущем.

DeepSeek нанимает команду для создания конкурента коде-харнессу Claude — DeepSeek активно набирает менеджеров по продукту и сотрудников НИОКР в Пекине для создания собственного инструмента для работы с кодом, явно смоделированного по образцу Claude Code.

💰 Бизнес

Бывший генеральный директор Google Эрик Шмидт освистан выпускниками при упоминании ИИ

Edison Scientific развёртывает ИИ-агента Kosmos совместно с Incyte для ускорения разработки лекарств

Кен Гриффин из Citadel описывает качественный скачок в наборе инструментов ИИ: финансовая работа уровня кандидата наук, которая раньше занимала человеко-годы, теперь выполняется агентным ИИ за часы или дни.

Президент заявляет, что Белый дом «должен был просить более крупную долю в Intel» сверх своих 10 процентов, после того как знаковые сделки подняли акции компании более чем на 300 процентов.

Выручка резко концентрируется: Anthropic и OpenAI получают 89% годовой выручки среди 34 наиболее зрелых стартапов в области ИИ.

Amazon привлекает немецкую компанию DeepL для сотрудничества.

🤖 Робототехника

Figure 03 демонстрирует потрясающую пропускную способность 2,6 секунды в течение 8-часовой смены без монтажа

«Момент iPhone 1»: Figure 04 достигает полной фиксации дизайна. Генеральный директор Figure Бретт Эдкок подтвердил, что Figure 04 достиг «полной фиксации дизайна», и компания уже начала отгружать детали для новой системы.
Эдкок описывает предстоящего гуманоида как «момент iPhone 1» для отрасли, представляющий собой самый значительный скачок между поколениями в истории компании.

Великий параллелизм: Джим Фан из NVIDIA излагает стратегию «конечной игры» в робототехнике. NVIDIA прогнозирует проведение «физического теста Тьюринга» в течение 2–3 лет и завершение «технологического древа» робототехники к 2040 году.

Boston Dynamics публикует видео, на котором её гуманоидный робот Atlas поднимает и переносит мини-холодильник, используя управляемую ИИ координацию всего тела в лабораторной демонстрации

Unitree Robotics демонстрирует управление своим гуманоидным роботом G1 в реальном времени с помощью голоса, когда внешние команды запускают автономные действия, сгенерированные ИИ, записанные в один дубль

В Атланте десятки пустых автомобилей Waymo вторглись в тупик и кружили там часами без пассажиров.

Робот может позволить себе проиграть, человек — не может позволить себе выиграть. Человек-сортировщик посылок от Figure выиграл с минимальным перевесом, при этом его левое предплечье было «практически сломано», а генеральный директор Бретт Эдкок предсказал: «Это последний раз, когда человек когда-либо победит».
Пропущено 512 постов
140 с картинками.
Пропущено 512 постов, 140 с картинками.
Аноним 25/05/26 Пнд 19:46:03 1619632
>>1619496
> базовый доход

Чел, не на твоем веку, на твоем веку тяжелый труд и миска рис с могилизацией
Аноним 26/05/26 Втр 04:02:20 1619777
Аноним 26/05/26 Втр 11:08:34 1619863
AI Chatbot General № 821 /aicg/ Аноним 07/05/26 Чтв 11:39:48 1606640 Ответ
IMG202509220721[...].jpg 60Кб, 1280x837
1280x837
Bladerunner.mp4 3425Кб, 960x720, 00:00:51
960x720
177783543554817[...].png 318Кб, 950x1100
950x1100
AI Chatbot General № 821

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышел Claude Opus 4.7: https://www.anthropic.com/news/claude-opus-4-7
• Вышел Deepseek V4: https://api-docs.deepseek.com/news/news260424

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards
• Risu: https://risuai.xyz/ | https://rentry.org/ox5cw9p8

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• DeepSeek: https://api-docs.deepseek.com/
• GLM: https://docs.z.ai

Ботоводчество
• /aicg/hub: https://aicg-hub.ru/characters.html
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://aicg.neocities.org/botmaking
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4
• Бургерские боты: https://aicg.neocities.org/bots

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• OpenRouter: https://openrouter.ai/
• Арена: https://lmarena.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives4
• Локальные языковые модели: >>1596667 (OP)
• Шаблон шапки: https://rentry.org/aicg_shapka

Прошлый тред: >>1597187 (OP)
Пропущено 1508 постов
191 с картинками.
Пропущено 1508 постов, 191 с картинками.
Аноним 15/05/26 Птн 18:01:28 1613057
>>1613037
ну у них там сикретклаб есть же, и там есть другие китайцы, менее шизовые, думаю к ним приткнусь
Аноним 15/05/26 Птн 18:55:35 1613083
>>1613057
Поделишься? Я у них форума не нашел никакого на сайте.
Аноним 22/05/26 Птн 18:27:56 1617857
>>1613037
>Сложно без клодика сидеть.
А мне охуенно, клод же эт говно, не повезло тебе со вкусом, сочувствую.
Джюпити видит другие чаты Аноним 19/05/26 Втр 13:39:05 1615371 Ответ
eme0nykyct0g1-1[...].jpg 267Кб, 2828x2828
2828x2828
Сап. Замечал ли кто-то, что даже с выключенной памятью гпт ссылается на другие чаты, а когда его ловишь, начинает отнекиваться и утверждает, что темы моего интереса "видно по стилю общения"?
Гуглил эту фигню, ничего не нашел
Пропущено 3 постов
1 с картинками.
Пропущено 3 постов, 1 с картинками.
Аноним 19/05/26 Втр 15:54:03 1615482
Бамп
Аноним 21/05/26 Чтв 12:01:43 1616873
>>>>1615371 (OP)
Ты только сейчас об этом узнал? Два года назад была новость. Я из-за этого старые чаты удаляю, так как chatgpt жалуется на переполнение контекста.
> гуглил
Значит, плохо искал.
Аноним 21/05/26 Чтв 23:22:46 1617304
>>1615371 (OP)
Это у всех сейчас так, хранят выжимку контекста из предыдущих сессий для твоего аккаунта, типа повышает персонализацию ответов. Удаление старых чатов не поможет. Если параноик - просто не регайся в чате.
Anime Diffusion #250 /nai/ Аноним 14/05/26 Чтв 23:21:47 1612344 Ответ
.png 21550Кб, 5152x2872
5152x2872
.png 2548Кб, 1748x1364
1748x1364
.png 5581Кб, 2528x1696
2528x1696
.jpg 6434Кб, 3840x2880
3840x2880
.png 5871Кб, 2560x1472
2560x1472
.jpg 1345Кб, 1696x2528
1696x2528
.png 2206Кб, 1344x1728
1344x1728
.jpg 993Кб, 1536x1536
1536x1536
Генерируем тяночек!

Прошлый тред: >>1604026 (OP) https://arhivach.vc/thread/1354687/

Схожие тематические треды
• SD-тред (не аниме): >>1602441 (OP)
• Технотред: >>1405043 (OP)
• Фурри-тред: https://2ch.su/fur/res/374311.html

FAQ
https://2ch-ai.github.io/wiki/nai

Установка
• NVidia: https://teletype.in/@aranon/welcome
• AMD: https://2ch-ai.github.io/wiki/nai/install/amd
• Облака: https://2ch-ai.github.io/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces
• Модели: https://2ch-ai.github.io/wiki/nai/models
• Промпты: https://2ch-ai.github.io/wiki/nai/prompts
• Апскейл: https://2ch-ai.github.io/wiki/nai/upscale
• LoRA: https://2ch-ai.github.io/wiki/nai/lora
• ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 506 постов
193 с картинками.
Пропущено 506 постов, 193 с картинками.
Аноним 22/05/26 Птн 00:21:56 1617344
1634411667155.png 20956Кб, 5120x2880
5120x2880
Аноним 22/05/26 Птн 20:16:14 1617923
>>1617328
>харухи
>27
Здесь явно 30+ скуфи
Аноним 26/05/26 Втр 07:48:49 1619810
>>1616421
>>1616666
>>1617157
Лучшие посты треды. Лисички они совсем как кошечки, но более озорные. Есть ли бусти, чтобы всех можно было посмотреть?
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №235 /llama/ Аноним 18/05/26 Пнд 22:53:40 1615052 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
177582899215505[...].jpg 3741Кб, 3407x2960
3407x2960
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://web.archive.org/web/20241201232031/https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50, тесты производительности и прочее: https://arkprojects.space/wiki/AMD_GFX906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1612868 (OP)
>>1610759 (OP)
Пропущено 522 постов
52 с картинками.
Пропущено 522 постов, 52 с картинками.
Аноним 22/05/26 Птн 09:27:09 1617481
>>1617370
Промпт процессинг на оперативке... Ммм..
Аноним 22/05/26 Птн 10:17:48 1617511
image 883Кб, 1080x1017
1080x1017
О, легендарная нейрофраза, наравне с шиверсами, в есстественной среде обитания.
Аноним 22/05/26 Птн 11:47:54 1617551
>>1616892
Спасибо! Буду пробовать, надеюсь я все правильно понял.
Ты когда попробуешь - расскажи, что и как, будет интересно
Агентов и вайб-кодинга тред #6 /agents/ Аноним # OP 20/05/26 Срд 18:38:51 1616422 Ответ
2b1.jpg 430Кб, 963x1080
963x1080
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.

FAQ и расширенная инфа:
https://rentry.org/2ch-agents-faq

Прошлый тред >>1600422 (OP)
Пропущено 22 постов
5 с картинками.
Пропущено 22 постов, 5 с картинками.
Аноним 21/05/26 Чтв 12:06:56 1616874
image 4Кб, 424x38
424x38
Перепутал он блять. Однажды он перепутает удаление файла и rm -rf /
Аноним 21/05/26 Чтв 12:20:44 1616881
Как вы сейчас покупаете подписки?
Раньше брал подписку ChatGPT Plus на плати маркете за 300р, но ту махинацию уже прикрыли и все услуги активации подписки стоят все те же 20$.
Какие для СНГ сейчас есть самые выгодные продложения в этом ценовом сегменте? Китайцы вывозят на фоне кодекса? Может есть другой вариант чат джипити урвать по дешевке?
21/05/26 Чтв 12:23:21 1616882
Оркестрация агентов Аноним 14/05/26 Чтв 13:58:39 1611902 Ответ
image.png 59Кб, 300x100
300x100
АИнон, скажи, нет ли у тебя чувства обмана?
Сегодня линкедин пестрит постами "я делаю 50 проектов в неделю", "я оркестрирую агенты", "хуяк-хуяк и в продакшен". На ютубе сотни видео, как классно юзать нейронки и как ты можешь без какого либо знания юзать %llmname% с %skillname% и будешь впереди планеты всей.
Но на весь ютуб я не увидел никакого фреймворка для оркестрации агентов.
В гугле лежит какая-то индусская поделка с initial коммитом (и статья на медиум) + фреймворк ruflo
ruflo настолько удобный, что какой-то товарищ приделал к нему дополнительную обёртку, чтобы не запускать одно и то же. И при этом руфло так херово документирован, что их собственное демо нельзя нормально использовать

Скажи, анон, как ты оркестрируешь команду из N агентов, раздавая им навыки и задачи, ставя таски, синхронизируясь с ними? Ты пробовал написать проект больше, чем перекладывание json с фронта в бд и обратно?
Пропущено 2 постов
1 с картинками.
Пропущено 2 постов, 1 с картинками.
Аноним 20/05/26 Срд 09:48:58 1615991
>>1611902 (OP)
ботохуета не смогла найти даже LangGraph, вот это новости
>>1615951
дед ногтей насыпал ))
Аноним 20/05/26 Срд 10:09:22 1615997
>>1615991
расскажи про свой опыт с этим фреймворком и получившиеся проекты (с реальным пользователями)
Аноним 20/05/26 Срд 10:15:59 1616002
>>1615997
у меня опыта нету и я в душе не ебу че там оркестрировать, но видимо в какие-то бизнес-процессы в каких-то компаниях их встраивают. поищи по запросу LangGraph вакансии на хх и подумай какие там юзкейсы
Новости об искусственном интеллекте №70 /news/ Аноним # OP 14/05/26 Чтв 05:53:06 1611633 Ответ
image 2681Кб, 1024x1024
1024x1024
image 2898Кб, 1448x1086
1448x1086
В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1606515 (OP)

🚀 Последний обзор ИИ новостей:

📰 Главные новости ИИ

Выпускники гуманитарных факультетов Университета Центральной Флориды громко освистали выступающего на церемонии вручения дипломов за называние ИИ следующей промышленной революцией.

WhatsApp добавляет режим инкогнито в чаты Meta AI
Эти разговоры, по словам компании, будут обрабатываться в безопасной среде и не могут быть увидены никем.

Thinking Machines Lab выпускает свою первую модель и утверждает, что интерактивность — это то, в чем OpenAI ошибается в отношении голоса.

Google анонсирует ноутбук Googlebook, разработанный для интеллекта Gemini
Google анонсировала Googlebook, свой первый ноутбук, построенный вокруг модели ИИ Gemini. Устройство нацелено на высокую производительность, добавляет прямую синхронизацию с телефонами Android и должно быть запущено этой осенью.

Telegram выпускает крупное обновление для ИИ-ботов и автоматизаций
Последнее обновление Telegram представляет Guest Bots, рабочие процессы с несколькими ботами, поиск стикеров с помощью ИИ, функции автоматизации чата и новые элементы управления для администраторов.

📦 Продукты

Anthropic запускает Claude для Excel, PowerPoint и Word в качестве общедоступного с полным контекстом разговора между приложениями

holaOS 0.1 выпущен как слой управления рабочими потоками ИИ
holaOS beta0.1 поставляется с Dashboard, Sub Agents и Multi Workspaces для управления параллельными рабочими потоками ИИ на рабочем столе.

Google приносит автоматизацию на основе интеллекта Gemini на устройства Android
Google запускает Gemini Intelligence на Android, начиная с телефонов Galaxy и Pixel этим летом, добавляя проактивные автоматизации на основе ИИ.

Anthropic расширяет предложения юридического ИИ с новыми плагинами Claude Cowork
Во вторник компания представила двенадцать новых плагинов и более 20 коннекторов MCP для своего чат-бота Claude, каждый из которых предназначен для конкретных областей права, включая договорное право, трудовое право и судебные разбирательства.

Meta запускает голосовые разговоры Meta AI на базе Muse Spark
Meta AI теперь поддерживает плавные голосовые разговоры, которые обрабатывают прерывания, смену тем и переключение языков без проблем. Благодаря поддержке Muse Spark обновление также позволяет ИИ генерировать изображения по требованию и предоставлять предложения в реальном времени из Reels и карт, добавляя описания с камеры в прямом эфире.

Alibaba интегрирует ИИ Qwen с Taobao для агентных покупок

💻 Оборудование

Fractile привлекает 220 миллионов долларов на чипы для вывода ИИ
Fractile, британский стартап по производству чипов, привлек 220 миллионов долларов на разработку специализированного оборудования для запуска крупных моделей ИИ в задачах вывода. Раунд под руководством Accel, Factorial Funds и Founders Fund ориентирован на чипы, которые эффективно работают в условиях жестких ограничений по мощности, теплу и памяти.

🔓 Открытый исходный код

Tencent открыла исходный код OpenSearch-VL: полное руководство для передовых многомодальных агентов глубокого поиска

PrimeIntellect представляет Renderers, повышающие пропускную способность RL более чем в 3 раза
PrimeIntellect выпустила Renderers, которые повышают пропускную способность обучения с подкреплением более чем в три раза на популярных открытых моделях. Библиотека согласует обучающие программы на основе токенов с средами на основе сообщений посредством явной обработки входящих и исходящих токенов плюс пользовательского шаблона.

🧪 Исследования

Тим Роктешель соосновывает Recursive для автоматизации исследований в области ИИ
Recursive запускается для автоматизации научного метода в исследованиях ИИ, преобразуя крупномасштабные вычисления в открытые открытия.

📱 Приложения

Google спешит поставить Gemini в центр Android до перезапуска ИИ от Apple.

Anthropic запустила «Claude для юридической отрасли», предоставив более 20 коннекторов MCP, которые связывают Claude с программным обеспечением, на котором работает юридическая отрасль, наряду с 12 плагинами для областей практики, и сотрудничает с Free Law Project и Justice Technology Association, чтобы сделать юридическую помощь доступной для людей, которые в настоящее время не могут ее получить.

Amazon запускает ИИ-помощника для покупок в строке поиска, работающего на базе Alexa+
По словам компании, Alexa для покупок предназначена для предоставления голосового и сенсорного опыта покупок на мобильных устройствах, настольных компьютерах и смарт-дисплеях Echo Show.

ChatGPT теперь позволяет добавить «доверенный контакт» для безопасности.
Новая функция позволяет назначить кого-то, кто будет уведомлен, если разговор в чате указывает на потенциальную проблему безопасности.

🔎 Мнение и анализ

Кэт Ву из Anthropic говорит, что в будущем ИИ будет предвосхищать ваши потребности, прежде чем вы узнаете, что они у вас есть.

⚠ Безопасность ИИ

«Большие языковые модели могут выводить частные атрибуты только на основе воздействия рекламы»: ИИ может многое рассказать о вас, основываясь только на общих паттернах рекламы, которую вы видите, без необходимости доступа к вашей истории просмотров или личным данным — и даже VPN не может защитить вас

Тесты безопасности ИИ имеют новую проблему: модели теперь подделывают свои собственные трассировки рассуждений

Агенты ИИ теперь могут взламывать компьютеры и копировать себя, и они быстро становятся лучше

OpenAI представляет Daybreak: инициатива по кибербезопасности, которая ставит безопасность Codex в центр обнаружения уязвимостей и валидации патчей.

Anthropic проследила попытки шантажа Claude Opus 4 до вымышленного злодейского ИИ в обучающем корпусе, что предполагает, что мы случайно дообучили модели на веке паранойи научной фантастики и получили именно то, что заказывали.

Группа разведки угроз Google идентифицировала первый разработанный ИИ эксплойт нулевого дня, использованный в дикой природе, завершив наступательный переход.

ИИ-чат-боты выдают реальные телефонные номера людей
Люди сообщают, что их личная контактная информация была обнаружена ИИ Google — и, по-видимому, нет простого способа предотвратить это.

Министерство обороны США заявляет, что развертывает Mythos для поиска и устранения уязвимостей программного обеспечения в правительстве США, даже когда оно работает над переходом от Anthropic.

OpenAI раскрывает Daybreak, свою попытку свергнуть Anthropic Mythos
Новое решение OpenAI для кибербезопасности на основе ИИ скоро будет выпущено в мир.

Модель ИИ Anthropic Claude Mythos автономно находит реальную уязвимость curl

Безопасность цепочки поставок ИИ быстро ухудшается: червь Shai-Hulud становится открытым исходным кодом на GitHub на той же неделе, когда Foxconn подтверждает утечку 8 ТБ, раскрывающую схемы Apple, Nvidia и Google.

💰 Бизнес

Давление на управление со стороны Сэма Альтмана нарастает с нескольких направлений одновременно: шесть генеральных прокуроров штатов от Республиканской партии, Комитет Палаты представителей по надзору и усиление контроля со стороны Комиссии по ценным бумагам и биржам США — все это происходит перед потенциальным IPO OpenAI.

Измененная сделка OpenAI с Microsoft ограничивает выплаты суммой в 38 миллиардов долларов, экономя расчетные 97 миллиардов долларов к 2030 году.

И в суде Илья Суцкевер небрежно подтвердил, что его доля в OpenAI стоит примерно 7 миллиардов долларов, подтверждая «почувствуй AGI» как самую высокодоходную сделку десятилетия.

🏭 Компании

Apptronik назначила Дэниела Чу, бывшего директора по продуктам в Waymo, своим новым директором по продуктам, чтобы направить траекторию развития продукта от промышленного использования к здравоохранению.
Расширение руководства следует за крупным раундом финансирования серии A на сумму 935 миллионов долларов и предшествует презентации «долгожданной» новой гуманоидной модели. Ключевые назначения из Boston Dynamics и Amazon привносят специализированный опыт в масштабировании глобальных роботизированных сервисов и многомодального ИИ-программного обеспечения.

Cerebras обновила свою заявку на IPO, нацеливаясь на оценку в 35 миллиардов долларов на этой неделе, выводя на публику тезис о масштабе пластины.

💰 Финансирование

Isomorphic Labs только что закрыла раунд на 2,1 миллиарда долларов под руководством Thrive для масштабирования открытия лекарств на основе ИИ, опуская следующий бенчмарк до молекулярного уровня.
Пропущено 524 постов
128 с картинками.
Пропущено 524 постов, 128 с картинками.
Аноним 19/05/26 Втр 22:52:49 1615814
Аноним 19/05/26 Втр 22:54:28 1615816
>>1615802
Ну хз насчёт грока, я им обычно вместо гуглёжки пользуюсь т.к. заметил что ищет по более чем 100 ссылкам. Я помню какой то "инсайдер" писал что у 3.5 будет цена 0.25!!! И где? Наебали. Ждём дальше когда китайцы их всех выебут
Аноним 20/05/26 Срд 00:11:47 1615866
>>1615763
Ну вот он для тебя и будет в качестве родителя, который будет с тобой взаимодействовать как с трёхлетним ребенком (по его меркам).
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №234 /llama/ Аноним 15/05/26 Птн 14:09:00 1612868 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
177421265265210[...].jpg 1079Кб, 1440x1860
1440x1860
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://web.archive.org/web/20241201232031/https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1610759 (OP)
>>1607859 (OP)
Пропущено 505 постов
67 с картинками.
Пропущено 505 постов, 67 с картинками.
ПЕРЕКАТ Аноним # OP 18/05/26 Пнд 22:54:03 1615053
Аноним 19/05/26 Втр 03:41:12 1615139
>>1614966
>Суммарайзы каждого сообщения через https://github.com/rivey404/ST-MessageSummarize

Честно - как-то не очень по описанию, я так понял что суммарайз сообщения в короткой памяти и так прикреплен к самому сообщению, тоесть в короткой памяти - бесполезен, а в длинную память надо вручную каждый суммарайз сообщения вносить. С таким же успехом я и ручками автосуммарайз таверны править могу.

>затем суммарайзы суммарайзов по дням, чтобы не проебать историю.
В ST MessageSummarize есть такая автоматическая функция? Или ты вручную пердолишься?
Аноним 19/05/26 Втр 09:34:19 1615211
>>1614857
>Гемма 4 31б и Квен 3.5 27б лучше бы запускал сегодня.
Попробовал я гемму 4, я охуел с того, что модель 6-гишабайтная как человек по-русски отвечает
Агентов и вайб-кодинга тред #5 /agents/ Аноним 28/04/26 Втр 21:01:39 1600422 Ответ
0032ea55-0f8d-4[...].png 119Кб, 1557x973
1557x973
f60b8bd8-b64e-4[...].png 381Кб, 1273x710
1273x710
2c62996e-de09-4[...].png 1860Кб, 1380x752
1380x752
1ed911e0-34c2-4[...].png 1078Кб, 1080x1311
1080x1311
fe304218-b992-4[...].png 662Кб, 814x843
814x843
dc61f909-9a6c-4[...].png 3724Кб, 1536x1536
1536x1536
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.

С чего начать:
- Хочешь кодить с AI эффективно: Cursor или Claude Code
- Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter
- Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.5, подробности в llama-треде
- Хочешь приложение без кода: Lovable или bolt.new
- Хочешь автоматизировать рутину: n8n или Langflow
- Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке

FAQ и расширенная инфа:
https://rentry.org/2ch-agents-faq

IDE с AI:
- Cursor: https://cursor.com
- Windsurf: https://windsurf.com
- Antigravity: https://antigravity.google.com
- Zed: https://zed.dev

CLI-агенты:
- Claude Code: https://code.claude.com/docs
- Codex (OpenAI): https://github.com/openai/codex
- Pi: https://pi.dev/
- OpenCode: https://github.com/anomalyco/opencode
- Qwen Code: https://github.com/QwenLM/qwen-code
- Gemini CLI: https://github.com/google-gemini/gemini-cli
- Kimi Code: https://www.kimi.com/code/en

Плагины для IDE:
- Kilo Code: https://kilo.ai
- Cline: https://github.com/cline/cline
- Roo Code: https://github.com/RooCodeInc/Roo-Code
- GitHub Copilot: https://github.com/features/copilot
- Continue: https://github.com/continuedev/continue

Вайб-кодинг без кода:
- Lovable: https://lovable.dev
- bolt.new: https://bolt.new
- v0: https://v0.dev

Персональные ассистенты:
- OpenClaw: https://github.com/openclaw/openclaw
- NemoClaw: https://github.com/NVIDIA/NemoClaw (OpenClaw в песочнице от NVIDIA)
- Hermes Agent: https://github.com/nousresearch/hermes-agent
- nanobot: https://github.com/HKUDS/nanobot
- PicoClaw: https://github.com/sipeed/picoclaw

Автоматизация и фреймворки:
- n8n: https://github.com/n8n-io/n8n
- Langflow: https://github.com/langflow-ai/langflow (визуальный построитель workflow)
- LangChain/LangGraph: https://github.com/langchain-ai/langchain
- CrewAI: https://github.com/crewAIInc/crewAI
- AutoGen: https://github.com/microsoft/autogen
- Agno: https://docs.agno.com/

Локалки и прочее API:
- OpenRouter: https://openrouter.ai
- llama-тред: >>1600155 (OP)

Предыдущий тред: >>1585804 (OP)
Пропущено 587 постов
80 с картинками.
Пропущено 587 постов, 80 с картинками.
Аноним 10/06/26 Срд 02:21:02 1628857
>>1618233
>а есть модель без цензуры, русскоязычная ( англо если вообще никак не найти русскую) и локальная которая влезет в 6гб врам.
>Для локального легкого агента который саммаризирует 2-3 страницы а 4 диктованного нецензурного текста
>задача не разовая, а на каждый день
gemma 4
Аноним 11/06/26 Чтв 18:40:55 1629996
>>1607107
Да уж, ситуация классическая. 🤖 Перепутал полярность инструкции на 180 градусов — это одна из главных болячек современных нейросетей при суммаризации.
## Почему это происходит?

Частица «НЕ»: Модели часто игнорируют отрицания при сильном сжатии текста.
Смешивание контекста: Дипсику показалось, что «жопа» и «хуй» — это просто синонимы в твоем контексте, и он выбрал один метод, перепутав знак (плюс на минус).
* Потеря логических связей: При объединении нескольких промптов ИИ часто теряет жесткие запреты (Negative Prompts).

## Как заставить их объединять нормально?
Если не хочется вычитывать каждое слово, давай им жесткую структуру для сборки.

1. Разделяй логику: Прямо пиши Дипсику: «Объедини эти промпты. Выдели блоки: Что делать ОБЯЗАТЕЛЬНО, Чего избегать КАТЕГОРИЧЕСКИ».
2. Используй капс для запретов: В исходных промптах пиши НЕ делать через [ХУЙ]. Капс и квадратные скобки ИИ считывает лучше.
3. Финальный чек-ап: После сборки задай Дипсику один контрольный вопрос: «Проверь получившийся промпт. В исходнике был жесткий запрет на [ХУЙ]. Сохранился ли он здесь?».

Доверять им на 100% нельзя, они пока еще тупые исполнители. Всегда перепроверяй критически важные условия (особенно запреты)!
Аноним 11/06/26 Чтв 19:32:51 1630034
>>1629996
>3. Финальный чек-ап: После сборки задай Дипсику один контрольный вопрос: «Проверь получившийся промпт. В исходнике был жесткий запрет на [ХУЙ]. Сохранился ли он здесь?».
Все намного проще.
Пишешь ЫЫ: Сравни тексты и покажи дифы.
FLUX.2 ДРОПНУЛ! 32 МИЛЛИАРДА ПАРАМЕТРОВ. ПРОВЕРЯЙ СВОЙ VRAM, НУЖНО 64 ГБ Аноним # OP 26/11/25 Срд 12:08:58 1430679 Ответ
1.png 6310Кб, 2752x1536
2752x1536
Image-courtesy-[...].png 1460Кб, 1280x720
1280x720
Black Forest Labs выпустили FLUX.2 — новую серию моделей генерации изображений, представленную как передовая система «визуального интеллекта». Это совершенно новая модель с новой архитектурой, которая была обучена с нуля. FLUX.2 не является простой заменой или итеративным обновлением FLUX.1.

https://www.youtube.com/watch?v=cvhO9yJk3M

### Главные особенности и боль VRAM

1. КОЛОССАЛЬНЫЙ МАСШТАБ И ПАМЯТЬ. FLUX.2 (версии Dev/Pro) обладает беспрецедентным масштабом в 32 миллиарда параметров (32B). Это значительный скачок по сравнению с FLUX.1 (12B параметров).
2. ТРЕБОВАНИЯ VRAM. Для полной загрузки модели в стандартной точности (FP16/BF16), она требует более 80 ГБ VRAM. Даже в режиме с низким потреблением VRAM (lowVRAM mode) требование составляет 64 ГБ VRAM.
3. VRAM — БИНАРНЫЙ КРИТЕРИЙ. Объем VRAM является самым критическим аппаратным ресурсом, поскольку это бинарный критерий ("работает" / "не работает эффективно").
4. СКОРОСТЬ УБИВАЕТ ОФФЛОАДИНГ. Если веса модели не помещаются в VRAM, система вынуждена использовать механизм Weight Streaming (потоковая передача) из системной RAM. Поскольку пропускная способность системной RAM в 15–20 раз ниже, чем у VRAM, это приводит к катастрофическому падению производительности, увеличивая время генерации изображения с секунд до минут.

### Решения для локального запуска

ОПТИМИЗАЦИЯ FP8. NVIDIA и Black Forest Labs сотрудничали для квантования модели в формат FP8, который снижает требования к VRAM на 40% (до ~38–44 ГБ). Флагманская RTX 5090 (32 ГБ) считается лучшей видеокартой для FLUX.2 на потребительском рынке.
КВАНТОВАНИЕ NF4/GGUF Q4. Владельцы карт с 24 ГБ VRAM (RTX 4090, RTX 3090) могут использовать 4-битное квантование, такое как NF4 / GGUF Q4, которое снижает требование до ~20–24 ГБ VRAM.
СИСТЕМНАЯ RAM. Поскольку модель редко помещается в VRAM потребительских карт, системная оперативная память (RAM) становится критически важной. При агрессивном оффлоадинге потребление RAM может достигать 40 ГБ и выше. Для стабильной работы настоятельно рекомендуется иметь 64 ГБ оперативной памяти (RAM).

### Революционные возможности

Мульти-референс. Модель имеет нативную поддержку использования множества изображений в качестве входных данных, позволяя ссылаться до 10 изображений одновременно. Эта функция обеспечивает лучшую согласованность персонажей, продуктов и стиля.
Гиперреализм 4MP. Поддерживается генерация и редактирование изображений в разрешении до 4 мегапикселей (4MP), что позволяет создавать фотореалистичные изображения даже в большом масштабе.
Точная Типографика. FLUX.2 превосходит конкурентов в области рендеринга текста, надежно создавая сложную типографику, инфографику, логотипы и макеты UI/UX с разборчивым мелким текстом.
Хирургический Контроль. Поддерживается структурированный JSON-промптинг для точного контроля над композицией и деталями камеры, а также возможность указания точных цветов, используя HEX-коды.
УПРАВЛЕНИЕ СКОРОСТЬЮ. Версия FLUX.2 [flex] позволяет регулировать количество шагов (inference steps) и шкалу руководства (guidance scale tuning), чтобы обменивать скорость на точность.

ГДЕ БРАТЬ: Открытые веса FLUX.2 [dev] (32B) доступны для сообщества. Модель поддерживается в ComfyUI, который является самой мощной и модульной GUI для диффузионных моделей и имеет функции оффлоадинга и квантования.

*

Представьте, что FLUX.2 — это профессиональная студия фотопечати, которая может работать с изображениями 4MP. Она требует, чтобы исходные файлы (веса модели) были загружены в супербыструю память (VRAM), но объем этих файлов (до 90 ГБ) настолько велик, что ваш домашний ПК не может вместить их целиком. Приходится постоянно подкачивать данные с медленной системной памяти (RAM), из-за чего печать одной фотографии (генерация) занимает минуты вместо секунд.
Пропущено 5 постов
5 с картинками.
Пропущено 5 постов, 5 с картинками.
Аноним 15/03/26 Вск 15:25:29 1552048
photo2026-02-03[...].jpg 89Кб, 736x981
736x981
>>1430679 (OP)
Оп и другие, нужна помощь, хочу отредактировать свои фотки, типо сделать себя в другом месте или свануть своё лицо с кем-то другим, но самое важное чтобы это было вообще нельзя было человеческим глазом отличить, какую ИИ мне вы посоветуете?
Аноним 17/05/26 Вск 14:02:00 1614034
dfdfsfsd.jpg 99Кб, 1024x572
1024x572
>>1552048
Либо Grok Imagine, либо ComfyUI на своём железе или облачном хостинге. Но тебе наверно лучше, Грок, но там платно 30 баксков в месец, Комфи на своей нвидии беслатно, но надо уметь пользоваться
Аноним 17/05/26 Вск 14:09:54 1614037
grok-video-16e2[...].mp4 5017Кб, 832x1504, 00:00:06
832x1504
>>1530090
GGUF (твой случай) или облачный хостинг, когда совсем мало VRAM
>>1530413
Открытая модель => лоры и чекпоинты без цензуры
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №233 /llama/ Аноним 12/05/26 Втр 18:25:41 1610759 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
177602872903323[...].jpg 6231Кб, 4080x3072
4080x3072
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://web.archive.org/web/20241201232031/https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1607859 (OP)
>>1605947 (OP)
Пропущено 500 постов
77 с картинками.
Пропущено 500 постов, 77 с картинками.
ПЕРЕКАТ Аноним # OP 15/05/26 Птн 14:09:21 1612869
Аноним 15/05/26 Птн 14:10:01 1612870
image.png 341Кб, 1092x668
1092x668
>>1612858
Все лорбуки уже починены и доведены до ума. Остается только нажать export to json и импротировать этот файл в таверну как лорбук.

>>1612862
Да, пароля нет.
Аноним 15/05/26 Птн 14:17:33 1612877
image.png 257Кб, 1205x883
1205x883
image.png 19Кб, 1126x127
1126x127
image.png 180Кб, 1087x592
1087x592
Gryphe_WorldSim-Opus-3.6-35B-A3B-Q5_K_L.gguf . В принципе имеет право на жизнь. Свайп на чате на 71k токенов. Ризонинг компактен и по делу. К сожалению moe-сущность модели никуда не делась - инструкция после истории на создание кодового блока со всякой херней была упомянута в ризонинге, но в output на нее был забит болт. Свайпы разнообразны - с некоторой вероятностью выскакивают паттерны разных видов ризонинга.
Anime Diffusion #249 /nai/ Аноним 03/05/26 Вск 16:00:57 1604026 Ответ
1775583966471.png 20607Кб, 5152x2872
5152x2872
1755626513627.jpg 5225Кб, 2880x3840
2880x3840
1706508685116.png 3794Кб, 1632x1632
1632x1632
1777214049504.png 5603Кб, 2400x1792
2400x1792
1752699301609.jpg 415Кб, 1824x1248
1824x1248
1651144973909.jpg 2655Кб, 2304x2304
2304x2304
1766581284092.png 2225Кб, 1536x1536
1536x1536
1639303760097.jpg 787Кб, 1280x1856
1280x1856
Генерируем тяночек!

Прошлый тред: >>1596740 (OP) https://arhivach.vc/thread/1347661/

Схожие тематические треды
• SD-тред (не аниме): >>1602441 (OP)
• Технотред: >>1405043 (OP)
• Фурри-тред: https://2ch.su/fur/res/374311.html

FAQ
https://2ch-ai.github.io/wiki/nai

Установка
• NVidia: https://teletype.in/@aranon/welcome
• AMD: https://2ch-ai.github.io/wiki/nai/install/amd
• Облака: https://2ch-ai.github.io/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces
• Модели: https://2ch-ai.github.io/wiki/nai/models
• Промпты: https://2ch-ai.github.io/wiki/nai/prompts
• Апскейл: https://2ch-ai.github.io/wiki/nai/upscale
• LoRA: https://2ch-ai.github.io/wiki/nai/lora
• ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 523 постов
218 с картинками.
Пропущено 523 постов, 218 с картинками.
Аноним 14/05/26 Чтв 23:25:23 1612349
Аноним 14/05/26 Чтв 23:30:29 1612357
>>1612301
>raylight (ray + rccl)
ХА А НЕ СЛИШКОМ ЛИ МНОГО R ТЫ СЕБЕ ПОЗВОЛЯЕШЬ МММ
>пикрилы
Ебать 5060 ти унылый калл. У меня 3090 ти в твоих 1.5 мегапикселей генерит 27 секунд - т.е. твоя скорость с рейлайтом. И это без сажи (я кстати поубирал сажу из всех воркфлоу кроме вана, потому что на некоторых сетках она артефачит).

Я уже кидал в сд тред, тут тоже скажу - сделали суперпиздатые int8 convrot кванты, которые лучше fp8
https://www.reddit.com/r/StableDiffusion/comments/1tazxqz/int8_in_the_age_of_mxfp8_an_investigation_into/
Если использовать квант, у меня вместо 27 секунд становится 19. Это, на минуточку, нихуя себе. Причем квант качеством на уровне q8. Особенно актуально ампероводам, у которых нэма fp8.
Аноним 26/05/26 Втр 02:50:16 1619764
images (42).jpeg 33Кб, 250x357
250x357
images (41).jpeg 63Кб, 374x534
374x534
images (40).jpeg 36Кб, 447x447
447x447
images (38).jpeg 40Кб, 522x588
522x588
Есть неподвижная картинка с нарисованным персонажем. Нужно сделать видео по типу новостей где этот персонаж в роли диктора читает новости.

Как это сделать проще всего? Каким инструментом,какая нужна нейросеть?
Прохождения собеседования на английском (и в целом зеркальный переводчик) Аноним 20/04/26 Пнд 15:43:47 1592407 Ответ
177b.jpg 80Кб, 1200x675
1200x675
Всем добы ден!

Ищу способ прохождения собеседования в контору со знанием англ. Подозреваю что есть уже такой функционал, но обнаружить его еще не удалось.

Хотелось бы чтобы делал следующее:

- С моей стороны на лету переделывал запись с вебки, звук сразу переводил с рус на англ, само видео редактировал, движение губ под англ слова (мб уже есть решения как поступать когда рус длинне чем англ слова или наоборот, в таких случаях какой то лаг добавлять или что то в этом роде)

- Со стороны собеседника, переводить с англ на рус и подавать мне.

Вдруг уже что то подобноее есть
Пропущено 1 постов
1 с картинками.
Пропущено 1 постов, 1 с картинками.
21/04/26 Втр 21:45:07 1593661
сажи говнотреду лишнему. есть закрепленный тред
такого нет, максимум ИИ для собесов (есть росиянские платные аналоги) где звук с компа считывается и микрофон с твоего стороны
задаёшь промптом что ты хохол не знающий английского и экраном выдавать текст, удобная транслитерация, произношение (как напиздеть в ответ), перевод и так далее.

если и есть синхронное говно, то оно говно и рекрутерам такое нахуй не надо
23/04/26 Чтв 00:55:21 1594994
Свободно владею английским, но на интервью никто не зовёт. Поэтому сажа
Аноним 14/05/26 Чтв 10:45:13 1611751
>>1592407 (OP)
Есть модели для восприятия аудио и переввода, но им нужна цельная ограниченная по времени аудиозапись. Дипфейки в реалтайм вроде как накладываются (вспомни хотя бы прямую линию в 2024), движение губ можно изменить на видео, но я не уверен что это реалтайм. А чтоб ещё заставить всё этл вместе работать, ну это совсем беда.
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов