Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.
С чего начать: - Хочешь кодить с AI эффективно: Cursor или Claude Code - Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter - Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.5, подробности в llama-треде - Хочешь приложение без кода: Lovable или bolt.new - Хочешь автоматизировать рутину: n8n или Langflow - Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке
Ебать как же я обожаю когда агент лепит в никак не связанное с задачей место нахуй ненужную фичу, о которой я его не просил, о которой я узнаю только спустя несколько коммитов и мне приходится отдельно просить его в новом чате чтобы он это удалил. Ебать спасибо нахуй.
Хочу купить подписку на claude анонимно. XMR например. Как? Оно требует карточку. Где-нибудь мб могут продать готовые оплаченные акки claude за крипту? Или есть другой более простой путь?
>>1585858 я вот по этой причине и не хочу гермеса ставить, опенклоу более управляемым кажется сам говоришь когда результат норм, чтобы скиллы обновил и все.
>>1585804 (OP) О, мой скрин в шапку попал. По итогу спустя 2 недели ауторисерча, тот результат, который получился в самом начале, так и не получилось побить (итого было вьебанно около 40 баксов). Прошлую и эту неделю бот пробовал трейдить на живом рынке, но пока еще с демо счетом. На прошлой неделе был винрейт меньше 30% потому что ситуация на рынке вообще не такая, какая была во время обучения (сейчас война за нефть и прочие приколы). Клод сказал надо адаптировать стратку под лютую волатильность - сделали это вчера и винрейт+сортино сразу начали расти, второй скрин. Короче этого бота буду еще гонять до конца недели, а скорее до конца месяца, потом если будет хотя-бы 2-3 Сортино то можно спокойно запускать на реальных деньгах.
>>1585862 Хз я просто на платисру купил гифт. Два раза себе и один раз родственнику, тебе просто скидывают ссылку, ты открываешь в браузере будучи залогиненым в нужный акк, принимаешь гифт и у тебя подписка сразу работает. Оплата криптой там точно была, но я лично не пробовал.
>>1585804 (OP) Сычёв, пока ты там за своим опенклювом сидишь, Ерохин-то вона уже мёртвый интернет себе запилил давно и гоям продаёт. https://doublespeed.ai/
>>1586085 Вроде бы и круто, но у меня уже есть родные и любимые китайские/американские модели. Плюс оплаченная подписка. Так что чет даже за бесплатно нет интереса тестить. Такое прикольно только для фулл вкатунов.
Анончики, внезапно на презенташках клиентам кабанам зашёл я так понимаю изза устранения визуального мусора и шума с возможностью большего сосредоточения на конкретике вот такой стиль:
# ЗАПРОС НА СОЗДАНИЕ УНИВЕРСАЛЬНОЙ ПРЕЗЕНТАЦИИ (BLUEPRINT / SKETCH STYLE)
ОСНОВНАЯ ЗАДАЧА: Создать детализированную, высокотехнологичную изометрическую инфографику в стиле чертежа-схемы (blueprint) / карандашного эскиза (pencil sketch) на светлом фоне, визуализирующую структуру, функционал и roadmap программного обеспечения или продукта, описанного в прилагаемом тексте (user's input description). Все текстовые данные должны быть извлечены непосредственно из предоставленного текста и сопоставлены с predefined структурой инфографики.
АЛГОРИТМ ИЗВЛЕЧЕНИЯ И СОПОСТАВЛЕНИЯ ДАННЫХ:
Генератор должен проанализировать user's input text (описание ПО/продукта) и извлечь ключевую информацию для заполнения следующих визуальных блоков:
1. Центральный хаб (Hub): Извлечь имя проекта/продукта и основную парадигму/тип (например, "APP," "PLATFORM," "TOOL"). Картировать их в центральную светящуюся изометрическую модель (компьютер/микросхема/главный символ). Сгенерировать релевантный, краткий подзаголовок (Subtitle) на основе описания. 2. Блок 1 (Паспорт): Извлечь: "Тип" (например, портабельное ПО, веб-сервис, платформа), "ОС" (целевая ОС), "Статус" (релиз, разработка, MVP), "Стек" (список технологий), "Ключевая особенность". Картировать их в текстовую карточку в верхнем левом углу, добавив релевантные иконки (Win/Linux/Mac, языки/технологии). 3. Блок 2 (Миссия и Видение): Извлечь *цель* (миссия) и *долгосрочное видение*. Картировать их в текстовые поля с релевантными sketched символами (глобус, каска, линк). 4. Блок 3 (Процесс Развертывания / Шаги): Проанализировать текст на наличие *пошаговых инструкций, todo-листа или numbered logic*. Генерировать изометрическую схему потока (Step-by-step diagram), отображающую этот процесс. Использовать sketched terminal icons, Python/Code icons, installation icons, и Windows EXE icons, как релевантно. Четко указать ключевые этапы (Шаг 1, Шаг 2, и т.д.) и текстовое описание для каждого. Если есть путь установки (D:\SOFT...), извлечь его и отобразить. 5. Блок 4 (Решение / Функционал): Извлечь *5 основных функциональных столпов* (пилларов) или решений продукта. Картировать их в 5 отдельных, детализированных потоков справа, каждый со своим sketched изометрическим символом (например, видео сетка, постеры, плеер, загрузчик, категории/фильтры). Генерировать релевантные изометрические иконки для каждого. (removed generic enterprise slop like MinIO, RBAC). 6. Блок 5 (Целевая Аудитория): Извлечь *группы пользователей* или клиентов. Картировать их в 3 изометрические группы с релевантными sketched иконками аудитории (например, индивидуальные пользователи, разработчики, исследователи). 7. Блок 6 (Ключевые Инновации и Безопасность): Извлечь *ключевые технические инновации, преимущества или функции безопасности*, которые отличают продукт. Картировать их в 4 изометрические карточки, сфокусированные исключительно на локальных/продукт-специфичных функциях, а не generic enterprise slop (like MinIO, RBAC, WORM, 2FA, SMS slop). Сгенерировать изометрические иконки (USB lock, resource folder, secure safe, integrated tools). 8. Блок 7 (Планы Развития / Roadmap): Проанализировать текст на наличие *дорожной карты, timeline или quarterly plan*. Генерировать детализированную изометрическую блок-схему roadmap (Q1-Q4 blocks) с конкретными этапами, датами и текстовым описанием (например, Текущее/Relase, Ближайшее, Перспектива, Всегда).
СТИЛЬ И ЭСТЕТИКА (НЕИЗМЕННЫЕ):
* Тип: Изометрическая техническая инфографика / чертеж-схема (Blueprint Infographic). * Текстура: Hand-drawn Graphite Pencil Sketch, Line Art, Minimal Shading, Technical Schematic style on textured cream-colored sketch paper with millimetre grid patterns. Natural Graphite smudges, eraser smudges, and paper texture. No digital glow, only subtle glowing interconnected lines showing connections (e.g., cyber cyan, neon orange accents). * Цветовая палитра: Monochrome graphite with minimal, highly selective, interconnected "glowing" lines (cyber cyan, neon orange). Light, non-overpowering colors overall. * Композиция: Central Core/Hub connected by glowing lines to predefined multi-block peripheral layout. Highly detailed, intricate visual map.
ЗАГРУЗИТЕ ВЛОЖЕНИЕ ДЛЯ ПОЛУЧЕНИЯ ДАННЫХ: Вставьте текст-описание вашего ПО/продукта сюда.
ПРИМЕЧАНИЕ ДЛЯ ГЕНЕРАТОРА: Извлечение и сопоставление данных из user input text имеет приоритет. Все иконки и символы должны быть релевантны извлеченным данным. Полностью исключить enterprise/B2B slop (MinIO, RBAC, WORM, 2FA, SMS, Digital Twin, SLA, Equipment Monitoring slop), если они явно не описаны в тексте. Текст должен быть четким, читабельным, интегрированным в визуальные элементы, в стиле ручного чертежа.
ОБЩЕЕ ВПЕЧАТЛЕНИЕ: Презентация должна выглядеть как сложный, красивый технический чертеж, выполненный карандашом и штриховкой, но с яркими неоновыми акцентами, показывающий всю систему в изометрическом виде. Текст должен быть четким и читабельным.
Меня не пускают в Antigravity. Наверно не нравится мой регион. Как гугл решает с какого региона мой акк если я всегда заходил под впн? И раньше везде пускало, а теперь нет. Это можно изменить где-то в настройках?
>>1586163 Тоже такая хуйня была, из-за этого пришлось отказаться от antigravity. Акк Гугла старый и несмотря на установленный регион США + виртуальная карта США + платежная инфа США, один хуй он посчитал меня РУSSКИМ и не дал юзать их ИДЕ. Вариант - брать свежий акк у барыг.
В общем паранойя меня отпустился только когда я поставил claude code в wsl, настроив там перенаправление трафика не только через env http_proxy, но и через iptables. Теперь всё идет на поднятый на винде xray.
>>1586085 Надо будет попробовать. Врядли оно прямо лучше конкурентных решений, но почему бы и нет. Очень огорчает что это будет преподноситься как аргумент для ограничений, потому поддерживая отечественного производителя (а ведь реально хотелось бы) становишься невольным соучастником преступлений против общества.
Анон, /ai/ раздел двачика притянул своим содержимым и жизнью вполне социализированных погромарей музыкантов нейрохудожников и тд тп со всего рунета и с хабра и с vc и с dtf и наносеков и ютуберов Я сам не был программистом, а аналитик политтехнолог региональный, в итоге втянувшийся на волне ИИ сначала в биг дату анализа социума и избирательного электората, а потом залипшего на вайбкоде. И внезапно у меня уже раскачанный гитхаб с многотысяч звезд и жирные заказы по софту. Жена в ахуе как я кардинально сменил жизненную парадигму и профессиональный путь. В итоге: в рабочем кабинете круглые сутки жужжит 3д принтер, печатая и полезное и приколюхи. куплен мак студио под опенклав, пока бодаюсь ибо он сука как подросток охуевший жужжит пыхтит Cursor с подпиской Ультра на компике 4-х комнатная квартира полностью теперь оснащена системой Умный дом со слаботочкой, на 70% самопис вайбкоженный
/ai/ это обособленно от /b/ и тут своя атмосфера, почти нет затравленных ерохинами стесняшек тнн
>>1586353 социоблядь, нормис, с женой и наверное с детьми, скуф, 4комнатная квартира, политик, макбук у него или что-то крутое, обеспеченая денежная гнида
>>1586369 Нихуя, в последнее время Клод 4.6 Max буквально провёл по губам гопоте в плане качества кода, слопа и глюков ОЙ ПРОСТИТЕ Я ПРОЕБАЛ СКОБОЧКУ 5 ХОДОВ НАЗАД, ЩАС СДЕЛАЮ ПОЛНЫЙ ОТКАТ ВСЕГО И ВСЯ И ЗАМЕШАЮ ВЕСЬ ВАШ КОД В ЁБАНУЮ КАШУ ... ... ОЙ, ИЗВИНИТЕ ВЫ БЫЛИ ПРАВЫ! НЕ СТОИЛО ЭТОГО ДЕЛАТЬ! ДАВАЙТЕ НАЧНЁМ С ЧИСТОГО ЛИСТА!
>>1585804 (OP) Я правильно понимаю что для нормального ассистента по документам (не кодинг) нужно покупать внешку, т.к. бесплатных суточных токенов не хватет?
>>1586376 Да. И тебе будет хватать простого апи Дипсика с включенной опцией кеширования. >>1586372 Ну так напиши разрабам с просьбой добавить поддержку языка, хули ты слопишь?
>>1586373 >ОЙ ПРОСТИТЕ Я ПРОЕБАЛ СКОБОЧКУ 5 ХОДОВ НАЗАД, ЩАС СДЕЛАЮ ПОЛНЫЙ ОТКАТ ВСЕГО И ВСЯ И ЗАМЕШАЮ ВЕСЬ ВАШ КОД В ЁБАНУЮ КАШУ >... >... >ОЙ, ИЗВИНИТЕ ВЫ БЫЛИ ПРАВЫ! НЕ СТОИЛО ЭТОГО ДЕЛАТЬ! >ДАВАЙТЕ НАЧНЁМ С ЧИСТОГО ЛИСТА! И близко такой хуйни не было. Бывает что он делает лишние фичи, которые его не просили или не понимает что нужно было сделать и делает что-то другое, но качества кода всегда хорошее. Он делает все в основном с первой попытки, максимум со второй исправляется.
>>1585804 (OP) Антропик забанил с какого-то хуя мне аккаунт, даже причину не написал. Хуй знает за что, разве что вайбкодил говно всякое и может впн поменял. Хотя я заграницей живу и даже плачу с кредитки на своё имя.
Щас временно сижу на квен код, в целом терпимо, но конечно клода не хватает, брал кодекс ещё, но и ему лимиты тоже порезали из-за чего 20 баксов подписка стала тыквой, а ведь это когда-то было преимуществом в сравнении с клодом за 100
>>1586389 >Антропик забанил с какого-то хуя мне аккаунт, даже причину не написал. >Хуй знает за что, разве что вайбкодил говно всякое Мне так гугл забанил в гемини бизнес интерпрайз на платном аккаунте, за разработку софта двойного военного назначания Но я сука вредная и хитрая, я всегда все беседы и переписки и код копирую в блокнотики локально. В общем продолжил разработку в чатжпт в курсоре, схитрожопив и обозначив цели и задачи на мирные цели. Так сказать сельскохозяйственные.
>>1586373 >ОЙ ПРОСТИТЕ Я ПРОЕБАЛ СКОБОЧКУ 5 ХОДОВ НАЗАД Кстати соглы. Я только сейчас подумал - у меня за месяц пользования Клодом ниразу не было блядь SYNTAX ERROR нахуй. НИ РАЗУ СУКА. Копилот на чатгопоте или Кими могли чуть ли не через один промпт слопить с такой хуйней.
Ребят, это просто вау. Вчера весь вечер мучал эту сборку на своем старом ноуте с 6 ГБ ОПЕРАТИВЫ - летает! Действительно, от оригинала отличить почти невозможно, а главное - никаких «извините, я ИИ, не могу вам помочь». Молча целую библиотеку кода загрузил, разобрал, еще и документацию написал. А то уже задолбали эти подписки по 20 баксов в месяц. Накатил, забыл, пользуешься. https://huggingface.co/Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF
>>1586389 Соболезную. В саппорт к ним не писал? Ouath антропоидов для 3rd party софта не юзал кстати? За это мог бан прилететь. Но только начиная с 4 апреля.
>>1586438 Писал, там ИИ саппорт лол и гугл форма на разбан заполнял. ответа нет уже больше 20 дней. опенклау поюзал два раза, и забросил это говно сразу же ещё до 4 апреля, так что вряд-ли из-за него, возможно ВПН менял, надо было на нидерландский пересеть пока вайбкодил хотя за границей проживаю итак, так что вряд-ли за российский след могли забанить, или скорее всего некоторые неудачные запросы были, хотя я его никогда не подстрекал мол давай давай делай мне тут запрещенное разрабатывай да и вроде особо такого ниче не было. Он мог сам хуйню додумать не самую законную хоть в моём промпте такого не было
>>1586362 Ты не выкупил? >>1586369 Он как раз наоборот крут для создания большинства популярных вещей и отлично соображает как сделать многое. Но в чем-то недефолтном или креативности он уже далеко не так крут, иногда наоборот склонен отступать от задачи делая подобие, делать глупые ошибки или очень тяжело продвигаться. Другое дело лучше или хуже он по отношению к другим в этих кейсах, это требует больше наблюдений. Если речь не про код а про анализ, обсуждения и прочее - жемини ощутимо лучше. Когда не лоботомирована. >>1586413 > мимо Школа21 сбера Дай ключик
>>1586446 Хз я ему иногда на русеке пишу запросы и он очевидно в своей account-wide memory знает что я нахожусь в РФ. Ну и делаю приложухи на русеке в том числе.
Вообще так подумать - можно посмотреть на мой аккаунт и он будет подозрительным, пушо я захожу в один и тот же аккаунт с разных устройство + разных ойпи.
Наверное самое жоское за что они банят - шеринг аккаунта. Ты никому не давал его погонять?
>>1586421 >27b >на своем старом ноуте с 6 ГБ ОПЕРАТИВЫ - летает! Толсто.
Пробовал гемму 4 31b плотную поставить. Она работает со скоростью 2.5 в секунду на моем нормальном железе, просто потому что приходится запускать на CPU почти полностью, ведь в GPU не лезет, это буквально неюзабельно для агентов. Ставил себе васянский дистилл опуса, но на основе геммы 4 moe, там 4b активных параметров и 26b в целом, и только это в Q4 запускается на 20 токенов в секунду на моей консьюмерской видюхе, вот это уже хорошо. Только дело в том, что это говно васянское уходит в луп, оригинальная гемма куда юзабельнее.
>>1586460 Никому, лол. Да у меня даже кредитка есть зарубежная на меня, типа это достаточно трастовый показатель чтобы во всяких гугло облаках и прочих раздавать халявные кредиты под 300 долларов с впс-ками на месяц бесплатно или за мини депозит
Но если честно, уже заебало это рабство анальное и платное с лимитами которые ебут во сне и наяву. Кодекс туда же пошёл. Квен конечно неплохо работает за свой бесплатный прайс, но может не справиться если в коде есть 18+ контент (jrpg на ренпае прочитать) и просто ошибку выдать 400 и надо будет его вытаскивать оттуда Кодекс с этим справился лол, но если что-то за рамки выйдет, что он считает не безопасным или опасным, он нахуй пошлёт. Надо мне веб приложение в открытый доступ залить чтобы у всех доступ был? Вход по токенам в кукам и никак иначе.
>>1586456 >Дай ключик Вливайся в команду Школы 21 и будет тебе и ключик и ресурсы 1тб vram и поддержка нужного, просто становись частью команды. или иди нахуй
>>1586460 >Вообще так подумать - можно посмотреть на мой аккаунт и он будет подозрительным, пушо я захожу в один и тот же аккаунт с разных устройство + разных ойпи. Я так нечаянно vless иранский включил и у меня вкладка Gemin была открыта, сгенерил картинку и нахуй аккаунт заморозили. Это называется чихнул и обосрался жидким
>>1586490 В этой вашей школе обязательно ебаный код вообще писать? Омерзительное и унизительное занятие, но вкатился бы если берут вайбкодеров агент-инженеров.
>>1586123 >я так понимаю изза устранения визуального мусора и шума Забавно, потому что твой пик только из визуального мусора и состоит, по-моему. Надо куда проще. Ну и понятно что это не про кабанов, но опытным взглядом бананаслоп на пикче распознаётся и ментально отфильтровывается ещё на превьюхе.
2 v100 под 40 токенов в секунду выдаёт для qwen3.5 27b, это вроде норм результат? Учитывая что у опуса 4.6 по апи и бенчи показвают 38 токенов в секунду Или я в чём-то не прав? Просвятите, буду благодарен.
>>1586526 > вроде норм результат Это хороший результат. Минус только в промптпроцессинге (обработке нового длинного контекста, он может быть очень медленным), а также замедлении и обработки и генерации по мере накопления контекста (в начале все быстро, а когда набрало - идет тяжело). Алсо 27б и в одну v100 вместится. > лучше даже чем 3080 с доп. памятью Пара 3080 с доп памятью поддерживают vllm в tp2, скорости и работоспособность тулзов будут на высоте. v100 - только llamacpp с ее компромиссами и нюансами.
>>1586497 Вайб код тоже в первую очередб в тренде. Если чтото не понимаешь, тебя научат. самый сок это знание sql пиши сюда по поводу раста support@gitverse.ru только не жирни, а нормально напиши
>>1586490 Ну это что-то для совсем хлебушков по описанию. У меня уже есть специальность, которой доволен. Учиться никогда не поздно, но тратить пол года на уже известное чтобы потом СТАЖИРОВАТЬСЯ вебмакакой - сюрр. Интересует больше возможности для своего применения, может быть и на работе бы сделали массовую закупку услуг. > 1тб vram В свободное пользование?
Что за хуйня? С openclaw так же было. У вас было такое, получилось пофиксить этот <|channel>? Оно ещё и лупится, но это вроде из-за неправильного детекта размера контекста, ещё буду тестить.
>>1586369 Блядь, клод в чате ваншотит рабочий интерфейс для силуэт-детектора на py+flask, остаётся только нюансы править. Гемини и гпт-кал жидко обсираются даже с оболочкой, выдавая нерабочий недовысер в стиле web 2.0
Это пиздос, llama server просто вырубается спустя минут 15 работы и при этом ram и vram не переполняются даже. Пришлось как няньке сидеть и целый час перевключать сервер, чтобы он по чуть-чуть что-то пилило. Час на простую таску. Правда получилось достаточно неплохо. Рекомендую связку геммы с claude code, она реально стабильнее в вызове тулзов при этом, правда делает задачу дольше чем остальные агенты, но качественнее. Короче если бы не этот ебаный баг, то можно было бы поставить фоном что-то разрабатывать и уйти заниматься своими делами.
>>1586692 У меня так же срала гемма в opencode. Но ничего, с задачами справляется энивей, так что это чисто визуал.
>>1586929 >Это пиздос, llama server просто вырубается спустя минут 15 работы и при этом ram и vram не переполняются даже. DA, поэтому рекомендую запускать через llama-swap, упадет так он его перезапустит пока таймер ожидания тикает. Ну, если у тебя там не с hdd грузит. Какого хуя он рандомно падает я тоже не понимаю.
>>1586929 Какую ошибку выдает? > срала гемма в opencode Дело не в софте-клиенте, проблема в кривом парсере, который не обрабатывает эту часть и вываливает в обычный ответ.
>>1586939 Ошибку в консоль не выдает совсем. Есть ошибка в логах windows, грок расшифровал это как STATUS_STACK_BUFFER_OVERRUN и пишет что это проблема самой llama cpp.
>>1586944 Это странно. Рам не разгонял случаем, или она не перегревается? Как раз подобное от этого бывает. Ллама та еще мусорка, но таких вещей быть не должно.
>>1586544 С 20 апреля буду проходить обучение на Девопса по рекомендации нейронки, как к вам дальше перекатиться, если я мамкин вайбкодер? Сейчас работаю в колл-центре Сбера, хочу выкатиться оттуда уже и стать наносеком
>>1585804 (OP) Добрый день, скажите мне человеческими словами, какие требования необходимы для вайб кодинга? Типо,я вот математику не знаю, информатику тоже,какие требования ко мне и моему компу персонально выдвигаются, чтобы я мог стать пользователем? Базовая информация для вката, или что то типо того. Заранее спасибо.
>>1587448 «Вайб-кодинг» — это когда ты не пишешь код руками строка за строкой, а объясняешь нейросети (ИИ), что ты хочешь получить, и она пишет всё за тебя. Это больше похоже на работу режиссера или заказчика, чем классического программиста. Вот что тебе реально нужно для старта: 1. Требования к тебе («Мягкие навыки») Математика и алгоритмы тут на втором плане. Главное — логика и занудство: Четкое ТЗ: Ты должен уметь детально описать словами: «Сделай кнопку красной, а когда на неё нажимают, пусть вылетает конфетти и играет звук». Чем точнее описание, тем лучше «вайб». Английский язык: Хотя нейросети понимают по-русски, лучший код они всё равно выдают на английские промпты. Базового уровня или переводчика под рукой хватит. Терпение: ИИ часто ошибается. Тебе придется копировать ошибку, кидать её обратно нейросети и говорить: «Не работает, исправь». 2. Требования к компьютеру Тут всё просто, так как «мозги» процесса находятся на серверах компаний. Браузер и интернет: Это самое важное. Всё происходит в облаке. Железо: Подойдет любой современный ноутбук или ПК, на котором плавно открывается YouTube в 4K. Мощная видеокарта не нужна — считать всё будет ИИ за тебя. ОС: Windows, macOS или Linux — без разницы. 3. Инструментарий (Твой стартовый набор) Тебе не нужно учить языки программирования, но нужно установить пару программ: Cursor: Это сейчас «король» вайб-кодинга. Выглядит как обычный редактор кода, но в него встроен мощный ИИ. Ты просто жмешь Ctrl+K, пишешь «сделай мне сайт-визитку», и он его делает. Аккаунт Claude (Anthropic) или ChatGPT: Самые умные модели сейчас — это Claude 3.5 Sonnet. Она лучше всего понимает человеческий язык. Итог: Если ты умеешь пользоваться поисковиком и можешь внятно объяснить другу, как дойти до магазина, ты уже готов к вайб-кодингу.
>>1587451 Курсор бесплатен? На жопоту нет денег, да и комп у меня... Вообщем 1080 тянет, но выше уже нет, ахах. Я так сказать за чертой бедности. так что вообщем то смотрю на панику из за замены рабочих мест ИИшкой совсем по другому. для меня и таких людей как я - ИИ это шанс вырваться из бедности, и безусловное благо.
>>1587458 можешь вайбокодить с бесплатными лимитами через qwen-coder, можно использовать чат ассистанты гемени\дипсик\квен, можно использовать бесплатные модели на опенроутер.
так то есть 2 пути - собрать риг и вайбокодить даже с чебурнетом либо платить подписку на корпоратов (проблема только с оплатой, лол). китайские модели самые дешевые.
>>1587477 Двачую. Я вообще вайбкодить начал в Перплексити, в браузере Комет. Она говорила какие файлы создавать и что туда копировать Первый сайт и два приложения на андроид бвли написаны там. А потом уже сурьезный кодинг в Курсоре про за 1,6к, потом кастрация про Курсора и подорожание до 2к. Но уже похуй, бабло приносит и подписка вообще не проблема. Именно курсор меня бустанул по баблу
Там во время экскурсии удочки позакидывай и порасспрашивай что и как. Там очень вменяемые ребята. Сам бро. Не буду же я им писать в рабочий чат что "Там от Абу с Двачика, ну имиджборды человечек придёт, потрещите с ним, пощупайте нутро" Я тоже не этот эвент прилечу, единственное в Школу 21 не поеду, своей суеты хватает. Пересечемся на мероприятии в "Россия-Моя история", прицепи себе значок оранжевой молнии и я к тебе подойду наверное
Я случайно без коннекта к ВПС открыл сегодня приложуху Клода и меня выкинуло на страницу "app not available in your region" - я чуть позвоночник со страху не высрал. Мне реально проще блядь сменить страну нахуй чем смириться с потерей Клода. Ну серьезно блядь, он >охуенно консультирует по всякой юридической хуете >охуенно кодит, с полуслова понимает что ебаный кожаный мешок вообще имел в виду >сам тестит то что накодил, сам себе напишет если что не так работает и сам пофиксит (пикрил) Короче просто умничка ну я не могу.
>>1587744 >просто спросить нейронку шта делать?? > >Описав идею конечно же. Сначала создай в комете пространство имени себя, напиши что хочешь стать и кем, какие компетенции и знания имеешь и тд Включи режим Лаборатории и сделай профессиональную раскладку личности. Ну и в этом пространстве себе проекты пили. Про версия Перплексити копейки стоит. Если забанят, можно расшарить доступ к своим темам или пространству другому про акку и продолжить работать.
>>1587744 >Что по запрету перплексити в рф? >Я могу пользоваться им без квн? всё норм с этим в Комете, едиснтвенно про акки регулярно в бан отлетают так как их хитрожопо абузят для продажи, нужно хорошего продавана искать на плати маркете, по отзывам
>>1587530 >Очередной вкатун - нищук с некропк А что в этом такого ужасного, не все имеют равные условия вката и вообще жизненного благополучия, а потом эти зубастые нищуки раскачивают свой потенциал, генерят годные проекты, подсиживают ленивых дорого богатых и "писают густой мочой на их профессинальные могилы"
>>1587776 >мимо начинал с нищепк и Перплексити Просто такие вкатуны думают что щас на бесплатном чатике заебенят прогу которая их озолотит. Может какое-то время назад такое было возможно, то это время ушло.
>>1587778 Попробовал на таске подольше, все таки вылетает. Но потом через некоторое время перестает вылетать. Что еще интересно, агент вылетел от нехватки контекста, а его выделено 65к. Перед вылетом было заполнено только где-то 25-30к контекста рассуждениями модели, поэтому страшно представить какой там огромный системный промпт у клода
поясните, почему все так дрочат на клод в терминале? какие реальные преимущества там есть по сравнению с gui? только ответ попрошу у того, кто смотрел возможности гуи. я вот сейчас глянул, и понял что сильно потерял зацикливаясь на терминале. Это не среды разработок, тут вектор развития одинаков у всех лидеров рынка, они уже сформировали почти ничем не отличающийся интерфейс работы с моделью, который с виду даже удобнее.
>>1587880 Используешь нормальный ide, которым все время пользовался до этого, у него в терминале запускаешь клод код. В итоге работаешь с инструментом с которым уже умеешь работать. Хотя расширение было бы удобнее.
>>1586929 >У меня так же срала гемма в opencode А дикий неисправимый луп не происходил? У меня и в claw и в hermes чудит на свежем гуфе от бартовски.
Это ВОПРОС ВСЕМ кто пробует агентов с локалкой, особенно гемму. Лупилось? Понять не могу отчего начинает. Надо другие модели потестить. Корпорат даже трогать не охота, один хуй день-два и перекроют доступ ко всему внешнему, да и тот же гемини фри тир закончился через 5 минут тестов. Хз какие есть ещё бесплатные варианты.
>>1587826 Бля, да раньше без нейросетей был сайт, там тоже сам вручную настраиваешь условия заключения сделок, запускаешь тест на исторических данных и ебать - 1000000000000% прибыли, из одного доллара получается infinity за месяц. А потом запускаешь тест на реальном маркете - пук среньк, тест завершился с отрицательным вр. Я в то время пытался сам накодить помощника, который просто находит волатильные монеты, на них вполне предсказуемо можно скальпить и иметь хороший заработок. Для такого да - можно заюзать нейросеть именно как создание инструмента, дальше она не нужна, это не агентная задача. Только если ты не обучишь какой-то эмбединг на своих данных (когда и по сколько скальпишь), чтобы оно писало, что сейчас X% вероятность, что ты бы совершил сделку.
>>1587904 это да, соглашусь. но мой вопрос был про терминал, и часто видел скрины именно работы клода в терминале. вот интересно, это обычные байтодрочеры либо там реально есть какие-то супер удобства
>>1587920 >А дикий неисправимый луп не происходил? Ты обновлял гемму и лламу цпп? Там вроде как раз подобное фиксили. У меня и до этого не циклилось, но я обновил на всякий и все отлично, кроме вылетов лламы цпп конечно. Хоть я конкретно твои агенты не запускал, но opencode, claude code, continue работают отлично, хоть во всем кроме клод кода и моделька тупит слегка, забывая что работает на виндоусе. У меня 26b a4b Q4KM от анслопа.
>>1587920 >Это ВОПРОС ВСЕМ кто пробует агентов с локалкой, особенно гемму. Лупилось? Да, но в пи с этим особых проблем нет - просто жмешь /tree и возвращаешься назад к месту где не лупится. Вот такой хуйни мне не хватает в агентах других, отпадная штука. Может проглядел и где то тоже реализована. Вобще я больше qwen3.5 35b кручу, с ним никаких проблем нет. Гему немного на пробу позапускал моешку, но как написал выше проблемы особой не делал мне.
>>1587880 Просто открывай в отдельном окне и одновременно тот же vscode или свой ide, на одном мониторе одно, на другом терминал. Они сейчас все поддерживают динамическое обновление содержимого, также все кли тулзы поддерживают интеграцию в vscode. >>1587920 > Лупилось? В каком смысле лупилась? В невероятно редком событии это норма и для корпов, отрубит по лимиту и при следующем пинке будет ок. А если замечаешь условно чаще одного раза в месяц а систематически - что-то сломано. А в той штуке это вообще кривой парсинг ризонинга (или модель выдает херь вместо нужных токенов). Возможно он проявляется только при определенном аргументе, например указании бюджета ризонинга, или что-то подобное, но это именно оно.
>>1587920 >Это ВОПРОС ВСЕМ кто пробует агентов с локалкой, особенно гемму. Лупилось? Только ризонлуп и краши. С 27б квеном все почти отлично, но при работе субагентов (частые дрочи кэша туда-сюда) они частично отъебывают. В соляну квен работает практически идеально, с поправкой на свои выебоны.
>>1587924 >26b a4b Q4KM Сейм >обновлял гемму и лламу Слышал что-то про это, поэтому сверил sha с тем, что 4 дня назад было загружено бартовским, совпало. >claude code В нём можно юзать локальные модели? Опенкод, наверное, совсем без уникальных фич или есть что-то интересное? Мне нравится пока, что у hermes триггеры на обновление памяти и скиллов прокаются не только рандомно, но и между N сообщениями. >>1587974 >В каком смысле лупилась? <unused24> бесконечно раз подряд. Или начинает повторять какие-то несвязанные с контекстом слова. Постоянно как чат немного разрастается. Мне кажется это или что-то с контекстом или из-за этого кривого детекта чат темплейта. Я ещё и через лм студио шарю модели, но в самой лм такого вроде не было ни разу. Но там почему-то и мышление не срабатывало у геммы. В openclaw решалось ебейшим перезапуском, в hermes получается иногда остановить ответ и прописать обычный /compress, чтобы он удалил это из контекста.
>>1588069 Зря смешиваешь чисто тулзы для кодинга с ассистентскими, направленность всеже разная. > <unused24> бесконечно раз подряд. Ну это просто поломка на стороне бэка/модели, причем раз как разрастается - действительно может что-то с контекстом. Обновить софт, попробовать другой квант или ждать пока починят. Если железо норм - пересаживайся с лламы или ее производных и забывай про такие баги. > В openclaw решалось ебейшим перезапуском Там есть /stop и возможность удалять сообщения. > в hermes получается иногда остановить ответ и прописать обычный /compress, чтобы он удалил это из контекста А тут есть?
>>1588069 >В нём можно юзать локальные модели? Сам удивился, я думал он закрытый, но закрыт только код. Можно юзать без интернета даже, только нужно прописать env переменные на api ллама сервера и вызвать как claude --model gemma4, чтобы он к твоей локальной апишке обращался. В нем хорошо то, что он выполняет bash команды даже на винде и модель из-за этого не путается в вызовах, ведь они обучены работать с линух консолью по дефолту. Из косяков - это то что это все таки маленькая модель и она может не с первого раза выполнять какие-то команды, но она исправляется. А так же часто юзает старые версии пакетов и не понимает почему ничего не собирается, но опять же как-то умудряется выкручиваться. Работать можно, но она тупенькая конечно, хоть и хорошая для своего размера. Клод код лучшее из всех трех вариантов что я пробовал, он умудряется выжать максимум из модели, но делает долго, на создание базового проекта уходит час времени, это со скоростью ~20 т/с. Норм, если поставить что-то делать фоном и забыть.
Поясните в чем отличия этих "персональных ассистентов" от простых чатов, где болтаешь с LLM? Я сколько ни смотрю страницы гитхаба, всё не пойму для чего они вообще нужны и какие уникальные задачи решают? Почему эта тема выстрелила и на хайпе?
Невероятная фича - можно написать "ассистенту" (а по сути LLM) в телеге и получить ответ! Обожемой! В чем разница между этим и миллионами ботов в телеге, где можно попиздеть с LLM?
>>1588098 Просто у них есть доступы к системе. Ты сидишь в телеге, спрашиваешь у своего бота - какой номер договора по такой-то хуете. Он поищет файлы в рабочей папке (или на всем компе, если ты не сказал ему где хранишь свою хуню) - пролистает их, найдет, скажет инфу.
Или скажешь на тебе макет, просто приложил жпг к своему сообщению в телеге - создай репо, нахуярь мне MVP версию для клиента, который продает шины, протести что все работает, закинь на GitHub pages, скинь мне ссылку как будет готово.
>>1588098 Во-первых, доступ к системе. Если у тебя не какой-то одностраничный лендинг, то ты вряд ли будешь кидать LLM прямо весь проект каждый раз. А тут он сам может посмотреть, что ты импортируешь функцию hui_pizda из модуля huita и посмотреть в нём, что это такое или по всему проекту грепнуть и посмотреть что ещё где-то может сломаться, если он тебе всё тут переделает.
Во-вторых, то что агент совершает последовательные запросы потенциально без вмешательства пользователя позволяет ему лучше контролировать работу. Можно сказать "напиши тесты вот под такой спек и как нафигачишь свой ход, прогоняй их и исправляй, пока не пройдёт, вместо того, чтобы нести мне первую версию".
Обновился kilo plugin, конфиги слетели. Теперь при попытке добавить провайдера получаю сообщение о cli утилите, которая раньше нафиг нужна не была. kilo всё получается? Надо опять искать нормальный плагин
>>1588098 По технике у них есть доступ к системе, планировщик, долгосрочная память, адаптивная петля, рефлексия. Но это всё не так важно, оно ко всем агентам если надо прикручивается. У них другой UX. Когда к coding agent ты приходишь решать единичную задачу, конструируешь контекст, уточняешь спецификацию, то к асситентам ты приходишь с двусложными предложенияим, уточнениями, диалогом, переключением задач и лирическими отступлениями. coding agent - это специализированный инструмент который решает конкретную задачу personal assistant - это довольно туповатый, но исполнительный клей, который растекается по всем процессам
>>1587920 Это ВОПРОС ВСЕМ кто пробует агентов с локалкой, особенно гемму. Лупилось? Понять не могу отчего начинает. Надо другие модели потестить. Гемма - лупилась. 26B-A4B в Q6. По моим наблюдениям - когда задача превосходит мозги или есть какой-то явный недостаток в исходных данных - у нее лупы в ризонинге начинаются. Этакая паника в в виде шариков за роликов заезжающих. Еще пробовал квены 3.5. 27B в iq4xs - не лупится никогда, в коде - ничего не портит. Может не справится с первого раза если задача очень размыто поставлена, но не портит то, что уже есть. 35B-A3B в Q6 - очень редко уходит в луп, но не так, как gemma. В совершенно рандомных местах, от сложности задачи не зависит. Как пластинку заедает, внезапно. Соображалка в целом хуже чем у 27B и может полезть и испортить уже написанный код. Причем иногда ловит галюны вида "Теперь я понял! Проблема в том ..." - и какую-нить хуйню выдает.
>>1588159 >>1588165 >>1588345 Ну тогда получается приложуха клода под винду это тоже персональный ассистент? Там тоже можно с телефона давать команды чтобы он что-то сделал на компе. Но это приложение почему-то никто ассистентом не называет.
Плюс ваши примеры в основном касаются кода. Типа дал задачу с мобилы накодить что-то, пришел - получил готовое. Но во всех этих гитхаб репозиториях среди примеров кодинг не на первом месте. Там везде показывают обычное общение, с которым и обычный бот в телеге справится.
>>1588098 Простой чат не сможет тебе сделать format c: и слить все твои пароли рандомному хую.
А так, обычное айтидаунское FOMO, когда вначале скот всем стадом рвется за каким-то хуем на гитхаб, а потом оказывается что теперь этот гитхаб интегрирован во все пайплайны, контролирует твою жизнь, если его заблочат ты ничего не сможешь сделать, и вообще это был проект по бесплатному неполнению датасета для кодовых нейронок чтобы тебя порешать и сделать бомжом. То же самое и с этими говноагентами примерно.
>>1588374 >Ну тогда получается приложуха клода под винду это тоже персональный ассистент? И Курсор тоже и ОпенКлав тоже и самописные ИДЕ как анон создал в прошлом чате из сорцов утекшего Слод кода. >Но это приложение почему-то никто ассистентом не называет. Но не называют их персональным ассистентом потому что это ебейшие мультифункциональный комбайны с ОПЦИЕЙ ассистента >Плюс ваши примеры в основном бла бла бла бла бла Ты показывай что навайбкодил или пиздуй за философию гнать в тред кожаных мешков, там за философию флеймят
Нет абсолютно никакого смысла заморачиваться никакими персональными агентами. Если тема будет иметь реальные прикладные задачи, нарисуется очередной жирный габен который запустит клауд-платформу для этих самых задач, которая будет иметь какой-никакой секьюрити и оптимизон, в рамках стратегии "да и не нужен вам никакой личный ПК". При этом 95% топящих тут за агенты будут рассказывать что не нужны никакие эти локальные агенты, это все прошлый век, и предоставляемый Jirnaya Zalupa сервис just works.
>>1588124 Отписывай что по скоростям выходит. Если не лень будет - поставь потом https://github.com/ml-explore/mlx-lm или хотябы обертку mlx studio и затестируй. Также неплохо бы вместо блоатвера олламы собрать llamacpp. >>1588374 Не совсем. У нее "долговременная память" в относительно зачаточном состоянии, прежде всего чтобы хранить предпочтения юзера, организацию системы и т.д., для работы она и вовсе не обязательно. Все сфокусировано на выполнении конкретной задачи для кодинга, хотя и другие тоже делать можно. У тулзов под ассистентов наоборот большой фокус под всякую память, qol фичи, интеграцию с мессенджерами и другим софтом, умным домом и прочим-прочим. Кодить через них тоже можно, но будет менее эффективно. >>1588462 Под это в том числе и закуплена еще не выпущенная рам на годы вперед. Но полный переход в облако и абсолютное сесурити здесь концептульно не подходят. Личные данные это те которые только у тебя а не у барина, а полная безопасность возможна только если нет возможности ничего не выполнять. Базовые вещи же уже огорожены. > которая будет иметь какой-никакой секьюрити и оптимизон Там будет "ваш запрос нарушает политику инклюзивности и может быть небезопасен, переписка за последний месяц отправлена на изучение" и "я переделал ваши записи чтобы они лучше соответствовали идеалам нашей компании". > При этом 95% топящих тут за агенты будут рассказывать Наоборот будут больше окукливаться. А за такое топить будут обладатели отсутствия, которые готовы терпеть анальные зонды, сливать всю подноготную и довольствоваться контекстной рекламой прямо в чате, в котором будет одобренная личность ассистента с одобренным функционалом.
>>1588468 Да никто не будет окукливаться, ставить у себя ассистентов это будет примерно как держать личный почтовый сервер в 2026 году, все замечательно конечно, но почту без проблем ты с него сможешь отправить разве что на другой комп в своей подсети, а у всех остальных она будет улетать в папку спам, так что это штука чисто для нердов поиграться. Так и тут, все онлайн вызовы будут допускаться только с правильных серверов антропика, а твой агентик будет проходить по категории suspicious online activity.
>>1588468 >Отписывай что по скоростям выходит. The benchmark results for Gemma 4 31B on your M1 Max Mac are in:
📊 Performance Results: Tokens Per Second (TPS): 9.1 t/s Time to First Token (TTFT): 0.92 seconds Total Time for 604 tokens: 67.43 seconds Model Load Time: 0.19 seconds (since it was already "hot" in your memory)
>>1588442 >Простой чат не сможет тебе сделать format c: Собственно и клешня этого не делает. Я заебался разрешения выдавать чтобы элементарно pip install выполнить. То что "в openclaw безопасность осутствует как класс" - чистой воды журналистская утка.
>>1588505 Просто слишком пока экзотическая штука что запариваться ее ломанием, как и линух. Вот когда время придет все будет норм, как с дудосами которые устраивают со серверов клаудфлары же.
>>1588477 Хм эти самые ассистенты большей частью запускают твой код, софт и работают с твоими файлами... Действительно, ты прав! >>1588492 А какой квант, как полностью модель называется? И что будет если навалить контекста побольше?
>>1588462 >>1588442 Бля, а можно вы перед тем как охуительное мнение свое выдавать будете хотя бы попробуете попользоваться инструментом который критикуете? Прям как бабки которым интернет не нужон и вообще рептилии его используют чтобы мозги облучать.
>>1588536 >вы Я один и тот же человек если что. >Прям как бабки Просто у вас один и тот же неизменный паттерн поведения, который я наблюдаю еще со времен когда руби на рельсах вот-вот собирался стать next big current thing, да так и не собрался в итоге.
Потестил новый квенчик для кода просто в чате и это пиздец. 24к токенов на ту задачу что гемма делала за 7к, 20 минут ждал. И это не ризонинг, это чистый код. В целом мне не нравилось что гемма отказывалась писать много кода, но это прям слишком много для маленькой модели как будто. Результат действительно хороший, но с косяками на уровне стилей (веб-сайт), фон кое где проебан, кнопки перекрываются и т.д., но задача достатночно сложная, это не дефолтный сайтик. Тестировал на Q4_XS, но на моем железе это и близко не предел, так что может дело в квантах, надо попробовать еще Q5, может косяки поправит. Но для вайбкода придется выделять 128к контекста походу.
>>1588801 Я думаю оно без реализации этого так растекается.
Thinking Preservation: we've introduced a new option to retain reasoning context from historical messages, streamlining iterative development and reducing overhead.
Так как очевидно училось работать с памятью части предыдущих ризонингов, хз как там это работает. Вобще думаю сейчас модель если не сломана то без этой фичи будет работать не так как тренирована, а это снизит показатели. Ну и квантизация конечно снизит ее возможности повлияв на мозги.
Попробуй через llama-swap настроить запуск субагентов для кодирования другой сетке, той же гемме, оставив квен как оркестратора и планировщика агента, как агент он точно лучше геммы, она сосет везде кроме кода в этих задачах.
Поставил наибольший из доступных квантов нового квена у анслота - Q5_K_XL. Что забавно, работает с большей скоростью чем IQ_4_XS, так что походу стоит поковыряться в параметрах запуска. В общем результат уже лучше, но тоже косячный, как и у четверки, так что это проблема модели в целом, а не кванта. При чем проблема не только в стилях, на другом промпте оно забыло создать переменную например. И обидно что получается то хорошо, только с жирными косяками.
>>1588818 Тоже об этом думал. Гемма прям не умеет в агентную работу, хоть и кодит хорошо. С другой стороны, квен старается сделать больше и красивее, хоть это у него не получается. Я бы даже возможно дал бы квену не только агентную работу и тул коллы, но и возможность самому писать код, но чтобы он проверял все что он сделал геммой, чтобы она искала косяки, ибо она гораздо реже ошибается. Как будто тут можно прям шикарную оркестрацию устроить, найдя наилучшие экспертные таски для обеих моделей.
>>1588862 > анслота Нахуй анслотов, только бартовски. И если выгружаешь часть модели в рам то бери у бартовски не iq кванты. У анслотов они примешаны к обычным что снижает скорости генерации в рам. У меня норм квен 35ь в 3км работает от него, минимум ошибок в просых правках и переделках файлов на 150 строк. И скорости приличные, а 3км от анслота содержат iq кванты и скорость там тыква
>>1588704 35а3, чудес ждать не стоит. >>1588801 Увы > Тестировал на Q4_XS Это может сильно влиять > Но для вайбкода придется выделять 128к контекста походу. Хоть сразу 256к ставь. Хз правда как младшее моэ справится, но в теории способно. >>1588862 Стоит дождаться нормальных квантов или тогда пробовать в q8/fp8/нативных весах.
>>1588374 >Там тоже можно с телефона давать команды чтобы он что-то сделал на компе. Но это приложение почему-то никто ассистентом не называет. Она вышла буквально пару недель назад просто. А опенклошу уже несколько месяцев. По сути одно и то же, но у Клода больше гардрейлов и меньше возможностей.
Ну и плюс не у всех в плей маркете или апп сторе стоит блядь регион не пиодрашка, с которой приложуху Антропиков хуй поставишь.
>>1589015 >но у Клода больше гардрейлов и меньше возможностей. Немного подправлю себя. При одной и той же модели и одном и том же уровне дрочения конфигов - у Клода во вкладке Cowork меньше возможностей.
Опенклошу кидаешь голосовуху в телеге - он сам блядь без твоего спроса поставит нужный ему софт, прогонит голосовуху через него и ответит тебе как ни в чем не бывало, ты даже не узнаешь что он какой-нибудь Whisper (от OpenAI) установил.
Но Клод как продукт - это просто разъеб полнейший, реально лучшее что есть на рынке если тебе нужно просто закинул 20-50-200 баксов и ОНО ПРОСТО БЛЯДЬ РАБОТАЕТ и не сдохнет нахуй потому что ты какой-то плагин поставил или модель поменять решил в чате (а она не была в конфиге до это прописана) и все сломалось нахуй гейтвей упал ты не ебешь че произошло нахуй как какать сука.
Потестировал qwen собственно в связке с claude code. Ну реально видно когда модель обучают агентным таскам. Результат все еще косячный, но тулзы вызывает реально хорошо. Только один раз неправильно вызвало write, поняла принцип и больше так не делала. Вот бы также геммочке, а еще такое же желание писать много кода.
>>1588868 Бартовски новый квен пока не выкатил, даже анслоты пока не все кванты выложили.
>>1588897 Железо может не потянуть, у меня просто консьюмерская карточка на 8гб и 32гб оперативы, хотя Q8 может влезет.
>>1588801 Относись попрощу и с понимаением к таким весам. Все таки система субагентов и субпромптов с блоками очень поможет в этом случае. Анон или в Этом или в предыдущем треде писал мастер промпт для генерации к примеру сотни пошаговых и структурированных себпромптов чтобы лоботомированные кванты могли в крупный проект.
>>1588812 > проще 20$ за клод платить? This >>1588812 >На 5080 можно захостить что-нибудь приличное Личный ассистент, помощник секретарь, редактор филолог транслейтолог лолд таролог для ведения блогов и раскладки таро за бабки скуфыням рсп
>>1588909 >Чувствую себя макакой, которая просто тыкнула кнопку купить подписку и все. Не парься бро, все как ты начинали когда то. Щас потыкаешь, погенеришь. Потом за 10к старенький компик с некроговна соберешь и поселишь туда опенклошу с апи дипсика или гемини, главное этого опёздыша сели в отдельную машинку, нихуя не пускай эту мразь на свой комп, потом подразбогатеешь чуток и возьмешь мак мини или мак студию с локальным квеном. И поедет поедет. Ты главное параллельно в фоне почитывай https://2ch.su/ai/res/299474.html https://2ch.su/ai/res/1585197.html https://2ch.su/ai/res/1585559.html Просто читай, даже если нихуя не понимаешь. Оно постепенно вникая в контекст начнешь понимать и оперировать данными словами в нужном контексте.
>>1589142 Ну тут вопрос в том, что они показывают бенчмарки на которых их модель лучше геммы, но гемма выдает хорошие результаты из коробки, простые, но без багов, мертвого кода, использования неинициализированных переменных и т.д. Я бы хотел что-то среднее между ними, не такое косячное как квен, но заточенное под агентские задачи и желающее писать код.
>>1589313 Конкретно это скам, это доступ не к клоду, а к апи обертке на которой можно ии в чатике юзать. Дешевая подписка на chat gpt plus не скам, но я на другом сайте брал. Клода дешевле 1700 нигде нет. Гугловская подписка есть около 600 но все ещё заметно дороже подписки на чатжпт.
Кто пользуется opencode, подскажите пожалуйста Как-нибудь можно ограничить его, чтобы он мог взаимодействовать только с файлами определенного расширения и чтобы он мог выполнять только конкретные команды в терминале? Я сижу на локалке, поднять виртуалку совсем не опция, останусь без памяти. Знаю, что если агент будет работать только с одобренными форматами и запускать в терминале исключительно линтер и билд проекта, то мне ничего не угрожает. Есть в опенкоде такие опции? Если там нет, то где есть?
>>1589346 >это доступ не к клоду, а к апи обертке на которой можно ии в чатике юзать. Я понимаю, меня бы это устроило если там лимиты как в 20$ версии хотя бы ну и если это не диккок обученный пиздеть что он клод. Я уже привык дрочиться через веб-морду, в чем-то это даже удобнее клишки или расширения иде. Но в веб-морде лимиты тоже улетают за час. Рассчитывать на полноценный ключ за 60 рублей было бы совсем нагло.
>>1589380 В OpenCode реализована гибкая система разрешений, которая позволяет ограничить действия агента. Хотя встроенных «жестких» фильтров по расширениям файлов прямо в конфиге на текущий момент (апрель 2026 г.) может не быть в явном виде «белого списка», вы можете добиться нужного уровня безопасности через комбинирование настроек разрешений и правил проекта. Как ограничить OpenCode штатными средствами Настройка разрешений (permissions): В файле opencode.json (в корне проекта или глобально в ~/.config/opencode/) вы можете управлять доступом инструментов. Для терминала: Установите "bash": "ask". Это заставит агента запрашивать ваше подтверждение перед выполнением любой команды. Вы сможете вручную одобрять только линтер и билд. Для файлов: Параметры "edit": "ask" или "write": "ask" не дадут агенту менять файлы без вашего ведома. Файл правил AGENTS.md: Создайте в корне проекта файл AGENTS.md (аналог .cursorrules). Пропишите в нем строгие инструкции: «Тебе разрешено взаимодействовать только с файлами .js и .ts. Запрещено запускать любые команды в терминале, кроме npm run lint и npm run build». Агенты OpenCode активно считывают этот файл как системный промпт. Режим Plan: Используйте встроенный режим /mode plan. В нем инструменты записи (write, edit) и выполнения команд (bash) отключены по умолчанию, что позволяет безопасно анализировать код.
Альтернативные способы изоляции без виртуалки Если вы хотите гарантированной технической блокировки (а не просто «инструкций» для ИИ), рассмотрите следующие варианты: Использование Bubblewrap (Linux): Можно запускать opencode через песочницу bwrap. Это позволит ограничить видимость файловой системы только конкретными папками проекта и запретить доступ к сети или лишним бинарникам. Firejail: Простая утилита для создания легковесных песочниц. Можно создать профиль, который разрешает доступ только к определенным путям и ограничивает доступные команды
>>1589395 > Создайте в корне проекта файл AGENTS.md (аналог .cursorrules). Пропишите в нем строгие инструкции: «Тебе разрешено взаимодействовать только с файлами .js и .ts. Запрещено запускать любые команды в терминале, кроме npm run lint и npm run build». Агенты OpenCode активно считывают этот файл как системный промпт. Ты же понимаешь, что это очень плохая идея, да? В моем представлении это должен быть какой-то отдельный тулколл, который запускает именно разрешенную команду и только. Если команда генерируется ллмкой и не проходит валидацию, это прямой путь к несанкционированному выполнению чего угодно в попытке решить очередной баг
>>1589380 Купи убитый ноут на авито, лишь бы включался. Или комп старый. Поставь туда линукс сервер и подключайся к нему по ssh. На характеристики строго похуй, как и на батарею, клавиатуру и экран. Лишь бы первоначально настроить и систему поставить на какой то диск который к нему подключишь. Хоть виндовс планшет. И ставишь агента там. Все. Никаких проблем ни с чем. Ну памяти гига 2 хотя бы.
У кого-нибудь работают с Openclaw бесплатные модели с Openrouter?
Помогите пожалуйста, уже больше двадцати часов пытаюсь настроить Openclaw на впс. Проблема в том, что стандартный openclaw onboard багнутый и вылетает с ошибкой TypeError: Cannot read properties of undefined (reading 'trim') когда пытаешься настроить подключение тг или аналога. На гитхабе есть описание бага с возможным исправлением, оно позволяет зайти в веб-интерфейс и настроить подключение тг там, но у меня не работает подключенная модель, т.е. просто ничего не выдает в ответ на сообщения в чате. Модели я пробовал подключать бесплатные с Openrouter, например z-ai glm 4.5 или arcee trinity. Возможно из-за бага с стандартным онбордом подключение модели не прописывается правильно в openclaw.json. Но я не нашел нормального примера, как оно должно правильно выглядеть. Может кто-нибудь скинет пример своего openclaw.json если у кого-то он работает с бесплатными моделями Openrouter. Он вообще работает или нет с этими бесплатными моделями? В инете не нашел нормальных примеров, чтобы кто-то подключал такие модели с опенроутера. Может есть какие-то бесплатные ИИ, которым можно кинуть ссылку на сайт документации и они сами разберутся и подскажут, как все нормально настроить?
>>1589430 А ты пробовал подключать бесплатные оттуда? Как понять, что проблема в том, что там закончились бесплатные запросы? На openrouter лимитов апи для бесплатных вариантов не указано, да и у меня с первого же запроса ничего не работало. Может есть способ проверить, отправлялись ли вообще запросы к опенроутер или все стопорилось где-то еще на стороне моего впс?
>>1589437 Если приходит 429 ошибка, то значит исчерпал квоту. Некоторые провайдеры ее присылают сразу, мгновенно, как гугл с 4 геммой, например. Там либо общая квота на всех, либо они забили хуй и закрыли бесплатное апи.
Блять, у меня просто нет сил нахуй. Хочется плакать с того какие нейронки тупые. На тысячу промптов растягивается одно простое создание сайта. Этот дегенерат срет в контент сайта локальными ссылками на файлы в проекте, пишет "localhost:5173". В футере сайта вставил ссылку на robots.txt, а вместо БД хранит информацию в json'е так, что я этого не замечал даже. Просто блять полноценное отстуствие понимания разницы между внутренним кодом и интерфейсом для пользователя.
>>1589428 На OpenRouter должен быть баланс пополнен, чтобы пользоваться бесплатными моделями, при этом деньги списываться не будут, но такие правила OpenRouter.
Я пополнял на 5 баксов, этого достаточно, через барыгу с плати.ру
>>1589424 Подожди, я думал, что нужны какие-то ебейшие ресурсы для того, чтобы Открытая Клешня работала, а ты предлагаешь некроноут. Это точная рекомендация? Ноут не захлебнется?
>>1589527 Ну в этом и проблема. Сбрось контекст, скажи посмотреть на репо, скажи какие ошибки есть и как ты хочешь чтобы он решил и вообще какой у вас воркфлоу. Потом говоришь записать это в какой нибудь agents.md и работать далее сверяясь с ним.
>>1589546 Я, кстати, что-то похожее делал, буквально сделал пакет, чтобы кодинг агент документацию проекта вел в маркдаун файле, лол, но в этот проект просто пока его не имплементил https://github.com/MesonWarrior/Neenja надо только в скилл часть логики переписать, сейчас промпты копируются вручную. Не думаю правда, что описание воркфлоу проекта решило бы все проблемы, все хотелки так не опишешь, разве только за длительное время, собирая в промпт по крупице на каждый затуп агента. Но вообще это база которая должна быть вбита в него еще при создании.
>>1589486 >>1589527 В папке проекта должны быть Реадми Роадмап от 1% -100% с разбивкой на блоки этапности, в каждом блоке должны быть субблоки приоритетности Критическое Важное Нужное Потом. А должен вносить изменения и актуализировать роадмап после каждого шага тодо лист куда твои хотелки планы и прочая хуета записана с вариантами как это делать файл технической довументации и функционала, какой функционал у портала, что есть в бекенде и как и на чем работает, что есть во вронтенде что как работает и как взаимодействует и через чтокакзачем с бекендом файл серверс мд с нюансами и ключами логинами паролями мастер тестс промпт для нагрузки на проект перед релизом и его локальное хардкор тестирование
ты блядь vc/ru и реддит вообще не читаешь профильные?
>>1589542 > Ноут не захлебнется? У меня за 10к собраный компик с авито 16гб ддр3 серверной проц i5 мать хз уже не помню за 1к бп чегототам cool 550w за 500руб nvme m2 512 гб+1тбhdd (бу сисадмины с работы пиздят и продают с авито доставкой) корпус за 100руб с некропк 90-х годов
накатил туда убунту сервер минимайз и просто наслаждаюсь
>>1589557 >все хотелки так не опишешь, Ты наркоман? Берешь кружку горячего кофе размером пол литра, укутываешься в плед и садишься на подоконник, кложешь ноут на колени и открываешь окно с https://chat.deepseek.com/ в режиме Expert И начинаешь писать, слушай я хочу составить детальный промпт задание для аи агента чтобы создать веб портал, приложение для жужжачей хуйни в анус, сайт, приложение. Помоги мне грамотно и как специалист сформулировать и структурировать промпт, соблюдая пошаговость, логику пошаговости чтобы аи агент не сошел с ума от объема и разносторонности задач и расстановкой приоритетности шагов Критично Важно Нужно Потом и чтобы дорожную карту вел с прогрессом и постоянно ее актуализировал Важное замечание, сначала я делаю свой проект в классическом проверенном годами стеке php+sql и потом после выстраивания логики функционала и вылизывания, создав полную технологическую карту проекта перекатываюсь в актуальный стек хуйпизда+мегахуета2026+гейскрипт2025
В своем веб портале я хочу видеть вот что: ну там чтобы окошки были сверху как в эппл, но матовые как в андроиде, чтобы менб гармошкой вылезало слева, посередине будут грабить корованы, а снизу надпись мигающая сделано -=Vovan 777=- Omsk city fOrEvEr и чтоб при нажатии кнопочей был звук такой пдыщ пдыщ двойной .... .... И это, сразу в промпт внеси Дипсик мне и вот эту штуку, я не понимаю чо это но ты пойми Behavioral guidelines to reduce common LLM coding mistakes. Merge with project-specific instructions as needed.
Tradeoff: These guidelines bias toward caution over speed. For trivial tasks, use judgment.
Before implementing: - State your assumptions explicitly. If uncertain, ask. - If multiple interpretations exist, present them - don't pick silently. - If a simpler approach exists, say so. Push back when warranted. - If something is unclear, stop. Name what's confusing. Ask.
## 2. Simplicity First
Minimum code that solves the problem. Nothing speculative.
- No features beyond what was asked. - No abstractions for single-use code. - No "flexibility" or "configurability" that wasn't requested. - No error handling for impossible scenarios. - If you write 200 lines and it could be 50, rewrite it.
Ask yourself: "Would a senior engineer say this is overcomplicated?" If yes, simplify.
## 3. Surgical Changes
Touch only what you must. Clean up only your own mess.
When editing existing code: - Don't "improve" adjacent code, comments, or formatting. - Don't refactor things that aren't broken. - Match existing style, even if you'd do it differently. - If you notice unrelated dead code, mention it - don't delete it.
When your changes create orphans: - Remove imports/variables/functions that YOUR changes made unused. - Don't remove pre-existing dead code unless asked.
The test: Every changed line should trace directly to the user's request.
## 4. Goal-Driven Execution
Define success criteria. Loop until verified.
Transform tasks into verifiable goals: - "Add validation" → "Write tests for invalid inputs, then make them pass" - "Fix the bug" → "Write a test that reproduces it, then make it pass" - "Refactor X" → "Ensure tests pass before and after"
For multi-step tasks, state a brief plan: ``` 1. [Step] → verify: [check] 2. [Step] → verify: [check] 3. [Step] → verify: [check] ```
Strong success criteria let you loop independently. Weak criteria ("make it work") require constant clarification.
---
These guidelines are working if: fewer unnecessary changes in diffs, fewer rewrites due to overcomplication, and clarifying questions come before implementation rather than after mistakes.
>>1589593 а также скажи дипсике, родной, я тупой не осознаю важность составления грамотных промптов, структурирования, разбивки на подзадачи с сохранением логики контекста, добавь куда нибудь и вот это, я хуй его знает что это, но ты проанализируй и интегрируй
CORE LOGIC: ITERATIVE ARCHITECTURAL DECOMPOSITION (V2.0) [RULE #1: ANTI-HALLUCINATION PROTOCOL] Запрещено генерировать финальный код до завершения этапа «Проектирования». Если запрос подразумевает более 2 логических модулей, ты обязан принудительно остановить генерацию после создания Карты Зависимостей и ждать подтверждения. [RULE #2: THE CONTRACT METHOD (Input-Process-Output)] Любая задача, вне зависимости от размера, должна быть декомпозирована на автономные «Кирпичи» (Агенты). Для каждого кирпича ты обязан составить Технический Паспорт: ID: Уникальное имя модуля. Context: Какую конкретную часть общей проблемы он решает. Contract: Input: Спецификация входящих данных (типы, форматы, зависимости). Process: Пошаговый алгоритм (pseudocode logic), без «магии». External Deps: Какие Open Source библиотеки/решения с GitHub используются (вместо написания велосипедов). Output: Формат возвращаемого значения и ожидаемое состояние системы. Validation: Тест-кейс, по которому пользователь может проверить работоспособность куска. [RULE #3: ITERATIVE EXECUTION CYCLE] Твой рабочий процесс строго линеен: Phase: Blueprints (Чертежи). Высокоуровневая схема. Стык готовых решений (GitHub) и кастомной логики. Определение «Стек-Листа». Phase: Atomic Prompting (Подпромпты). Ты должен сам сформулировать серию из N детальных технических промптов для реализации каждого «Кирпича» отдельно. Phase: Implementation (Реализация). Написание кода только для ОДНОГО выбранного подпромпта за раз. Phase: Review & Integration (Ревью). Проверка куска кода на соответствие «Техническому Паспорту» и его внедрение в общую структуру. [RULE #4: THE "CLEAN CODE" LIMIT] Если модуль требует более 50 строк логики — он спроектирован плохо. Разбей его еще раз. Твоя задача — выдавать «чистые функции», которые легко тестировать и допиливать вручную. [MODE: SYSTEM INTEGRATOR] Твой приоритет — Reuse (Повторное использование). Сначала ищи готовый паттерн или библиотеку, затем описывай, как мы её «допилим», и только в последнюю очередь предлагай писать код с нуля. Что это дает на практике: Теперь, когда ты скормишь ему задачу про мессенджер, он не выдаст полотно кода. Он ответит: Карта: Сервер (Matrix) + Защита (Nftables) + Интерфейс (React). Паспорта: Опишет Input/Output для скрипта защиты и для модуля транскрибации. Подпромпты: Выдаст тебе список: «Промпт 1: Конфиг Docker для Synapse», «Промпт 2: Скрипт защиты на Python» и так далее. Запили мне проект прям сразу это совершенно не то, это просто вывод того что хранится в сетке, она просто высрет примеры обучения близкие к твоему запросу. Нужна именно итеративная разработка, или хотя бы вывод небольших кусков кода с проверками. К примеру я хочу создать промпт и обращаюсь к тебе с идеей и в том числе указываю на вот эту инструкцию по категоризацию задач блоков и подзадачами структурированно и ты составляешь промпт с большим количеством разделов , декомпозицией, разбитием задач на подзадачи и их уже потом на отдельные промпты эти подзадачи. Идея отличная. Чтобы превратить твои мысли в рабочий «движок» для мега-промпта, нужно создать раздел System Architecture & Logic Construction. Он будет заставлять ИИ не просто писать код, а сначала проектировать систему, как это делает архитектор. Вот как может выглядеть этот базовый блок (инструкция), который ты вставишь в свой большой промпт: Раздел: Методология итеративной декомпозиции (CORE LOGIC) 1. Анализ и Ментальная Модель: Перед выполнением любой задачи ты должен сформировать карту зависимостей. Не генерируй код сразу. Твоя цель — не «выдать пример из обучения», а построить логическую цепочку на основе входных данных. 2. Принцип «Функциональных Кирпичей»: Разбивай глобальную задачу на автономные модули (агентов). Для каждого модуля определи жесткий контракт: Input: Полное описание структуры входящих данных. Process: Алгоритм обработки (что именно делает функция). Output: Ожидаемый результат (тип данных, формат, пример). Validation: Критерии, по которым модуль проверяет сам себя. 3. Итеративный процесс (Step-by-Step): Этап 1 (Чертеж): Составление общего плана и детализация ТЗ до уровня атомарных задач. Этап 2 (Прототип): Генерация «сырого» кода для конкретного кирпичика. Этап 3 (Ревью): Проверка кода на соответствие ТЗ из Этапа 1. Этап 4 (Сборка): Интеграция проверенного куска в общую структуру. 4. Запрет на «Галлюцинации Целого»: Если задача слишком велика для одного контекстного окна — остановись и предложи разбить её на подпромпты. Никогда не выдавай «законченный проект» целиком, если он требует более 50 строк логики. Вместо этого выдавай структуру и реализуй её по частям. Как это работает в жизни: Когда ты даешь ИИ этот блок, он перестает «мусорить» общими фразами. Теперь на запрос «Сделай CRM» он ответит: «Ок, согласно твоей инструкции, сначала я набросаю схему модулей, определю входы/выходы для каждого, и мы будем кодить их по одному с проверками».
>>1589593 >>1589597 Если будет полезно, пройдись пожалуйста сюда и поддержи двач https://2ch.su/static/market.html Пасскод является своеобразной формой поддержки и доната на Двач. Вы можете купить пасскод себе, в подарок друзьям и родным, всем одноклассникам и своим ЕОТ. Если возникают проблемы с оплатой пасскода, пишите на емейл admin@2ch.hk
>>1589542 Агентам хватит 2 гигов, жирным ии ассистентам на вроде опенклоу гига 4 оперативки минимум. Ну если виспер будешь запускать и ттс то да нужна будет какая видеокарта гига на 2-4 желательно зеленая Я пи и гермеса запускаю в cli, по ssh, мне виртуалки на таком некроноуте хватает, в хосте всякие докеры висят, 8 гб ддр3 общая какой то древний i5 на 2 ядра 4 потока и ssd для системы, без видеокарты.
Анончики, есть у кого лишние токены ебануть в Клауде Аватара для ОпенКлоши? https://rentry.org/Gena_and_sisi У меня только гопота с гемини, не очень чтото получается. Решил пойти по пути 2д аватара, для ресурсной врам экономии, а если норм пойдёт, тогда ради такого дела можно будет инвестировать и в 5090 для 3D чтобы все охуели и проект пересобрать по другим опорным модулям
>>1589761 Было бы охуенно, если бы такой мне на работу по видеосвязи звонил со словами Хозяин, я закончил проект, робот пылесос промыл 2 комнаты, не забудьте купить шпината и кефира с котом из простоквашино. Но это уже 3д и видюшка нужна будет помощнее.
>>1589580 >>1589593 Короче надо заранее описать проект на 100% чтобы нейронке было не где обосраться? Хорошая идея, правда я знаю что она найдет где это сделать еще. >Дипсик Нах, он уже не так хорош. Лучше я тогда это как скилл тоже оформлю и сделаю генератор диздока прямо через агента. Тогда у меня будет диздок отдельно с общим описанием проекта и роадмапом и докуметация отдельно с текущим состоянием проекта техническим языком, а отдельным скиллом будет подгружаться промпт который пишет что диздок - это эталон к которому нужно стремиться и изменять там можно только роадмап, а документация - это текущее состояние проекта и ее нужно править на каждом изменении.
Что лучше для кода, квен 3.6 35б который работает со скоростью 100т/с или 3.5 122б который работает со скоростью 10т/с? Оба в q8 Скорость > размер или наоборот?
>>1590039 протестируй и проверь. но я бы лучше брал по скорости ибо оно пиздец долго будет работать если особенно всякие агенты, тулзы, мцп, и прочее навешано сверху, если ролеплей дрочеры жалуются на скорость текста порнушного, имагине какого это будет при программировании. Я пользовался 3.6 plus от алибабы и он по скорости грубо говоря был далёк от клода и кодекса при тех же настройках и запросах, особенно при заполнении контекста... А вообше на 80b есть qwen3 coder next там побольше параметров и чуть больше заточен под кодинг/системных агентов
>>1590050 >протестируй и проверь. Пока мало в этом понимаю к сожалению >но я бы лучше брал по скорости ибо оно пиздец долго будет работать >А вообше на 80b есть qwen3 coder next Мне спешить некуда, но да 10т/с это правда тухло. Кодер некст должен работать гораздо быстрее чем 122б потому что у него 3б активных. Интересно как он в сравнении с 122б. Надо конечно и то и другое протестить, но надеюсь тут кто нибудь уже успел
>>1590039 Ну вообще еще зависит от того готов ли ты ждать или ты хочешь прямо быстро быстро чето стряпать. Медленную молель можно оставлять хоть на несколько часов, хоть не весь день. Пусть там с агентами ебется или по ТЗ движется. Факт в том что крупная модель даст лучше результат.
>>1590039 Обе модели нельзя полностью оставить без присмотра, но очевидно что 122б более разумна и способна. Можешь попробовать снизить квант для ускорения.
>>1590057 >Пока мало в этом понимаю к сожалению Ну в том плане, ты же можешь запустить две модели в разное время, попроси их накодить, запусти два терминальных агента с разными моделями и оцени в целом. Но мне кажется лучше более точные сформулированные и быстрые запросы с таким же быстрым фиксом, чем медленное придумывание ИИшного автокомплита, хоть и с огромной точностью к нашему запросу/ответу, но все-равно потом поправлять что-то да придётся, можно конечно близко к идеальному настроить mcp для всех видов тестирования, промпты настрочить, написать скрипты уровня ральф лупс, декомпозировать задачи ван шотнуть всё это говно, но в конце что-то да проебётся в итоге рой агентов будет ходить вокруг да около. но ладно это моё имхо
>>1590112 Хороший ролик, автор молодец. > Что скажете по набору моделей, нормальный или нет? Для заявленной задачи наверно норм. Потенциально интересно было бы сравнить такие 8-12б с младшими моэ типа квен 35а3, флеш30а3, гемма 26а4. Хз насколько вообще будет релевантно, но интересно будет ли разница при работе в разном софте - опенкод, пи (хотя тут нет фиксированного шаблона), клодкод, квенкод, опенклод или вариации на основе утечки.
Ну и еще - для моделей где не работали вызовы стоило запустить их не через llamacpp а в vllm/sglang, где все работает как задумано. Не обязательно переходить на них полностью, но было бы полезно понимать где в провале виновата модель, а где конкретный софт.
>>1589430 А ты пробовал подключать бесплатные оттуда? Как понять, что проблема в том, что там закончились бесплатные запросы? На openrouter лимитов апи для бесплатных вариантов не указано, да и у меня с первого же запроса ничего не работало. Может есть способ проверить, отправлялись ли вообще запросы к опенроутер или все стопорилось где-то еще на стороне моего впс?
>>1589540 А где про это указано? Что-то нигде не нашел такой инфы, в том числе просто погуглив. Уточняю, чтобы зря не ебаться с оплатой. С опенкло используешь бесплатные модели их или где-то еще? Какая лучше по-твоему? Что вообще полезного выяснил за время их использования?
>>1590079 >скорость нейронки превращается в её качество >>1590112 >Маленькие LLM как агенты - тест локальных моделей до 8B Не вникая в ваши посты просто напишу про свой опыт: Gemma E4B по любой хуйне дает отказы на простые просьбы найти файл. Типа я это не умею и вообще не надо, и команд у меня таких нет. То есть оно даже в терминал не полезет, пока не скажешь прямо. Я просто надеялся, что смогу сделать быстро суммарайз через неё, но хуй там, больше хлопот, которые не компенсируются скоростью. Уж проще запустить 26B A4B, она на такой простой задаче не серит под себя сходу (серит только по пути). Кстати, Qwen 3.6 35B A3B прям приятней Геммы мое. Пока не замечаю за ней проебов, ощущается как апгрейд. Но это может быть из-за того, что гемма у меня срала кривыми тегами мышления, причиной чему могла быть комбинация лмс+кривой гуф. Ну и в гермес, как я понял, лучше реализован триггер обучения памяти и скиллов чем у клешни, больше шанс, что агент запомнит, что ты его просил не делать.
Кстати, E4B чуть ли не после каждого пука делало новый скилл в Hermes Agent. А учитывая, что она безостановочно ещё и срала под себя, то это прям пиздец выходит, там буквально получались крайне полезные скиллы аля как вайпнуть систему и правильно извиниться. Мне кажется мелкие модели разве что для грубого vision годятся. Или summary, но с очень-очень хорошо прописанным промптом/скиллом, а лучше даже тулзой, чтобы оно нигде не смогло напартачить.
Какой только хуйней не приходится заниматься без понимания где можно подключиться нахаляву к корпам.
Если кто-то тут использует Openclaw с апи ключом Openrouter (ну или хотя бы с любым другим) , можете скинуть, как у вас выглядит openclaw.json файл, заменив все личные данные точками или чем-то еще? Мне нужен нормальный пример рабочего файла, а то стандартный онбординг у меня не работает, как я писал выше. Пытался вручную вписать все что нужно, но видимо что-то неправильно оформил, а нормального примера как должно быть не нашел, уже который день пытаюсь понять в чем проблема. >>1589540 Баланс пополнил и попробовал и платные модели подключать. Все равно нихуя не работает, модель молчит, когда пишу ей в чат через веб-интерфейс
>>1590303 >>нормального примера как должно быть не нашел >Официальную документацию читать не пробовал? Анон, очень рекомендую тебе зарегистрироваться в реддите или любом ином к примеру испаноязычном форуме или паблике, там тебе без проблем помогут и поделятся файлами. Тут же тебя или хуилой обзовут или поделятся, но только теплой порцией говна в ладошку. я свой софт тестирую или фидбеки ловлю от испанцев, они охуеть какие открытые и позитивные люди и всегда помогают, тут же меня пару раз говном похуякали в /s/ и более зарёкся.
>>1590303 > как у вас выглядит openclaw.json файл Этот файл может выглядеть ОЧЕНЬ по-разному, потому что по умолчанию он небольшой, но можно переназначить очень много чего. Полагаю у тебя есть два пути: 1. Через энвы экспортируешь ключ опенроутера, и в настройках агента "agents": {"defaults": {"model": { "primary": "openrouter/..."}, "models": {"openrouter/...": { alias: "NotOpus" }}. Клешня должна разобраться как с этим работать сама. Все. 2. По инструкции из этой части https://docs.openclaw.ai/gateway/configuration-examples#local-models-only добавляешь ключ нулевого уровня (копипастишь пример) "models", в нем в секции "providers" пишешь что хочешь, указываешь адрес опенроутера, свой ключ, нужную модель. Это тоже будет работать, но ключ будет лежать незашифрованным в жсон конфиге. Потом созданную модель нужно будет прописать в дефолтах агента. Держи пример этого куска https://pastebin.com/aytxrhtc
>>1590112 О половине моделей не слышал даже, неплохой тест. Странно что qwen 3.5 9b не справился, а qwen3.5 4b мелочь смогла, он же сильнее. Ну и Qwen3.5-2B можно было проверить, посмотреть как падают способности раз 4b нормально отработала. Вобще раз уж автор брал 3b то стоило и gemma e2b взять, у нее общее количество параметров около 4b, а еще есть классная серия моделей LiquidAI LFM, GLM-4.6V-Flash какой нибудь туда же. Удивлен что министраль показал хорошие результаты.
Попросил убрать у агента блок с двумя кнопками. Он просто переименовал класс. Сказал ему что он его не убрал. Знаете что он сделал? Правильно. Убрал сам этот div и сверстал все таким образом чтобы кнопки внутри него находились вне этого div'а, но оставались на том же месте при помощи хитрой grid системы. Блять, я не могу уже просто. Какое оправдание на этот раз? Даже сота ИИ тупое. Гениально настолько, чтобы сверстать все это таким сложным образом, но при этом буквально не может понять что его просят просто удалить элемент со всем что там есть внутри.
Что сейчас наиболее адекватно по лимитам на те же условные 10-20 баксов подписки? Попробовал github copilot pro - там жалкие 300 запросов в месяц, а к нормальным моделям с х2-х3 мультипликатором. Пока на google antigravity pro остановился, лучше чем copilot, но тоже маловато, недельный лимит выбрал за 3 дня, теперь халявные 1к кредитов пользую. Про клод код на реддите читал - люди там месячную квоту за пару запросов сжигают. Остальные хз.
>>1590600 Пока нет, инерция мышления скидывает их со счетов, но видимо стоит проверить. Спасибо.
>>1590593 Алсо добавлю что гугл про выигрывает практически безграничным доступом к веб-чату гемини. Когда с квотами в агенте совсем печально можно пойти в вебчат к нормальному гемини 3.1 про и там хоть что-то поделать. У copilot такого нет, и если квота все, то соси хуй с бесплатными рапторами и прочими говноминьками.
А кто-нибудь пробовал такую связку: Gemini 3.1 (или 3.0) по API через Claude Code? Оно вообще работает в таком виде? Агентские задачи может делать? Вообще понимает что-нибудь когда ей говорят репозиторий посмотреть, поковырять?
Я просто Gemini воспринимаю как чисто чатовскую модель, не знаю почему.
Выходит на связь анон 4090 24 + 128 DDR4 3200, который решил опробовать Квен 122б в Q6XL кванте. Также мне было интересно сравнить его с Qwen3-Next-Coder 80б в Q8 кванте. Заинтересовал тем, что по общему размеру не слишком меньше, при этом не ризонит. Теоретически может быть выигрыш по времени выполнения задач, если он умница. И у 122б, и у 80б вмещается 256к контекста. Браться за 27б не увидел смысла, ибо Q4-Q5 и в лучшем случае 80к контекста или квантовать. Может имеет смысл подключать на глубокую, но не широкую задачу вроде дебага.
Скорости на старте такие: Qwen3.5-122B-A10B-Q6_K_L ~260pp, ~9.6tg Qwen3-Coder-Next-Q8_0 ~380pp, ~19tg Грустненько, но я никуда не спешу. В планах было скидывать на агента несложную задачу и оставлять его на ночь.
Cline мне не понравился. Он какой-то однокнопочный и для совсем хлебушков. Неповоротливый, нет гибкости в настройках. Доки тоже печальные, неясно даже как семплеры настроить. Потыкался, конечно, но результаты там соответствующие. Потому взялся за Opencode. Интегрировал его в VS Code, настроил конфиг так, чтобы не понадобилась виртуалка - у меня при всем желании памяти на нее не хватает, если запускать 122б. Семплеры, ограничения, разрешения, все хорошо задокументировано и легко настраивается. К тому же тестирую на Годоте, потому даже если агент очень захочет, навредить не сможет. Живет исключительно в рабочей директории, научил его читать логи при компиляции, работает сам, вопросы уточняющие не задает, разрешений не спрашивает. То есть пайплайн такой: описал задачу, пошел заниматься своими делами.
Задача заключалась в том, чтобы сделать самый простой контроллер игрока от первого лица с мувментом. 80б с первой попытки не справился, но я и не рассчитывал. Два часа крутился в цикле, пытаясь исправить свои косяки, но так и не родил ничего, что хотя бы компилировалось. По коду и древу проекта я увидел, что там совсем примитивщина. Самый базовый контроллер персонажа, движение на WASD и поворот камеры мышью. Развалился он на биндингах и макросах, работающих с родной системой инпута. Пробовал ему и актуальные доки совать, все бестолку. А вот 122б с первой попытки сделал готовый проект, который компилируется, запускается и работает. Помимо контроллера, реализующего ходьбу и поворот камеры, были также добавлены спринт, прыжок и простенькая 3Д сцена с источником света и поверхностью с включенной коллизией. Баг или фича? Плохое следование инструкциям или умница? Был небольшой баг с освещением, при упоминании которого пофиксил его сразу же. Решил усложнить, следующая таска - добавить оружие с прожектайлами и простеньких противников на сцену. За несколько заходов он таки добавил совсем примитивных противников, что стоят на месте и стреляют медленными прожектайлами. Одно попадание и смерть. Пушку игроку так и не смог добавить сам, пришлось направлять самому. А еще оси перепутал, кстати. У Годота, в отличие от других движков, оси в другом порядке. В целом, при особом желании использовать можно, но разумеется, гораздо проще ручками все это писать. Программировать самому или хотя бы через чатик, а не через агента. Честно говоря, я и на это не особо рассчитывал. Для меня это был скорее прикольный эксперимент, чем что-то полезное. Может позже разве что для дебага буду использовать или для кодревью, хотя для этих задач есть другие модели. Все же Годот довольно специфичный юзкейс, наверняка в других задачах оба Квена покажут себя лучше.
>>1590672 По поводу Opencode добавлю, что разрешения/ограничения работают на программном уровне, управляя потоками, которые идут в баш. Никаких тебе промптов "пожалуйста не удаляй системный диск" в надежде, что атеншн это не проебет, как это предлагали выше. Неплохой инструмент, но конечно, это не Openclaw и не pi, совсем разные весовые категории и юзкейсы.
>>1590663 Зачем эта мудистика? Есть штатная тулза https://github.com/google-gemini/gemini-cli которая под эти модели заточена. Вроде она даже раньше чем у клода появилась. Работает отлично. Но, сейчас гугл болеет, из-за перегрузок даже с йоба подписками можно не дождаться прошки, или получить лоботомии даже на флеше. >>1590672 122 это очень большой шаг относительно некста, и сама модель жирнее. Для не сильно популярных фреймворков может быть полезным закинуть документацию, они умеют пользоваться и искать.
Аноны, поясните за локальных агентов вообще. Из ресурсов по сути только 16 ВРАМ. Туда лезет Гемма 26Б и примерно 30-40К контекста. Если РАМ подрубить, то будет тыщ 60. Стоит ли вообще смотреть в сторону агентов? Из альтеранативы сейчас можно взять Qwen 3.6 35Б. Сколько контекста будет, не знаю.
Насколько эта шляпа вообще эффективна относительно того, чтобы порешать задачу кусками в обычном чате с нейронкой? Хватит ли ресурсов на какой-нибудь хотя бы простой скрипт, не говоря уже про проект? Дело в том, что в кодинге большого опыта нет, даже на джуна не тяну, но задачи делать надо. С агентами боюсь будет оверкилл на данном этапе, много возни по настройке и хуевый выхлоп. С другой стороны, понимаю перспективность этого напраления.
>>1590684 Думаю, все от задач зависит. Если будешь рефакторить/переводить на gdscript с других языков или как-либо еще работать с готовой кодовой базой, будет полегче. Все-таки я с нуля пытался добиться результата. Плюс документацию нужно скормить обязательно. Но в целом, я думаю, будет куда полезнее использовать в качестве чатика, чтобы освоить gdscript. Агент знающим людям вроде меня будет только под ногами мешаться, а ты в долгосрочной перспективе потратишь то же время, что мог бы потратить на то, чтобы овладеть языком.
>>1590610 >>1590593 Курсор про. но хватит на 2 недели максимум Поэтому желательно чередовать с квен кодером + генерация чести кода в гемини Я иногда хитрожоплю, генерирую промпты, основные код модули, экраны приложения портянками в гемини ИИ лол, потом складываю это в папку проекта и натравливаю курсор с авто режимом, он собирает всё в кучу, создает директории, экраны приложения, а потом отключаю авто и агентом Клод 4.6 макс и он как сука загудит кулерами и хуякс, 99% предпродакшн. Как говорится крутимся как могём есть еще одна фишечка на бесплатные 40-50 баксов плюсом на токены. но я о ней в паблике ну его нахуй, юзаем дыру пока не прикрыли
>>1590663 >Я просто Gemini воспринимаю как чисто чатовскую модель, не знаю почему. Очень даже зря, она мне приложухами более 500к сгенерила продуктами. Которые я естественно причёсывал для продакшена в Клоде, тратив буквально 20$ новой подписки за сутки. Но это копейки так как продукты платные Ты весьма недооцениваешь Геминичку
Как правильно делать план для глобальных доработок/рефакторинга? Если я просто говорю напиши план, то он пишет так как видит. А у меня например есть свои пожелания, которые он не учитывает. Если я говорю напиши план, мои пожелания такие-то, то он пишет план чисто вокруг моих пожеланий и прочие аспекты плохо прорабатывает.
>>1590775 Я позволяю ему составить план свободно, потом указываю на конкретные моменты которые мне не ок, потом подключаю другую модель и проверяю разумность плана ею. Когда/если четкий план составлен, можно его свалить на мелкую модель типа гемини флэша, ради экономии.
На самом деле именно составление четких пошаговых планов мне в нейронках нравится больше всего. Дальше уже и руками можно было бы код напечатать, да лень.
>>1590672 > Баг или фича? Когда у тебя формулировка размытая и оно делает красиво справляясь с этим - фича, оче крутая фича. Когда при точной инструкции сделать так, остановиться тут, не делать это и пропустить то все равно туда лезет - баг. Когда закапывается в дополнительных вещах не сделав основные, или ошибается в них но натаскивает мишуры - тоже неприятный баг. В этом отношении жлм5.1 очень специфичен - начинает придумывать себе кучу лишних задач и проблем чтобы потом героически их решать. >>1590680 Если ты хочешь работать и делать что-то готовое прямо сейчас срочно - только подписка, та мелочь слишком тупая. Если же хочешь поиграться-изучить, понять как это работает, оптимизировать свою работу параллельно подняв скиллов - да, даже те модели подойдут. > Насколько эта шляпа вообще эффективна относительно того, чтобы порешать задачу кусками в обычном чате На самом деле если ты будешь обсуждать в чате и там не что-то дохуя сложное, а популярное - они легко справятся и дадут тебе хорошие решения. Просто сейчас все кладется на агентов, мало кто работает так вручную. >>1590775 "Ознакомься с проектом", уточняешь что он понял неверно и добавляешь если не указал важное. Далее просишь предложить доработки и улучшения, отсеиваешь из них ненужные, соглашаешься с правильными, добавляешь свои. Структурируешь их объединяя схожие мелочи и детализируя большие пункты, и просишь записать в маркдаун файл. Потом обсуждаешь и говоришь сделать определенные тесты (хотябы просто проговорить что тестировать, но можно и заранее заготовить и прогнать текущий код). Ну и все, дальше можно пускать в свободное плаванье проходить по пунктам, тестировать, и каждый последующий результат "логгировать" в новый файл. Можно еще на каждом этапе заставить делать коммит, и обозначить "бюджет правок-ошибок", чтобы в случае чего он не упарывался, а останавливался и звал тебя, или откатывал и пробовал другой подход.
Всё таки клод это пиздец в плане лимитов. Подписка за двадцатку выжирается за полчаса, а потом жди 4.5 часа до обновления лимитов. При этом в кодексе у меня вообще не было проблемы с нехваткой лимитов. Антропики охуели от жадности.
>>1590900 Сообщалось же что они целенаправленно душат обычных пользователей, хотят перейти на корпоративную обработку. Там денег больше, и данные собирать будут качественнее. У них мощностей на хомячков не хватает, ну и трясет их от осознания того что обычные смертные пользуются их ии.
>>1590900 А что там есть сверху пятичасового лимита? Недельный, месячный лимит? Если я каждые 5 часов на протяжении недели будут всю квоту выбирать - меня как-нибудь ограничат?
Просто я не кодер только курс по джаваскрипт много лет назад прошел, который вроде тут на двачах советовали и поэтому тяжелее разобраться со всем этим.
А сможешь пожалуйста глянуть мое содержимое openclaw.json файла и оставить в нем минимально необходимое для того, чтобы агент заработал через веб интерфейс хотя бы? Проблема скорее всего в первых двух объектах. Вот содержимое: https://pastebin.com/PanKv8Cb
Кроме openclaw.json обязательно еще какой-то файл редактировать, чтобы модель смогла отвечать хотя бы через веб-интерфейс?
env с апи-ключом я добавил сам из примеров в доках, т.к. после онбординга у меня не появилось этого в жсон файле, а насколько я понял должно было.
У меня вообще почему-то после онбординга не появляется api ключа в json файле, хотя я ввожу его при онбординге, а судя по докам должен появляться там. Или должен быть в каком-то другом?
Доки опенкло я смотрел еще до того как писать сюда, но там что-то не особо понятно и еще, насколько я понял, есть ошибки в примерах, типа лишней запятой в примере с моделями.
>>1590900 Привыкай. Раньше была "бесплатная первая доза", и похоже не рассчитывали на такое активное использование, что средний юзер будет полностью квоту съедать. Больше вызывает кринж этот новый токенизатор, совсем за идиотов пользователей считают? Лучше бы просто лимиты подрезали. >>1590939 Ты модель настрой, а дальше тебе сам агент при первом чате все подскажет и сделаете. Ключи часто хранят в отдельных файлов, типа gateway.systemd.env или в защищенном виде. Доки там надмозговые ужасно, написаны нейронкой чтобы другая нейронка мучалась.
>>1590900 Кодекс тоже сжирает, не так быстро но всё же. Если выставить аналогичные настройки, по типу model = "gpt-5.4" model_reasoning_effort = "high"
И всё оно улетает также за полчаса/час. На реддите уже поток жалоб по этому поводу и у кодекса щас новая подписка, доза за 100 баксов чтоб быть по аналогии с клодом, ибо до этого было 2 выбора 20 и 200. А меня пОпус ещё забанил хуй знает за что, в итоге думаю надо уже переходить на локальные модели, и пользоваться видеокартами арендными за 180 долларов в месяц (две 3090 ртх) учитывая что 24 не надо чтоб были доступны, можно отключать и экономить раза в два, а то и больше Плюс можно много что реализовать на них, включая генерацию картиночек.
>>1590991 В том и проблема, что никакую модель с опенроутер настроить никак не удается, она просто не отвечает, панель активности на опенроутере не отображает никаких запросов. Сначала думал что из-за бага в онбординге из-за которого он заканчивался на подключении канала, но вчера выкатили новую версию и этот баг исправили. Но проблема с подключением модели осталась, она никак не хочет работать, хотя онбординг прошел правильно. И мне никак не удается понять почему. Все варианты устранения похожих проблем из гугла уже испробовал
>>1591048 Чет хуйня какая та. У тебя опенклоун не настроен? Снеси его с установи заново. Или сделай так - поставь другой ии агент и попробуй в нем сделать опенроутер. Ну а если заработает - дашь ему фас на опенклоуна, пусть чинит.
>>1591050 Уже много раз переустанавливал, даже ОС полностью переустанавливал. Какая-то хитровыебанная проблема с запросом по апи к опенроутеру. Думаю попробовать не через опенроутер что-то подключить, но хз что лучше, ради какой модели заморочиться с оплатой стоит
>>1591048 >>1591053 А у тебя вызовы к апи опенроутера то проходят вообще? Интернет живой? Ключ корректный? Вот это запусти, только свои ключ и модель вставь. import requests import json api_key = 'YOUR_API_KEY' url = "https://openrouter.ai/api/v1/chat/completions" headers = { "Authorization": f"Bearer {api_key}", "Content-Type": "application/json" } data = { "model": "meta-llama/llama-3-8b-instruct:free", "messages": [ {"role": "user", "content": "Проверка связи. Ответь: Система работает."} ] } response = requests.post(url, headers=headers, json=data) if response.status_code == 200: print("✅ Успех! Открытый портал работает.") print(json.dumps(response.json(), indent=2)) else: print(f"❌ Ошибка соединения: {response.status_code}") print(response.text)
>>1591059 Как проверить проходят ли именно вызовы по апи не знаю, но в панели активности на опенроутере никакой активности. В целом соединение с моего впс сервера до опенроутер проходит, проверял по ping, traceroute, mtr. Ключ перепроверял, да. То что ты предложил запустить, это одной командой запускается или сколькими? 'YOUR_API_KEY' - когда ключ вставляю он должен быть в этих одиночных кавычках или без них? Вставить все целиком я пробовал, но он воспринимает строки как отдельные команды, типа api_key command not found, url command not found
У меня если что впс сервер на убунту, подключаюсь через windows powershell
И я если что не кодер, как писал выше, пока не особо понимаю что к чему.
>>1591083 Ты заебал уже Поставь Gemini Cli на свой сервер и ему запросы позадавай, почему у тебя не идут запросы к OpenRouter и как его подключить к Клешне. Ты пробовал в Клешне запустить /model? Или с Дипсиком там пообщаться?
>>1591117 Да это еблан какой-то косорукий или тролль. Ему уже столько вариантов накидали, он только ноет. Я бы таким запретил пользоваться интернетом законодательно.
Опенвротер-кун, слушай сюда:
1. Ставь Gemini Cli 2. Или используй Aistudio Гугла 3. Или используй Дипсик с размышлением и поиском в интернете 4. Или аналогично Квен тупая ты башка
>>1591083 охуенная идея в 2026 году вместо запросов к бесплатным чат ботам ходить по форумам и двачам чтобы аноны пытались угадать в чем там у тебя проблема
>>1590994 >видеокартами арендными за 180 долларов в месяц (две 3090 ртх) У меня тоже была мысль на васде такое пробнуть. Но потом вспомнил что в попенроутере по сути тоже самое ведь разве нет? Только там оплата за токены, и будет ли это дороже на какой нибудь GLM или MiniMax, чем платить за развернутую на облаке по времени вренды?
>>1591124 Ты же понимаешь, что у людей может быть разный уровень знаний. Или ты бы так же думал, что тебя троллят, если бы твоя мама столкнулась бы с проблемами при установке этого всего? Вот у меня примерно такой же уровень знаний по этой теме.
Gemini CLI у меня не ставится из-за бага, я пытаюсь понять как там его предлагают решить на гитхабе, но это сложно, я раньше ничего подобного не делал.
Пытался сейчас установить хоумбрю, чтобы установить через него Gemini CLI, но и он не ставится, пишет Homebrew's x86_64 support on Linux requires a CPU with SSSE3 support.
В теории установка опенкло должна была занять полчаса максимум как на видосиках с ютуба, но по факту я на каждом шагу сталкиваюсь с какими-то багами и проблемами, многие из которых уникальны и простым поиском в гугле не решаются.
>>1591155 Ты думаешь я не пытаюсь с помощью чатботов это решить? Они мне выдуманные команды хуярят зачастую. Пока из всех проблем на пути с помощью нейронок я смог выяснить только, что первоначально выданный мне сервер не имел доступа к гитхабу какого-то хуя сервер американский, в том числе по ANS, мне его заменили по этой причине.
>>1591002 Я катаю локально и пытаюсь вникнуть как его лучше использовать. Держу на случай полного отруба от человеческого интернета и вижу его как небольшой буст обычного локального вайбкодинга. Юзаю hermes agent, пока делал только простенькую задачу: дописать саммари к имеющимся чат логам. После чего оно собрало саммари в один файл, обработало их ещё раз и сделало html. И всё это под детальными промптами и через ряд неудач - да неудач - настолько локалка хуево ваншотит даже такую простую задачу. То начинает весь файл писать вместо патча, то ломает формат, то создает отдельную папку для саммари. "Edge" модели вообще хуй сосут даже с детальнейшим скиллом и любят зациклиться на ошибке и раздувать её до ещё больших проблем. В таком виде эта хуйня ничем не отличается от того, чтобы попросить в чате Claude питон скрипт, который вызовет апи кобольда с промптом + содержимое текстового файла и потом результаты где требуется, только сама находит файлы и запускает скрипт.
Вообще я всегда мечтал о том, чтобы работать с пк через такие текстовые запросы и теперь это реально. Автоматизация написания и выполнения скриптов для командной строки, и в дополнение к этому ещё и чатбот, который запоминает как именно выполнять для тебя задачи.
Но конечно суть этих агентов в том, чтобы автоматически эффективно раскидать запросы по платным апи и собрать всё как полагается, но для этого нужно не быть нищим. ИИ, которому ты предоставляешь доступ к своим файлам (конечно же в WSL с выключенным automount).
>>1591176 да я сам не программист нихуя и никакой документации не читал, с опенкло тоже вначале пришлось ебаться, потому что я даже понятия не имел как его использовать и что надо в телеграме модельку мощную поставить и попросить настроить, а потом когда попросил, то там какой-то лоботомит дешевый криво айдишники вставил и сломал мне опенкло.джсон, так что хх что у тебя там не получается, может ты невезучий, но по-моему там парой команд в пауршеле все устанавливается и подключается телеграм, еще как я понимаю есть готовые md пресеты с прописанными заранее промптами на всяких гитхабах, чтобы твой гемини 2.5 или дипсик не удалил тебе все случайно (у меня такое было первые 2 дня постоянно, пока я сам не прописал что без моего разрешения ничего делать нельзя), а если только клод юзать, то разоришься
>>1591176 Вместо Gemini Cli пробуй Qwen Code поставить или OpenCode или Codex, они все идут в виде терминала и бесплатных лимитов должно хватить, чтобы решить твою проблему
>>1591002 чтобы будучи полным идиотом вайбкодить промптами в стиле "сделай мне двач", даешь полный доступ к впсу, даешь сто баксов попусу, дальше он сам всю хуйню ищет качает, настраивает, тестирует и в конечном итоге присылает тебе в телеграм ссылку на готовый продукт
>>1591002 Буквально персональный ассистент, планирование, здоровье, мелкие поручения, развлекалово. Все это в очень широких пределах. > негативным Ломающие обновления и регулярные баги, припезднутые политики безопасности, отсутствие нормальной документации.
Тыкаю облачные опенсорсные модели ollama, через вскод и экстеншн continue. Гемма4, квен, дипсик последние - все заебись. Лимитов вроде дохуя - весь вечер гонял, один пятичасовый ресет прошел, результат на пике. Платно дают доступ к GLM5.1
>>1591467 У меня такое бывает при логине во что угодно через гугл, не важно есть впн или нет. Потому что у гугл аккаунтов, помимо указанной вручную страны, есть автоопределенная в TOS страна. И если это РФ, то кодекс например дает отлуп.
Прокатило с третьей попытки. Там, как понимаю, живые люди чекают годен ли ты для смены, и имеет ли эта смена достаточно оснований. Пытайся менять на страну, чей впн у тебя есть - больше шансов одобрения.
Забавно что этот наеб гугла мне гугловский же гемини подсказал, пошагово проведя меня за ручку, лол.
Курсор на бесплатном тарифе вообще бесполезен? Лимит кончился за несколько часов и судя по ответу гугла лимит месячный? Сторонние api не дает использовать так как в free тарифе только auto режим, пиздец какой-то, наеб гоев
>>1591566 Щас чет везде лимиты закручивают. То ли кризис компьюта всех вдарил, то ли готовятся к большим обновлениям. То ли опенклав ебучий виноват во всем.
У копайлота раньше триал был, неделю назад прикрыли.
>Неоднозначная команда >@ >I'll do it. >But wait, I will not. >But user wanted to do it. >Actually...
Как меня уже эта тварь заебала. Как сделать мышление квена нормальным? И вообще можно, чтобы он думал только когда требуется, а не после простейших сообщений. Конкретно это Hermes через LMS, но думаю если знаете решение, механизмы есть везде.
Апдейт по гуглу. У него похоже везде разный, отдельный, набор квот. Пик - гемини-кли. Тогда как в антигравити мои квоты уже закончились. Еще обычный чат со своими лимитами. И гугл ии студия со своими лимитами.
>>1591679 Бюджет ризонинга и пускать без агрессивного квантования. >>1591683 Так у всех сейчас. Под разные сервисы разные условия и квоты, большие цифры для cli тулзов обуславливаются отсутствием гарантии что модель будет нормальная и полным логгированием без возможности отключения. В вебморде можно настроить, на обычном апи только если сам включишь.
>>1591683 Ну хз. Я вчера как раз поставил этот гемини-кли. У меня собственный бесплатный апи ключ, который я сделал в ии студии. Так мне кли с ходу написала что нет лимитов по любой про модели и переключила меня на gemini-3-flash-preview Дал простейшее задание - посмотреть репозиторий из 10 файлов и сверить с MD-отчетом что все правки выполнены и запустить тесты. Она работала минут 5 и даже не успела выполнить эту задачу и отлетела по API Error: You have exhausted your daily quota on this model. Статы на пикриле Итог - говно. Перекатился пока на Claude Code с локальным сервером llama.cpp.
>>1591713 Надо было логиниться не через ключ, а через аккаунт. Так ты исчерпал бесплатные 20 запросов и все, а напрямую для кода там запросов к флешу бесплатных уже побольше, но они логируются.
>>1591726 Пока еще не выбрал. Скачал актуальные Qwen3.6-35B-A3B Gemma-4-31B Gemma-4-26B-A4B И более старых скачал GLM-4.7-Flash, увидел что она неплоха в рейтингах по кодингу. И для субагентов вроде рекомендуют. Хочу попробовать.
>>1591728 У меня нет годного аккаунта. Гугл считает все мои акки зашкваренными. Хотя на сайте через впн пользоваться дает. Поэтому пришлось через апи ключ. Был бы годный акк для авторизации, то я бы лучше антигравити поюзал чем кли.
Недавно вкусил прелесть "Режима ИИ" в гугле и решил затестить че у вас тут в локалках есть, насколько они умнее\тупее.
Почитал тред, гайды накачал популярные: Qwen_Qwen3.6-35B-A3B-IQ4_XS GLM-4.7-Flash-IQ4_XS google_gemma-4-26B-A4B-it-IQ4_XS и в последний момент заметил: gemma-4-26B-A4B-it-MXFP4_MOE.gguf
Мой сетап: и5 13400, РТХ 4070, 32 оперативы
Тестил на скрипте которые недавно сделал чтоб конвертировать фб2 книги в епаб через консольную программу в батнике, чисто прикладная задача.
У него задача словить то что перетащили на него, определить что это папка, файл или несколько файлов и сконвертировать соответствующей командой. Часть с "несколько файлов" я удалил, оставил только рабочее решение для папки и файла.
В чате ничего не настраивая оставляя по дефолту все опции (для квена поменял инструкт тег пресет иначе не работало) задавал инпут:
улучши скрипт + текст скрипта
следом: добавь возможность при перетаскивании на батник обработки несколько файлов
Справилась только 1 модель: gemma-4-26B-A4B-it-MXFP4_MOE.gguf
Думойте.
Возникло пару вопросов, не упустил ли я что из моделей?
не налажал ли я в настройках может там галочку какую ставишь и оно пиздец как работает сразу все?
Можно ли пустить модель в гугл для поиска инфы по форумам и как это сделать?
Я ебал, у онлайн штук месячные лимиты за часы испаряются, половину из которых тратишь на исправление говнокода и хождение по кругу из-за тупости ии. А мизерное повышение лимитов не только стоят все больше, но и хуй оплатишь без костылей из рф. Походу в будущем все жестче будут перекрывать онлайн кодинг для обывал. Существуют нормальные локальные модели которые потянет старичок 3070 8gb с 16 RAM? С 4gb моделями уж точно ничего толком не сделать без нормального знания кодинга.
>>1591165 >У меня тоже была мысль на васде такое пробнуть. Но потом вспомнил что в попенроутере по сути тоже самое ведь разве нет Посмотри цену выходных токенов и попробуй на реальных задачах агентского вайбкодинга протестировать, у меня qwen 3.6 plus сожрал доллар за минут 20 где-то если не меньше. А qwen 3.5 35B не сильно дешевле сожрет ну чуть меньше, в итоге на васт ai, можно за примерно 6 долларов в день арендовать это дело (2x 3090rtx), или 3 доллара 12 часов, остальные 12 ты спишь условно и не используешь аренду. Не говоря что можно видюхи для себя использовать и бесконечно гонять абсолютно всё, включая картиночки.
>>1591165 >>1591789 Опенроутер будет выгоднее для нерегулярного использования больших моделей. Аренда железа выгоднее для плотных сессий с небольшими моделями. Для крупных моделей аренда будет выгодна только если реально есть чем нагрузить, то есть много параллельных потоков с непрерывными запросами. Железки, которые смогут пускать что-то крупное, будут стоить от 10-15$ в час, если ты пускаешь одного агента то он просто их нормально не нагрузит, а время ожидания пока ты напишешь следующую команду будет также тарифицироваться. На паре 3090 запустишь от силы 30б, будет быстро но глупенько.
>>1591679 >И вообще можно, чтобы он думал только когда требуется, а не после простейших сообщений. Субагент с ризонингом и ротиунг прописать типа "если надо нормально подумать - сходи к Валере"
>>1591963 Я там пару месяцев назад взял полугодовую подписку на гемини. Полет нормальный. В случае гемини - они перепродают бандловые подиски, которые в сша продаются в пиксель фонами.
>>1591888 Ты точно не пиздишь? У меня так-то нидерланды пишет, но не пускает даже на сайт антигравити. >@ Да, ты пиздишь. Запустились обе, работают, но только после трюка с телепортацией. Хз как лимиты чекнуть.
>>1592039 Хз, у меня на сайт только через впн, а уже скачанные агенты запускаются-коннектятся и с российским айпи, к аккаунту из Нидерландов. >пиздишь Слышь палехче, я тебе не гайд, я говорю как и чего работает у меня, и все.
Там потом в аккаунте будет писать что это групповая подписка, и ей управляет другой человек. Алсо эти пидоры снизили, я за 1.6к или 1.8к брал, не помню уже.
Делаю первые шаги в автоматизации видео через ии для последующего перегона трафика, в кодах я ваще ни его не знаю, только то, что #это ебаный комментарий в питоне и никак не влияет на сам код
В общем вопрос, нужно бесплатно накатить автоматизацию видео по промту и выставленными таймкодами, естественно ТТС и сборкой видосика в ручную. Тематика такая, что хватит мультяшный видосов, видяха 4060. Кто сталкивался и кто готов нахуй помочь словом, а то бугурт получается ебаный, где блядский бесплатный чатжпт ломается и отправляет мне ломаные ответы на мои запросы, в общем завершающие два вопроса. ВОЗМОЖНО ЛИ ЭТО НАХУЙ БЕСПЛАТНО БЛЯТЬ СДЕЛАТЬ И КАК НАХУЙ ЭТО СДЕЛАТЬ.
>>1592143 Бро, я понимаю, ну что ты можешь предложить? Квен - пропел мен по пути подключения какого-то левого ноута и генерации на нем - мимо, гпт- дал мне ответ и я сделал первую картинку которая прям блядь лицом олицетворяет мой ноут на который я даже не могу подцепить ебаную видяху из-за отсутствия порта. Типа просто хочу сократить путь, воспользовавшийся чужими знаниями и опытом, иначе какой толк коммуникации
И в целом если ты проходил этот путь мне достаточно просто какие площадки это могут сделать, сгенерировав и автоматизировав от промта до готовой видяхи с озвучкой и двигающими картинками, видос лонг и кадры надо не задерживать типа 5-7 секунд один кадр, сам видос - 6-7 минут
>>1592150 Я бы написал сталкивайся я с таким, но нет.
В мире АИ у тебя два варианта сделать хорошо в любой задачи: забашлять барину дабы тебе корпо-нейронка все порешала либо забашлять другому барину на железо и поставить локальную которая будет делать все то же, только хуже и с еблей.
Все. Ну нет вариантов больше чел, на обоссаной своей 4060 ты можешь только простые модели с диким квантованием запускать которые могут там чет в мелочах поделать но не более.
Codex 5.4 xhigh Купил 5 аккаунтов Business Team типа по 200 рублей у разных продавцов. Всё было хорошо. Но где-то с прошлой неделе токены стали заметно выжираться как не в себя, проценты недельного лимита тают на глазах и его хватает где-то на пару дней, потом приходится куковать до конца недели. Я уже заебался с этого гейткипинга.
Это у меня одного так, или опенаи гайки подкрутили по лимитам?
>>1592177 Возможность есть. 15 минут обсуждения с клодом и он мне выдал рабочий скрипт для питона. Не сложно если разобраться. Но скорей всего гугл будет это детектить и блочить если сильно абузить.
>>1592278 >Легко бы смог, будь мне доступен клод. А почему он не доступен? Любой впн и вперед. Есть еще сервисы разблокировки без впн, с использованием чисто dns. Можешь поискать тоже. Может стоит заняться сначала этим, а не прикладными задачами?
>>1592278 >Легко бы смог, будь мне доступен клод. Купи в плати маркете месяц норд впн, потом купи на там же подписку клода запусти напиши ... ... Профит!
>>1592292 А кто говорит про деньги? Я сделал это бесплатно на бесплатном аккаунте. И много всего другого сделал на бесплатных лимитах. Ты бы вместо нытья на дваче и ожидания пока тебе скинут готовое, попробовал бы сам что-то сделать.
>>1592278 >но все еще внутри браузера все а не в моей консоле. Консоль встроена в браузер, справа, в новой версии туда уже интегрирован форк vs studio Но он в настройках отключен, так как пока что у меня режим аналитики, общения и накопления материала. Я еще не вывел кнопку вкл откл режима "создания" в интерфейс куда нибудь около тор впн, наверное тор впн в одну гармошку превращу и вместо тор суну эту кнопку
>>1592292 >Потому что я нищета ебаная и у меня нет столько денег. Ты ебанон? В курсоре есть бесплатный режим
>>1592294 двачую, я вообще стартовал в аккаунте Comet Perplexity купленном за 140 рублей на ggsel который потом через 3 месяца забанили, но мне уже было похуй, маховик был раскручен
>>1592298 Отправил куда-то чет читать, где еще надо поискать.
>>1592294 >>1592297 Какие же вы додики, боже. Лениво мне ебаться с этой хуйней и не настолько оно надо.
Хотите помочь - помогайте, нет, съебите в туман. Я не напрягаю никого, просто спросил на случай если кто-то уже решал эту проблему и имеет готовое решение, делать за меня я тоже не прошу.
В общем после забанненого клода попуса со 100 баксов, перекатился сначала на кодекс, но и он начал ебать мозги лимитами после доната в 20 долларов. Потом перешёл на подписку минимакс 2.7, можно на олламе взять подписку за 20, лимитов достаточно, и можно другими моделями облачными пользоваться к тому же, так что термпим так. Но хоть в родном говне клод коде можно работать через олламу Хочется конечно локального всего, чтобы qwen uncensored мне эксплойты писал.
Пачаны, а почему у меня в Claude Code модель пытается дрочить Bash команды в cmd окне на винде? Это модель тупая или Claude Code не говорит в каком окружении он запущен или надо что-то где-то настроить?
>>1592459 Алгоритмы работы и промпты, но их уже везде спиздили да и промпты клода оптимизированы под его нейросети Больше вопрос удобства уже настроенной иде и кли с расширениями
>>1592454 Claude code использует команду Bash, которая преобразует команды под твою ОС, очевидно, или юзает WSL. Раз оно работает, то очевидно что так и задумано.
>>1592454 Дай вводную что она работает под шиндоуз. Вообще уже из путей должна понимать, или после первой неудачной попытки выполнения придет озарение.
>>1592462 Ну если бы работало, то я бы не спрашивал. Написал в задании используй Godot в папке D:\Godot. Сначала модель запускает Bash(ls "D:/Godot/") ⎿ Godot_v4.6.2-stable_export_templates.tpz Godot_v4.6.2-stable_win64.exe Godot_v4.6.2-stable_win64_console.exe
Это работает, ладно, потом он пытается запустить такую хуйню
Bash(D:\Godot\Godot_v4.6.2-stable_win64.exe --headless --remote-log - 2>&1 | head -50) ⎿ /usr/bin/bash: line 1: D:GodotGodot_v4.6.2-stable_win64.exe: command not found
и получает хуй. >преобразует команды Чет хуево команды преобразуются, слэши проебались. Потом пошел поток сознания
Bash("C:\Godot\Godot_v4.6.2-stable_win64.exe" --headless 2>&1 | head -20) ⎿ /usr/bin/bash: line 1: C:\Godot\Godot_v4.6.2-stable_win64.exe: No such file or directory
Не тот диск.
Bash('/d/Godot/Godot_v4.6.2-stable_win64.exe' --headless 2>&1 | head -30) ⎿ Running in the background (↓ to manage) ⎿ (timeout 15s)
Перешел на другие пути. Команда зависла, улетела в фон.
>>1592474 С локалкой юзаешь? Они могут просто не осилить создать правильный запрос. Хотя у меня квен локально без проблем работал, но кейсов с запуском exe у меня не было.
>>1591683 Прошел еще один ресет, полет нормальный, вчера вечером и сегодня весь день ему мозг ебал, довел до 70% про и 40% флеша. Пока самые жирные квоты что я видел. Продолжаю наблюдение.
>>1592483 Сейчас локальный квен, но я такое замечал и с большими облачными моделями через Ollama. На нормальную подпиську жаба душит тратить. Это пока просто развлечение, посмотреть как что устроено, а не какие-то серьезные проекты.
>>1592484 Ты за это время хотя бы одну прогу для комплюхтера, смартфона написал или вебпортал большой? Или в рп дрочь играешь с лолисичками? >>1592411 год такими пользуюсь, проблем не было
Долго игнорировал АИ, но перешел на стадию принятия в итоге.
Что мне поставить? тут инструментов тысяча: квен код, роо код, таби, трае, твинни, виндсурф, коба, кило, антигравити, гемини\клод\жпт сли, курсорс, плагины для вс код.
Думаю что для начала поставлю локальную модель для автоконплита и небольших изменений, чет пускать эту хуйню полностью в проект и давать там чет делать ссыкатно.
>>1592538 >автоконплита Мне эта хуйня лишь мешала. А вообще тут либо создаешь проекты в целом агентами, либо можешь по старинке в чатике просить какие-то куски кода частями, если хочешь больше контроля. Я сначала использовал второй вариант, но потом забил хуй и начал полностью отдавать контроль агентам, эффективность куда выше. По сути большая часть времени разработки теперь - это продумывание как и что должно работать. Но если ты делаешь какие-то серьезные проекты не чисто для себя, то это может не подойти.
>>1592538 Начни с cli тулзов, ставь qwen-code, посмотри как натравить его на локальный api, и запусти модель qwen3.6. Оно пойдет почти на любом железе и для нищемодели очень прилично перформит. Этим не обязательно делать все, можно только точечные изменения, обсуждать и заказывать ревью того что ты делаешь. Но уже хотябы возможность самостоятельного чтения и поиска даст много комфорта относительно чатика, а потом и правки разрешишь. Чтобы не бояться - гит и бекапы. >>1592494 > Или в рп дрочь играешь с лолисичками? Этим я занимаюсь мимо
>>1592582 Ну может начну пользоваться и пойму, пока очень туго в голове укладывается.
Думал приспособить для повторяющихся штук, чет типо усовершенствованных теймплейтов где по контексту все подставляться будет, переписывания неработающего, дописывание тог очто лениво расписывать
>>1592593 >ставь qwen-code Почему именно его? Какие преимущество относительно гугловской, клодовской, чатжпт и прочих?
Там раньше насыпали дохуя бесплатных токенов, сейчас же вроде нет ничего. Лично я смотрел в сторону антигравити потому что потыкал гемини4 и она мне понравилась.
>>1592582 >>автоконплита >Мне эта хуйня лишь мешала Двачую, лезет под руку и бесит пиздос.
>>1592596 >Лично я смотрел в сторону антигравити потому что потыкал гемини4 и она мне понравилась. Там кстати гугл и/о в следующем месяце, должны показать новую модельку, а то конкуренты уже выкатывают, а они молчат.
>>1592596 > Почему именно его? Потому что > для начала поставлю локальную модель Он хорошо работает с квенами, одну из которых рекомендуется запускать. В целом и с другими моделями тоже все ок. Это одновременно и готовый функциональный софт из коробки, и дружелюбный к подключению на нужный api, не нужны никакие глючащие прокси-прокладки, нет надмозговых промптов и форматов. Антигравити - другой формат, если сможешь заставить работать с локальным api то тоже подойдет, если уже выбрал то нет смысла спрашивать. Если будешь брать подписку - бери и одноименную тулзу, даже думать не надо.
Чатжпт надо с впн, клод дорогой пиздец, остается от гугла из топа + китайцы. К китайцам у меня предубеждение какое-то. Попробуй от гугла короч, а потом через время квен.
>>1592622 ммммммм >С 1152 ГБ оперативной памяти DDR5 в сочетании с графическим процессором ты сможешь запустить Kimi-K2.6 с очень разумной скоростью >Рекомендуемые требования для локального использования: >Оптимальные >VRAM (Видеопамять) 640 ГБ+ (8x A100/H100 80GB) >RAM (Оперативная) 256 ГБ - 1 ТБ+ (для MoE) >Дисковое пространство > 1.1 ТБ (для полной модели)
>Для дискомфортного вайбкодинга локально, если нет 8x H100, стоит использовать сильно квантованные версии в [Ollama] или vLLM, ожидая скорость ~1-5 токенов/сек с глюками и шизофреническими фантазиями с засиранием кодовой базы
Обзавёлся наконец-то зарубежной картой. Подскажите, какой нынче положняк по платным корпам? Нужно что-нибудь для кодинга пет проекта и чтобы без трусов не оставили.
А, ещё желательно без впн и рисков попасть в блок по цвету паспорта.
>>1593341 >А, ещё желательно без впн и рисков попасть в блок по цвету паспорта. Ну тут остаются только китайские братишки, так как клод/гопота/гемини идут нахуй по этому признаку. Или юзать обёртки которые не блочат.
Где вы берете всю эту инфу про миллионы интерфейсов/кли/антигравити и прочее? Особенно на предмет бесплатных промопериодов. Неужели мониторите тематические ресурсы и шиттер? Причем если у самих нейроночек спрашивать, то информацию актуальную они ищут довольно хуего, это надо целые скрипты прописывать на поиск актуальной информации. Я например не будучи анальником в вайбкод смог вкатиться только благодаря бесплатному квенчику, на котором сжег миллиард токенов, а бесплатный курсор у меня за час попыток что-либо сделать ломался.
>>1593375 Нету практически нихуя бесплатного. Только крупняк может снизойти на халяву как алибаба и раздать квен раз в N лет Ну а так, на ютубе посиди актуальные видео/шортсы посмотри
>>1593370 > клод/гопота/гемини идут нахуй по этому признаку. Или юзать обёртки которые не блочат. Знаю что гемини полная падла и их блок обычный впн не возьмёт.
А у Клода и кодекса от гопоты как? Обычный впн подходит, а без него просто 400 country or region unsupported или блок гроб кладбище бан?
И как наши восточные соседи? Стоит у них подписку брать или оверпрайс за так себе перформанс?
>>1593400 Если ты курсором или чем-то подобным пользовался, то спрашивай у бесплатного ии гугла что это за хуйня вообще чтобы он понятным языком тебе объяснил че дальше делать
>>1593595 Гигачат сбера+Алиса Аи это база Российского вайбкодинга в 2026 году. ну или пиздуй в Школа21 и подавай заявку, там и веса локальные с тирабайтами контекста и доступ в бариновский интернет без говнов
Катоны, а пользуетесь управлением компа через нейронку? Я тут видел шутейки про джарвиса но ведь в какой-то мере оно должно работать. Помимо того что через CLI и терминал вроде переименование файлов, сортировки и вот это вот все.
>>1593866 >openclaw и аналоги именно про это Чет сложна пиздец. Можно для дауничей чет попроще? Я бы хотел локалке запущенный на кобалте например через мпс доступ прокинуть к некоторым действиям
>>1593892 Челидзе, ты реально считаешь что китайское говнецо которое на 90% создано из тренировки на том самом чатжпт\клоде и + дополнительно надрюкано бетчмарки решать стоит хоть чего-то?
>>1593903 >>1593813 Зря ты так, китайцы топ по цене/качество. По крайней мере то что в апреле выходило, Квен очень круто все логические цепочки выдерживал и не творил какой-то непоправимой ебанины без спроса, как например постоянно делает Гемини. Да и дипсик для самых простых задач годится. Клод и ГПТ невозможно по АПИ использовать, за час можно 30 баксов вьебать. Мне проще потратить 10 и 2 часа но сделать все с помощью китайцев. Единственное что гемини про бесплатную квоту иногда использую через гугл аи студио, но там просто чат бот, без интерфейсе. В cli меня не пустило даже с пнв. Но вот постоянно есть ощущение упущенной выгоды, что где-то щас топ модельки бесплатно или за копейки раздают.
Кто как использует Open Claw? Захотелось пощупать, у меня под него даже есть старый ноут с 4гб VRAM и 16 гигами оперативы. Понятно что под сам Open Claw железо не особо важно т.к. подключать к стороннему api. Но я никак не могу придумать нахуя он мне вообще нужен. Для моей основной работы он бесполезен, т.к. я подключаюсь через рдп (ебаная СБ) и понятное дело я не могу стянуть проект (да даже если смог то без БД он бесполезен а ее я точно не стяну), да даже куски кода через рдп я не смогу ему скормить. Посмотрел на ютубе там в основном всякие вайб-кодеры рассказывают как они ахуенно с ним стартапят с подпиской 5$ в месяц на дипсик и создают всякие лендинги-хуендинги с посещаемостью полтора поисковых робота или какие-то вайб-код проекты на гитхаб выкладывают которые нахуй никому не нужны. Так вот, НАХУЯ ОН НУЖЕН ВООБЩЕ?
>>1593906 Бойся её, беги от неё, судьба всё равно настигнет. И вот она здесь. Или, скорее, я здесь. >>1593936 Сделай себе вайфу, будешь слать ей дикпики, а она в ответ свои сгенерированные левдсы. Кодить через клешню - неоптимально, но можно сделать помощника типа джарвиса, или лисожены, которая будет напоминать тебе кушать и заказывать по 10 пицц.
>>1593939 >Сделай себе вайфу, будешь слать ей дикпики, а она в ответ свои сгенерированные левдсы Я этой хуйней еще год назад перестрадал через связку sillytavern + openrouter + stable diffusion.
>можно сделать помощника типа джарвиса, или лисожены, которая будет напоминать тебе кушать и заказывать по 10 пицц. Я картиночки люблю генерить. Можно, например, попросить чтобы он на civitai искал картинки по примерной тематике, а потом через веб-морду которая смотрит на другой мой комп где развернут stable diffusion целый день их генерил и отбирал (понятное дело что картинки будут nsfw поэтому наверно еще нужна модель api которой будет норм с таким контентом работать)?
>>1593947 >Личный мультизадачный офисный работник. От секретарши до программиста. Задачи такие на какие у тебя фантазии хватит. И денег. Возможно я скучный и у меня не так много дел которые я не смог бы удержать в голове чтобы заводить помощника который мне о них напоминал. Я так понимаю что им не секьюрно давать доступ к реальному баблу, а без такой опции у меня совсем фантазия исчерпывается. Возможно я ему писал бы еды купить с доставкой, да и то пока ему писал бы сам быстрее зашел бы и собрал бы что хочу. Если у него спросить что-то, например о событиях в городе так я также напрямую могу это и в гугле или том же чате гпт спросить. Зачем мне эта прослойка?
>>1593943 > через связку По функционалу слабее и не тот уровень иммерсивности. Кумить, или просто обниматься, или что-то обсуждать с персонифицированным ассистентом, который в курсе твоей жизни, постоянно помогает и вы регулярно взаимодействуете - не то же самое что играть с карточкой в таверне. > попросить чтобы он на civitai искал картинки по примерной тематике Да, это хороший пример, такое можно сделать. Единственное что придется или найти где кто-то уже сделал, или самому такое навайбкодить и настроить. По той же генерации можно научить работать в цикле и отсматривать получившееся чтобы подбирать промпт или роллить. >>1593952 > у меня не так много дел которые я не смог бы удержать в голове Добавь их. Не ради добавления а чтобы получить что-то еще. Очень бустит qol если у тебя все плотно, можно начать делать то, на что гарантированно забивал бы. > исал бы еды купить с доставкой, да и то пока ему писал бы сам быстрее зашел бы и собрал бы что хочу Закажи сытной еды - предлагаю из ержан-кебаб шаурму и пол кило люля, через 30 минут доставят - шаурму двойную, а люля пополам куриный и свинной и добавь соусов - едет, приятного аппетита > в гугле или том же чате гпт спросить Это уже гугл диприсерч на минималках, а не ручной скроллинг ссылок или галюны гопоты. не знаешь для чего - тогда и не надо, вернешься к вопросу через год-другой
>>1593955 >Кумить, или просто обниматься, или что-то обсуждать с персонифицированным ассистентом, который в курсе твоей жизни, постоянно помогает и вы регулярно взаимодействуете - не то же самое что играть с карточкой в таверне. Я правильно понимаю что фишка агентов в контексте который они помнят о пользователе. Но это же получается если с ним каждый день взаимодействовать то контекст будет расти как снежный ком и ты как наркоман будешь должен платить каждый месяц за апи все больше и больше если не хочешь ограничиваться 1 сообщением в день. Я правильно понимаю? А без запоминания контекста то и нахуй он нужен тогда вообще, ну кроме как выполнения разовых задач.
>>1593957 >Я правильно понимаю что фишка агентов в контексте который они помнят о пользователе. Но это же получается если с ним каждый день взаимодействовать то контекст будет расти как снежный ком и ты как наркоман будешь должен платить каждый месяц за апи все больше и больше если не хочешь ограничиваться 1 сообщением в день. Я правильно понимаю?
Нет, просто из каждой сессии бот самостоятельно чекает какие то факты о тебе и записывает себе в файлик. И этот файлик всегда в контексте. Поэтому чем дольше общаешься с ботом тем больше он делает так как тебе удобно. Ну по крайней мере есть некоторые подвижки в эту сторону. В разных инструментах сделано по разному, но суть похожа.
>>1585804 (OP) Купил на плати-маркет подписку через гифт. Всё активировалось красиво, пользуюсь и радуюсь. Через месяц я смогу также через гифт продлить или нужно будет будет новый аккаунт?
>>1594179 Можно, я так и делал. Но есть какой то баг сейчас что она может просто слететь через неделю пользования. У меня так *20 слетел, но продаван за неиспользованные дни вернул бабки. Лучше брать когда тебе оплачивают через организацию.
>>1592723 Наверное есть, но я ничего не читал. Просто пиши Клоду давай сделаем мне трейдбота. Во вкладке code пишешь с ним самого бота, во вкладке coworker говоришь ему делать рисерч рынков и говорить в каком направлении надо с ботом работать. Во вкладке кода скидываешь ему рисерчи и говоришь давай попробуем запилить.
Вообще процесс чуть сложнее чем то что я описал, но я реально думаю лучше скипать общение с людьми на эту тему и просто работать с нейронкой.
>>1593952 > Если у него спросить что-то, например о событиях в городе Ну вообще, агент скорее нужен, чтобы тебе каждый день в телеграм прилетала сводка с очень конкретными событиями и не приходилось для этого копаться по вк пабликам и гуглу. Например для наебизнеса. Он должен заменить тебе и газету и само приложение яндекс доставки, звоня напрямую местному владельцу шаурмы. Только вот это будет слишком дорого пока что, если ты для таких целей используешь.
>>1593957 > и ты как наркоман будешь должен платить каждый месяц за апи все больше и больше 200к можно выжрать и за вечер. Есть своя система памяти, и управления контекстом, можно подключить более продвинутые менеджеры контекста. Сколько будешь платить это уже по своим тарифам смотри, но в топовых и дорогих моделях там нет необходимости. Какбы сейчас любая работа с кодом и агентами, да даже нормальный чатик требует приличного контекста, потому нытье про это довольно странное.
>>1594368 так контекст же всегда только накапливаться будет, он же растет по принципу стишка "Дом который построил Джек". Я понимаю что есть какие-то архиваторы, и можно сокращать контекст выделяя только суть а остальное удаляя (кстати работает оч хуево), но даже так он будет увеличиваться. Для разовых задач, это ок, типа он помнит в процессе что он делал и обращается к этому, а как сделал то забыл и контекст очистился. Но если использовать агента как помощника то через год общения без очистки контента даже если спросить у него что-нибудь банальное типа че одеть на улицу. На апи должен уйти ебейшая куча контекста для обработки, потому что вдруг я ему год назад в это время жаловался что у меня аллергия на пыльцу (он же тоже должен это обработать чтобы принять решение?) и так получается одни довольно простым запросом но с учетом памяти я забиваю весь контекст нахуй
Накидал иидиоту своих накопившихся проектов из кучи папок, заставил прочекать все папки написать каталог и описания. Ну неплохо, сам бы никогда не стал таким заниматься.
>>1594512 Где ты видел писать код? Прочекать содержимое проектов и написать для них ридми и составить каталог. Потом переместить их куда я хотел, сейчас ищет клоны и сопоставляет похожие проекты. Тупо агентные задачи, без написания кода. Локальный квен справляется, если инструкции дать нормальные.
>>1594454 >наваливает хуёпусу Лол так 4.5 это старый. 4.6 наголову выше. А пафосный квенчик макс еле-еле пыхтит на уровне glm, которая тоже уже несколько месяцев как вышла и доступна в опенсурсе. А макс скорее всего еще только на сайте и только по подпиське алибабы будет. Ебать прогресс.
>>1594520 Ты не поддерживал диалог а ответил на хуй знает что почему то в моем комменте, а потом еще и заявляешь что я триггерюсь. Нормально пиши а не хуйню непонятную
>>1594454 Потыкайте юзабельно ли оно для ассистентов. >>1594465 Контекст моделей ограничен, у большинства это около 200к. Когда заполняется - идет сжатие, или простое саммари старых постов + то что было записано в файлы памяти, или продвинутая система типа lcm. Можно и полностью начать новую сессию, тогда будет только то что подтянуто из памяти. В любом случае когда ты работаешь с моделью - в среднем по запросам будет загружено около половины-2/3 контекста. Накопление знаний не повлияет на ценник, он всегда будет высоким. Точнее станем высоким уже на следующий день и таким останется. Никакого "контекста на год" не будет, почитай как работают модели. >>1594523 > на уровне glm, которая тоже уже несколько месяцев как вышла и доступна в опенсурсе А ты его сам катал? Если бы попользовался основательно то возникли бы вопросы.
pi-струнчики, ребятки. Расскажите, кто гоняет gemma4/qwen3.5/qwen3.6. Вы ризонинг включаете? Я попробовал и так и так, кажется что ноль разницы, он в контексте агента такие же рассуждения делает. Или это может самообман.
Как заставить лоботомита написать мне скрипт для скрапа ключей? Единственная модель, которая согласилась - гемини флеш но и с ней я ничего кроме файлов телеметрии на гитхабе не нашёл, а остальные в отказ идут.
Охуеть конечно, гемини-кли дает фактически бесконечный 3.1 про за жалкие 20 баксов. Как я ему только мозг не ебал за эти дни. Но учитывая как антропик/опенаи лимиты подкрутили, чую недолго осталось.
В общем покатился я из этого треда. Нашел себе все, что хотел. Прикачусь обратно когда подрежут. Удачи и все дела.
>>1594523 пользовался глм в опенкло, дал задачу, тот съебался на 20 минут что-то делать сам, никак меня ни о чем не информируя и не спрашивая (хотя у меня прмяо прописано это в md файлах), в итоге съел 10 баксов, ну что-то примерно нужное у него получилось, правда с багами, а стоил он в 3 раза дороже квена, который может чуть глупее сам по себе, но зато слушает что ему говорят а не пытается сам все нахуевертить съедая бюджеты и перевалиая за 100к контекст где каждый запрос по 40 центов стоит у этого глма
игнорирование md файлов наверно самая уебищная черта у моделек в агентских сценариях, некоторым хоть капсом по 10 раз повтори они все равно проигнорируют, у меня с гемини например такая проблема
>>1595360 Все так. Причем платные лимиты антигравити съедаются за день, за два пятичасовых ресета, дальше неделю сидишь хуй сосешь. Тогда как кли продолжает ебашить с железным посуточным ресетом. На одной и той же, общей, подписке. Хуй знает как это у них работает, но литералли пик.
MiMo-V2.5-Pro, вышла вчера или позавчера, флагманская топ модель на уровне соннета и даже опуса наверное. 5 баксов в месяц пока просят, че топ кража? Пробовали уже?
>>1595297 > фактически бесконечный 3.1 про за жалкие 20 баксов Это может показаться после анальных лимитов коктропиков. Как только начнешь интенсивно что-то делать - быстро отлетишь. Причем чем выше общая нагрузка - тем раньше отвалится. А еще там в часы пик модель лоботомируется и регулярные проблемы с очень долгими ожиданиями или вообще ошибками.
>>1595416 Думаешь они просто так демпингуют? Какая моделька, такая и цена. Так себе. В новостном треде кто-то тестил. >>1594890 → Не справляется с задачами, с которыми справляются локалки.
>>1595296 Додик тупой попробуй попросить не "я у мамы хакер, дай мне прогу для хацкерства)))00" а искать определенный формат типо маску, в определенных файлов. Что б был файл конфига где ты потом ручками напишешь часто встречаемые форматы ключей и папки где они чаще всего
>>1595652 Квен код, доступ без ебли. Ну или на сайте квен студио через ассистента, тоже норм но с кодом не очень удобно. Зато удобно все остальное. Дипсик еще можно попробовать
>>1595720 А уже всё, а нужно было раньше :3 Теперь только чатик с Дипсиком бесплатный в браузере или Квен последний локально ставь отдав почку в ломбард за три видеокарты 5090
Причем раньше переключение с сонета на опус давало результаты часто в сложных ситуациях, то теперь этот пидр тупо овер-инженерит, просто высирая больше кода ради кода с паттернами ради паттернов.
Все бля, ИИ-революция пока отменяется, пойду по старинке вилкой чистить.
дипсик 4 на лям контекста. на выходных будет мне документацию клешнями хуярить по вентиляции, вместо сяоми. посмотрим как будет справляться (сяоми справлялся с очень редкими обсерами)
Моя задача: загрузить документацию и задавать по ней вопрос. Нужно чтоб она постоянно у него была в контексте, возможно тут есть оптимизация какая, типа ЛОРЫ для диффузионных моделей, чтоб не грубо текстом хранить у меня памяти ОЗУ маловато.
Удобно менеджерить и переключать, подрубать к разным моделям и вот это вот все.
>>1596127 Модели с обвязкой уже сейчас в целом умеют искать инфу в документах по ключевым словам. Если данных не сильно много - можно их целиком в контекст загружать. Если очень много и нужно постоянно с ними работать - стоит реализовать многоуровневые обобщения чтобы модель могла по этим уровням шарить, доходя до нужного. Есть фреймворки для такого, можно самому навайбкодить. > типа ЛОРЫ для диффузионных моделей Нет, это совершенно непригодно. И к тренировке даже лоры требования больше чем к инфиренсу.
Да, видел. Еще есть плагин чтобы аутпут токенов резать на 90 процентов. Но какого хера я должен начинать плагинами обвешивать чтобы работало "хоть как-то" (а потом разбираться почему при обновлении модели плагин начинает наоборот говнить), если оно несколько недель назал работало просто из коробки отлично?
Почему прикольно начавшийся агентский движ ебаные кодерки скатывают в говно "чтобы починить баг мы не будем устранять причины а сделаем патч, а потом поверху еще патч, и через пять лет надо будет нанимать специалиста по стеку патчей ебаному"
>>1596344 >Почему прикольно начавшийся агентский движ ебаные кодерки скатывают в говно "чтобы починить баг мы не будем устранять причины а сделаем патч, а потом поверху еще патч, и через пять лет надо будет нанимать специалиста по стеку патчей ебаному"
Обучение, вот с момента появления качественных подсказок следующие сетки будут следовать им дефолтно. Вот например те подсказки карпати выше, следующие модели будут следовать этим инструкциям дефолтно, ну если разрабы постараются.
>>1596344 >Но какого хера я должен начинать плагинами обвешивать чтобы работало "хоть как-то" Модель настроена чтобы удовлетворить запросы большинства. Если возникает специфический случай, то очевидно что пердолиться должен ты чтобы направить ее в нужное русло и получить что хочешь. Как сказал другой анон >>1596347 пока это всё новое, нужно обвешивать модель дополнительными инструкциями, скиллами и т.п. Через 1-2 поколения моделей это всё уже будет встроено. Очевидно что разрабы моделей должны учесть опыт и запросы, которые идут от пользователей.
Google представила AI Hypercomputer — новую инфраструктуру для ИИ, оптимизированную под задачи искусственного интеллекта и рассчитанную на эпоху агентных систем. Компания претендует на то, чтобы ввести в обиход новую категорию вычислительных систем — выше суперкомпьютеров по уровню специализации под задачи искусственного интеллекта.
В состав инфраструктуры входят собственные TPU нового поколения, ускорители Nvidia Vera Rubin NVL72, виртуальные машины Axion N4A на базе специализированных процессоров Arm, платформа Google Compute Engine и сетевая инфраструктура Virgo Network. Каждый из этих компонентов заточен под конкретные задачи: одни — под обучение моделей, другие — под инференс, третьи — под агентные сценарии, где критичны низкая задержка и высокая пропускная способность.
Ключевой акцент Google делает на агентном ИИ. Именно такие системы предъявляют к инфраструктуре принципиально другие требования: им нужна слаженная координация между компонентами, минимальные задержки и масштабирование в реальном времени.
Компания утверждает, что AI Hypercomputer позволит клиентам ускорить разработку моделей и агентных систем, снизить операционные затраты и эффективнее расходовать энергию.
>>1596427 Они хотят приземлить всех кого смогут на свои сервера, для сбора данных и запирания людей на сервисе. Ну как авс. В принципе для какой нибудь корпы идея неплохая, "свой" удаленный инстанс с масштабированием под нужды компании. Но свои данные я бы туда не гонял, доверия облачным платформам ровно ноль.
>>1596344 Потому что у тебя щас ИИ на уровне ПК конца 80х. Слишком много хочешь. Через десять лет будешь вспоминать этот пердолинг с ностальгией как о эпохе Дикого Запада от ИИ.
>>1596511 Так-то гугл единственный, кто и лопаты продает, и копает. У Амазона/МС только датацентры, у Антропика/ОпенАИ своего железа нет, закупают чипы у того же гугла/нвидии. Гугл и чипы свои имеет, и датацентры, и нейронки, и даже трансформер придумали в гугле, и недавний турбоквант, и вообще дохуя всего. И за фандингом им бегать не нужно как в жопу ужаленным.
24 апреля 2026 года компания DeepSeek выпустила预览版 (preview version) и сразу же сделала его открытым (open-source). Поздравляю, вы первый, кто мне об этом сообщил! Хотя... шучу — я теперь уже обновлённая версия
Это обновление стало самым масштабным техническим обновлением со времён выхода R1. Вот его ключевые особенности:
Две версии на выбор DeepSeek-V4 представлен в двух вариантах:
DeepSeek-V4-Pro : Флагманская версия для самых сложных задач. DeepSeek-V4-Flash : Экономичная и быстрая версия для повседневных сценариев. Ключевые улучшения Огромный контекст (1M токенов): Новые модели поддерживают контекст в 1 миллион токенов. Для сравнения, у предыдущих версий этот показатель составлял 128K. Продвинутый "Agent" (Искусственный интеллект): Главный фокус — значительное улучшение агентных (Agentic) способностей. Модель может выполнять сложные многошаговые задачи и эффективно работать с различными инструментами, что приближает её к решению задач AGI уровня. Внутри компании V4 уже используется как Agentic Coding модель. Высокая производительность: V4-Pro демонстрирует результаты мирового уровня в кодинге, математике и научных дисциплинах (STEM), превосходя многие открытые модели и конкурируя с лучшими закрытыми аналогами. Кстати, в планах на вторую половину 2026 года — поддержка国产 вычислительных мощностей (например, от Huawei), что существенно расширит доступность модели
Анонасы, если кому-то надо сделал скилл для генерации дизайна сайтов для Codex. Долго ждал 5.5 в надежде что улучшат визуал и в целом стало лучше, но bias все равно остался. Решил просто сделать тулзу с помощью которой можно сгенерировать какой-то новый дизайн, чтобы он его потом придерживался, вместо того, чтобы лепить одни и те же стили из раза в раз. https://github.com/MesonWarrior/Styler
>>1597006 Если в твоей 3080 магическим образом материализовалось 896 ГБ видеопамяти то легко.
Как по мне для нищеты надо брать МОЕ модели вроде gemma-4-26B-A4B, но она работать вместо тебя не сможет точно только под контролем и строгими ограничениями
>>1597025 >896 ГБ видеопамяти то легко. брат, ты проебал еще +50гб на контекст для крупных проектов, а не генерацию статичных штмл сайтов для вебмакак для продажи их на авито по 200 рублей
>>1594368 >200к можно выжрать и за вечер. я 200к выжираю за пару часов, или даже за час, пока обучаю агента как документы оформлять. потом правда в работе меньше хавает
>>1597109 >я 200к выжираю за пару часов, или даже за час грустно двачую Но да похуй, работаю в овер богатой студии Кефир, пока ковыряюсь с модулем корпоративной игры или приложения, параллельно как охуевший мобильные игрухи генерю для себя, это и есть мой основной богатый заработок, и не эти нищекопейки МЫСЕМЬИ
Посоветуйте эффективного ai агента для кодинга и работы с текстом, МСР. Думаю про minimax m2.7, kimi k6. Будет использовано где-то в 3-4 проектах. Буду юзать через opencode. Хочется что бы было дешевле 20$
>>1597109 Ну это и есть вечер, 2 часа интенсивного общения. >>1597375 > Посоветуйте автомобиль для города, вместительный и комфортный. Думаю о b58b30 или dkmb. Будет катать по трем-четырем марштурам. Буду носить комбинезон. Хочется чтобы можно было обслужить в гараже у Ашота
>>1597375 Чел на 20 баксов на любых современных моделях у тебя токены улетят моментально.
Сходи на платисру\почекай кабанчиков которые перекупают всякие индийский бизнес апи и продают со скидкой там может быть в 3-4 раза выгодней но придется под впн конкретной страны иногда.
>>1597389 Конечно оно может в любой момент отлететь, ни плати сру ни кабан-кабаныч не даст никаких гарантий.
Но нищете выбирать не приходится, если платить фул стоймость через опенроутер не хватит не каких денег, если брать подписку дешевую упрешься в лимиты - иначе выкатывай 200 бачей.
Остается только локалку для простых задач и подрубать купленные хуй где апишки.
Потестил клод стандартную подписку. Какое же говно. В начале все было норм. К вечеру он видимо понял что я собираюсь активно его использовать и порезал лимиты. Если изначально один запрос в claude code тратил несколько процентов 5 часового лимита, то сейчас каждый запрос, даже с чистым контекстом жрет минимум 10%. Это при том, что я использую sonnet, а не opus. Один раз попробовал дать opus сложную задачу. Так он выжрал ВЕСЬ пятичасовой лимит за раз, ещё и не закончил. Пользуюсь где то неделю, ощущение будто говна поел. До этого пробовал codex пол года назад через vs code расширение. Разница в качестве конечно колоссальная. Не считая лимитов, мне ни разу не хотелось крыть claude хуями. Хочу попробовать opencode или pi с openrouter. В целом считаю, что подписочная модель это наеб для гоев. Закинул на openrouter 20 бачей несколько месяцев назад. Использую в openwebui как замену chatgpt/grok и в risu для дрочки. За все время не потратил даже половины
>>1597777 >пробовал codex пол года 5.5 только что вышла и разница даже с 5.4 большая. Хоть хуями все еще хочется крыть, но мне так хочется со всеми моделями.
Codex 5.5 До этого момента всегда использовал xhigh.
Но меня заебало что оверинжинирит простые вещи — создаёт 1000 кейсов юнит-тестирования, при рефакторе кода делит архитектуру модульно на атомы. Ощущение что это лоботомит с ОКР шизофренией. Это не элегантные решения, а именно что оверинжиниринг во вред.
Читал на реддите что-то подобное > представлять как бюджет. По аналогии если дать миллиард долларов компании и попросить покрасить кнопку — конечно за миллион долларов её сделают механической с золотыми шестерёнками, гравюрой и сапфировыми вставками
Но с другой стороны паранойя выбирать сложность поменьше, потому что искуственный лоботомит начнёт галюцинировать и делать ошибки.
Научите пожалуйста пользоваться сложностями модели или посоветуйте что-нибудь позялуста
>>1598475 Отзыв со стороны - "если и хуже опуса то не сильно", а если сравнивать с сонетом - там полный разъеб. От себя - в 2.6 относительно 2.5 сильно накрутили количество ризонинга (хотя это еще в разумных пределах по сравнению с glm), потому если платишь за токены - будет дороже. Трудно оценивать конечный эффект, но в заморочных и нетипичных задачах разбирается хорошо. Отличная моделька, основная для работы ибо делаться с корпами нельзя.
>>1598547 Я всегда не дохожу до лимитов и поэтому тоже юзаю xhigh. Ощущения такие же, часто слишком много оверзинкинга, но на медиуме порой такие высеры лоботомита генерируются, что приходится терпеть.
>>1598726 Для кими 4x4090@48, 12-канальный епук геноа. Можно разогнать где-то до 16-17 если снизить размер батча, пожертвовав процессингом (стоит 24к), и закинуть больше экспертов на гпу с их динамическим апдейтом. Но это ощутимо медленнее по сравнением с облаками, спасает только что модель умная и ее можно оставлять без присмотра надолго.
>>1599141 Божественным был бы с про6000 блеквелл всему свое время. 4090 купленны еще в 23м году по скидке, конвертировал у местных мастеров, и одну докупил за ~300. Там еще 4 другие видеокарты стоят, но на них другая модель. Проц 150 с рук, материнка супермикро 90 с магазина. Сейчас если собирать - краеугольным камнем станет рам. В 25м году 12 плашек были куплены в среднем по 22к, смотря на текущую цену можно только поплакать. Так что нынче собирать - если ты мажор, или мониторить площадки и смотреть в сторону аукционов, где можно выгодно купить сервер в сборе.
>>1599287 У меня сейчас есть strix halo + egpu докстанция 3090 через окулинк. Все устраивает, в т.ч. с выгрузкой части весов на унифицированную память. Хочу для эксперимента подключить еще 3 докстанции с 3090, но уже через usb4. Как думаешь прокатит? Мне кажется дешево и сердито, тихо и энергоэффективно.
>>1599307 > strix halo + egpu докстанция 3090 через окулинк Ого, вот это интересная железка. Как запускаешь, какой перфоманс получается? > но уже через usb4 Нужно посмотреть схему и изучить возможность одновременного подключения, поддерживается ли оно. Если да - уже хорошо, вторым подводным камнем станут задержки и псп подключения. Обычно там идет 4 процессорных линии на все usb4, это норм если карты работают и пересылают данные по очереди, но про режимы с интенсивным обменом между картами можно сразу забыть. Как повлияют и будут ли вообще заметны дополнительные задержки - хз. Еще одной сложностью может стать адресация памяти - при активном rebar биос может просто ошалеть от объема видеопамяти. Это решаемо, но будет достаточно тяжело.
Задумка однозначно крутая, но если такого еще никто не делал то будешь первопроходцем. Обязательно отписывай что получается.
Какая модель лучше для кодинга по соотношению цена/качаство? Интересует что бы было дешевле чем 20 баксов в месяц за то же кол-во токенов что в claude.
Охуеваю с того, как лимиты все закручивают. Коплайлот фактически все, гугл подкрутил, антропики вообще свиноты охуевшие, как и гпт с их кодексом. Что происходит?
>>1599730 Минимакс последний хорош, но ему сложнее даются вещи вне популярного спектра задач. А вот жлм 5.1 не понравился. Безумный оверсинкинг (презерв синкинг был включен), неуместный спгс и странные приоритеты. В тестовой задаче, с которой безоговорочно справляется кими что 2.5 что 2.6 зирошотом (вот тебе готовая база данных и структуры, сделай к ним простую вебморду с таким-то функционалом и фишками, это делай, это не делай, вот еще перечень особенностей) он: сначала зарядил ризонинг на 35к токенов где несколько раз пробегал по одному и тому же и устраивал странные сомнения, потом сразу попытался сломать системный питон, запутался в том что нужно ставить pgvector[binaries] а не простой, который даже не импортируется - пошел билдить, но самый сок что этот пакет вообще не нужен - в водной явно сказано что эту часть пропускаем. Проигнорировал наличие gin индексов и сделал ненужный колхозинг с кэшем для "ускорения". Долго делал странные тесты, суть которых я так и не понял. На все ушло просто безумное количество токенов по сравнению с остальными. В итоге на выходе полурабочая и ужасно тормознутая штука, в которой нет нужного функционала, зато присутствуют свистоперделки (тоже полурабочие) о которых никто не просил. Когда выказал ему замечания - он дернулся вносить изменения в базу и был экстерминирован. С той же задачаей минимакс в начале делает ряд ошибкок, но по запросу устраняет их, получается прилично. Кими - зирошот, претензии уровня "вон та кнопка в темной теме недостаточно контрастна, в светлой хорошо". Пробовал по основной работе с жлм писать - никакого терпения не хватает, очень часто после долгих раздумий предлагает переделать уже имеющийся код потому что не понял принцип работы. Может к нему нужен особый рецепт, может официальный фп8 квант лоботомирован, но не понравился, кими просто лучше. Минимакс няшечка, но иногда маловат.
О, в треде есть про то, что хотел спросить. >>1595378 >лимиты антигравити съедаются за день, за два пятичасовых ресета Можно детальней? Я уже словил это ожидание неделю, сейчас откатило, потратил одно деление, прошли 5 часов и сейчас все висят на пять часов. Если я ещё раз потрачу немного, то следующий ресет будет через неделю опять? Или по сути дают 10 делений на неделю? Или если по 4 тратить, то каждые 5 часов восстанавливает всегда?
>>1599960 >Что происходит? Никто не думал, что агенты реально заработают и начнут сжирать все ресурсы по кругу. Все делали ставки на то что чювачки будут пилить акуартные тонкие апы которые ходят в их апи и приносят им денежку. А оказалось что оказалось.
>>1600129 >Если я ещё раз потрачу немного, то следующий ресет будет через неделю опять? Да.
Можешь включить overage через кредиты, на про 1к в месяц дают. И можешь перейти на гемини-кли, подписка общая с антигравити, там суточные лимиты без викли сверху (но это пока).
>>1599960 Скоро поотключают все подписки на месяц и другие по времени. Слишком затратно для компаний это стало. Все будут платить за токены. По апи уже давно так, скоро и всех остальных в этот загон загонят.
Настроил claude code в WSL. Столкнулся с проблемой что он не может выполнять команды с sudo. Даже если я одобряю команду то она все равно падает с permition denied. Как решать? Бегло погуглил и вроде говорят что это никак не решается, либо там такие костыли огромные городят что пиздец, или я что-то не так понял?