Не так давно я решил углубиться в робототехнику с применением RL. В связи с этим всё чаще сталкиваюсь с особенностями и стандартами области. Например штраф за скорость суставов, использование шумных сетей и важность планирования(Те алгоритмы, основанные на моделях).
Какие ещё особенности RL для робототехники вы знаете и имели ли вы подобный опыт с подобными приложениями?
О, моя бакалаврская была об этом! Такая фигня по итогу получилась, даже в симуляторе двигается чёрт знает как. Какие только штрафы я не прописывал, всё было бесполезно. Я перепррбовал несколько библиотек для python, предназначенных как для rl вообще, так и предназначенных специально для роботов. >>1621089 С Isaac sim есть очевидная проблема: требуется топовая комплектация компа. А ещё говорят, что возни много с его настройкой. MuJoCo шикарен, но у него свой особый формат хранения моделей: в других симуляторах используется urdf, а тут mjcf, причём mjcf нельзя нормально сконвертировать в urdf (да, решения есть, но фигня полная). P.S. аттестационная комиссия несмотря на то, что задача была фактически не достигнута, поставила 5.
Аноны подскажите пожалуйста есть ли на просторах интернета ИИ или может какая надстройка для Word которая может делать сноски автоматически?(Сноска пик3) Буду очень благодарен за подскаску и про инвестирую 3 чая в анона.
>>1618839 (OP) мудила, для этого есть специальный тред https://2ch.org/ai/res/299474.html Автоматические сноски можно делать как стандартными средствами Word, так и с помощью современных ИИ-плагинов и менеджеров источников. ------------------------------ ## 🛠️ Встроенный метод в Microsoft Word Word сам нумерует и переносит сноски вниз страницы. Вам не нужны сторонние программы для базовой автоматизации.
Горячие клавиши: Нажмите Alt + Ctrl + F (в Windows) или Cmd + Option + F (в Mac). Через меню: Вкладка «Ссылки» ➡️ кнопка «Вставить сноску». Результат: Номер сноски связывается с текстом автоматически. При добавлении новых сносок нумерация сама пересчитается.
------------------------------ ## 🤖 ИИ-сервисы и плагины для автоматических цитат Если вам нужно, чтобы ИИ сам находил источники, оформлял их по ГОСТу/конкретному стилю и превращал в сноски, используйте эти инструменты: ## 1. Специализированные ИИ-ассистенты
Jenni AI: Пишет текст вместе с вами. Автоматически ищет научные статьи. Генерирует правильные сноски в один клик. SciSpace (Typeset.io): ИИ для работы с научными текстами. Подключается к Word. Сам оформляет цитаты и сноски по тысячам стандартов.
## 2. Умные плагины для Word (Менеджеры библиографии) Это не чистый ИИ, но они полностью автоматизируют создание сносок из вашей базы источников.
Zotero + плагин Zotero Word Integration: Полностью бесплатный инструмент. Выделяете цитату ➡️ нажимаете кнопку ➡️ Zotero сам ставит сноску вниз страницы. * Mendeley Cite: Официальная надстройка для Word от Elsevier. Работает аналогично Zotero.
------------------------------ Если вы хотите автоматизировать создание сносок для научной работы или диплома, напишите, какой стиль оформления (например, ГОСТ) вам нужен. Я подскажу, как лучше настроить Zotero или Jenni AI под эту задачу.
МУЗЫКАЛЬНЫЙ №21 /music/
Аноним29/04/26 Срд 17:38:35№1601065Ответ
1. Suno https://suno.com/ Вышла версия 5.5 (но для тех кто платит денюшку), качество моделей постепенно улучшается: звук, понимание концепций, набора различных жанров. Но в то же время все сильнее урезается для бесплатных юзеров: осталось только 5 бесплатных генераций в день на аккаунт, а также по заявлением некоторых анонов, модель для генерации на бесплатке (на момент создания треда использовалась 4.5) ухудшили. Спам аккаунтами пока что работает. Купить подписку из РФ: 1. https://payment.mts.ru/tools/suno-ai 2. https://plati.market/games/suno-ai/1701/
2. Tunee https://www.tunee.ai Хороший звук, более-менее понимание концептов, но тоже сильно урезан для бесплатных юзеров: режет концепты в промптах, плюс произвольно определяет "цену" за каждую генерация исходя из какой-то "сложности запроса". И получается, что если с бесплатки забацаешь промпт сложнее банальщины "Make cool rock about love for youtube" он может решить что у тебя нет кредитов для такого сложного запроса и пошлет нахуй. Способов оплаты из РФ неизвестно.
3. Sonauto https://sonauto.ai/ Как по мне, недооценённая вещь, особенно учитывая что недавно он обновился до 3.0, который очень даже разъебывает. Но он тут более ограничен тегам и понимает чисто какие-то жанровые теги, гибкости поменьше. Но зато пока что халявный и не ограничен кредитами, генерируй пока есть настроение.
Потихоньку развиваются, стоит внимания ACE-STEP 1.5: https://github.com/ace-step/ACE-Step-1.5 Звук уже на уровне раннего Suno ~2.0-3.0, аноны делают на нем уже приемлемые результаты и постят в тред. Если есть хотя бы 12 GB VRAM и хочется генерировать без цензуры и подписок - можете юзать.
МЁРТВЫЕ ГЕНЕРАТОРЫ
1. Udio (udio.com) - куплен Warner Bros, но затем сами Warner Bros сдали назад и откатили сделку. Но уже успели испортить, больше нельзя скачивать треки, их только доставать из буфера в 160 кбит/с. Плюс непонятно как работающая цензура, которая не дает генерировать треки с определенными тегами. Плюс уже год ебут один и тот же 1.5 allegro. 2. Riffusion, Producer.ai (producer.ai) - куплен гуглом, удалены все старые относительно норм модели, вместо этого запихали безальтернативную каловую модель, которая и промпты сложнее самых нормисных в духе "make cool rock about love" не понимает, и вокал смазывает в какую-то кашу. При этом еще и максимально дегенеративная цензура, которая режет чуть ли не любые попытки сделать просто что-то не попсовое и не "музыку для ютуб".
ПРОЧИЕ ПОЛЕЗНЫЕ УТИЛИТЫ
1. https://www.bandlab.com/mastering Быстрый мастеринг в две кнопки, если хочешь чтобы звучало более слушабельно, но не имеешь навыков в DAW или аудиоредакторах (или лень). 2. https://morpher.ru/accentizer/ Если генерируешь музыку с лириками на русском, то очень часто случается, что твой генератор путает ударения в словах. Прежде чем пихать свою графоманию в генератор, проставь ударения в сервисе по ссылке. И уже из этого сервиса копируй текст в генератор. По крайней мере в Suno это помогает. 3. https://x-minus.pro/ai Быстро вытащить минус или вокал из трека.
Примечание от афтора шапки: в прошлых шапках были ссылки на нерабочие сервисы или полностью мертвые ссылки, я их не включил в шапку
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
• Lens (3.8B) от Microsoft • HiDream-O1-Image • Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
>>1620852 >>1621073 Оно, емнип, как ВПН все равно работать не будет. Да, блоки РКН обойдет, но если сайт с той стороны геоблок имеет - тебя на него не пустит. Плюс будет нужно что-то типа zapret-discord-youtube, для "обманки" входного фильтра и коннекта к самому WARPу.
По крайней мере чистый WARP у меня именно так работает, через амнезию не пробовал его пускать ибо подписка на Амнезию есть.
че за хуйня я полгода назад заходил в стейбл дифюжн треды и вы нереально пиздатые кратинки генерили, ща какая то хуита как будто технологии откатились на 5 лет назад, почему так?
Новости об искусственном интеллекте №71 /news/
Аноним# OP19/05/26 Втр 19:41:08№1615659Ответ
Amazon представила Alexa Podcasts, позволяя пользователям в США создавать подкаст-эпизоды по запросу с помощью ИИ, расширяя возможности создания аудиоконтента на базе искусственного интеллекта.
LetinAR привлекла $18,5 млн на разработку оптики PinTILT для ИИ-очков, обещая более яркие, тонкие и энергоэффективные дисплеи и сигнализируя о растущих инвестициях в носимые устройства с ИИ.
Google DeepMind сигнализирует, что сцена готова к Google I/O, и направляет зрителей на прямую трансляцию в X в 10:00 по тихоокеанскому времени для новых прорывов в области ИИ и анонсов продуктов
🏢 Приобретения
Anthropic приобрела Stainless более чем за $300 млн, закрепив за собой инфраструктуру SDK и ограничив возможности таких конкурентов, как OpenAI и Google.
Cohere приобретает Reliant AI, добавляя исследователей с опытом работы в области корпоративных приложений ИИ для здравоохранения и биофармацевтики, и интегрируя операции в Берлине и Монреале
Mistral AI покупает стартап Emmi AI
📦 Продукты
Amazon представила Alexa Podcasts, позволяя пользователям в США создавать подкаст-эпизоды по запросу с помощью ИИ, что знаменует собой выход на рынок автоматизированного аудиоконтента.
Google Gemini 3.5 Flash появляется в интерфейсе квот Cloud Console под идентификатором gemini-3.5-flash по цене $1,5 за миллион входных токенов и $9 за миллион выходных токенов
💻 Оборудование
LetinAR привлекла финансирование в размере $18,5 млн для развития оптических модулей PinTILT для ИИ-очков, стремясь к созданию более ярких, тонких и энергоэффективных дисплеев и выходя на рынок, который вырос на 300% в 2025 году.
NVIDIA начинает распространение ранних блоков процессоров Vera для рабочих нагрузок агентного ИИ, поскольку Илон Маск получает один для оценки SpaceXAI, а Oracle планирует сотни тысяч развёртываний, начиная с 2026 года
ASML сотрудничает с Tata Electronics по строительству 300-миллиметровой фабрики в Гуджарате, стремясь сделать Индию равным игроком в области чипов к 2032 году, в то время как в Техасе солнечная энергия впервые в истории может превзойти угольную генерацию в рамках ERCOT.
📱 Приложения
SandboxAQ приносит свои модели для открытия лекарств в Claude — степень кандидата наук в области вычислительной техники не требуется
Deutsche Börse разработала инструмент генеративного ИИ для решения задачи масштабной миграции блокнотов Zeppelin в Databricks
В поставщике услуг по уходу за пожилыми людьми Regis ИИ берёт на себя бумажную работу, чтобы сотрудники могли сосредоточиться на подопечных
OpenAI обновила ChatGPT для поддержки разворачиваемых и сворачиваемых сообщений, позволяя пользователям скрывать или отображать длинные ответы одним касанием
Новое приложение Siri от Apple, похожее на ChatGPT, по сообщениям, будет автоматически удалять чаты.
🔓 Открытый исходный код
Qwen 3.7 появляется на Arena. Релиз скоро на хаггингфейсе.
Выпущен бесплатный многоязычный корпус Indic из 9,8 млн документов — хинди, бенгали, тамили, телугу + ещё 7 языков (CC0, HuggingFace). Многоязычный корпус для предобучения из 9 836 075 документов (~8,4 млрд оценочных токенов) на 10 языках Индии и английском языке, созданный на основе высококачественных данных веб-краулинга HPLT Monolingual v3.
PSA: Если вы не обновляли Llama.cpp пару дней и обнаруживаете, что MTP работает плохо, обновите llamacpp. Обновил его вчера и получил прирост скорости генерации токенов примерно в 1,5–1,8 раза. Они даже в значительной степени исправили проблему с pp.
Unsloth AI выпускает оптимизированные под MTP GGUF-файлы для Qwen3.6-27B и Qwen3.6-35B-A3B на Hugging Face, обеспечивая генерацию в 1,4–2,2 раза быстрее
Perplexity AI выпускает pplx-embed-v1-late-0.6b — модель эмбеддингов с поздним взаимодействием на 0,6 млрд параметров — на Hugging Face с оптимизацией MaxSim на уровне токенов и поддержкой нескольких языков
OpenAI открывает исходный код Symphony — спецификации SPEC.md для оркестрации автономных агентов для написания кода.
NVIDIA представляет SANA-WM: открытую мировую модель с 2,6 млрд параметров, которая генерирует видео разрешением 720p длительностью в минуту на одном графическом процессоре.
💰 Финансирование
Kin Health привлекает $9 млн на создание ИИ-ассистента для ведения заметок для пациентов
Viktor привлекает $75 млн в раунде серии А под руководством Accel — крупнейшее финансирование для компании, основанной в Польше, поскольку её ИИ-коллега работает внутри Slack и подключается к более чем 3000 инструментам
Leopold's Situational Awareness раскрывает новые длинные позиции в NVDA, AMD, TSM, MU и других названиях полупроводниковых компаний, а также корректировки владений, связанных с майнингом биткойнов, в своём последнем отчёте 13F
Капитал оценивает будущее до его наступления: акции SpaceX открылись для торговли на бессрочных фьючерсах Hyperliquid с оценкой в $2,4 трлн — крупнейшее размещение в истории, а Илон заявляет, что Starship создан для вывода на орбиту более мегатонны груза в год.
🏭 Компании
Бум ИИ не помешал компаниям США нанимать дешёвую офшорную рабочую силу, и занятость в зарубежных кол-центрах по-прежнему стремительно растёт
Присяжные выносят победу Сэму Альтману и OpenAI в споре с Илоном Маском
Андрей Карпати присоединяется к Anthropic для исследований передовых больших языковых моделей — Андрей Карпати объявил, что присоединился к Anthropic для работы над большими языковыми моделями на переднем крае исследований. Он выразил энтузиазм по поводу возвращения к практическим НИОКР и внесения вклада в усилия компании в ближайшие несколько лет. Карпати также отметил свою неизменную страсть к образованию и намерение возобновить соответствующие проекты в будущем.
DeepSeek нанимает команду для создания конкурента коде-харнессу Claude — DeepSeek активно набирает менеджеров по продукту и сотрудников НИОКР в Пекине для создания собственного инструмента для работы с кодом, явно смоделированного по образцу Claude Code.
💰 Бизнес
Бывший генеральный директор Google Эрик Шмидт освистан выпускниками при упоминании ИИ
Edison Scientific развёртывает ИИ-агента Kosmos совместно с Incyte для ускорения разработки лекарств
Кен Гриффин из Citadel описывает качественный скачок в наборе инструментов ИИ: финансовая работа уровня кандидата наук, которая раньше занимала человеко-годы, теперь выполняется агентным ИИ за часы или дни.
Президент заявляет, что Белый дом «должен был просить более крупную долю в Intel» сверх своих 10 процентов, после того как знаковые сделки подняли акции компании более чем на 300 процентов.
Выручка резко концентрируется: Anthropic и OpenAI получают 89% годовой выручки среди 34 наиболее зрелых стартапов в области ИИ.
Amazon привлекает немецкую компанию DeepL для сотрудничества.
🤖 Робототехника
Figure 03 демонстрирует потрясающую пропускную способность 2,6 секунды в течение 8-часовой смены без монтажа
«Момент iPhone 1»: Figure 04 достигает полной фиксации дизайна. Генеральный директор Figure Бретт Эдкок подтвердил, что Figure 04 достиг «полной фиксации дизайна», и компания уже начала отгружать детали для новой системы. Эдкок описывает предстоящего гуманоида как «момент iPhone 1» для отрасли, представляющий собой самый значительный скачок между поколениями в истории компании.
Великий параллелизм: Джим Фан из NVIDIA излагает стратегию «конечной игры» в робототехнике. NVIDIA прогнозирует проведение «физического теста Тьюринга» в течение 2–3 лет и завершение «технологического древа» робототехники к 2040 году.
Boston Dynamics публикует видео, на котором её гуманоидный робот Atlas поднимает и переносит мини-холодильник, используя управляемую ИИ координацию всего тела в лабораторной демонстрации
Unitree Robotics демонстрирует управление своим гуманоидным роботом G1 в реальном времени с помощью голоса, когда внешние команды запускают автономные действия, сгенерированные ИИ, записанные в один дубль
В Атланте десятки пустых автомобилей Waymo вторглись в тупик и кружили там часами без пассажиров.
Робот может позволить себе проиграть, человек — не может позволить себе выиграть. Человек-сортировщик посылок от Figure выиграл с минимальным перевесом, при этом его левое предплечье было «практически сломано», а генеральный директор Бретт Эдкок предсказал: «Это последний раз, когда человек когда-либо победит».
Сап. Замечал ли кто-то, что даже с выключенной памятью гпт ссылается на другие чаты, а когда его ловишь, начинает отнекиваться и утверждает, что темы моего интереса "видно по стилю общения"? Гуглил эту фигню, ничего не нашел
>>>>1615371 (OP) Ты только сейчас об этом узнал? Два года назад была новость. Я из-за этого старые чаты удаляю, так как chatgpt жалуется на переполнение контекста. > гуглил Значит, плохо искал.
>>1615371 (OP) Это у всех сейчас так, хранят выжимку контекста из предыдущих сессий для твоего аккаунта, типа повышает персонализацию ответов. Удаление старых чатов не поможет. Если параноик - просто не регайся в чате.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.
Как вы сейчас покупаете подписки? Раньше брал подписку ChatGPT Plus на плати маркете за 300р, но ту махинацию уже прикрыли и все услуги активации подписки стоят все те же 20$. Какие для СНГ сейчас есть самые выгодные продложения в этом ценовом сегменте? Китайцы вывозят на фоне кодекса? Может есть другой вариант чат джипити урвать по дешевке?
АИнон, скажи, нет ли у тебя чувства обмана? Сегодня линкедин пестрит постами "я делаю 50 проектов в неделю", "я оркестрирую агенты", "хуяк-хуяк и в продакшен". На ютубе сотни видео, как классно юзать нейронки и как ты можешь без какого либо знания юзать %llmname% с %skillname% и будешь впереди планеты всей. Но на весь ютуб я не увидел никакого фреймворка для оркестрации агентов. В гугле лежит какая-то индусская поделка с initial коммитом (и статья на медиум) + фреймворк ruflo ruflo настолько удобный, что какой-то товарищ приделал к нему дополнительную обёртку, чтобы не запускать одно и то же. И при этом руфло так херово документирован, что их собственное демо нельзя нормально использовать
Скажи, анон, как ты оркестрируешь команду из N агентов, раздавая им навыки и задачи, ставя таски, синхронизируясь с ними? Ты пробовал написать проект больше, чем перекладывание json с фронта в бд и обратно?
>>1615997 у меня опыта нету и я в душе не ебу че там оркестрировать, но видимо в какие-то бизнес-процессы в каких-то компаниях их встраивают. поищи по запросу LangGraph вакансии на хх и подумай какие там юзкейсы
Новости об искусственном интеллекте №70 /news/
Аноним# OP14/05/26 Чтв 05:53:06№1611633Ответ
Выпускники гуманитарных факультетов Университета Центральной Флориды громко освистали выступающего на церемонии вручения дипломов за называние ИИ следующей промышленной революцией.
WhatsApp добавляет режим инкогнито в чаты Meta AI Эти разговоры, по словам компании, будут обрабатываться в безопасной среде и не могут быть увидены никем.
Thinking Machines Lab выпускает свою первую модель и утверждает, что интерактивность — это то, в чем OpenAI ошибается в отношении голоса.
Google анонсирует ноутбук Googlebook, разработанный для интеллекта Gemini Google анонсировала Googlebook, свой первый ноутбук, построенный вокруг модели ИИ Gemini. Устройство нацелено на высокую производительность, добавляет прямую синхронизацию с телефонами Android и должно быть запущено этой осенью.
Telegram выпускает крупное обновление для ИИ-ботов и автоматизаций Последнее обновление Telegram представляет Guest Bots, рабочие процессы с несколькими ботами, поиск стикеров с помощью ИИ, функции автоматизации чата и новые элементы управления для администраторов.
📦 Продукты
Anthropic запускает Claude для Excel, PowerPoint и Word в качестве общедоступного с полным контекстом разговора между приложениями
holaOS 0.1 выпущен как слой управления рабочими потоками ИИ holaOS beta0.1 поставляется с Dashboard, Sub Agents и Multi Workspaces для управления параллельными рабочими потоками ИИ на рабочем столе.
Google приносит автоматизацию на основе интеллекта Gemini на устройства Android Google запускает Gemini Intelligence на Android, начиная с телефонов Galaxy и Pixel этим летом, добавляя проактивные автоматизации на основе ИИ.
Anthropic расширяет предложения юридического ИИ с новыми плагинами Claude Cowork Во вторник компания представила двенадцать новых плагинов и более 20 коннекторов MCP для своего чат-бота Claude, каждый из которых предназначен для конкретных областей права, включая договорное право, трудовое право и судебные разбирательства.
Meta запускает голосовые разговоры Meta AI на базе Muse Spark Meta AI теперь поддерживает плавные голосовые разговоры, которые обрабатывают прерывания, смену тем и переключение языков без проблем. Благодаря поддержке Muse Spark обновление также позволяет ИИ генерировать изображения по требованию и предоставлять предложения в реальном времени из Reels и карт, добавляя описания с камеры в прямом эфире.
Alibaba интегрирует ИИ Qwen с Taobao для агентных покупок
💻 Оборудование
Fractile привлекает 220 миллионов долларов на чипы для вывода ИИ Fractile, британский стартап по производству чипов, привлек 220 миллионов долларов на разработку специализированного оборудования для запуска крупных моделей ИИ в задачах вывода. Раунд под руководством Accel, Factorial Funds и Founders Fund ориентирован на чипы, которые эффективно работают в условиях жестких ограничений по мощности, теплу и памяти.
🔓 Открытый исходный код
Tencent открыла исходный код OpenSearch-VL: полное руководство для передовых многомодальных агентов глубокого поиска
PrimeIntellect представляет Renderers, повышающие пропускную способность RL более чем в 3 раза PrimeIntellect выпустила Renderers, которые повышают пропускную способность обучения с подкреплением более чем в три раза на популярных открытых моделях. Библиотека согласует обучающие программы на основе токенов с средами на основе сообщений посредством явной обработки входящих и исходящих токенов плюс пользовательского шаблона.
🧪 Исследования
Тим Роктешель соосновывает Recursive для автоматизации исследований в области ИИ Recursive запускается для автоматизации научного метода в исследованиях ИИ, преобразуя крупномасштабные вычисления в открытые открытия.
📱 Приложения
Google спешит поставить Gemini в центр Android до перезапуска ИИ от Apple.
Anthropic запустила «Claude для юридической отрасли», предоставив более 20 коннекторов MCP, которые связывают Claude с программным обеспечением, на котором работает юридическая отрасль, наряду с 12 плагинами для областей практики, и сотрудничает с Free Law Project и Justice Technology Association, чтобы сделать юридическую помощь доступной для людей, которые в настоящее время не могут ее получить.
Amazon запускает ИИ-помощника для покупок в строке поиска, работающего на базе Alexa+ По словам компании, Alexa для покупок предназначена для предоставления голосового и сенсорного опыта покупок на мобильных устройствах, настольных компьютерах и смарт-дисплеях Echo Show.
ChatGPT теперь позволяет добавить «доверенный контакт» для безопасности. Новая функция позволяет назначить кого-то, кто будет уведомлен, если разговор в чате указывает на потенциальную проблему безопасности.
🔎 Мнение и анализ
Кэт Ву из Anthropic говорит, что в будущем ИИ будет предвосхищать ваши потребности, прежде чем вы узнаете, что они у вас есть.
⚠ Безопасность ИИ
«Большие языковые модели могут выводить частные атрибуты только на основе воздействия рекламы»: ИИ может многое рассказать о вас, основываясь только на общих паттернах рекламы, которую вы видите, без необходимости доступа к вашей истории просмотров или личным данным — и даже VPN не может защитить вас
Тесты безопасности ИИ имеют новую проблему: модели теперь подделывают свои собственные трассировки рассуждений
Агенты ИИ теперь могут взламывать компьютеры и копировать себя, и они быстро становятся лучше
OpenAI представляет Daybreak: инициатива по кибербезопасности, которая ставит безопасность Codex в центр обнаружения уязвимостей и валидации патчей.
Anthropic проследила попытки шантажа Claude Opus 4 до вымышленного злодейского ИИ в обучающем корпусе, что предполагает, что мы случайно дообучили модели на веке паранойи научной фантастики и получили именно то, что заказывали.
Группа разведки угроз Google идентифицировала первый разработанный ИИ эксплойт нулевого дня, использованный в дикой природе, завершив наступательный переход.
ИИ-чат-боты выдают реальные телефонные номера людей Люди сообщают, что их личная контактная информация была обнаружена ИИ Google — и, по-видимому, нет простого способа предотвратить это.
Министерство обороны США заявляет, что развертывает Mythos для поиска и устранения уязвимостей программного обеспечения в правительстве США, даже когда оно работает над переходом от Anthropic.
OpenAI раскрывает Daybreak, свою попытку свергнуть Anthropic Mythos Новое решение OpenAI для кибербезопасности на основе ИИ скоро будет выпущено в мир.
Модель ИИ Anthropic Claude Mythos автономно находит реальную уязвимость curl
Безопасность цепочки поставок ИИ быстро ухудшается: червь Shai-Hulud становится открытым исходным кодом на GitHub на той же неделе, когда Foxconn подтверждает утечку 8 ТБ, раскрывающую схемы Apple, Nvidia и Google.
💰 Бизнес
Давление на управление со стороны Сэма Альтмана нарастает с нескольких направлений одновременно: шесть генеральных прокуроров штатов от Республиканской партии, Комитет Палаты представителей по надзору и усиление контроля со стороны Комиссии по ценным бумагам и биржам США — все это происходит перед потенциальным IPO OpenAI.
Измененная сделка OpenAI с Microsoft ограничивает выплаты суммой в 38 миллиардов долларов, экономя расчетные 97 миллиардов долларов к 2030 году.
И в суде Илья Суцкевер небрежно подтвердил, что его доля в OpenAI стоит примерно 7 миллиардов долларов, подтверждая «почувствуй AGI» как самую высокодоходную сделку десятилетия.
🏭 Компании
Apptronik назначила Дэниела Чу, бывшего директора по продуктам в Waymo, своим новым директором по продуктам, чтобы направить траекторию развития продукта от промышленного использования к здравоохранению. Расширение руководства следует за крупным раундом финансирования серии A на сумму 935 миллионов долларов и предшествует презентации «долгожданной» новой гуманоидной модели. Ключевые назначения из Boston Dynamics и Amazon привносят специализированный опыт в масштабировании глобальных роботизированных сервисов и многомодального ИИ-программного обеспечения.
Cerebras обновила свою заявку на IPO, нацеливаясь на оценку в 35 миллиардов долларов на этой неделе, выводя на публику тезис о масштабе пластины.
💰 Финансирование
Isomorphic Labs только что закрыла раунд на 2,1 миллиарда долларов под руководством Thrive для масштабирования открытия лекарств на основе ИИ, опуская следующий бенчмарк до молекулярного уровня.
>>1615802 Ну хз насчёт грока, я им обычно вместо гуглёжки пользуюсь т.к. заметил что ищет по более чем 100 ссылкам. Я помню какой то "инсайдер" писал что у 3.5 будет цена 0.25!!! И где? Наебали. Ждём дальше когда китайцы их всех выебут
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
Честно - как-то не очень по описанию, я так понял что суммарайз сообщения в короткой памяти и так прикреплен к самому сообщению, тоесть в короткой памяти - бесполезен, а в длинную память надо вручную каждый суммарайз сообщения вносить. С таким же успехом я и ручками автосуммарайз таверны править могу.
>затем суммарайзы суммарайзов по дням, чтобы не проебать историю. В ST MessageSummarize есть такая автоматическая функция? Или ты вручную пердолишься?
>>1614857 >Гемма 4 31б и Квен 3.5 27б лучше бы запускал сегодня. Попробовал я гемму 4, я охуел с того, что модель 6-гишабайтная как человек по-русски отвечает
Агентов и вайб-кодинга тред #5 /agents/
Аноним28/04/26 Втр 21:01:39№1600422Ответ
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.
С чего начать: - Хочешь кодить с AI эффективно: Cursor или Claude Code - Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter - Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.5, подробности в llama-треде - Хочешь приложение без кода: Lovable или bolt.new - Хочешь автоматизировать рутину: n8n или Langflow - Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке
>>1618233 >а есть модель без цензуры, русскоязычная ( англо если вообще никак не найти русскую) и локальная которая влезет в 6гб врам. >Для локального легкого агента который саммаризирует 2-3 страницы а 4 диктованного нецензурного текста >задача не разовая, а на каждый день gemma 4
>>1607107 Да уж, ситуация классическая. 🤖 Перепутал полярность инструкции на 180 градусов — это одна из главных болячек современных нейросетей при суммаризации. ## Почему это происходит?
Частица «НЕ»: Модели часто игнорируют отрицания при сильном сжатии текста. Смешивание контекста: Дипсику показалось, что «жопа» и «хуй» — это просто синонимы в твоем контексте, и он выбрал один метод, перепутав знак (плюс на минус). * Потеря логических связей: При объединении нескольких промптов ИИ часто теряет жесткие запреты (Negative Prompts).
## Как заставить их объединять нормально? Если не хочется вычитывать каждое слово, давай им жесткую структуру для сборки.
1. Разделяй логику: Прямо пиши Дипсику: «Объедини эти промпты. Выдели блоки: Что делать ОБЯЗАТЕЛЬНО, Чего избегать КАТЕГОРИЧЕСКИ». 2. Используй капс для запретов: В исходных промптах пиши НЕ делать через [ХУЙ]. Капс и квадратные скобки ИИ считывает лучше. 3. Финальный чек-ап: После сборки задай Дипсику один контрольный вопрос: «Проверь получившийся промпт. В исходнике был жесткий запрет на [ХУЙ]. Сохранился ли он здесь?».
Доверять им на 100% нельзя, они пока еще тупые исполнители. Всегда перепроверяй критически важные условия (особенно запреты)!
>>1629996 >3. Финальный чек-ап: После сборки задай Дипсику один контрольный вопрос: «Проверь получившийся промпт. В исходнике был жесткий запрет на [ХУЙ]. Сохранился ли он здесь?». Все намного проще. Пишешь ЫЫ: Сравни тексты и покажи дифы.
FLUX.2 ДРОПНУЛ! 32 МИЛЛИАРДА ПАРАМЕТРОВ. ПРОВЕРЯЙ СВОЙ VRAM, НУЖНО 64 ГБ
Аноним# OP26/11/25 Срд 12:08:58№1430679Ответ
Black Forest Labs выпустили FLUX.2 — новую серию моделей генерации изображений, представленную как передовая система «визуального интеллекта». Это совершенно новая модель с новой архитектурой, которая была обучена с нуля. FLUX.2 не является простой заменой или итеративным обновлением FLUX.1.
1. КОЛОССАЛЬНЫЙ МАСШТАБ И ПАМЯТЬ. FLUX.2 (версии Dev/Pro) обладает беспрецедентным масштабом в 32 миллиарда параметров (32B). Это значительный скачок по сравнению с FLUX.1 (12B параметров). 2. ТРЕБОВАНИЯ VRAM. Для полной загрузки модели в стандартной точности (FP16/BF16), она требует более 80 ГБ VRAM. Даже в режиме с низким потреблением VRAM (lowVRAM mode) требование составляет 64 ГБ VRAM. 3. VRAM — БИНАРНЫЙ КРИТЕРИЙ. Объем VRAM является самым критическим аппаратным ресурсом, поскольку это бинарный критерий ("работает" / "не работает эффективно"). 4. СКОРОСТЬ УБИВАЕТ ОФФЛОАДИНГ. Если веса модели не помещаются в VRAM, система вынуждена использовать механизм Weight Streaming (потоковая передача) из системной RAM. Поскольку пропускная способность системной RAM в 15–20 раз ниже, чем у VRAM, это приводит к катастрофическому падению производительности, увеличивая время генерации изображения с секунд до минут.
### Решения для локального запуска
ОПТИМИЗАЦИЯ FP8. NVIDIA и Black Forest Labs сотрудничали для квантования модели в формат FP8, который снижает требования к VRAM на 40% (до ~38–44 ГБ). Флагманская RTX 5090 (32 ГБ) считается лучшей видеокартой для FLUX.2 на потребительском рынке. КВАНТОВАНИЕ NF4/GGUF Q4. Владельцы карт с 24 ГБ VRAM (RTX 4090, RTX 3090) могут использовать 4-битное квантование, такое как NF4 / GGUF Q4, которое снижает требование до ~20–24 ГБ VRAM. СИСТЕМНАЯ RAM. Поскольку модель редко помещается в VRAM потребительских карт, системная оперативная память (RAM) становится критически важной. При агрессивном оффлоадинге потребление RAM может достигать 40 ГБ и выше. Для стабильной работы настоятельно рекомендуется иметь 64 ГБ оперативной памяти (RAM).
### Революционные возможности
Мульти-референс. Модель имеет нативную поддержку использования множества изображений в качестве входных данных, позволяя ссылаться до 10 изображений одновременно. Эта функция обеспечивает лучшую согласованность персонажей, продуктов и стиля. Гиперреализм 4MP. Поддерживается генерация и редактирование изображений в разрешении до 4 мегапикселей (4MP), что позволяет создавать фотореалистичные изображения даже в большом масштабе. Точная Типографика. FLUX.2 превосходит конкурентов в области рендеринга текста, надежно создавая сложную типографику, инфографику, логотипы и макеты UI/UX с разборчивым мелким текстом. Хирургический Контроль. Поддерживается структурированный JSON-промптинг для точного контроля над композицией и деталями камеры, а также возможность указания точных цветов, используя HEX-коды. УПРАВЛЕНИЕ СКОРОСТЬЮ. Версия FLUX.2 [flex] позволяет регулировать количество шагов (inference steps) и шкалу руководства (guidance scale tuning), чтобы обменивать скорость на точность.
ГДЕ БРАТЬ: Открытые веса FLUX.2 [dev] (32B) доступны для сообщества. Модель поддерживается в ComfyUI, который является самой мощной и модульной GUI для диффузионных моделей и имеет функции оффлоадинга и квантования.
*
Представьте, что FLUX.2 — это профессиональная студия фотопечати, которая может работать с изображениями 4MP. Она требует, чтобы исходные файлы (веса модели) были загружены в супербыструю память (VRAM), но объем этих файлов (до 90 ГБ) настолько велик, что ваш домашний ПК не может вместить их целиком. Приходится постоянно подкачивать данные с медленной системной памяти (RAM), из-за чего печать одной фотографии (генерация) занимает минуты вместо секунд.
>>1430679 (OP) Оп и другие, нужна помощь, хочу отредактировать свои фотки, типо сделать себя в другом месте или свануть своё лицо с кем-то другим, но самое важное чтобы это было вообще нельзя было человеческим глазом отличить, какую ИИ мне вы посоветуете?
>>1552048 Либо Grok Imagine, либо ComfyUI на своём железе или облачном хостинге. Но тебе наверно лучше, Грок, но там платно 30 баксков в месец, Комфи на своей нвидии беслатно, но надо уметь пользоваться
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
Gryphe_WorldSim-Opus-3.6-35B-A3B-Q5_K_L.gguf . В принципе имеет право на жизнь. Свайп на чате на 71k токенов. Ризонинг компактен и по делу. К сожалению moe-сущность модели никуда не делась - инструкция после истории на создание кодового блока со всякой херней была упомянута в ризонинге, но в output на нее был забит болт. Свайпы разнообразны - с некоторой вероятностью выскакивают паттерны разных видов ризонинга.
>>1612301 >raylight (ray + rccl) ХА А НЕ СЛИШКОМ ЛИ МНОГО R ТЫ СЕБЕ ПОЗВОЛЯЕШЬ МММ >пикрилы Ебать 5060 ти унылый калл. У меня 3090 ти в твоих 1.5 мегапикселей генерит 27 секунд - т.е. твоя скорость с рейлайтом. И это без сажи (я кстати поубирал сажу из всех воркфлоу кроме вана, потому что на некоторых сетках она артефачит).
Ищу способ прохождения собеседования в контору со знанием англ. Подозреваю что есть уже такой функционал, но обнаружить его еще не удалось.
Хотелось бы чтобы делал следующее:
- С моей стороны на лету переделывал запись с вебки, звук сразу переводил с рус на англ, само видео редактировал, движение губ под англ слова (мб уже есть решения как поступать когда рус длинне чем англ слова или наоборот, в таких случаях какой то лаг добавлять или что то в этом роде)
- Со стороны собеседника, переводить с англ на рус и подавать мне.
сажи говнотреду лишнему. есть закрепленный тред такого нет, максимум ИИ для собесов (есть росиянские платные аналоги) где звук с компа считывается и микрофон с твоего стороны задаёшь промптом что ты хохол не знающий английского и экраном выдавать текст, удобная транслитерация, произношение (как напиздеть в ответ), перевод и так далее.
если и есть синхронное говно, то оно говно и рекрутерам такое нахуй не надо
>>1592407 (OP) Есть модели для восприятия аудио и переввода, но им нужна цельная ограниченная по времени аудиозапись. Дипфейки в реалтайм вроде как накладываются (вспомни хотя бы прямую линию в 2024), движение губ можно изменить на видео, но я не уверен что это реалтайм. А чтоб ещё заставить всё этл вместе работать, ну это совсем беда.