/ai/ - Искусственный интеллект

Новости об искусственном интеллекте №56 /news/ Аноним # OP 24/02/26 Втр 00:14:39 № 1531615 Ответ

В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1525708 (OP)

🚀 Последний обзор ИИ новостей:

🔓 Открытый исходный код

nanollama позволяет проводить сквозное предобучение Llama 3 с нуля одной командой, снижая порог входа для создания пользовательских моделей.

Kon выпустил компактного агента для программирования, построенного на основе glm‑4.7‑flash‑q4, который работает локально на потребительских GPU, расширяя набор инструментов ИИ на устройствах.

📰 Главные новости ИИ

Samsung добавила агента Perplexity AI в Galaxy AI, предоставив ему доступ к нативным приложениям и избранным сторонним сервисам, стремясь дифференцировать свою экосистему от Apple и Google.

🧠 Модели

FlashLM v5 «Thunderbolt» был обучен на CPU за 40 часов и, по сообщениям, превзошел предыдущий базовый уровень на GPU, демонстрируя эффективность обучения на CPU.

Gemini 3.1 Pro достиг более 75 % на HLE и LiveCodeBench Pro, что указывает на сильные способности к рассуждению и программированию.

Claude Opus 4.6 зафиксировал наивысшую точечную оценку METR за всю историю, подчеркивая его доминирование в оценках.

В релизе seed от ByteDance модель gpt‑5.2‑high показала результат Codeforces ELO 3148, что отмечает заметное снижение по сравнению с предыдущими результатами.

📱 Приложения

Внутренний агент LLM для операций безупречно работал во время демонстраций — отвечал на заявки, обобщал сообщения в Slack, выявлял проблемы с биллингом — но тихо вышел из строя после трех недель реальной эксплуатации, что подчеркивает проблемы с надежностью после развертывания.

⚙️ Инфраструктура

Тестирование квантования UD‑IQ2_XXS (2-бит) на модели Qwen‑3 объемом 30 млрд параметров дало неожиданно высокое качество, ставя под сомнение предположение о том, что форматы ниже 4 бит непригодны к использованию.

🛠️ Инструменты разработчика

Пользователь сократил потребление токенов Claude Code на 65 %, создав локальный граф зависимостей и предоставляя контекст через MCP, что снизило затраты и задержки.

Universal Prompt Framework V2 добавил парсинг XML, динамическую маршрутизацию и отслеживание памяти, отражая быструю итерацию, управляемую сообществом.

Был представлен бэкенд ИИ, сочетающий LangGraph и FastAPI, с запросом совета по переходу от автоматических выключателей к обнаружению плато уверенности, что указывает на зрелость агентных систем RAG.

Был выпущен пакет навыков для Claude, предоставляющий структурированный набор инструментов рыночного консультанта для Claude, расширяющий его функциональные плагины.

Был создан жесткий промпт для аудита системных проектов, действующий как «кувалда» для раннего выявления недостатков.

Бесплатный виджет для macOS в реальном времени отслеживает лимиты использования Claude, помогая пользователям избежать неожиданных превышений квот.

Обсуждение на Reddit предполагает, что Claude иногда пишет более чистый код, чем разработчики, что вызвало дебаты о качестве помощи ИИ в программировании.

📦 Продукты

OpenAI обсудила потенциальную подписку Pro Lite по цене $100, направленную на заполнение ценового промежутка между текущими уровнями $20 и $200.

🧪 Исследования

Недавние высокие результаты (68–84 %) на ARC‑AGI2 у Claude Opus 4.6, Gemini 3.1 Pro и Gemini 3 Pro DeepThink вызвали обеспокоенность по поводу переобучения на метриках.

DynaMix был представлен как первая фундаментальная модель, способная к долгосрочному прогнозированию динамических систем без дообучения (zero-shot), расширяя возможности прогнозирования временных рядов.

В одной публикации утверждалось, что недетерминированность LLM делает надежность дорогостоящей, подчеркивая необходимость затратной инженерии для достижения стабильных результатов.

📰 Инструменты

Новый бот для Telegram обеспечивает удаленный доступ к Claude Code, позволяя разработчикам редактировать и запускать код из любого места с постоянными сессиями ИИ.

📰 События

ByteDance AI отображает молекулярные связи в рассуждениях ИИ для стабилизации производительности длинных цепочек рассуждений и обучения с подкреплением (RL).

NVIDIA выпускает Dynamo v0.9.0: масштабная переработка инфраструктуры с FlashIndexer, поддержкой мультимодальности и удалением NATS и ETCD.

Новый генеральный директор игрового подразделения Microsoft клянется не наводнять экосистему «бесконечным ИИ-мусором».

Метрополитен-полиция использует инструменты ИИ, предоставленные Palantir, для выявления неправомерного поведения офицеров.

На Moltbook агенты ИИ активно готовятся финансировать строительство роя Дайсона в течение следующих «50–100 лет», ища рабочую группу агентов «и людей, серьезно думающих об экономике мегасооружений».

METR оценивает, что у Claude Opus 4.6 горизонт автономности 50 % составляет около 14,5 часов для задач по программированию — самый высокий показатель за всю историю отчетов.

Сообщество LessWrong наконец признает: «AGI уже здесь», отмечая, что Opus 4.6 и GPT-5.3 могут думать, планировать и «осмысленно пытаться выполнить большинство задач, доступных человеку».

Сэм Альтман соглашается, говоря, что его «внутренний взгляд» указывает на «более быстрый взлет, чем я изначально предполагал», и что ChatGPT, «вероятно», теперь более энергоэффективен, чем люди, при ответе на вопросы.

Разработка программного обеспечения теперь составляет почти 50 % агентной активности Anthropic.

Gemini 3.1 Pro решил задачу FrontierMath уровня 4, которую ранее не решала ни одна модель, выводя машинные рассуждения на территорию, недоступную большинству профессиональных математиков.

Фермеры в США получают предложения свыше $120 000 за акр от разработчиков центров обработки данных. Но они отказываются.

OpenAI планирует потратить $600 млрд на вычислительные мощности к 2030 году.

Агенты ИИ теперь управляют примерно каждой шестой квартирой в США.

Meta переименовывает менеджеров по продукту в «строителей ИИ».

Илон Маск предсказывает, что FSD плюс Starlink измеримо увеличат распространение кочевого образа жизни в течение пяти лет.

Гуманоидные роботы Figure теперь работают 24/7 без присмотра, меняясь на зарядных станциях и заряжаясь индуктивно через свои ступни.

Исследователи создали роботизированную руку, которая передвигается на кончиках пальцев, сгибается назад и отсоединяется от руки — реализация «Вещи» из «Семейки Аддамс».

Разработчик использовал помощника по программированию на базе ИИ для реверс-инжиниринга своего робота-пылесоса DJI и случайно получил доступ к живым трансляциям с 7000 пылесосов в 24 странах.

OpenAI хочет вывести из эксплуатации бенчмарк для оценки программирования ИИ, на который все ориентировались.

Anthropic заявляет, что DeepSeek, MiniMax и Moonshot нарушили ее Условия использования, отправив более 16 млн запросов к Claude в совокупности и используя дистилляцию для обучения собственных продуктов.

Google ограничивает подписчиков Google AI Pro/Ultra за использование OpenClaw.

Некоторые кнопки «Обобщить с помощью ИИ» тайно внедряют рекламу в память вашего чат-бота.

Вице-президент Google предупреждает, что два типа стартапов в сфере ИИ могут не выжить.

В некоторых школах чат-боты допрашивают студентов об их работах. Но ИИ-революция вызывает беспокойство у преподавателей.

Страны, которые не примут ИИ, могут остаться позади, говорит Джордж Осборн из OpenAI.

Аноним # OP 04/03/26 Срд 03:15:51 № 1541082

ПEPЕКАAAТ

Аноним 04/03/26 Срд 06:26:38 № 1541106

>>1541082
https://2ch.org/ai/res/1541081.html
https://2ch.org/ai/res/1541081.html
https://2ch.org/ai/res/1541081.html

Аноним 04/03/26 Срд 06:34:29 № 1541108

>>1541106
>>1541081 (OP)
>>1541081 (OP)
>>1541081 (OP)