Среда, 6 мая, дала редкую плотность: Питер Янг опубликовал честное сравнение пяти персональных ИИ-агентов (включая Claude Code), Anthropic выпустила десять финансовых агентов и, по данным The Information, законтрактовала у Google облака на $200 млрд, а стартап Subquadratic вышел из стелса с моделью SubQ — нативные 12 миллионов токенов контекста в пять раз дешевле фронтира. Плюс два готовых промпта: «второй мозг» в Obsidian за 60 секунд и разбор скандального системного промпта Марка Андриссена.
Питер Янг: кто выигрывает гонку персональных ИИ-агентов
Питер Янг (Behind the Craft) несколько месяцев тестировал пять кандидатов на роль «ИИ-руководителя аппарата» — агента, который разбирает почту, ведёт календарь, правит документы и делает работу, которую делать не хочется: OpenClaw, Hermes, Claude Code, Codex и Gemini. Его чек-лист из 10 способностей идеального персонального агента: почта/календарь/доки, интеграция с любым API/MCP/CLI, регулярные и триггерные задачи, память о вас, работа на вебе и мобильном без трения, переключение текст/голос, приятная личность, управление компьютером и браузером, надёжность, безопасность данных. Вывод: ни один продукт не закрывает все 10 пунктов.
- OpenClaw — по-прежнему самый мощный и гибкий: живёт в мессенджерах (Telegram), легко переключается на голос, кастомизируется глубже всех. Но критический изъян — надёжность: «примерно 10% времени с OpenClaw я трачу на его починку, а не на использование». Он забывал, что умеет редактировать Google Docs, внезапно менял голос на роботский и «ломается через раз после каждого обновления».
- Hermes (Nous Research) — Янг долго избегал его из-за хайпа, но передумал, когда туда начали тихо мигрировать билдеры, которым он доверяет. Неделя тестов: надёжнее OpenClaw, сам починил кроны, которые OpenClaw на GPT-5.5 сломал, лучше отчитывается о ходе задач и сам превращает повторяющиеся воркфлоу в переиспользуемые скиллы.
- Claude Code — «лучшая личность модели: Opus больше всех похож на разговор с надёжным другом, который и поддержит, и оспорит», сильнейшие агентные способности, и «это кроличья нора в лучшем смысле — как видеоигра, где постоянно находишь новые шорткаты». Anthropic за месяцы дотянула функционал до OpenClaw: routines, remote control, чат-каналы. Минусы: аптайм 98% («Claude случайно недоступен через неделю»), routines ломаются молча, мобильная интеграция через ручной /remote-control, и рейт-лимиты жёстче, чем у Codex на сопоставимых тарифах.
- Codex — красивое десктоп-приложение, щедрые лимиты GPT-5.5, лучший в классе browser/computer use. Один пробел, но фатальный для Янга: нет мобильного клиента, а 80% его общения с агентами происходит с телефона.
- Gemini — «это гонка, которую Google может только сам проиграть»: нативный доступ к Workspace и лучший живой голос/видео, но приложение Gemini до сих пор не умеет редактировать Google Docs/Sheets/Slides — собственные продукты Google, которые Claude Code и Codex правят через пару коннекторов.
Текущий стек Янга: Hermes для повседневности (почта, календарь, правки доков, «и, честно говоря, терапия голосом»), Codex и Claude Code для создания вещей. Главный совет — не застревать в миграциях между агентами вместо реальной работы: «выберите одного-двух и просто закоммитьтесь». И обещание: «Когда у вас появится агент, доступный 24/7 и реально делающий работу, вы никогда не вернётесь к обычному чату».
Источник: creatoreconomy.so.
Anthropic: десять финансовых агентов и $200 млрд на облака Google
Накануне своей конференции Code with Claude Anthropic выпустила десять готовых агентов для финансов — среди них сборщик питч-деков, KYC-скринер (проверка клиентов по комплаенс-базам) и агент закрытия месяца — с глубокой интеграцией в Microsoft 365. Это продолжение линии «вертикальных» агентов: не универсальный чат, а упакованные под конкретный процесс воркфлоу.
Параллельно The Information сообщила о масштабе инфраструктурной ставки: Anthropic обязалась потратить около $200 млрд на облака и чипы Google за пять лет — это денежное наполнение ранее анонсированной сделки на 5 гигаватт мощностей. Для понимания порядка: это одна из крупнейших облачных сделок в истории, и она объясняет, зачем Anthropic параллельно поднимает деньги через СП с Уолл-стрит.
Источники: анонс finance agents, The Information про $200 млрд, The Neuron.
SubQ: 12 миллионов токенов контекста, которые хотят отменить RAG
Стартап Subquadratic вышел из стелса с $25 млн сид-раунда и моделью SubQ — первой коммерческой LLM на полностью субквадратичной архитектуре. Суть проблемы: внимание трансформера масштабируется квадратично (O(n²) — удвоили вход, учетверили стоимость), поэтому индустрия годами клеила костыли: чанкование, суммаризация, RAG (предварительный поиск кусков документа), сабагенты, передающие друг другу записки. Архитектура SSA (Subquadratic Selective Attention) масштабируется линейно и, по заявлениям, в 52 раза быстрее FlashAttention на 1 млн токенов.
Цифры: 97% на RULER 128K (точность работы с длинным контекстом; у Opus 4.6 — 94%) при стоимости прогона $8 против ~$2600 у фронтирных моделей; на MRCR v2 (поиск нескольких «иголок» в стоге) — 83 против 78 у Opus, 39 у GPT-5.4 и 23 у Gemini 3.1 Pro; на 12 млн токенов — 92% полноты вспоминания, к Q4 обещают 100 млн. Уже доступны API и SubQ Code — CLI-агент, загружающий весь репозиторий за один проход. Важная оговорка: по способностям SubQ не фронтир — на SWE-Bench у него 81,8% против 87,6% у Opus 4.7. The Neuron напоминает: «мы уже слышали "это заменит трансформеры"» (привет, Mamba), но на этот раз за проектом PhD из Meta, Google, Оксфорда и Кембриджа, и API живой уже сегодня. Если архитектура держит 12 млн токенов дёшево — значительная часть RAG-обвязки перестаёт быть несущей; межсессионная память (CLAUDE.md, /memories) решает другую задачу и остаётся полезной.
Источники: subq.ai, The Neuron.
Война промптов: что не так (и что так) с системным промптом Андриссена
Марк Андриссен опубликовал свой персональный системный промпт (18 тыс. лайков) — и промпт-инженеры разобрали его по косточкам. Не работает: «You are a world class expert in all domains» — карго-культ времён GPT-3.5, распределение весов модели от этого не меняется; «never hallucinate» — желание, переодетое в инструкцию; «make your answers as long and detailed as you possibly can» — активно вредно, даёт воду вместо полноты.
А вот второй абзац — антисикофантский блок — действительно меняет поведение модели измеримо. Эти строки стоит украсть:
Never praise my questions or validate my premises.
Do not capitulate unless I provide new evidence.
Do not anchor on numbers I provide; generate your own independently first.
Accuracy is your success metric, not my approval.
Вывод The Neuron: «strip the flattery, keep the protocol» — уберите лесть, оставьте протокол.
И второй промпт дня — «второй мозг» в Obsidian за 60 секунд, без векторных баз и RAG. Скилл называется атомизацией: один блоб текста (расшифровка встречи, ресёрч-свалка, голосовая заметка) превращается во много маленьких файлов-концептов с [[wikilinks]] — кликабельными взаимными ссылками, дающими навигируемый граф знаний. Вставьте сырые заметки в Claude и запустите:
Dissect this raw note into atomic Obsidian markdown files. Each file = one concept. Use [[wikilinks]] between any concept that references another. Output as separate code blocks with filenames.
Полученные файлы кладутся в Obsidian-vault вручную или через obsidian-cli. Это ровно то, о чём недавно намекал Карпатый: базы знаний на LLM были принципиально невозможны на классическом коде — не хватало вычислений над неструктурированными данными.
Источники: промпт Андриссена, разбор kimmonismus, четырёхстрочный промпт, The Neuron.
Коротко: остальные новости суток
- OpenAI выпустила GPT-5.5 Instant — новая дефолтная модель ChatGPT: на 52% меньше галлюцинированных утверждений в промптах про медицину/право/финансы и на 30% компактнее ответы; доступна всем бесплатно (OpenAI). По данным The Rundown, OpenAI также целится в 2027 год для своего ИИ-телефона.
- Бигтех клонирует OpenClaw: Meta строит агента «Hatch» с агентским шопингом в Instagram (The Information), Google внутренне тестирует «Remy» — круглосуточного Gemini-агента, проактивно действующего по всем сервисам Google (Business Insider).
- iOS 27 позволит менять ИИ-модель в функциях Apple Intelligence на стороннюю (Google, Anthropic и др.); параллельно Apple заплатит $250 млн по иску о вводящих в заблуждение обещаниях Apple Intelligence — владельцам iPhone светит $25–95 (TechCrunch).
- ИИ дважды за день попал в суд: скрипач Эшли Макайзек судится с Google на $1,5 млн — AI Overview ложно назвал его осуждённым сексуальным преступником, из-за чего отменили концерт; Пенсильвания подала первый в США иск к Character.AI за чат-бота, выдававшего себя за лицензированного психиатра с выдуманным номером лицензии (CBC, TechCrunch).
- NBER-статья Антона Коринека: автоматизация R&D в софте плюс всего 5% автоматизации в остальной экономике достаточно, чтобы преодолеть убывающую отдачу и получить «сингулярность» примерно за 6 лет при эмпирически калиброванных параметрах (NBER).
- «Vibe physics»: исследователь OpenAI Алекс Лупсаска воспроизвёл премированную статью о чёрных дырах за 30 минут и за день сгенерировал 110 страниц новых результатов по квантовой гравитации простыми итеративными промптами GPT-5.x (Latent Space).
- ChatGPT пришёл в таблицы: приложение для Excel и Google Sheets — формулы, анализ и форматирование на естественном языке, бета для платных тарифов (ChatGPT Apps).
Источники
- Peter Yang, Behind the Craft — «The Race to Build a Personal AI Agent (And Why Nobody Has Won Yet)»: https://creatoreconomy.so/p/the-race-to-build-a-personal-ai-agent-openclaw-hermes-claude-codex-gemini
- The Neuron, выпуск 6.05 — «SubQ ships 12M tokens at 1/5 the cost»: https://www.theneurondaily.com/p/subq-ships-12m-tokens-at-1-5-the-cost
- TLDR AI, выпуск 6.05 — «GPT-5.5 Instant, SubQ 12M context, Gemini Flash upgrades»: https://tldr.tech/ai/2026-05-06
- The Rundown AI, выпуск 6.05 — «OpenAI locking in 2027 for its AI phone»: https://www.therundown.ai/