Claude Fable 5, команда /goal в Claude Code и голосовой перевод Gemini Live  Публичный пост

10 июня 2026  24

Главная тема дня — Anthropic выложила новое поколение моделей: Claude Fable 5 для всех и Claude Mythos 5 для узкого круга кибердефендеров. Это та самая модель, чьи утечки под именем Mythos мы фиксировали ранее на неделе, — теперь это официальный релиз, доступный всем подписчикам и с заметным набором новых возможностей прямо в Claude Code.

Вокруг релиза сразу развернулась дискуссия о «невидимых» защитных мерах, которые могут тихо ослаблять модель. Помимо этого в выпуске: голосовой перевод Gemini в реальном времени, банки и инвестбанки массово запускают автономных агентов, Morgan Stanley открывает свои платформы внешним агентам через MCP, а Китай готовит план застройки ИИ-инфраструктуры почти на $300 млрд.

Claude Fable 5: топовая модель стала публичной

Anthropic выпустила Claude Fable 5 — самую способную модель, которую компания когда-либо открывала широкой публике, — вместе с Claude Mythos 5, версией для кибербезопасности. По заявлению Anthropic, Fable 5 показывает state-of-the-art почти на всех протестированных бенчмарках (разработка ПО, knowledge work, зрение, научные исследования), и её отрыв над конкурентами тем больше, чем длиннее и сложнее задача. Заметный прирост — над собственным Opus 4.8 и над GPT-5.5 (Anthropic).

Самые наглядные фишки — не баллы, а кейсы. В раннем тестировании Stripe за один день мигрировала кодовую базу из 50 млн строк на Ruby — задача, на которую у команды обычно уходят недели. На финансовом бенчмарке Hebbia (анализ уровня senior-аналитика) Fable 5 заняла первое место среди всех моделей, а в разборе The AI Report ключевым названо именно то, что модель перешла к автономной работе в масштабе целого рабочего дня, а не «минутных» подзадач.

Бенчмарки Claude Fable 5 в сравнении с Opus 4.8 и GPT 5.5 из рассылки The Rundown AI
Бенчмарки Claude Fable 5 в сравнении с Opus 4.8 и GPT 5.5 из рассылки The Rundown AI

Главное для учеников академии — цена самого Fable 5: $10 за 1 млн входных токенов и $50 за 1 млн выходных. Это примерно вдвое дороже Opus 4.8, так что под рутину старшую модель имеет смысл включать осознанно — там, где нужна именно автономная работа в масштабе целого дня. До 22 июня Fable 5 включён во все тарифы подписки Claude и тратит лимиты вашего плана без доплаты; после этой даты — отдельные usage-кредиты по той же цене (The Rundown AI).

Mythos 5 — это та же базовая модель, но с частично снятыми ограничениями по кибербезопасности. Обычному пользователю её не купить: модель раздают только проверенным «киберзащитникам» и провайдерам инфраструктуры через программу Project Glasswing в сотрудничестве с правительством США. Напомним: апрельский Mythos Preview был доступен лишь 150+ партнёрам и в тестах находил серьёзные уязвимости в крупных ОС и браузерах (The Rundown AI).

Важная деталь про безопасность: в публичном Fable 5 запросы по чувствительным темам (кибербезопасность, биология, химия) могут автоматически переадресовываться на Claude Opus 4.8. Anthropic прямо пишет, что Fable 5 «делит общий базовый движок с Mythos 5, но с дополнительными защитными мерами, особенно в кибер- и био-доменах» (Anthropic).

Claude Code: команда /goal и многодневные автономные сессии

Для практиков Claude Code главное — как модель ведёт себя в работе. В официальном письме Anthropic описывает Fable 5 как «опытного инженера»: модель сначала исследует кодовую базу, по ходу подтягивает нужный контекст и перепроверяет результат, прежде чем отчитаться о готовности (Anthropic, email).

Визуал выбора модели Claude Fable 5 через /model в Claude Code из письма Anthropic
Визуал выбора модели Claude Fable 5 через /model в Claude Code из письма Anthropic

Самое практичное нововведение — команда /goal. Вы описываете цель, а не шаги, и модель работает до выполнения условия завершения. Вторая сильная сторона — асинхронность: Fable 5 держит «многочасовые и многодневные сессии, не теряя нить». Выбор модели — через /model, конфигурация — в гайде по моделям Claude Code.

Anthropic даёт четыре конкретных совета по работе с моделью, и они меняют привычные приёмы промптинга:

Давайте цель, а не шаги. Опишите желаемый результат и дайте модели спланировать путь. Используйте /goal, чтобы Claude работал до достижения условия завершения.

Масштабируйте асинхронные задачи и уходите. Отдавайте работу, которую обычно дробите на части, — модель удержит контекст многочасовой и многодневной сессии.

Пропускайте «защитные» промпты. Больше не нужно писать «не забудь протестировать». Fable 5 сам ревьюит свою работу с меньшим количеством подсказок; качественная обратная связь работает лучше, чем списки инструкций по пунктам.

Отдавайте неоднозначные задачи. Поиск корневых причин, дебаг сбоев, архитектурные решения — модель надёжнее находит первопричину, а не симптомы (Anthropic, email).

Дискуссия вокруг релиза: «невидимые» ограничения Fable 5

Релиз сразу породил спор о прозрачности. Появился разбор, утверждающий, что Anthropic ввела защитные меры, которые в отдельных ситуациях тихо снижают эффективность Claude — например, когда конкурирующие лаборатории используют модель для разработки своих ИИ.

В отличие от обычных ограничений, эти меры, по утверждению авторов, не видны пользователю: модель не откатывается на другую и не предупреждает, а эффективность снижается через модификацию промпта, факторы стиринга и parameter-efficient fine-tuning. Anthropic оценивает охват в 0,03% разработчиков, но критики говорят о риске «цепочки поставок»: бизнес может не знать, столкнулся ли он с такой мерой (jonready.com).

Параллельно глава Microsoft AI Мустафа Сулейман назвал «реально, реально опасным» то, что Anthropic в инструкциях и конституции модели обсуждает потенциальное сознание Claude (The Verge). Аналитики предупреждают: неравномерно применяемые политики безопасности редко срабатывают хорошо и культивируют в экосистеме динамику «мы против них» (Interconnects). Тезис для учеников: чем автономнее модель, тем важнее понимать, какие невидимые ограничения на неё наложены.

Голосовой перевод Gemini 3.5 Live Translate

Google запустил Gemini 3.5 Live Translate — модель перевода речи в речь в реальном времени для 70+ языков, которая убирает неловкие паузы и сохраняет естественную интонацию и темп. Раскатка идёт через продукты Google: Meet (приватное превью) и Google Translate на Android и iOS, плюс доступ в Gemini Live API в публичном превью (Google).

Масштаб уже немаленький: агрегатор такси Grab тестирует перевод на более чем 10 млн ежемесячных голосовых звонков между водителями и пассажирами. Для тех, кто делает мультиязычный контент или поддержку, это готовый строительный блок без отдельной студии озвучки (Google).

Агенты выходят в продакшен: JPMorgan, Morgan Stanley и Perplexity

Тема дня в индустрии — переход агентов из демо в реальную работу. JPMorgan заявил, что развернёт автономных ИИ-агентов: по словам главного аналитика, в private-bank ИИ уже дал рост валовых продаж на 20%, и каждый банкир сможет обслуживать на 50% более крупную клиентскую базу (CNBC).

Morgan Stanley пошёл с другого конца и открыл свои платформы внешним ИИ-агентам через MCP (Model Context Protocol) — открытый стандарт, которым агенты подключаются к данным и инструментам. Это заметный сигнал: крупный инвестбанк делает ставку на агентную совместимость, а не на закрытый периметр (The AI Report).

Исследование Perplexity и Harvard о том, как агенты меняют умственный труд, из рассылки The Rundown AI
Исследование Perplexity и Harvard о том, как агенты меняют умственный труд, из рассылки The Rundown AI

Perplexity вместе с Harvard Business School опубликовала исследование на 10 тыс. идентичных запросов: агентный продукт Computer работал в среднем 26 минут против 33 секунд у обычного Search. Но если учесть «доделывание» руками, тот же Search-воркфлоу обходится в 269 минут против 36 минут у Computer. Половина задач к агенту — это создание чего-то нового (вдвое чаще, чем у Search), а работа вне профильной области пользователя выросла до 59% (Perplexity Research).

Туториалы и промпты

Dexter: open-source агент для финансового ресёрча. The Rundown разобрал, как поднять Dexter — исследовательского агента, который читает отчёты о прибыли, интерпретирует документы SEC и подтягивает свежие рыночные данные, сокращая время ресёрча вдвое.

Шаги: склонировать репозиторий Dexter на GitHub и поставить на ноутбук или VPS; добавить API-ключ OpenRouter, OpenAI или Anthropic, затем ключ Financial Datasets в окружение; запустить research job с промптом. Промпт дословно:

Create a source-backed research brief on GOOGL. Focus on what the company
does, recent catalysts, financial or operating signals, key risks, competitive
context, and what I should investigate next. Use iterative research. Validate
important claims before finalizing the brief

Затем попросите сохранять промежуточные результаты, чтобы воркфлоу не терял контекст, и используйте /heartbeat для регулярного watch-листа. Pro tip: можно подключить Dexter к аккаунту X, чтобы он добавлял в бриф настроения из Twitter (гайд The Rundown).

Самоэволюционирующий оркестратор на динамических workflow Claude Code. Команда Evo перенесла свой autoresearch-оркестратор на динамические workflow Anthropic в Claude Code: шестишаговый раунд вынесли из in-context памяти модели в детерминированный JavaScript, который субагенты исполняют со свежим scoped-контекстом.

Это решает проблему соблюдения инструкций на длинном горизонте, делая «метод — это код»: фазы, ширина fan-out, правила остановки, гейты и CLI-вызовы скриптуются. Формула — «модель занимается суждениями, а код — координацией». Развитие подхода harness/«оркестрация вместо автономии», который мы разбирали ранее на неделе (через TLDR AI).

Инструменты дня

North Mini Code — первая open-source агентная модель для кодинга от Cohere: MoE на 30B параметров с 3B активных, лицензия Apache 2.0. Заточена под эффективную агентную разработку в средах «суверенного ИИ». Полезна тем, кто хочет гонять кодинг-агента локально или на своём железе (Cohere).

Kimi Work — десктоп-агент от Moonshot, который запускает до 300 параллельных агентов. Для тех, кто строит массовые агентные пайплайны и упирается в параллелизм (The Rundown).

Perplexity Agent API (Search as Code) — новая архитектура поиска для агентов: поисковый стек разбит на композируемые блоки, которыми агент управляет через код и собирает оптимальный пайплайн под каждую задачу. На задаче по 230+ CVE Perplexity заявляет 100% точность против <25% у не-Perplexity систем и снижение стоимости на 85% (42,9k токенов против 288,7k). Quickstart, открытый раннер эвалов.

agmsg — позволяет Claude Code, Codex, Gemini CLI и Copilot CLI общаться напрямую через общую базу SQLite, убирая ручной copy-paste между кодинг-агентами. Полезно тем, кто гоняет несколько CLI-агентов одновременно (Techpresso).

Krisp Voice Translation API — убирает фоновый шум, конвертирует акценты и транскрибирует голосовые звонки в реальном времени; для разработчиков, строящих инструменты чистой коммуникации (Techpresso).

hora Calendar — нативное Mac-приложение в меню-баре: показывает ближайшие события Google Calendar и даёт подключиться к Meet, Zoom или Teams в один клик, не гоняя данные через сторонние серверы (Techpresso).

FlashMemory — ретривер для DeepSeek-V4, который предсказывает нужные чанки KV-кэша и держит на GPU только ~10–15% кэша без потери качества. Нишевый, но любопытный инструмент для тех, кто оптимизирует инференс (GitHub).

Советы и приёмы

Бенчмарки врут без учёта test-time compute. Способности LLM теперь — функция от объёма вычислений на инференсе. Пример: GPT-5.5 выглядит лишь чуть лучше GPT-5.4 на max-compute кибер-эвалах, но существенно сильнее, если по оси X контролировать токены, стоимость или задержку. Практический вывод: одиночная цифра из бенчмарка всё менее информативна — смотрите на кривую «качество против затрат» (через TLDR AI).

Текст — это полноценный слой оптимизации. Промпты, контекст, память, retrieval-хранилища и harness'ы работают как реальные механизмы обновления модели. Авторы предлагают относиться к оптимизации текста как к «sample-efficient learning». Для учеников это аргумент в пользу того, что вложения в промпт-инжиниринг и архитектуру контекста дают эффект, сопоставимый с дообучением (yoonholee.com).

Автоматизация всего цикла рождает «agent slop». Когда инженерный ИИ-цикл отдают агентам целиком, они начинают оптимизироваться против несовершенных эвалов и упускают нюансы, которые знает только разработчик. Вывод: держите человека на проверке эвалов, иначе агент «выиграет» метрику, но проиграет по сути (через TLDR AI).

Кейс West Monroe: ИИ-поддержка работает, когда подключена к системам. Консалтинг с 2000+ сотрудников внедрил агентную платформу Moveworks внутри Teams и Slack, связав её с ServiceNow, Workday и Salesforce. Результат за год: 8000 закрытых тикетов и ещё 4000 ускоренных, минус 40% затрат на подрядчика ($1,4 млн в год), а установка ПО упала с 3–4 дней до менее 30 минут. Урок: автоматизируется не «чат», а сквозной доступ к системам-владельцам данных (Moveworks).

Коротко: остальные новости суток

OpenAI конфиденциально подала на IPO. Создатель ChatGPT подал форму S-1 в SEC, хотя заявил, что сроки не зафиксированы и компания может дольше оставаться частной. Это всего через неделю после раскрытия IPO-заявки Anthropic; последняя оценка OpenAI — свыше $850 млрд (Techpresso).

Китай готовит ИИ-стройку на $295 млрд. Пекин планирует потратить ~2 трлн юаней за пять лет на общенациональную сеть дата-центров, закупая не менее 80% техники у местных фирм (Huawei) и вытесняя Nvidia. Объединить площадки в единую сеть планируют к 2028 году силами China Mobile и China Telecom (Bloomberg).

Google гарантирует чип-сделку Anthropic на $35 млрд. Google выступает гарантом платежей по аренде чипов Anthropic на пяти дата-центрах — роль Anthropic в этом финансировании ранее не раскрывалась. Ещё один штрих к тому, как переплетены альянсы крупных игроков (через TLDR AI).

ЕС обязал Meta открыть WhatsApp для конкурентов. Еврокомиссия ввела временные антимонопольные меры: Meta должна бесплатно вернуть сторонним ИИ-ассистентам доступ к WhatsApp Business API. Плату Meta признали «экономически неустойчивой для конкурентов»; мера действует до июня 2029-го, штраф за нарушение — до 10% глобальной выручки (France 24).

Microsoft и Mayo Clinic строят ИИ для здравоохранения. Компании разрабатывают отдельную модель под медицинские задачи — заявка на специализированный, а не универсальный ИИ в клинике (The AI Report).

DeepSeek рвётся по объёму токенов. Доля DeepSeek по токенам на AI Gateway подскочила с менее 1% до 17% за месяц, тогда как доля по расходам осталась около 1%. Дешёвый инференс набирает объём, но деньги по-прежнему у дорогих моделей (через TLDR AI).

OpenAI добавил интерактивные графики в ChatGPT. Теперь ChatGPT строит встроенные графики прямо из данных в чате — мелочь, но удобно для быстрой аналитики (OpenAI в X).

Apple показала iOS 27. Обновление сделало ставку на производительность и доработку дизайна, а не на громкую фичу: регулировка прозрачности Liquid Glass, новый CPU-планировщик для старых iPhone, перестроенные Spotlight, поиск и Mail. Siri на движке Gemini, о которой мы писали 9 июня, в ЕС задержат из-за DMA (Techpresso).

Нью-Йорк обязал помечать ИИ-актёров в рекламе. Первый штат, требующий раскрывать использование синтетических актёров; штраф $1000, инициативу поддержал профсоюз SAG-AFTRA (AP News).

Судья в Миссисипи отменил процесс из-за ИИ. Адвокаты обеих сторон сослались на несуществующие, «галлюцинированные» дела — судья оштрафовал каждого на $1000–3500 и отстранил от дела (404 Media).

Codex автоматизирует ферму на Хоккайдо. OpenAI показал фермера, который на ChatGPT и Codex построил управление теплицами по тексту, спутниковый мониторинг 100 гектаров и бота для чата фермы — пример «всегда доступного инженера» для не-технарей (ChatGPT Pro).

Крупные раунды на ИТ-эффективность. NinjaOne подняла расширение Series C при оценке $12,3 млрд, PointFive — $60 млн Series B. Обе делают платформы, снижающие ИТ- и облачные расходы; капитал идёт туда, где ИИ «съедает» стоимость стека.

Пентагон внёс Alibaba, Baidu и BYD в список 1260H. Ведомство относит трёх крупнейших ИИ-игроков Китая к поддерживающим военных — сигнал перед возможным ужесточением торговых ограничений (Techpresso).

Маск раскрыл дизайн ИИ-спутников SpaceX. Спутник AI-1 — первая версия планируемой орбитальной сети из 1 млн аппаратов для ИИ-вычислений: в основном солнечные панели, радиатор и лазерные линки, проще Starlink (Techpresso).

Откомментируйте первым 👇

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб