Аудит CLAUDE.md под Fable 5, skill engineering и IPO SpaceX  Публичный пост

11 июня 2026  8

Главная тема дня — не сам релиз Claude Fable 5 (о нём мы подробно писали 10 июня), а первые практические разборы того, как с моделью реально работать. Появился детальный гайд с замерами скорости, поведения «ручки усилия» и готовым промптом-аудитом для ваших файлов инструкций — он переворачивает привычные приёмы промптинга.

Параллельно оформляется новая дисциплина — «skill engineering»: как обучать и поддерживать сами навыки агентов, а не только промпты. А в индустрии — переподписанное вчетверо IPO SpaceX, заявка OpenAI на дата-центр за полтриллиона долларов и десяток свежих инструментов для тех, кто строит на агентах.

Гайд по Fable 5: «ручка усилия», скорость и почему ваш слой знаний устарел

Через сутки после выхода Fable 5 появился первый развёрнутый разбор для практиков — гайд Павла Хурина (Product Compass), построенный на шести собственных экспериментах за первые 36 часов. Главный вывод: новая модель не просто «умнее», она впервые начала оценивать ваши инструкции, а не слепо их исполнять.

Сильнее всего меняет привычки «ручка усилия» (effort dial). Замеры показали: ниже уровня max ручка почти не влияет на правильность ответа — модель сама подбирает глубину размышления. Лишние секунды на max покупают перепроверку и оговорки, а не другой результат. Практический вывод автора: ставьте по умолчанию high, а max — редкое исключение, когда действительно нужна максимальная самопроверка.

Отдельно автор разбирает жалобу первого дня — «Fable тормозит». По замерам, модель стартует примерно на 3 секунды позже Opus (первая активность на 7–8-й секунде против 4–5-й) — отсюда ощущение «ползёт». Но в полёте она, наоборот, плотнее: на той же задаче тратит около 40% меньше выходных токенов и часто заканчивает раньше. На тяжёлом мульти-файловом аудите разрыв исчезает совсем — 59 секунд против 63 у Opus, при этом Fable находит на треть больше проблем.

Замеры «ручки усилия» Fable 5: выше high прирост точности почти не растёт, из гайда Павла Хурина
Замеры «ручки усилия» Fable 5: выше high прирост точности почти не растёт, из гайда Павла Хурина

Важны и три «подводных камня» миграции с Opus 4.7/4.8, о которых стоит знать тем, у кого есть свои пайплайны. Во-первых, у Fable нельзя выключить thinking — пайплайны с thinking: disabled ради скорости вернут ошибку 400. Во-вторых, убрали параметр temperature — eval-наборы, перебирающие sampling-настройки, упадут. В-третьих, до 22 июня API-ключи не достают до модели: она доступна только на подписочных поверхностях (Claude Code, Cowork, приложения), так что окно тестирования командой планируйте заранее.

Таблица миграции с Opus 4.8 на Fable 5: у новой модели нельзя выключить thinking, из гайда Павла Хурина
Таблица миграции с Opus 4.8 на Fable 5: у новой модели нельзя выключить thinking, из гайда Павла Хурина

По бенчмаркам автор приводит конкретику, которой не было во вчерашнем анонсе: на FrontierCode Diamond (самые сложные невиданные задачи) Fable набирает 29,3 против 13,4 у Opus 4.8 — более чем вдвое, и примерно впятеро выше GPT-5.5. Честная сноска из system card: опубликованные баллы Fable уже включают её защитные механизмы, поэтому часть строк идёт чуть ниже закрытой Mythos 5.

Хурин уточняет и сюжет о «невидимых» ограничениях, который мы разбирали 10 июня. Он разделяет два разных механизма. Первый — видимая маршрутизация: на чувствительных темах (кибер, био-, химия) сессия переключается на Opus 4.8 с уведомлением, и это около 5% сессий. Второй — невидимая «тихая деградация»: по разделу 1.5 system card запросы, нацеленные на разработку самих фронтир-моделей, не перенаправляются, а тихо ухудшаются без всякого уведомления — заявленные ~0,03% трафика. Если ваша команда не претренит свои LLM, вы туда не попадёте, но прецедент важен: купленную модель могут приглушить по теме, молча.

Схема маршрутизации Fable 5 на Opus 4.8 по чувствительным темам, из гайда Павла Хурина
Схема маршрутизации Fable 5 на Opus 4.8 по чувствительным темам, из гайда Павла Хурина

Главный практический подарок гайда — мысль о том, что ваш слой знаний (CLAUDE.md, skills, файлы памяти) писался под более слабую модель и теперь тормозит новую. Запустив свой первый промпт на Fable, автор обнаружил в собственных файлах захардкоженную старую дату, правило-запрет на em-dash, написанное с em-dash, и устаревшие калибровочные константы. Перед тем как давать любой новой модели реальную работу, он советует прогнать аудит — дословный промпт приводим в разделе с туториалами (Product Compass).

Туториал: как промптить Fable 5 по утёкшему системному промпту

Два готовых к копированию материала дня — оба про то, как заставить Fable 5 работать как «операционную систему», а не как чат-бота.

Аудит-промпт для ваших файлов инструкций (от Павла Хурина). Это первое, что он советует запускать на новой модели — не задачу, а ревизию собственных CLAUDE.md, skills и memory-файлов. Модель ищет противоречия и устаревшие правила, но ничего не правит сама — решения об удалении остаются за вами:

Read your own instruction files (CLAUDE.md, skills, rules, memory files) end to end.

1. Where do they contradict each other? Quote both sides.
2. Which rules exist to manage a weaker model: guardrails for failure
   modes you don't have, recipes for things you no longer need spelled
   out, hardcoded facts that have drifted? List them with file:line.
3. Which rules teach by bad example: documents that violate the
   patterns they prescribe?
4. What would you delete? What would you keep exactly as is, and why?

Don't fix anything yet. Report first. I decide what gets cut.

Промптинг по утёкшему системному промпту Fable 5 (от The Neuron). В сети появилось публичное зеркало системного промпта модели (репозиторий CL4R1T4S). Относиться к нему стоит как к стороннему артефакту, но он совпадает с публичной линией Anthropic и даёт понятные ориентиры.

Главные выводы из разбора. По продуктовым вопросам (лимиты планов, цены API, имена моделей, возможности Claude Code) промпт велит модели сначала свериться со свежей документацией Anthropic — её собственные знания могут быть устаревшими; формулируйте запрос как «сначала проверь доки, потом объясни текущее поведение». Для высокоставочной работы нужен структурированный промпт: чёткие детали, положительные и отрицательные примеры, XML-теги, явные критерии «готово».

Ещё один нюанс: на неоднозначных запросах модель по умолчанию отвечает с разумными допущениями вместо уточняющих вопросов — это удобно в чате, но рискованно в проде, поэтому заранее задавайте аудиторию, формат, объём, разрешённые инструменты и требования к проверке. И по умолчанию Fable отвечает прозой без избыточного форматирования — если нужен извлекаемый вывод со списками и заголовками, просите об этом явно (The Neuron).

Skill engineering: следующий слой после промптов и контекста

Пока все обсуждают модели, Turing Post фиксирует тихий сдвиг в том, как устроена работа агентов. После промпт-инжиниринга и контекст-инжиниринга оформляется третий слой — skill engineering, то есть проектирование самих переиспользуемых навыков агента.

Идея в том, что навык — это не одноразовый промпт, а мини-процедура, которая говорит агенту не только что делать, но и как сделать это снова. Навыки ближе к программным артефактам: их можно версионировать, тестировать, шарить между агентами и обновлять при изменении воркфлоу. Чем дольше живёт агент и чем чаще повторяет задачи, тем ценнее придать его поведению стабильную, инспектируемую форму — это напрямую перекликается с механикой Claude Skills, которую осваивают в академии.

Сейчас навыки в основном пишут вручную или генерируют один раз LLM-ом, и практика остаётся бессистемной. В ответ появляется набор методов «систематического самоулучшения» навыков: SkillOpt от Microsoft обучает отдельный навык (рассматривает сам документ навыка как нечто, что можно «тренировать»), SkillOps управляет целой библиотекой навыков, а SkillMOO оптимизирует связки навыков именно под софтверных агентов. Подробный разбор каждого метода у Turing Post за пейволом, но сама рамка полезна как ориентир: вложения в качество навыков — это отдельный рычаг, помимо выбора модели. Важное предупреждение оттуда же: как только навыки становятся частью стека агента, они превращаются и в новую поверхность для ошибок и атак (Turing Post).

Инструменты дня

Spotlight by Backplanes — бесплатный трекер сессий, который анализирует запуски ваших агентов Claude Code и Codex и выдаёт инсайты для улучшения воркфлоу (для соло и команд). Прямо полезно тем, кто хочет понять, на что агенты тратят токены и время.

Publora — даёт вашему ИИ-агенту публиковать посты, комментировать и упоминать сразу в 10 соцсетях через единый MCP/API, убирая зоопарк отдельных OAuth-интеграций. Для тех, кто автоматизирует SMM через агентов.

Typeahead (typeahead.ai) — автодополнение во всех приложениях на Mac: учит ваш стиль письма локально, текст остаётся на устройстве. Полезно для приватного ускорения переписки и заметок.

Craft (craft.do) — приложение для заметок, задач и документов с нативной поддержкой ваших собственных ИИ-ключей (BYO) и MCP. Есть бесплатный план. Удобно тем, кто хочет подключить свою модель к личной базе знаний.

Extend UI (ui.extend.ai) — open-source вьюеры для тех, кто строит агентов по работе с документами: просмотр PDF, DOCX, таблиц, цитат, загрузок и e-signing. Бесплатно попробовать.

Shortcut (shortcut.ai) — строит и редактирует финансовые модели в Excel: формулы, LBO, DCF, трёхотчётные модели с журналом изменений (audit trail). Для аналитиков и тех, кто часто собирает модели в таблицах.

Paper (paper.design) — веб-нативный дизайн-канвас для команд, связывающий визуальный дизайн с кодом и агентными воркфлоу. Полезен дизайн-инженерам.

Shotblock (shotblock.vercel.app) — постановка 3D-сцен, планирование охвата камеры и экспорт аннотированных раскадровок с готовыми ИИ-промптами. Бесплатно попробовать; пригодится тем, кто делает ИИ-видео и хочет контроль над композицией.

Napkin Math — фото-дневник питания: распознаёт приёмы пищи по снимку и отслеживает прогресс к личным целям без ручного ведения. Для тех, кто хочет контролировать рацион без рутины.

Monako Glass — лёгкие умные очки на Linux со встроенным waveguide-дисплеем, позволяющие запускать ИИ-кодинг-агентов «hands-free» жестами. Ранний, но любопытный форм-фактор для разработчиков.

Советы и приёмы

Рекурсивное самоулучшение перестаёт быть теорией. Anthropic сообщает, что её инженеры выпускают примерно в 8 раз больше кода в день, чем несколько лет назад, и более 80% кода, попадающего в кодовую базу компании, пишет Claude, а не люди. Это продолжение темы RSI-отчёта, который мы разбирали 6 июня, но теперь с конкретными цифрами. Для учеников вывод простой: планка того, что один человек может построить с агентами, поднялась резко — и продолжает расти (Anthropic).

Не для всего нужна фронтир-модель. Тезис Matt Wolfe (Future Tools): для типовых задач — резюмировать документ, переписать письмо, разобрать голосовые заметки, брейнсторм — хватает небольшой локальной модели, а железо уже догнало спрос (пример — NVIDIA RTX Spark Superchip с 128 ГБ объединённой памяти). Плюсы локального запуска: приватность (промпты и файлы не покидают компьютер), офлайн, дешевле за токен и независимость от одной лаборатории. Практика: держите дешёвую/локальную модель дефолтом, а Fable 5 включайте точечно — там, где нужна именно автономная работа на часы (Future Tools).

Чат-боты пишут на удивление одинаково. В исследовании генерации историй четыре протестированных инструмента сошлись на одних и тех же 11 словах, именах вроде Elias и сюжетах про маяки — они встречались в 88,3% сгенерированных историй. Полезное напоминание для тех, кто делает контент: без явного запроса на оригинальность модель скатывается в усреднённые штампы, поэтому задавайте конкретные детали, имена и ограничения (Techpresso).

Коротко: остальные новости суток

IPO SpaceX переподписано вчетверо. Заявок собрали более чем на $250 млрд против цели в $75 млрд, при оценке компании в $1,8 трлн; цену в $135 за акцию ждут в четверг. Часть аналитиков винит сделку в «предмега-IPO сжатии ликвидности»: инвесторы распродают техакции и крипту, чтобы профинансировать заявки (Techpresso).

OpenAI присматривает дата-центр за полтриллиона. Компания ведёт переговоры об аренде планируемого 10-гигаваттного дата-центра в Огайо (девелопер SB Energy под контролем SoftBank). Полная застройка — минимум $500 млрд, аренда на 20 лет, гарантом по аренде и проектному финансированию выступит Nvidia; первая фаза на 800 МВт — к 2028 году (Techpresso).

GM выходит на рынок батарей для ИИ-дата-центров. Автопроизводитель разрабатывает натрий-ионную химию в партнёрстве со стартапом Peak Energy — такие ячейки дешевле и меньше склонны к перегреву, чем литиевые. Пробное производство — на Battery Cell Development Center в 2028 году (Techpresso).

Midjourney рассылает инвайты на первое железо. Студия генерации изображений начала приглашать пользователей на свой первый аппаратный запуск — намёк на выход за пределы картинок (Future Tools).

OpenAI запустила Economic Research Exchange. Площадку для изучения влияния ИИ на рабочие места и экономику (Future Tools).

Perplexity планирует IPO в 2028-м. Независимо от того, выйдут ли Anthropic или OpenAI на биржу первыми (The Neuron).

Apple расширила on-device ИИ. Компания представила третье поколение Foundation Models и расширила Private Cloud Compute на Google Cloud и инфраструктуру NVIDIA (The Neuron).

OpenAI добавила веб-поиск в API. Модели теперь могут искать актуальную информацию перед ответом прямо через API (The Neuron).

Standard Bots привлекла $200 млн. На производство роботизированных манипуляторов в США (The Neuron).

Шаг в квантовых вычислениях. Коррекция ошибок впервые отработала 90 повторяющихся циклов на машине из нейтральных атомов — продвижение к долгим вычислениям без потери данных (Techpresso).

Источники

Откомментируйте первым 👇

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб