Ловушка большого контекста, маховик с проверкой и дирижёр агентов Omnigent Публичный пост

14 июня 2026 126

«Миллион токенов контекста» — красивая цифра, но по делу это маркетинг. Модель внимательна примерно до сотни тысяч токенов, а дальше плывёт — и Claude Code начинает тупеть прямо посреди работы. Разберём, как держать его в «умной зоне» и не терять контроль над сессией. А заодно — как замкнуть агента на автономную работу без слитого бюджета и как собрать ИИ-помощника под свою профессию вообще без дообучения.

Главное за 30 секунд

Большое контекстное окно — это реклама: модель внимательна примерно до 100 тысяч токенов, дальше плывёт.
Автономного агента замыкает не доверие к модели, а дешёвая и быстрая проверка его результата.
Omnigent сводит Claude Code, Codex и других агентов в одну сессию с общим контролем и бюджетом.
Правительство США отключило Claude Fable — и теперь выясняется, что спусковым крючком был Amazon.

Внедряем и улучшаем

Не верь большому контексту — считай его бюджетом, а не складом. Цифра окна (200К, 1 млн, 2 млн токенов) — маркетинг. Реально модель внимательна примерно до 100 тысяч токенов. Дальше начинается «тупая зона»: она забывает то, что ты сказал пять минут назад. Это ограничение самого механизма внимания, большое окно его не лечит.

Для Claude Code это особенно больно. Пара чтений файлов, долгий дебаг, большой прогон тестов — и ты в тупой зоне ещё до обеда. На авто-сжатие сессии надейся осторожно: оно срабатывает, когда ты уже там побывал, а конспект пишет уже подсевшая модель.

Что делать: всё, что можно вынести из живой сессии, — выноси в отдельные файлы (план, ТЗ, скиллы). Когда контекст распух, начни новую сессию и передай ей спецификацию, которую написал сам. Так ты сам решаешь, что важно дальше, а не доверяешь это уставшей модели (garrit.xyz).

Маховик с проверкой: как отпустить агента в автономку и не прогореть. Полезная рамка от Turing Post. Есть лестница: жёсткий сценарий (одни и те же шаги), рабочий процесс (шаги плюс человеческое суждение в ключевых точках) и «маховик» — связка рабочих процессов, которая крутится к цели сама. Маховик не просто повторяется, он рулит — за счёт измерения результата.

Замкнуть петлю можно двумя способами. Неправильный — убрать человека и понадеяться. Так начинаются истории «мы развернули автономных агентов» и так заканчиваются самые позорные из них. Правильный — заменить человека проверяльщиком: тестом, проверкой схемы, сверкой с известными цифрами, метрикой. Суждение никуда не девается, ты просто кодируешь его в проверку один раз.

Дословно: «Петли замыкаются не там, где кто-то решил довериться модели. Они замыкаются там, где проверку сделали дешёвой, быстрой и объективной. Везде остальное остаётся человек». Что делать: пройдись по своим рабочим процессам и найди, где проверяющий — это лично ты. Где проверку можно удешевить и формализовать — туда и пускай агента. Где нельзя — оставайся в петле (Turing Post).

Урок «химика Claude»: как собрать помощника под свою профессию. Anthropic показала кейс: обычный Claude без всякого дообучения помогает химикам читать спектры и восстанавливать структуру молекул — местами на уровне и выше специального софта. Интересен не сам результат, а метод, который переносится на любую нишу.

Модель получала ровно тот же ввод, что специалист вставил бы в чат. Никакого дообучения. Целились не в само экспертное суждение, а в рутину вокруг него: перевод, припоминание, сборку данных. Там, где модель буксовала, её разблокировали одной доменной подсказкой. И всё рассуждение видно по шагам — эксперт может проверить.

Что делать, если строишь ИИ-помощника под свою область: бери топовую общую модель, давай ей сырые данные как есть, нагружай рутиной, а не финальным решением. И добавляй минимальный контекст ровно там, где она спотыкается (Anthropic).

Как обычный Claude без дообучения предсказывает ЯМР-спектры наравне со специальным софтом, из исследования Anthropic

Как не дать ИИ выхолостить твой текст. Знакомая беда: просишь модель вычитать текст, а она полирует его до стерильного гладкого ничто — без живого голоса. Китайский автор собрал против этого Claude-скилл и чек-лист типовых маркеров ИИ-письма: что вырезать и как сохранить «присутствие» автора за словами. Что делать: прогоняй свой ИИ-отредактированный текст по такому списку признаков и возвращай то, что модель причесала. Честно: материал на китайском и под Claude-агента, но сама идея и чек-лист легко переносятся на русский (GitHub).

Инструменты и штуки

Omnigent — надстройка над всеми твоими агентами сразу. Сводит Claude Code, Codex, Pi и собственных агентов в одну живую сессию. Их можно мешать в одной задаче: один пишет код, агент другого вендора проверяет. Сессию переносишь между терминалом, браузером и телефоном. Сверху — политики доступа и лимиты расходов. Работает с любой моделью и ключами, в том числе через OpenRouter и Ollama. Бесплатный, Apache 2.0, ставится одной командой. Полезно тем, кто рулит несколькими кодинг-агентами и хочет контроль над бюджетом и доступами (GitHub).

Paca — открытая замена Jira, где ИИ-агенты сидят в команде на равных. Не чатбот сбоку, а полноценный участник доски: агента назначают в спринт, он сам берёт задачи из списка и обновляет статусы. Есть MCP-сервер и скиллы для Claude Code (/paca, /paca-sprint, /paca-breakdown), управление задачами прямо из редактора. Self-hosted на своём сервере, бесплатно навсегда, Apache 2.0. Для тех, кто хочет вести проекты совместно с агентами (GitHub).

Paca: доска спринта, где ИИ-агент берёт задачу рядом с людьми

World of Claudecraft — целый браузерный MMO в стиле старого WoW, собранный с помощью Claude Code. 9 классов, данжи, арена, свой сервер-арбитр, база, тесты и боты для автопроверки. Это не игрушка-однодневка, а наглядный референс масштаба: что реально потянуть на Claude Code. Стоит склонировать, запустить офлайн-режим за пару команд и полистать структуру проекта как пример архитектуры. Код — MIT, бесплатно (GitHub).

Группа игроков на квесте в World of Claudecraft — MMO, собранной на Claude Code

Weave — умное слияние кода для тех, кто гоняет несколько агентов сразу. Обычный git ругается на конфликт, если два агента правят один файл, даже когда трогают разные функции. Weave разбирает код по сущностям — функциям и классам — и сливает их чисто: заявлено около 95% меньше ложных конфликтов. Ставится через brew install weave, есть и MCP-сервер, чтобы агент дёргал слияние сам. Бесплатно, Apache 2.0 (GitHub).

Weave сливает правки двух агентов в одном файле без ложного конфликта

SQL → ER-диаграмма — вставляешь SQL-схему, получаешь интерактивную схему базы данных. Всё работает прямо в браузере: запрос никуда не уходит, на сервер ничего не грузится. Удобно быстро понять чужую базу или показать свою. Без регистрации и установки, бесплатно (sqltoerdiagram.com).

SQL-схема превращается в интерактивную ER-диаграмму прямо в браузере

slopscan — оценивает, насколько проект писали с ИИ. Прогоняет историю коммитов и дерево файлов репозитория, ищет следы агентов — от текстов коммитов до папок вроде .cursor/ и CLAUDE.md. Полезно ревьюеру или перед тем, как брать чужую зависимость. Можно просто вставить ссылку на репозиторий на сайте или запустить локально. Open-source, MPL 2.0 (slopscan).

Новости и тренды

Claude Fable отключили — и спусковым крючком, похоже, был Amazon. 13 июня мы писали: США увели Fable и Mythos под экспортный контроль за «узкий джейлбрейк». Теперь WSJ назвал зачинщика. Гендиректор Amazon Энди Джасси сказал чиновникам, что его исследователи обошли защиту моделей и достали данные для кибератак.

Что это значит. Amazon — крупнейший инвестор Anthropic (~$8 млрд) и одновременно её облачный конкурент: AWS хостит чужие модели и строит свои. Урок жёсткий: арендованную топовую модель могут выключить за ночь, и помочь в этом способен даже ближайший союзник. Если строишь бизнес на одной закрытой модели — держи запасной вариант (WSJ).

Вышла GLM-5.2 — ещё одна открытая модель под кодинг. Китайская Zhipu выкатила модель, заточенную под агентный кодинг, с окном в 1 млн токенов и обещанием открыть веса под лицензией MIT на следующей неделе. Совместимость с Claude Code и другими агентами заявлена с первого дня. Что это значит: на контрасте с историей Fable открытые модели выглядят страховкой — их не выключат директивой. Но пока это анонс: ни весов, ни бенчмарков, ни числа параметров нет. Проверять стоит, когда выложат (Jie Tang).

42 штата взялись за OpenAI. Коалиция генеральных прокуроров во главе с Нью-Йорком вручила компании повестку: вопросы про рекламу, данные детей и пожилых, удержание пользователей. Что это значит: по OpenAI бьют ровно перед выходом на биржу. Худший момент — оценка может просесть, сроки уехать (NYT).

Meta лихорадит изнутри. На корпоративной трансляции сотрудник матом обозвал одного из ИИ-руководителей, инженеры зовут перевод в новый отряд «гулагом», Цукерберг признал «ошибки». Что это значит: у одного из крупнейших игроков турбулентность в ИИ-команде — на темпе релизов это ещё скажется (Wired).

TensorZero ушла в режим «только чтение» сразу после раунда $7,3 млн. Open-source платформа для работы с LLM ушла в архив, основатели вернули капитал инвесторам. Что это значит: молодой открытый инструмент в твоём стеке может умереть в любой момент — не завязывай критичные процессы на один сторонний проект без плана отхода (GitHub).

Полицейского в Британии поймали на фабрикации улик через ИИ. Офицер полиции Дербишира снят со службы — первое такое дело в уголовной системе страны. Лишнее напоминание: вывод ИИ нужно проверять, особенно когда на кону чья-то судьба (Sky News).

PwC: ИИ задирает медицинские счета. По прогнозу, ИИ станет одним из драйверов роста медрасходов в 2027-м. Парадокс: технологию продают как способ удешевить медицину, а пока она её удорожает (Fortune).

Google собрал дата-центр из 2000 старых смартфонов. Кластер из «пенсионных» телефонов гоняет около 100 параллельных задач машинного обучения и экономит встроенный углерод (Google Research).