Убыток OpenAI $38 млрд, OpenRouter Fusion и локальные модели для кода Публичный пост

16 июня 2026 192

За 2025 год OpenAI потеряла $38,5 млрд — это почти втрое больше её выручки. И всё это прямо перед выходом на биржу. А рядом тихо случилось кое-что полезное: топ-качество ответов теперь можно собрать из дешёвых моделей за половину цены. Ещё в выпуске — как кодить локально без подписок и как одной командой превратить Claude в целый отдел.

Главное за 30 секунд

OpenAI за 2025-й потеряла $38,5 млрд при выручке $13 млрд — токены пока дотируют, и это намёк на рост цен впереди.
OpenRouter Fusion смешивает несколько дешёвых моделей и обгоняет одиночный фронтир — качество топ-модели за половину денег.
Локальные модели уже тянут ежедневный кодинг: связка Qwen 3.6 и хорошего харнесса заменяет подписку на простых задачах.
Salesforce купила ИИ-агента поддержки Fin за $3,6 млрд — гонка за такими агентами перешла в стадию поглощений.
42 штата вызвали OpenAI повесткой перед самым IPO — давят по рекламе, данным и защите детей.

Внедряем и улучшаем

Картинка из ChatGPT → редактируемый дизайн в Canva. Сгенерировали картинку в ChatGPT, а потом переделываете её под каждый формат заново? Теперь можно один раз отправить её в Canva и дальше править там.

Как сделать:

В десктопном ChatGPT откройте Настройки → Apps → Browse Apps и добавьте Canva.
Начните новый чат и сгенерируйте картинку — например пост или инфографику.
В том же чате наберите @Canva и нажмите Enter, чтобы ChatGPT подтвердил приложение. Затем напишите:

Now turn it into a new @Canva project.

Когда Canva создаст проект, попросите пересобрать под другой формат:

Okay, now resize that as a new @Canva project for a story post.

Дальше правьте прямо из чата: меняйте текст, раскладку, отступы, делайте новые версии.

Важно: без @Canva в начале ChatGPT воспримет фразу как обычный текст и не отправит её в приложение (гайд The Rundown).

Бесплатный набор Anthropic превращает Claude в целый отдел. Anthropic выложила открытый репозиторий knowledge-work-plugins. Он делает из Claude набор ролей: продажи, маркетинг, финансы, юристы, данные, продукт, поддержка, продуктивность. Каждая роль добавляет свои скиллы, слэш-команды и подключения к инструментам.

Как поставить (Claude Desktop, режим Cowork):

Один раз добавьте маркетплейс:

claude plugin marketplace add anthropics/knowledge-work-plugins

Поставьте одну роль для начала:

claude plugin install sales@knowledge-work-plugins

Вместо sales подставьте marketing, finance, legal, data, product-management, customer-support или productivity.
3. Вызовите команду роли, например /sales:call-prep или /marketing:seo-audit.
4. Подключите роли нужные инструменты: CRM, аналитику, документы.

Совет: начните с одной роли, доведите её до ума и только потом добавляйте остальные. Под себя плагин докручивается своей терминологией и процессами (репозиторий Anthropic).

Сначала план, потом переписать: новый ритм работы с ИИ-кодом. ИИ-агент пишет код не лениво, а наоборот — слишком старательно. Ему написать 200 строк так же легко, как 2 строки импорта. Поэтому он всё реализует с нуля там, где человек взял бы готовую библиотеку. Код формально верный, но раздутый.

Из этого автор выводит сдвиг: проверять такой код стало дорого, а переписывать — дёшево. Та же модель, что нагородила лишнее, быстрее всех это и упростит.

Рабочий цикл:

Больше времени на план заранее: что вообще должно существовать, какие берём библиотеки, каков объём.
Дайте агенту реализовать.
Выкатите в тестовое окружение и посмотрите, что получилось.
Найдите код, которого быть не должно: где 100 строк — это 10, где фича пока не нужна.
Попросите ту же модель это упростить или заменить библиотекой.

Практический вывод: в ревью продавливайте сильнее. Раз переписать теперь не страшно, режьте всё, что «многовато», не дожидаясь долгих споров. Как говорит автор, «модель, создавшая проблему, — самый быстрый способ её починить» (ishmeetbindra).

Локальные модели уже тянут ежедневный кодинг — вот как. Большой тред на Hacker News (887 голосов) подвёл итог: локальные модели в середине 2026-го годятся для повседневного кода, но не для всего. Консенсус: лучшие локальные модели идут где-то между Claude Haiku 4.5 и Sonnet 4.5. Это «джуниор, которого надо вести», а не «сеньор, думающий с тобой над архитектурой».

Кому подходит: личные проекты, приватные данные, рутина, чётко нарезанные задачи. Кому нет: сложный дизайн в большом коде и работа «запустил и ушёл».

Что советуют ставить:

Qwen 3.6-27B (плотная) — лучшая по качеству кода, но медленнее; берите квант Q6–Q8.
Qwen 3.6-35B-A3B (MoE) — золотая середина по скорости и размеру, самая популярная.
Gemma 4 — вторая по любви, особенно для не-кодинга; берите QAT-квант.
DeepSeek V4 Flash через API — не локально, но «95% качества за 5% цены»; у людей выходит ~$1–8 в месяц.

Железо: рабочий минимум — одна RTX 3090 на 24 ГБ или Mac с 48 ГБ. «Фронтир-подобно» начинается со 128 ГБ единой памяти на Mac. Скорость хороших сборок — 50–150 токенов в секунду, это уровень облака.

Главный приём дня — гибрид: дорогая модель пишет подробный план, локальная реализует кусками, дорогая ревьюит. Так вы платите за облако только на сложных 10%. Один из участников: «Если Opus даёт ускорение в 15 раз, локальный Qwen — в 5. И это бесплатно — всё равно поразительно» (Ask HN).

Claude Code веером поднимает субагентов-finder'ов, каждый в своём окне контекста

Субагенты или один сжатый поток: как агент держит контекст. Любая реальная работа агента — это управление контекстом. Подходов два, и Codex с Claude Code держат их по-разному.

OpenAI (Codex) — «оракул»: один длинный поток, который постоянно сжимается. Когда токены переполняют окно, модель ужимает старое и оставляет только важное. Поток остаётся связным, мелкие детали не теряются. Окно держит около 200К и всё равно не плывёт на долгих задачах.

Anthropic (Claude Code) — «фирма»: задача дробится на подзадачи, каждый субагент работает в своём окне и возвращает наверх только нужное. Claude охотно плодит субагентов — например, поднимает Explore на Haiku, чтобы быстро просканировать код.

Плата за субагентов реальна: они часто дублируют работу и роняют факты. Если субагент решил, что факт «не стоит возвращать», в контексте его больше нет. Отсюда Claude иногда «забывает» очевидное, хотя вроде всё исследовал. Зато кажется быстрее: токены идут параллельно.

Что с этим делать на практике:

Разбивайте на субагентов то, что реально параллелится: разведка по коду, широкий ресёрч, веерное ревью.
Держите один поток там, где важна связность и память на мелкие детали из начала задачи.
Не верьте слепо отчёту субагентов. Агент «упустил очевидное» — переспросите, факт мог не дойти до родителя (calv.info).

Агент OpenCode сам создаёт ветку и pull request, человек мёржит — лента git-сервера

Безопасный автономный агент: за PR-гейтом и в песочнице. Инженер собрал домашнюю станцию, где ИИ-агент сам правит его серверы, но не может ничего сломать. Принцип переносится на любой проект и стоит того, чтобы его перенять.

Связка: агент OpenCode живёт на отдельной виртуалке, у него свой git-пользователь с отдельными ключами. Он может создавать ветки и пушить, но не может пушить в ветку деплоя. Дальше человек сам открывает и мёржит pull request, а выкатывает уже GitOps.

Две защиты, которые тут главное:

PR-гейт: ничего не уезжает в прод без ручного ревью и мёржа.
Изоляция радиуса поражения: виртуалка видит интернет и git, но не видит живые сервисы. Поэтому автору не страшно дать агенту даже root на этой виртуалке.

Зачем: обновление десятка контейнеров раньше занимало часы, теперь это пара минут на просмотр PR. Уровень продвинутый — нужен опыт с виртуалками, своим git и Docker. Но сам принцип «агент за PR-гейтом, в песочнице с малым радиусом» полезен каждому (rsgm.dev).

Инструменты и штуки

Бенчмарк DRACO: связки моделей в OpenRouter Fusion обгоняют одиночный фронтир

OpenRouter Fusion. Отправляет ваш запрос сразу нескольким моделям, а отдельная модель-судья сводит их ответы в один сильный. На бенчмарке глубокого ресёрча DRACO связка Fable 5 и GPT-5.5 дала 69,0% — выше одиночного Fable 5 с его 65,3%. А «бюджетная» тройка Gemini 3 Flash, Kimi K2.6 и DeepSeek V4 Pro взяла 64,7% — почти как Fable, но за половину денег. Платите как за сумму всех вызовов, и ответ идёт в 2–3 раза дольше. Брать стоит там, где цена ошибки выше пары лишних запросов: ресёрч, экспертная критика, важные решения. Для кода это не замена основной модели, а инструмент, который она вызывает на сложных вопросах. Рядом OpenRouter завёл Subagents: основная модель на ходу отдаёт мелкие подзадачи дешёвым моделям (OpenRouter).

FastContext от Microsoft. Маленькая модель на 4 млрд параметров, которая работает «разведчиком» по репозиторию для кодинг-агентов. Идея простая: чтение и поиск по коду съедают почти половину токенов основного агента. FastContext берёт это на себя — параллельно шарит по файлам и возвращает точные ссылки на строки. Расход токенов главного агента падает до 60%, а доля решённых задач растёт до 5,5%. Лицензия MIT, ставится на свой сервер. Пока заточена под харнесс Mini-SWE-Agent, не под Claude Code (Hugging Face).

Headroom. Сжимает то, что летит в модель: выводы инструментов, логи, куски файлов из поиска. Экономит 60–95% токенов, не теряя качества ответа. Open-source, бесплатно. Полезно всем, кто гоняет агентов на длинных задачах и упирается в лимиты (GitHub).

Opik. Превращает упавшие прогоны агента в разбор: что именно сломалось, предложенный фикс, перезапуск и постоянный тест на регресс. Open-source. Нужная штука, когда агент работает в проде и тихо ломается (GitHub).

Knowledge Graph Extractor. Берёт документы, ссылки или zip и строит интерактивную карту связанных фактов. Помогает увидеть связи в куче разрозненных файлов — удобно для ресёрча и сборки учебных материалов. Open-source, есть демо (GitHub).

Guardians. Проверяет план агента на соответствие правилам безопасности ещё до запуска. Под капотом формальная проверка: математически доказывает, нарушает ли воркфлоу политику. Open-source. Нишево, но любопытно тем, кто пускает агентов на чувствительные действия (GitHub).

Claude Code для Visual Studio. Энтузиаст сделал нативную интеграцию Claude Code в Visual Studio 2026: окно диффа, кнопки принять/отклонить, диагностика компилятора, живая панель статистики. Нужен установленный Claude CLI. Для тех, кто живёт в Visual Studio, а не в VS Code (GitHub).

machine0. Даёт постоянные виртуалки NixOS или Ubuntu, которыми управляешь из командной строки: выделенные ресурсы, статический IP, поминутная оплата. Удобно как изолированная песочница для автономных агентов и воспроизводимая среда разработки (machine0).

CrankGPT. Самая весёлая штука дня. Гоняет локальную модель, пока вы крутите педали или ручку. Никакого облака — токены генерируются буквально на вашей мускульной силе. Приватно, бесплатно и абсурдно. Заодно напоминание, сколько энергии стоит каждый токен (CrankGPT).

GrassDx. Бывший ветеринар собрал бесплатный сервис, который по фото газона и почтовому индексу ставит диагноз и выдаёт план лечения с конкретными средствами. Узко, но показательно: ИИ-диагностика по фото уже уходит в самые бытовые ниши (GrassDx).

Генератор спрайт-листов на Codex. Браузерный инструмент для сборки 2D-сцен и генерации спрайт-листов, где Codex автоматизирует анимацию: композиция сцены, слои, живой предпросмотр. Бесплатно, прямо в браузере. Приятная находка для инди-геймдева (GitHub).

Новости и тренды

OpenAI: минус $38,5 млрд за год. Журналист Эд Зитрон опубликовал аудированную отчётность OpenAI, заверенную Financial Times. За 2025 год компания потеряла $38,5 млрд — почти в 8 раз больше, чем в 2024-м. Выручка — $13,07 млрд, расходы — $34 млрд, операционный убыток — $20,9 млрд. Майкрософту за год заплачено $17,2 млрд, из них $10,6 млрд — похоже, за обучение моделей.

Что это значит: токены сейчас дотируются с огромным минусом. Это прямой намёк, что дешёвый инференс временный, и цены на доступ к моделям, скорее всего, поползут вверх. Фон для IPO — тяжёлый (Where's Your Ed At).

Salesforce купила Fin за $3,6 млрд. Salesforce покупает Fin — ИИ-агента поддержки, выросшего из Intercom. Fin работает на своей модели Apex и, по данным Salesforce, сам закрывает в среднем 76% обращений. С ним приходят 30 тысяч клиентов. Платформа агентов Salesforce Agentforce уже на $1,2 млрд годовой выручки при росте 205%.

Что это значит: рынок ИИ-агентов для поддержки переходит от запусков к поглощениям. Автономный агент, закрывающий три четверти тикетов, в руках Salesforce — это автоматизация фронтлайна поддержки в очень большом масштабе (Salesforce).

Сага Fable: Anthropic поехала в Белый дом. Об отключении Fable 5 и Mythos 5 мы подробно писали 13–15 июня. Из нового: на выходных Anthropic отправила в Вашингтон старших сотрудников, включая сооснователя Тома Брауна, договариваться о восстановлении доступа. Советник Белого дома Дэвид Сакс заявил, что Амодеи отмахнулся от уязвимости как «несерьёзной» и чинить отказался. Semafor связывает запрет с опасениями, что к Mythos могла получить доступ китайская группа. В Европе на этом фоне вспыхнул спор о технологическом суверенитете.

Что это значит: доступ к мощной модели может исчезнуть за сутки по приказу сверху. Держите запасную модель и не стройте критичный процесс на одном поставщике. Бен Томпсон в Stratechery называет это «суперсилой безопасности» Anthropic: любое выгодное компании действие искренне подаётся как забота о безопасности (Stratechery).

42 штата вызвали OpenAI повесткой. Мы отмечали это давление 14 июня. Новое — повестку 12 июня вручила лично генпрокурор Нью-Йорка Летиция Джеймс от лица коалиции 42 штатов. Требуют документы по рекламе, приёмам удержания и работе с данными, включая данные о здоровье; отдельно интересуют обращение с детьми и пожилыми и «подхалимаж» чат-бота. Параллельно Флорида подала отдельный иск на 83 страницы, назвав Сэма Альтмана лично.

Что это значит: перед выходом на биржу на OpenAI давят по линии защиты потребителей. Такие расследования придётся раскрывать в проспекте — инвесторам это не нравится (Bloomberg).

Качество против цены: бюджетная смесь моделей почти догоняет фронтир за доли стоимости

«Сеть сильнее узла»: ансамбли против фронтира. Эндрю Траск выдвинул тезис: сети из дешёвых моделей теперь обгоняют любую одиночную топ-модель сразу по скорости, точности и цене. Аналогия — мейнфреймы 1960-х: все ставили на большие централизованные машины, а победила сеть. Каждую новую сильную модель сеть просто впитывает и снова обгоняет.

Что это значит: ставьте не на одну модель, а на маршрутизацию и ансамбли — под это уже есть OpenRouter Fusion из раздела выше. Самый дешёвый путь к топ-качеству теперь движущаяся цель: вышла новая дешёвая модель — пересобрали смесь (Andrew Trask).

Наделла про «токен-капитал». Сатья Наделла заявил: настоящий ров в ИИ не сама модель, а «токен-капитал» — то, что компания копит, прогоняя свои данные и результаты через систему. Модель — это движок; ценность в машине, построенной вокруг него. Каждой фирме нужны и человеческий капитал, и свой ИИ, которым она владеет.

Что это значит: не отдавайте свою ИИ-логику на сторону целиком. Стройте и держите у себя то, что накапливается — воркфлоу, оценки, память, внутренние циклы. Turing Post добавляет острую мысль: выиграют не фирмы с самыми «звёздными» по старым меркам сотрудниками, а структуры, дающие нестандартным людям корпоративный масштаб ресурсов (Turing Post).

NHS раздаёт Copilot 505 тысячам сотрудников. Государственная медслужба Англии раскатывает Microsoft Copilot на 505 тысяч человек. В пилоте на 30 тысячах он экономил по 43 минуты в день на каждого; цель — 5 млн сэкономленных часов в год на бумажной рутине.

Что это значит: реальная, измеренная польза ИИ в огромной организации — не в магии, а в возвращённом времени на админ-задачах. Считайте эффект в сэкономленных часах, а не в «вау» (TechRadar).

Rakuten: Claude Code срезал срок фичи вчетверо. Японский Rakuten развернул Claude Code и управляемых агентов на больших многоязычных репозиториях. Срок выкатки фичи упал с 24 рабочих дней до 5 — на 79%. Один автономный прогон рефакторинга на кодовой базе в 12,5 млн строк шёл 7 часов и дал 99,9% точности.

Что это значит: дисциплинированный агентный кодинг уже даёт такие цифры на корпоративном масштабе. Приём, который стоит украсть: гоните документацию, тесты и реализацию параллельными сессиями, а потом ревьюйте всё одним блоком (The Applied).

Коротко.

OpenAI собирает консультантов. Запущена Partner Network с Accenture, McKinsey, BCG, Bain и PwC — цель обучить 300 тысяч ИИ-консультантов к концу года (OpenAI). Консалтинг-гиганты становятся каналом продаж OpenAI.

Открытые модели для кода едут дальше. GLM-5.2 от Z.ai открыли всем подписчикам GLM Coding Plan, веса под MIT обещают через неделю; Moonshot выпустила Kimi K2.7-Code с минус 30% к расходу токенов на рассуждение (Hugging Face). Мы писали об обеих 13–14 июня — открытые модели продолжают догонять.

Снова ИИ-галлюцинации в суде. Судья в Миссисипи Шарион Эйкок отстранила четырёх адвокатов с обеих сторон: в документах нашлись выдуманные ИИ цитаты и несуществующие дела (Mississippi Today). Проверяйте за ИИ каждую ссылку и цитату — это уже не редкий курьёз.

Деньги в роботов Европы. Немецкая NEURA Robotics подняла Series C на €1,2 млрд, испанская Theker — $85 млн (EU-Startups). Физический ИИ в Европе заливают деньгами.