Agent-native GitHub, Lockdown Mode в ChatGPT и Claude в АНБ Публичный пост

7 июня 2026 157

Главная тема дня — как меняется сама роль разработчика: глава продукта GitHub Марио Родригес рассказал, что только за март агенты открыли 17 млн pull request'ов, и описал, во что превращается GitHub в эпоху, когда код пишут не только люди. Параллельно OpenAI выкатила «Lockdown Mode» — режим жёсткой защиты ChatGPT от атак через скрытые инструкции, всплыли подробности о работе самой мощной модели Anthropic в АНБ, а большие деньги на вычисления потекли по новым руслам — от сделки Google со SpaceX до дата-центров Meta в палатках. Разбираем по порядку.

GitHub становится «agent-native»: большое интервью Марио Родригеса

Главный сюжет суток — большое интервью Марио Родригеса, директора по продукту GitHub. Он описывает перелом, который случился примерно в декабре 2025-го: модели стали достаточно хороши, чтобы им можно было по-настоящему делегировать крупные задачи, а не нянчиться с каждым шагом. Раньше это напоминало присмотр за малышом — «нет-нет, не туда, сделай вот так». Теперь, по его словам, можно сказать агенту «иди и работай — это безопасно» и получить результат высокого качества.

Сдвиг изменил саму манеру работы. Разработчики стали гораздо больше «макро-делегировать» и микро-управлять только при необходимости — процесс превратился из исправления ошибок в итеративное создание. И масштаб этого виден в цифрах: только за март, по словам Родригеса, агенты открыли 17 миллионов pull request'ов. При этом у GitHub более 630 млн посетителей в месяц, и весь жизненный цикл разработки компаундится — больше коммитов тянут за собой больше PR, запусков Actions и сканов безопасности.

Свою философию GitHub формулирует фразой «low floors, high ceilings» — низкие полы, высокие потолки. ИИ снижает порог входа в создание софта: инструменты творчества получают намного больше людей (Родригес приводит метафору — в мире могли быть десятки Моцартов, но не у всех был доступ к фортепиано). Одновременно поднимается потолок: профессионалы создают всё более сложное. Вывод компании — «GitHub должен стать agent-native инженерной системой» для всего этого континуума, а его миссия переписывается с «коллаборации разработчиков» на коллаборацию «разработчиков и агентов».

Технически это означает переход от UI к UX и дальше к AX — agent experience. Анонсированное приложение Copilot вводит идею «холстов» (canvases): интерфейс становится двунаправленным — он отдаёт инструменты агенту, агент их читает и влияет на интерфейс, а пользователь правит холст и тем самым направляет агента. «Как художник, ты формируешь что-то в реальном времени, а агент помогает тебе это формировать», — описывает Родригес.

Отдельно он спорит с модным нарративом про «управление 50 агентами одновременно». Сам он держит в работе 1–3 задачи: «Я не могу следить за пятьюдесятью вещами сразу». И формулирует жёстко: «Параллелизация без ценности — это как ездить по кругу». Важно не число потоков, а то, что именно ты создаёшь и где проявляешь суждение. Разработчиком, по его мысли, становится любой builder, который через ИИ и платформы вроде GitHub превращает замысел в результат.

Практичный для учеников блок — про деньги. Copilot с 1 июня перешёл на оплату по факту использования (usage-based billing), и агентные сессии жгут много токенов. GitHub предлагает дисциплину расходов: режим Auto с семантической маршрутизацией (простой вопрос уходит в маленькую модель, а не во фронтирную), новую лёгкую модель MAI Code One Flash для простых задач, а фронтирные модели — только под тяжёлый reasoning.

Отдельный инструмент — Chronicle: он сохраняет сессии в облако и позволяет спросить «помоги сократить затраты» или «что я делаю неэффективно». Родригес сам так делал — система указала ему, что он не переключил модель и плохо управлял контекстом. Для команд это ещё и вопрос предсказуемости расходов, который индустрии предстоит решать сообща.

Главный вывод Родригес держит на человеке: «Мы назвали это Copilot не просто так — не Pilot». Он уверен, что создание всегда будет включать человека в петле; форма петли будет меняться, как с автопилотом в машинах, но сама петля останется. Полная расшифровка — в материале Turing Post, видеоверсия — на YouTube.

OpenAI выкатывает Lockdown Mode против prompt-injection

OpenAI запускает Lockdown Mode — опциональную настройку безопасности в ChatGPT с усиленной защитой от prompt-injection. Это атаки, при которых злоумышленник прячет вредоносные инструкции на веб-странице или в документе, чтобы обманом заставить ИИ слить данные или сделать что-то нежелательное — растущая угроза именно для агентных сценариев, где модель сама ходит по сайтам и файлам.

Что меняется при включении: полностью отключаются Deep Research и Agent Mode, блокируется подгрузка и показ картинок из интернета, бот не может скачивать файлы. Ручная загрузка файлов и генерация изображений при этом продолжают работать. Механика простая — режим ограничивает сетевые запросы, через которые атакующий мог бы вытащить данные, а не пытается «вычистить» сами инъекции из обрабатываемого контента.

Важная для учеников деталь: режим доступен всем личным аккаунтам, включая бесплатный тариф. Если вы даёте ИИ-агенту доступ к чувствительным данным и одновременно пускаете его в открытый веб — это ровно тот случай, когда стоит понимать, что такое prompt-injection и зачем нужен жёсткий режим.

Mythos в АНБ: Anthropic и наступательный кибер

По репортажу Financial Times, Anthropic разместила около шести инженеров в АНБ, чтобы развернуть там Mythos — свою самую мощную модель — для наступательных кибер-операций. Это та самая модель из нашумевшего сюжета: мы писали ранее на неделе про утечку «Оцеануса» и про закрытый доступ к Mythos. Публично её Anthropic выпускать отказалась из-за рисков злоупотребления, ограничив доступ проверенными партнёрами через коалицию Project Glasswing (туда входят Microsoft, Apple и Amazon).

Сюжет острый из-за контекста: АНБ продолжало пользоваться Mythos, несмотря на то что Anthropic судится с Пентагоном. Поводом стала метка supply-chain risk от министра обороны, а до этого сорвался контракт на $200 млн — стороны разошлись по вопросам автономного оружия и ограничений на внутреннюю слежку. История показывает, как модель, которую лаборатория считает слишком опасной для открытого релиза, всё равно оказывается в руках спецслужб — и какой будет реальная политика доступа к фронтирным моделям.

Деньги на вычисления: Google платит SpaceX и палатки-дата-центры Meta

Гонка за вычислениями вышла на новый уровень. Google подписал сделку, по которой будет платить SpaceX около $920 млн в месяц с октября 2026 по июнь 2029 за доступ примерно к 110 000 GPU NVIDIA плюс сопутствующую инфраструктуру. Схема повторяет более раннюю сделку SpaceX с Anthropic, который платит $1,25 млрд в месяц за дата-центр Colossus 1 под Мемфисом. В договоре есть жёсткие условия: если SpaceX не уложится с поставкой GPU к 30 сентября 2026, Google сможет расторгнуть контракт или взять меньше железа по сниженной цене.

Meta тем временем решает проблему мощностей буквально на ходу — строит дата-центры в палатках. Возле New Albany (Огайо) компания разместила шесть таких объектов, заменив планы по капитальным зданиям на то, что называет «структурами быстрого развёртывания». С апреля по июнь поставлено пять палаток по 125 000 кв. футов — против двух-трёх лет, которые ушли на первые пять зданий площадки. Под питание Meta подписала десятилетний контракт на автономные (off-grid) электростанции, а дополнительные палатки ставит на своей ИИ-площадке в Теннесси.

Трамп присматривается к доле в OpenAI

Администрация Трампа и CEO OpenAI Сэм Альтман ведут переговоры о передаче правительству США доли в компании — по данным источников, разговор идёт уже больше года. По обсуждаемой схеме OpenAI пожертвует часть акций для создания «Public Wealth Fund» (Фонда общественного благосостояния): идея из апрельского policy-предложения компании — фонд инвестировал бы в долгосрочные активы и делил доход с гражданами.

Условия пока не согласованы. Трамп заявил журналистам, что «части могут быть отданы американскому народу», и анонсировал встречу с ИИ-компаниями в ближайшее время. Если сделка состоится, это станет необычным прецедентом отношений государства и частной ИИ-лаборатории.

Инструменты дня

Agent Mode on Arena (arena.ai/agent) — позволяет бенчмаркать автономных ИИ-агентов сразу на нескольких фронтирных моделях, которые параллельно выполняют реальные многошаговые задачи (браузинг, ресёрч, кодинг). Полезно тем, кто выбирает, какой модели доверить агентный воркфлоу, и хочет сравнить их на одной задаче.

MAI-Image-2.5 (microsoft.ai/models/mai-image-2-5) — собственная модель Microsoft для генерации и редактирования изображений: точечные локальные правки, аккуратный рендеринг текста на картинке и сохранение идентичности объектов между правками. На Arena стартовала №2 по редактированию и №3 по text-to-image; доступна разработчикам в Microsoft Foundry и на OpenRouter, есть быстрый вариант Flash. Для тех, кто делает визуалы и устал от того, что модель «перерисовывает» всё при малейшем изменении.

Manus Shopify Connector (manus.im/integrations/shopify-manus) — даёт продавцам строить, вести и продвигать магазин Shopify полностью через разговор на естественном языке: Manus генерирует витрину, заводит товары и описания, а Shopify работает «под капотом» как коммерческий слой. Релевантно всем, кто ведёт коммерцию и хочет автоматизировать рутину магазина.

Google Search Profiles (анонс, как завести) — официальные профили в поиске Google для авторов и брендов: можно завести отдельный профиль под каждую свою идентичность (личный бренд, подкаст и т.п.) и собрать в одном месте свои статьи, видео и соцпосты, чтобы вас проще находили в Поиске и Discover. Пока только в США.

Советы и приёмы

ИИ почти закрыл research-grade математику. В новом тесте из 100 экспертных математических задач, составленных 49 математиками, ИИ-инструменты решили всё, кроме двух. Это показывает, насколько близко модели подошли к рассуждению уровня исследователя — и одновременно намекает, где ещё остаётся человеческое преимущество.

Когда агент пишет себе тесты — это привычка, а не польза. Исследование показало: когда ИИ-агенты во время багфикса сами пишут тесты, изменение частоты тест-писания не улучшает результат значимо. Практический вывод: не принимайте «агент написал тесты» за гарантию качества — это может быть ритуал, а не реальная проверка. Тесты всё равно стоит просматривать самому.

ИИ-оценщики со временем «ломаются». Ещё одна работа: инструменты, которые имитируют разные человеческие точки зрения для оценки ответов модели, со временем становятся непоследовательными. То есть статичные универсальные методы тестирования недостаточно надёжны, чтобы судить, реально ли ИИ согласуется с человеческими ценностями — оценку нужно периодически пересматривать.

Новый метод файнтюна для логики. Подход под названием Discrete Tilt Matching заметно улучшает решение логических головоломок вроде судоку и Countdown, не теряя в обычных математических бенчмарках — небольшой, но любопытный шаг к моделям, которые лучше держат строгую логику.

Стоит почитать: Claude как жёсткий критик. В рекомендациях недели всплыл разбор «Turn Claude into a Brutally Honest Critical Thinking Partner» — про то, как настроить Claude быть не поддакивающим ассистентом, а честным спарринг-партнёром, который разносит ваш план. Готового промпта в анонсе нет, но идея полезна для учеников: сам пост.

Коротко: остальные новости суток

xAI месяцами училась на ответах Claude. По сообщениям, xAI Илона Маска тренировала свои coding-модели на выводах Claude, прежде чем ей отрезали доступ. Сюжет добавляет красок к тому, как лаборатории относятся к чужим моделям как к источнику обучающих данных.

Нью-Йорк ввёл мораторий на дата-центры. Легислатура штата приняла годовой мораторий на строительство дата-центров — на фоне бума ИИ-инфраструктуры регуляторы начинают притормаживать экспансию.

Рейд Хоффман уходит из совета Microsoft. Сооснователь LinkedIn покидает совет директоров Microsoft после почти десяти лет.

Акции Meta падают на новостях о финансировании ИИ. Бумаги компании просели на сообщениях о том, что Meta может привлечь десятки миллиардов долларов на ИИ-экспансию — рынок нервно реагирует на масштаб капзатрат.

Источники

Turing Post — интервью Марио Родригеса (GitHub): статья, видео
Techpresso — выпуск от 6 июня: веб-версия
AI Skill of the Week — «Turn Claude into a Brutally Honest Critical Thinking Partner»