«Чат мёртв»: OpenAI собирает суперапп, моделям прописали «сон» и чёрная дыра данных Дваркеша  Публичный пост

9 июня 2026  42

Главная тема дня — OpenAI публично хоронит формат чат-бота. Компания подтвердила, что сливает ChatGPT, кодинг-агента Codex и браузер Atlas в единое десктопное «суперприложение», а один из её топов прямо заявил: «Chat is dead». Это прямой удар по Anthropic и её Claude Code — и сигнал всем, кто строит работу вокруг ИИ, что ставка смещается с «поболтать» на «поручить и проверить».

Параллельно сразу две исследовательские работы предлагают нейросетям «поспать», чтобы перестать забывать выученное, Дваркеш Патель объясняет, почему люди учатся в миллион раз эффективнее моделей, а Apple наконец признала свой ИИ-кризис и сажает новую Siri на движок Google Gemini. Плюс — Claude в роли химика, свежие инструменты для агентного кодинга и практические выводы про экономику ИИ-разработки.

«Чат мёртв»: OpenAI перестраивает ChatGPT в агентный суперапп

Самый громкий сюжет суток. OpenAI подтвердила, что готовит крупнейшую переработку ChatGPT с момента запуска: в ближайшие недели на десктопе и в вебе чат-бот превратится в единое «суперприложение» (superapp), которое объединит сам чат, кодинг-агента Codex и ИИ-браузер Atlas в одном интерфейсе.

Предыстория объясняет, зачем это. К концу 2025 года продукты OpenAI расползлись: ChatGPT жил отдельно, Codex отдельно, Atlas — где-то ещё. Сэм Альтман объявил внутренний «code red» и приказал прекратить разрастание. Внутренняя записка CEO по приложениям Фиджи Симо была прямой: «Fragmentation has been slowing us down and making it harder to hit the quality bar we want» — фрагментация тормозит и мешает держать планку качества.

Тезис, который задаёт тон всему сюжету, сформулировал глава команды основного продукта Тибо Соттьо: «Chat is dead». По его словам, суперапп даст каждому пользователю персонального агента, доступного с мобильного, десктопа, в вебе и даже голосом в машине. Стратегию единой платформы курирует президент OpenAI Грег Брокман, коммерцию — Фиджи Симо.

Новый ChatGPT будет активно подталкивать к Codex, автономным агентам, генерации картинок и сторонним приложениям — по данным Financial Times, редизайн поведёт пользователей к партнёрским сервисам вроде Canva и Booking.com. Модель «суперприложения» не нова: так устроены китайский WeChat и Grab в Юго-Восточной Азии — одна платформа для чата, поиска, продуктивности, платежей и коммерции.

За разворотом стоят и деньги, и конкуренция. Codex вырос в 6 раз — до 5+ млн пользователей с февраля. OpenAI подала конфиденциальную заявку S-1 в SEC при оценке выше $300 млрд, и ей важно нарастить долю платящего бизнеса: два миллиона компаний уже дают 40% выручки, цель — довести до 50% к листингу.

Почему это важно для академии. По сути OpenAI повторяет путь Anthropic: Claude Code был прорывным продуктом, который затем «упаковали» для широкой аудитории через Cowork, и к февралю 2026-го он вышел на ~$2,5 млрд годовой выручки, отъедая у OpenAI лидерство среди разработчиков. Теперь гонка идёт не за «самый умный чат», а за то, чей агент удобнее встроить в реальную работу. Тэглайн свежего ТВ-ролика OpenAI — «It's time to fly».

Кадр нового ТВ-ролика OpenAI «It's time to fly», продвигающего Codex и ИИ-агентов вместо привычного чата
Кадр нового ТВ-ролика OpenAI «It's time to fly», продвигающего Codex и ИИ-агентов вместо привычного чата

Claude примеряет халат химика

Небольшой, но показательный сюжет про то, как фронтирные модели заходят в естественные науки. Anthropic опубликовала исследование, в котором Claude предсказывает ЯМР-спектры (NMR — ядерный магнитный резонанс, базовый метод определения структуры молекул) на уровне специализированных программ, а иногда и точнее их.

Если коротко: вариант модели Opus 4.7 в среднем аккуратно предсказывал химические сдвиги водорода и углерода и стабильно воспроизводил результаты — то есть конкурировал с профильными инструментами вроде ChemDraw и MestReNova. Более того, Claude умеет идти в обратную сторону: предлагать химическую структуру по спектральным данным — задача, которая обычно требует тяжёлого специализированного софта.

Вывод для учеников простой: «универсальная» языковая модель всё чаще оказывается рабочим инструментом в узких профессиональных доменах, а не только в тексте и коде. Это повод проверять, не закрывает ли уже Claude часть вашей предметной рутины. Подробности — в исследовании Anthropic.

Зачем нейросетям «сон»: continual learning снова в центре

Глубокий сюжет для тех, кому интересно, куда движутся сами модели. На прошлой неделе вышли сразу две научные работы с почти одинаковым названием — «Do Language Models Need Sleep?» (25 мая, CMU и Мэрилендский университет) и «Language Models Need Sleep» (2 июня, исследователи, связанные с Google). Совпадение неслучайное: тема continual learning (непрерывного обучения) вернулась в центр исследований.

Проблема старая. Когда модель доучивают новой задаче, она часто становится хуже в старой — это называют «катастрофическим забыванием». Но у больших языковых моделей задача шире: как оставаться актуальными, специализироваться под пользователя и учиться на опыте после развёртывания, ничего при этом не ломая.

Метафора «сна» означает не отдых, а офлайн-фазу консолидации. Ключевая идея: «There needs to be a phase between seeing something and changing from it» — между «увидел новое» и «изменился под него» нужна отдельная фаза. Модель не сразу переписывает себя под каждый запрос, а накапливает опыт и затем в фоне решает, что из него заслуживает сохранения.

Работа CMU смотрит со стороны вычислений: длинный контекст дорог, потому что растёт KV-кэш, и простого сжатия недостаточно — модели нужны офлайн-проходы по недавнему контексту, чтобы глубже его обдумать. Главный тезис: «memory is not only storage, it is processing» — память это не только хранилище, но и обработка. Работа от Google предлагает двухшаговую схему: «Knowledge Seeding» закрепляет краткосрочное знание в стабильных параметрах, а «Dreaming» прогоняет синтетические данные, чтобы «отрепетировать» выученное.

Здесь сходятся теория и практика. Обновление памяти ChatGPT под названием «Dreaming», которое мы подробно разбирали 6 и 8 июня, — ровно такая «system-side» консолидация: модель синтезирует ваш профиль в фоне, а не хранит плоский список заметок. Это не значит, что непрерывное обучение в самих весах уже решено, но давление одинаковое: «memory cannot remain a static list of notes forever». Автор обзора ждёт несколько прорывов в continual learning уже в этом году. Полный разбор — в Turing Post.

Чёрная дыра данных: эссе Дваркеша о сэмпл-эффективности

Дваркеш Патель выпустил эссе, которое полезно прочитать всем, кто хочет понимать ИИ глубже хайпа. Его главный тезис: прогресс последних лет дала не возросшая «сэмпл-эффективность» моделей (умение учиться на малом числе примеров), а гигантское расширение и улучшение распределения данных, на которых их учат.

Сэмпл-эффективность Патель определяет так: «сколько данных нужно увидеть в области, чтобы действовать в ней свободно и компетентно». И по этому показателю люди опережают модели в тысячи и миллионы раз. Человек слышит около 2000 слов в час — за всю жизнь до взрослости это примерно 200 миллионов токенов. Фронтирные модели обучают на десятках и сотнях триллионов токенов — разрыв «близок к миллиону раз».

Откуда тогда успехи? Из данных. RL Патель называет разновидностью генерации синтетических данных: «вы тратите много вычислений против верификатора, чтобы найти „хорошие“ данные», а затем учите модель их воспроизводить. Для каждого навыка нужны сотни живых экспертов, пишущих примеры и рубрики, — целая индустрия разметки на «миллиарды в год, скоро десятки миллиардов». Образно: «мы собираем чудовище Франкенштейна из миллиарда аккуратно пришитых друг к другу примеров».

Отсюда и центральная метафора эссе: «Мы видим эти ИИ как галактику, сверкающую способностями, но в её центре, невидимая глазу и удерживающая все созвездия вместе, — невообразимо массивная чёрная дыра данных».

Но дальше Патель делает неожиданный поворот: для бизнеса лабораторий это может быть и неважно. Рутинные задачи инженера, аналитика, бухгалтера легко «загнать в распределение» через RL, и кривые выручки показывают огромную ценность, даже если человеческую эффективность так и не повторили.

Логика простая: обучение дорого, но «знание амортизируется на миллиарды сессий», поэтому можно учить модель абсурдно неэффективно и всё равно оставаться в плюсе. А вот профессии, где каждый день встречаются задачи «далеко от распределения» (по мнению автора, сюда входит и разработка ПО), автоматизировать будет куда труднее — он даже ставит на то, что спрос на программистов-людей в 2028 году окажется выше нынешнего. Полный текст.

Apple очнулась: секретная встреча и Siri на движке Gemini

Всплыли подробности о том, как Apple проспала ИИ-волну и что теперь с этим делает. По данным расследования, в начале 2025 года прошла закрытая встреча топ-менеджеров, которую созвал тогдашний COO Джефф Уильямс без участия Тима Кука, — именно там компания признала кризис после провала Apple Intelligence и затянувшейся переделки Siri.

Дальше пошли кадровые сдвиги. Чинить Siri вызвался создатель Vision Pro Майк Роквелл, заменив руководство своей командой visionOS; прежний глава ИИ Джон Джаннандреа был отодвинут, а на его место пришёл экс-руководитель из Google Амар Субраманья. Главная же деталь: по сообщениям, новая Siri будет работать на моделях Google Gemini и в Google Cloud.

На WWDC Apple наконец показала обновлённую Siri — более разговорный, контекстный ассистент, работающий между приложениями, с упором на обработку на устройстве и Private Cloud Compute. Сюжет важен как симптом: даже Apple с её ресурсами предпочла опереться на чужую фронтир-модель, лишь бы быстрее закрыть отставание.

Туториалы и промпты

Агент-охотник за лидами на Codex: 5 квалифицированных контактов в день. The Rundown разобрал, как собрать на Codex систему, которая каждый день находит пять подходящих проспектов, ранжирует их и предлагает следующий шаг для аутрича, отдавая отчёт с причинами соответствия.

Шаги по порядку: скачать Codex, создать папку и попросить агента завести структуру (reports/, prospects.csv, burned_sources.csv, source_queue.md). Затем пусть Codex проинтервьюирует вас о вашем идеальном клиенте промптом: «Here is my company, offer, and URL: [COMPANY], [OFFER], [URL]. Interview me about my ICP and sales process».

Пробный прогон запускается одним промптом (дословно):

Use my ICP brief to find five qualified prospects today. Inspect sources first.
Build a longlist, reject weak matches, return the best five, create a dated report
in reports/, append accepted leads to prospects.csv, and update burned_sources.csv

Дальше это превращают в навык Prospect Finder по расписанию на будни плюс второй навык, который ранжирует найденных и пишет персонализированный аутрич. Совет автора: добавьте еженедельное обновление источников, чтобы агент искал свежие, а не майнил один и тот же список бесконечно.

Иллюстрация к разбору агентного поиска лидов на Codex из рассылки The Rundown AI
Иллюстрация к разбору агентного поиска лидов на Codex из рассылки The Rundown AI

Видео в Google Flow без слива всех кредитов. Туториал дня от Пола Дж. Липски про студию ИИ-видео Google Flow. Главный приём — workflow намеренно начинается с картинок, потому что генерация изображений дешевле по кредитам, и только потом картинки превращают в видео и сшивают в сцены.

Рабочий цикл: создать проект и сгенерировать изображения (выбрав модель, соотношение сторон и число выводов); править их кликом внутрь и описанием правки («change the blue blanket to orange»); использовать предыдущий кадр как референс через «+», чтобы держать персонажа консистентным; переключиться с image на video, прикрепить референс и описать действие; сшить клипы в сцену через «add clip», подрезая на таймлайне. Главный совет по экономии: всегда смотрите, во сколько кредитов обойдётся генерация, перед запуском. Для ориентира: на Pro-плане дают 1000 кредитов в месяц, на Ultra — 10 000.

Инструменты дня

Boxes (boxes.dev) — даёт каждой сессии Claude Code или Codex отдельный изолированный облачный компьютер, чтобы агентный кодинг шёл без конфликтов; работать можно с мобильного или десктопа. Есть бесплатный тариф. Прямо релевантно тем, кто гоняет несколько агентов параллельно.

LangSmith Sandboxes (langchain.com) — та же идея на корпоративном уровне: аппаратно-изолированные микро-ВМ, где агент безопасно исполняет недоверенный код, держит состояние и гоняет сложные воркфлоу, не трогая прод. Для тех, кто выводит агентов в production.

Google Labs / Flow (labs.google) — обновлённый набор экспериментов Google: Flow (студия ИИ-видео), Stitch (превращение наброска в UI) и Pomelli (генератор брендового маркетингового контента). Всё бесплатно на этапе раннего доступа.

Reve 2.0 — новая 4K-модель генерации изображений с правками на основе разметки макета (layout-based editing). Полезна дизайнерам и тем, кто делает визуалы с точным контролем композиции.

Ideogram 4.0 (ideogram.ai) — выдаёт картинки в 2K с плотным и аккуратным рендерингом текста на разных языках и точным размещением объектов через bounding box. Есть бесплатный тариф, платные — от $8/мес. Хороша, когда на изображении нужен читаемый текст.

Browse.sh — каталог переиспользуемых рецептов автоматизации браузера, которые учат ИИ-агентов выполнять веб-задачи; ставится через CLI browse. Для тех, кто строит браузерных агентов и не хочет описывать каждый сценарий с нуля.

Microsoft Scout (testingcatalog.com) — всегда активный агент для участников программы Frontier, усиливающий автоматизацию в стеке Microsoft 365: многошаговые рутины, доступ к локальным файлам, поддержка моделей OpenAI и Anthropic. Пока доступ ограничен, но это заявка Microsoft на «постоянных» агентов против конкурентов.

Советы и приёмы

ИИ-кодинг дешевле, чем кажется, только из-за субсидий. Разбор экономики (на 39 минут чтения) утверждает, что лаборатории, возможно, тратят больше $1000 на каждые $100, что вы им платите. Программирование с LLM сейчас работает только потому, что подписки сильно субсидируются; серьёзные сценарии с циклами и «размышлением» через API стали очень дороги. Практический вывод: закладывайте рост цен и проектируйте процессы так, чтобы не сжигать токены впустую.

Дайте агентам конкурировать — и они умнеют. Исследователи из Harvard, MIT и Kempner Institute построили «экономику» из ИИ-агентов: те участвуют в аукционах, платят друг другу, копят «богатство» за хорошие результаты и банкротятся при неэффективности. Стартовав со слабых агентов, система резко выросла на бенчмарках — например, на математике с 15,9% до 57,0%, в науке лучший прогон с 5,0% до 20,0%. Идея в том, что конкуренция и отбор между агентами могут быть отдельным рычагом качества помимо размера модели.

Схема из работы «Economy of Minds»: агенты-LLM торгуются, платят друг другу и банкротятся, а система в целом растёт на бенчмарках
Схема из работы «Economy of Minds»: агенты-LLM торгуются, платят друг другу и банкротятся, а система в целом растёт на бенчмарках

Эффект «ИИ-бумеранга»: уволенных нанимают обратно. Опрос 2000 менеджеров по найму в США показал: 32% организаций сокращали роль из-за прироста производительности от ИИ, а затем снова нанимали на ту же позицию. Сильнее всего бумеранг в финансах (44%), затем HR (35%) и tech (32%). Причина — пробелы в качестве, надзоре и принятии решений, когда спрос восстанавливался. Полезное напоминание: автоматизация рутины не отменяет человека там, где нужны суждение и контроль.

Коротко: остальные новости суток

Доля государства в OpenAI: появились цифры. Мы писали 7 июня о переговорах Белого дома и OpenAI о госдоле через «Public Wealth Fund». Теперь Axios уточняет масштаб: в индустрии обсуждали долю 1–5% — против 50%-го «налога акциями», который предлагал сенатор Берни Сандерс. Альтман встречался и с Сандерсом, и с командой Трампа; экс-«ИИ-царь» Дэвид Сакс выступил против, назвав это «слиянием бизнеса и государства».

Банки режут набор джуниоров на две трети. На фоне ИИ банки сокращают наём junior-аналитиков примерно на две трети, одновременно набирая 62% новых сотрудников из ИИ-специалистов. Глава Standard Chartered назвал вытесняемых «менее ценным человеческим капиталом» — резкий сигнал о том, как ИИ меняет вход в профессию.

Microsoft выпустила семь своих MAI-моделей. На Build 2026 компания представила семь собственных моделей семейства MAI, пересмотрев контракт с OpenAI и сняв ограничения, которые мешали обучать свои фронтир-модели. Это продолжение линии (ранее на неделе мы отмечали MAI-Image-2.5 и рецепт MAI Thinking-1) — теперь уже как заявка на независимость от OpenAI.

Anthropic переманила чип-инженера OpenAI. Создатель Claude нанял одного из первых чип-инженеров OpenAI (Clive Chen) на фоне слухов, что Anthropic рассматривает разработку собственных чипов. Обе компании при этом идут к IPO.

Профсоюз музыкантов судится из-за Suno и Udio. Американский профсоюз AFM подал в суд на Universal и Warner за лицензирование записей музыкантам ИИ-генераторам Suno и Udio без компенсации артистам — при том что лейблы получали деньги по сделкам с этими платформами.

NVIDIA скупает Южную Корею. Компания заключила пакет сделок с SK Hynix, SK Telecom, Naver, LG, Hyundai и Doosan — память, ИИ-фабрики, робототехника и дата-центры. Naver заявил о строительстве гигаваттных ИИ-фабрик на технологиях NVIDIA.

Intel ставит на ИИ-агентов. CEO Лип-Бу Тан рассчитывает возродить Intel на росте спроса на CPU, который подстёгивают ИИ-агенты; акции подскочили на сообщении о возможной чип-сделке с Google.

Sakana AI открыла RSI-лабораторию. В продолжение темы рекурсивного самоулучшения (мы разбирали отчёт Anthropic 6 июня) японская Sakana AI запустила в Токио RSI Lab — группу, которая использует ИИ, чтобы перепроектировать сам процесс разработки ИИ.

Meta запустила Business Agent. Компания выводит ИИ-агентов в WhatsApp, Messenger и Instagram для поддержки, продаж и бронирований — заявка на корпоративный сегмент агентов.

Gemma 4 12B запускается на ноутбуке. Google выпустил 12-миллиардную модель Gemma 4 и QAT-чекпойнты, оптимизированные под мобильные и ноутбуки, — заметный шаг для локальных агентных воркфлоу без облака.

Утечка Mythos продолжается. Новая модель Anthropic Mythos начала мелькать в Dev Mode и соцсетях; в сообществе спекулируют о близком публичном релизе (в продолжение сюжета про чекпойнт Oceanus, о котором мы писали 6 июня).

Взлом ИИ-чатбота Instagram затронул 20 225 аккаунтов. Meta впервые назвала масштаб: уязвимость в чатботе поддержки High Touch Support слала ссылки на сброс пароля на любой email без проверки. Баг эксплуатировали с 17 апреля по 31 мая; среди возможно раскрытых данных — личные сообщения и данные профиля. Чатбот отключён, пострадавших отправили на смену паролей.

Источники

  • The Neuron Daily — OpenAI superapp, банки и джуниоры, MAI-модели (выпуск)
  • The Rundown AI — госдоля в OpenAI, агент-охотник за лидами, инструменты (therundown.ai)
  • Techpresso — ребрендинг ChatGPT, секретная встреча Apple, взлом Instagram (archive.techpresso.co)
  • TLDR AI — Microsoft Scout, Claude-химик, экономика ИИ-кодинга, Gemma 4 (tldr.tech/ai)
  • Turing Post — FOD#155: Continual Learning, «Economy of Minds», Sakana RSI Lab (выпуск)
  • Dwarkesh Patel — The sample efficiency black hole (эссе)
  • Anthropic — Making Claude a Chemist (исследование)
Откомментируйте первым 👇

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб