Большая чистка моделей в Tinker: Qwen3.6 вместо Llama и DeepSeek Публичный пост

17 мая 2026 85

Выпуск охватывает письма за 16 мая 2026 года. Суббота выдалась тихой: из содержательного — одно, но показательное письмо от Thinking Machines (компания Миры Мурати, экс-CTO OpenAI) о масштабной ротации open-weight моделей на платформе Tinker. Для всех, кто файнтюнит открытые модели, это полезный срез того, «что сейчас считается актуальным» в мире открытых весов.

Tinker отправляет на пенсию Llama 3.x и DeepSeek-V3.1: эпоха Qwen

Tinker — это сервис Thinking Machines для дообучения (fine-tuning) открытых моделей: вы пишете обучающий цикл на Python, а распределённые GPU-вычисления берёт на себя платформа. В письме команда объявила деприкацию целого пласта моделей: «По мере выхода новых open-weight моделей мы стремимся держать линейку Tinker актуальной... Закат старых моделей позволяет нам сохранять высокую пропускную способность и низкие задержки на тех моделях, которые мы предлагаем».

Ключевые даты: устаревшие модели работают до 12 июня 2026, после чего обучение и инференс на них отключаются. Сохранённые чекпойнты можно скачать в течение 6 месяцев после отключения. Cookbook и рецепты Tinker обновят в ближайшие дни.

Самое интересное — таблица замен, фактически карта эволюции open-weight экосистемы:

Qwen3 → Qwen3.6: Qwen3.5-35B-A3B и Qwen3.5-27B уступают место Qwen3.6-35B-A3B и Qwen3.6-27B; старшие Qwen3-235B-A22B-Instruct заменяются на Qwen3.5-397B-A17B (включая vision-вариант). Обозначение «A3B»/«A17B» — это MoE-архитектура: из 35 или 397 млрд параметров на каждый токен активны лишь 3 или 17 млрд, что и даёт скорость при большом «мозге».
Kimi: Kimi-K2.5 и Kimi-K2-Thinking → Kimi-K2.6.
Llama уходит совсем: вся линейка Llama 3.1/3.2/3.3 (от 1B до 70B) деприкейтится, и замены ей предлагаются... из семейства Qwen: Llama-3.3-70B-Instruct → Qwen3.6-27B или Qwen3.6-35B-A3B, Llama-3.1-8B → Qwen3.5-9B. Симптоматичный момент: ещё год-полтора назад Llama была синонимом open-weight, теперь индустриальный сервис не видит смысла её поддерживать.
DeepSeek-V3.1-Base также заменяется на Qwen3.5-35B-A3B-Base.

Одновременно в линейку добавлены три модели для исследований: Qwen3.5-9B, Qwen3.5-35B-A3B-Base и Qwen3.5-9B-Base.

Практический вывод для тех, кто экспериментирует с локальными и дообучаемыми моделями: ориентир смещается на семейство Qwen 3.5/3.6 — именно его сейчас считают лучшим балансом качества, скорости и лицензионной свободы. Если у вас есть пайплайны на Llama-3.x — пора планировать миграцию, причём не только в Tinker: тренд общеотраслевой. Полная таблица — на странице деприкаций в документации Tinker.

Коротко: остальные новости суток

OpenAI обновила систему почтовых уведомлений ChatGPT — пользователей просят заново выбрать, какие письма получать (продуктовые новости, исследования, советы). Чисто сервисная история, но если хотите получать анонсы новых функций ChatGPT первыми — стоит зайти в настройки рассылок.

Источники

Thinking Machines / Tinker — «Model Deprecation» (письмо tinker@thinkingmachines.ai от 16.05.2026); документация: tinker-docs.thinkingmachines.ai/tinker/model-deprecations
OpenAI — «Get updates about ChatGPT» (служебное письмо noreply@email.openai.com от 16.05.2026)