Gemma 4 от Google Здесь!

Смотреть урок

В этом обзоре детально разбирается новое семейство открытых мультимодальных моделей Gemma 4 от Google, впервые выпущенных под свободной коммерческой лицензией Apache 2.0. Автор описывает архитектурные особенности четырех доступных версий (E2B, E4B, 26B MoE и 31B Dense), акцентируя внимание на встроенном механизме внутренних рассуждений (reasoning), поддержке Tool Calling для ИИ-агентов и нативной интеграции аудио и зрения. В практической части видео демонстрируется настройка Google Colab и тестирование младшей модели для задач текстовой генерации, распознавания графиков на изображениях и прямого перевода аудио в текст.

Оглавление

  • 0:00–0:48 Введение в Gemma 4 и лицензию Apache 2.0 — Обзор главных нововведений и снятия лицензионных ограничений для разработчиков.
  • 0:48–1:30 Структура семейства моделей — Разбор четырех версий Gemma 4: от "тяжелых" для рабочих станций до сверхэффективных Edge-моделей.
  • 1:30–2:38 Важность открытой лицензии — Автор объясняет, почему переход на Apache 2.0 делает Gemma 4 ключевым выбором на фоне ограничений конкурентов.
  • 2:38–3:44 Мультимодальность и встроенные рассуждения — Разбор главных архитектурных преимуществ: нативная работа с текстом, аудио, картинками и внутренние логические цепочки.
  • 3:44–4:56 Поддержка ИИ-агентов и визуальный энкодер — Обсуждение Tool Calling, работы с изображениями в нативном разрешении и доступности моделей на различных платформах.
  • 4:56–5:58 Подготовка к тестам на Hugging Face — Поиск младшей модели и подготовка среды для тестирования в Google Colab.
  • 5:58–7:37 Настройка среды и первый запрос —…
🔒

Этот материал доступен участникам Клуба. Войдите или оформите доступ, чтобы читать целиком, открывать видео и комментировать.

Войти Вступить / купить доступ