В этом обзоре детально разбирается новое семейство открытых мультимодальных моделей Gemma 4 от Google, впервые выпущенных под свободной коммерческой лицензией Apache 2.0. Автор описывает архитектурные особенности четырех доступных версий (E2B, E4B, 26B MoE и 31B Dense), акцентируя внимание на встроенном механизме внутренних рассуждений (reasoning), поддержке Tool Calling для ИИ-агентов и нативной интеграции аудио и зрения. В практической части видео демонстрируется настройка Google Colab и тестирование младшей модели для задач текстовой генерации, распознавания графиков на изображениях и прямого перевода аудио в текст.