Урок посвящен практическому применению новой мультимодальной модели Gemini Embedding 2 от Google. Автор демонстрирует, как уйти от сложных цепочек обработки данных (транскрибация аудио, описание картинок нейронками) к единому вектору для любого типа контента. На примере автоматизации в n8n и векторной базы Supabase показано, как реализовать поиск по смыслу между разными форматами: например, найти PDF-документ, отправив в чат голосовое сообщение или фрагмент картинки.
00:00–01:10 Мультимодальность Gemini Embedding 2 — Введение в возможности модели: поиск документов по аудио, видео или картинкам в едином пространстве.
01:10–02:25 Как работали эмбеддинги раньше vs сейчас — Сравнение старого подхода (подготовка контента через транскрибацию и описание) с новым (векторизация «как есть»).
02:25–03:40 Теория и документация Google — Нюансы работы с разными типами входа: текст, картинки в Base64, аудио и видео до 2 минут.
03:40–04:30 Сборка workflow в n8n: Обработка Telegram — Настройка…
🔒
Этот материал доступен участникам Клуба. Войдите или оформите доступ,
чтобы читать целиком, открывать видео и комментировать.