В данном видео разбирается эволюция технологии RAG (Retrieval Augmented Generation) — от классических векторных баз данных до «Агентского RAG». Автор объясняет, почему традиционный подход с нарезкой текста на куски (chunks) часто ошибается, особенно в математических задачах и анализе таблиц. В качестве решения демонстрируется продвинутый шаблон для n8n, который позволяет ИИ-агенту самостоятельно выбирать инструменты: выполнять SQL-запросы к базе данных или считывать файлы целиком для максимально точных ответов.
00:00–01:16 Что такое RAG — Определение процесса генерации ответа с привлечением внешних данных (аналогия с поиском в Google).
01:17–02:42 Традиционный RAG — Процесс подготовки данных: нарезка на куски, создание эмбеддингов и сохранение в векторную базу.
02:43–03:51 Линейный процесс поиска — Как обычный агент ищет 4–6 ближайших по смыслу векторов для формирования ответа.
03:52–05:16 Переход к Агентскому RAG — Описание автономности агента, который сам решает, идти ли в SQL-базу, смотреть схему данных или читать файлы.
05:17–06:34 Проблема потери контекста — Почему классический RAG «не видит» документ целиком и как это решают большие контекстные окна (например, в Gemini).
06:35–08:43 Сложности с табличными данными — Почему векторный поиск бесполезен для математики и аналитики продаж.
08:44–11:14 Обзор шаблона в n8n — Демонстрация нод для автоматической настройки таблиц и метаданных в Supabase.
11:15–14:22 SQL-инструменты в действии — Пример того, как агент пишет SQL-запросы для точного подсчета уникальных клиентов и сумм продаж.
14:23–19:15 Векторный поиск vs Чтение файлов — Сравнение точности при суммаризации проектов и использование фильтрации по File ID.