В этом видео Нейт (Build with Nate) разбирает концепцию «контекстного инжиниринга» — искусства предоставления AI-агенту правильных данных в правильном формате. Автор утверждает, что простого использования векторных баз данных (RAG) часто недостаточно для точности, особенно когда речь идет о таблицах или хронологии. Видео демонстрирует альтернативные подходы: использование SQL-запросов для структурированных данных и передачу полного контекста (Full Context) в окно промпта для сложных документов.
00:00–00:56 Почему RAG-агенты ошибаются — Введение в проблему низкой точности ответов и факторов, влияющих на нее.
00:57–02:44 Контекстный инжиниринг vs Промпт-инжиниринг — Суть нового подхода: не только как спрашивать, но и какие данные (память, инструменты, знания) давать агенту.
02:47–03:10 Проблема актуальности (Knowledge Cutoff) — Почему базовые модели не знают о событиях после даты их обучения без внешних инструментов.
03:12–04:22 Ограничения векторного поиска — Как разбиение документа на куски (chunks) приводит к потере структуры и метаданных.
04:23–05:34 Проблема табличных данных в RAG — Почему векторный поиск не может корректно суммировать продажи или искать максимумы по всей таблице.
05:47–12:30 Фильтрация и SQL-запросы — Использование инструментов n8n для точного извлечения данных из PostgreSQL вместо векторного поиска.
12:31–14:27 Демо: Агент-аналитик — Как ИИ самостоятельно пишет SQL-код для группировки и суммирования 50 строк данных.
14:28–17:05 Метод полного контекста (Full Context) — Загрузка целых транскриптов в промпт для сохранения хронологии и связности.
17:07–21:35 Рост контекстных окон — Сравнение возможностей современных моделей (Gemini, Claude, GPT-4o) по обработке огромных объемов данных.