Глава 8. RAG и retrieval (поиск и извлечение)

Слушать урок

Глава 8 - RAG и retrieval

RAG_Masterclass

Глава 8. RAG и retrieval: Как агент находит нужные знания

RAG (Retrieval-Augmented Generation) — это подход, при котором модель не отвечает только «из головы», а сначала получает найденные фрагменты из внешних источников, а потом формирует ответ с их учётом. Важно понимать, что RAG — это конвейер поиска и проверки, а не волшебная кнопка «сделать правду».

1. Агент как библиотекарь

Работу RAG лучше всего сравнивать с работой библиотекаря.

  • Плохой библиотекарь (подход «по памяти»): Ищет ответ в голове и пытается угадать, отвечая неуверенно (например, «Наверное, можно...»).
  • Хороший библиотекарь (подход RAG): Понимает вопрос, идет к нужной полке, находит регламент, проверяет его актуальность и цитирует точное правило.

2. Мини-словарь терминов

  • Index (Индекс): Подготовленная структура (каталог-справочник) для быстрого поиска нужных кусков по документам, а не просто база данных.
  • Chunk (Фрагмент): Небольшой и логичный кусок документа, на которые порезан большой текст для удобства поиска.
  • Embedding (Вектор): Числовое представление смысла текста, которое помогает искать похожие фрагменты, а не только точные слова.
  • Top-k: Число фрагментов, которые система берет из поиска (например, первые 5 результатов), так как контекстное окно ИИ ограничено.
  • Citation (Ссылка): Обязательное указание, из какого именно документа и раздела взят факт для ответа.

3. Этапы RAG-конвейера

Система проходит через 6 обязательных шагов, чтобы выдать точный ответ:

  1. Вопрос: Определение того, что человек реально спросил.
🔒

Этот материал доступен участникам Клуба. Войдите или оформите доступ, чтобы читать целиком, открывать видео и комментировать.

Войти Вступить / купить доступ