Глава 8. RAG и retrieval (поиск и извлечение)

Глава 8. RAG и retrieval: Как агент находит нужные знания

RAG (Retrieval-Augmented Generation) — это подход, при котором модель не отвечает только «из головы», а сначала получает найденные фрагменты из внешних источников, а потом формирует ответ с их учётом. Важно понимать, что RAG — это конвейер поиска и проверки, а не волшебная кнопка «сделать правду».

1. Агент как библиотекарь

Работу RAG лучше всего сравнивать с работой библиотекаря.

Плохой библиотекарь (подход «по памяти»): Ищет ответ в голове и пытается угадать, отвечая неуверенно (например, «Наверное, можно...»).
Хороший библиотекарь (подход RAG): Понимает вопрос, идет к нужной полке, находит регламент, проверяет его актуальность и цитирует точное правило.

2. Мини-словарь терминов

Index (Индекс): Подготовленная структура (каталог-справочник) для быстрого поиска нужных кусков по документам, а не просто база данных.
Chunk (Фрагмент): Небольшой и логичный кусок документа, на которые порезан большой текст для удобства поиска.
Embedding (Вектор): Числовое представление смысла текста, которое помогает искать похожие фрагменты, а не только точные слова.
Top-k: Число фрагментов, которые система берет из поиска (например, первые 5 результатов), так как контекстное окно ИИ ограничено.
Citation (Ссылка): Обязательное указание, из какого именно документа и раздела взят факт для ответа.

3. Этапы RAG-конвейера

Система проходит через 6 обязательных шагов, чтобы выдать точный ответ:

Вопрос: Определение того, что человек реально спросил.
…

🔒

Этот материал доступен участникам Клуба. Войдите или оформите доступ, чтобы читать целиком, открывать видео и комментировать.

Войти Вступить / купить доступ