Слушать урок
Глава 8 - RAG и retrieval
RAG_Masterclass
RAG (Retrieval-Augmented Generation) — это подход, при котором модель не отвечает только «из головы», а сначала получает найденные фрагменты из внешних источников, а потом формирует ответ с их учётом. Важно понимать, что RAG — это конвейер поиска и проверки, а не волшебная кнопка «сделать правду».
Работу RAG лучше всего сравнивать с работой библиотекаря.
- Плохой библиотекарь (подход «по памяти»): Ищет ответ в голове и пытается угадать, отвечая неуверенно (например, «Наверное, можно...»).
- Хороший библиотекарь (подход RAG): Понимает вопрос, идет к нужной полке, находит регламент, проверяет его актуальность и цитирует точное правило.
- Index (Индекс): Подготовленная структура (каталог-справочник) для быстрого поиска нужных кусков по документам, а не просто база данных.
- Chunk (Фрагмент): Небольшой и логичный кусок документа, на которые порезан большой текст для удобства поиска.
- Embedding (Вектор): Числовое представление смысла текста, которое помогает искать похожие фрагменты, а не только точные слова.
- Top-k: Число фрагментов, которые система берет из поиска (например, первые 5 результатов), так как контекстное окно ИИ ограничено.
- Citation (Ссылка): Обязательное указание, из какого именно документа и раздела взят факт для ответа.
Система проходит через 6 обязательных шагов, чтобы выдать точный ответ:
- Вопрос: Определение того, что человек реально спросил.
- …
🔒
Этот материал доступен участникам Клуба. Войдите или оформите доступ,
чтобы читать целиком, открывать видео и комментировать.
Войти
Вступить / купить доступ