Глава 2. База по LLM

Алексей Ульянов

В этой главе мы разбираем фундамент работы с искусственным интеллектом: как модель получает входную информацию, почему она не «помнит всё» и почему её ограничения критически важны для Context Engineering.

Главная схема работы выглядит так: вход (input) -> токены (tokens) -> контекстное окно (context window) -> ответ (output).

1. Главная мысль: Модель не «знает задачу»

Многие ошибки в работе с AI появляются из-за неправильных ожиданий пользователя. Часто можно услышать:

«Я же уже говорил это модели, почему она не помнит?».
«Я загрузил много текста, почему она пропустила важное?».
«Модель такая сильная, почему она уверенно придумала факт?».

Ответ один: модель не смотрит на «всю реальность». Она отвечает исключительно из того, что попало в её текущий контекст, плюс из закономерностей, которые она выучила во время обучения. Модель видит только то, что ей дали в текущем шаге.

2. Анатомия модели и токенов

LLM (большая языковая модель) — это не база данных и не человек с памятью. Она генерирует ответ на основе того, чему научилась раньше (training data), того, что вы дали ей сейчас (input), и доступных инструментов.

Когда вы пишете запрос, модель не воспринимает его как магический смысл, она получает набор токенов.

Токен (token) — это маленькая единица текста для модели.
Токеном может быть короткое слово, часть длинного слова, знак препинания или даже пробел.
Это важно понимать, потому что ограничения моделей считаются именно в токенах, а не в словах или страницах.

3. Контекстное окно: Взгляд через прожектор

Context window (контекстное окно) — это максимальный объём информации, который модель может учитывать за один шаг.

…

🔒

Этот материал доступен участникам Клуба. Войдите или оформите доступ, чтобы читать целиком, открывать видео и комментировать.

Войти Вступить / купить доступ