Слушать урок
Глава_2_База_по_LLM_как_модель_видит_задачу (1)
LLM_Fundamentals (1)
В этой главе мы разбираем фундамент работы с искусственным интеллектом: как модель получает входную информацию, почему она не «помнит всё» и почему её ограничения критически важны для Context Engineering.
Главная схема работы выглядит так: вход (input) -> токены (tokens) -> контекстное окно (context window) -> ответ (output).
Многие ошибки в работе с AI появляются из-за неправильных ожиданий пользователя. Часто можно услышать:
- «Я же уже говорил это модели, почему она не помнит?».
- «Я загрузил много текста, почему она пропустила важное?».
- «Модель такая сильная, почему она уверенно придумала факт?».
Ответ один: модель не смотрит на «всю реальность». Она отвечает исключительно из того, что попало в её текущий контекст, плюс из закономерностей, которые она выучила во время обучения. Модель видит только то, что ей дали в текущем шаге.
LLM (большая языковая модель) — это не база данных и не человек с памятью. Она генерирует ответ на основе того, чему научилась раньше (training data), того, что вы дали ей сейчас (input), и доступных инструментов.
Когда вы пишете запрос, модель не воспринимает его как магический смысл, она получает набор токенов.
Токен (token) — это маленькая единица текста для модели.
Токеном может быть короткое слово, часть длинного слова, знак препинания или даже пробел.
Это важно понимать, потому что ограничения моделей считаются именно в токенах, а не в словах или страницах.
Context window (контекстное окно) — это максимальный объём информации, который модель может учитывать за один шаг.
…