Привычные нейросети вроде ChatGPT, Gemini или Алисы — это программы, которые ведут диалог с пользователем. Если очень упростить, то суть такая: пользователь спрашивает — бот находит ответ в своей базе.
ИИ-агент не просто отвечает, а выполняет задачи. Если чат-бот можно сравнить с консультантом в турагентстве, который расскажет про отели и покажет ссылки, то ИИ-агент — это личный ассистент, который сам всё найдёт, сравнит, забронирует и пришлёт подтверждение.
В основе агента лежит большая языковая модель (LLM) с дополнительными способностями:
- Планирование: агент умеет разбивать сложную задачу на шаги и выстраивать последовательность действий.
- Память: агент сохраняет контекст между разговорами и использует накопленный опыт.
- Инструменты: агент подключается к внешним сервисам, базам данных и API, через которые действует в реальном мире.
- Автономность: агент принимает решения и работает без постоянного контроля человека.
Цикл работы агента выглядит так: он получает задачу, анализирует её, разбивает на подзадачи, выполняет каждую из них через нужные инструменты и возвращает результат. По ходу дела агент может корректировать свой план, если что-то пошло не так. Человек подключается только для конкретных решений.
Продукты условно делятся на три категории: готовые агенты для пользователей, платформы для бизнеса и инструменты для разработки.
OpenClaw. Самый свежий и популярный ИИ-агент. Его главная фишка в том, что он работает на вашем устройстве — компьютере, виртуальном сервере или даже старом ноутбуке — и общается с вами через WhatsApp, Telegram, Slack, Discord, Signal или iMessage. Достаточно написать ему сообщение, и он начнёт выполнять задачу: запускать команды в терминале, управлять браузером, читать и писать файлы, работать с почтой и календарём. Работает OpenClaw на основе разных нейросетей на выбор: Claude, ChatGPT, Gemini, GLM.
ChatGPT Agent. Агент умеет открывать сайты, работать с загруженными файлами, заполнять формы, редактировать таблицы, подключаться к Gmail и GitHub. По сути, у него есть собственный виртуальный компьютер, на котором он выполняет задачи. Можно попросить его спланировать поездку, проанализировать конкурентов и собрать данные в презентацию. Стоимость Plus начинается от $20 в месяц.
Claude развивает агентные возможности в нескольких направлениях: Computer Use, Claude Code и Claude Cowork. Благодаря Computer Use Claude управляет компьютером так, как это делает человек: двигает курсор, нажимает кнопки, набирает текст. Claude Code — это агентный инструмент для разработчиков. Claude Cowork — аналог Claude Code для нетехнических пользователей с графическим интерфейсом.
Microsoft Copilot добавил Agent Mode в Microsoft 365. В этом…