n8n Masterclass\Module 6 Smarter Workflows\05 Category Based Evaluations

Смотреть урок

В данном видео разбирается инструмент Evaluations (Эвалюации) в платформе n8n. Автор объясняет, почему классическое программирование с предсказуемой логикой отличается от работы с нейросетями, где входы и выходы вариативны. Урок демонстрирует, как создать тестовый набор данных, сравнить работу разных моделей (GPT и Claude) и объективно оценить их точность, скорость и стоимость для автоматизации бизнес-процессов.


Оглавление с таймкодами

  • 00:01–01:22 Зачем нужны эвалюации — Разница между жесткой логикой кода и вариативностью AI-моделей.
  • 01:30–02:58 Демонстрация базового агента — Разбор задачи по классификации email (категория и приоритет) без системного промпта.
  • 02:59–03:55 Подготовка датасета — Почему для оптимизации стоимости и скорости необходим набор «эталонных» ответов.
  • 03:56–05:48 Настройка триггера и Google Sheets — Как связать тестовую таблицу с процессом оценки в n8n.
  • 05:49–06:47 Логика путей (Evaluation Check) — Разделение потока данных на «боевой» и «тестовый» внутри одной автоматизации.
  • 06:48–07:49 Запись результатов — Процесс возврата ответов AI в Google Sheets для визуального сравнения.
  • 07:50–10:07 Настройка метрик качества — Использование инструментов категоризации и сравнения строк (1 — верно, 0 — неверно).
  • 10:08–12:09 Анализ отчета — Обзор дашборда с данными по токенам, времени выполнения и проценту точности.
🔒

Этот материал доступен участникам Клуба. Войдите или оформите доступ, чтобы читать целиком, открывать видео и комментировать.

Войти Вступить / купить доступ