Проблема, от которой хочется плакать

Представьте себе среднестатистическую компанию на 50 человек. Каждый месяц через неё проходит около 150 договоров: с клиентами, поставщиками, арендодателями. Каждый договор нужно:

Скачать с почты (иногда из трёх разных ящиков)
Переименовать по шаблону «Контрагент_Дата_Тип»
Заполнить Excel-таблицу с реквизитами
Загрузить в CRM (Bitrix24 в нашем случае)
Отправить уведомление юристу на проверку
После проверки — разослать контрагентам
И, наконец, положить в папку «Обработанные»

На это уходило 3,5 часа рабочего времени каждый день. В месяц — примерно 70 часов. При стоимости часа работы сотрудника в 1500 рублей (администратор + частично юрист) — это 105 000 рублей ежемесячно на рутину, которую можно заменить скриптом.

Самое обидное: ошибки. Человек мог перепутать даты, опечататься в сумме, отправить не ту версию. Одна такая ошибка в договоре на 2 миллиона стоила компании месяца переговоров и нервов.

Почему именно n8n, а не что-то ещё?

Потому что это бесплатно (self-hosted версия), визуально и не требует программирования. Zapier за такие объёмы запросил бы 100$ в месяц. Make (бывший Integromat) — около 80$. А n8n работает на вашем сервере за стоимость электричества.

И главное — гибкость. Когда вам нужно добавить проверку через ChatGPT или интеграцию с какой-нибудь странной корпоративной системой, вы просто добавляете новый узел. Не пишете код, не нанимаете разработчика.

💡

Кстати, если вам нужно извлекать структурированные данные из текста без GPU, посмотрите мой гайд про GliNER2. Иногда проще вытащить данные из PDF, чем парсить шаблон.

Архитектура решения: что куда идёт

Что делали вручную	Как делает n8n	Экономия времени
Мониторинг почты	Триггер IMAP каждые 5 минут	2 часа в день
Извлечение данных из PDF	OCR через Unstructured.io + парсинг	1,5 часа в день
Заполнение Excel	Автозапись в Google Sheets	30 минут в день
Загрузка в CRM	API Bitrix24	20 минут в день
Уведомления	Telegram-бот + email	15 минут в день

1Настраиваем мониторинг почты

Создаём новый workflow в n8n. Добавляем триггер «Email (IMAP)». Настраиваем подключение к корпоративной почте.

// Пример конфигурации узла IMAP
{
  "host": "imap.yandex.ru",
  "port": 993,
  "secure": true,
  "authentication": "plain",
  "username": "{{ $vars.email_login }}",
  "password": "{{ $vars.email_password }}"
}

Ключевой момент: фильтрация. Нам нужны только письма с вложениями .pdf или .docx и темой, содержащей «Договор» или «Соглашение». В n8n это делается через условия прямо в узле.

Не делайте частоту проверки меньше 5 минут. Почтовые сервисы могут забанить за спам. И храните пароли в Secrets n8n, а не в plain text.

2Извлекаем текст и данные из документов

Здесь два пути. Если документы создаются в вашей компании по шаблону — можно парсить по регулярным выражениям. Если приходят от контрагентов в разных форматах — нужен OCR.

Я использовал связку:

Unstructured.io для извлечения текста из PDF (есть готовый узел в n8n)
Самописный JavaScript-узел для парсинга ключевых полей

// Пример парсинга данных из текста договора
function extractContractData(text) {
  const data = {};
  
  // Ищем сумму (разные форматы)
  const sumMatch = text.match(/(\d{1,3}(?:[\s,]\d{3})*(?:\.\d{2})?)\s*(?:руб|RUB|₽)/i);
  if (sumMatch) {
    data.amount = sumMatch[1].replace(/[\s,]/g, '');
  }
  
  // Ищем дату (формат ДД.ММ.ГГГГ)
  const dateMatch = text.match(/(\d{2}\.\d{2}\.\d{4})/);
  if (dateMatch) {
    data.contractDate = dateMatch[1];
  }
  
  // Ищем контрагента (после слов "между" или "с одной стороны")
  const partyMatch = text.match(/между\s+([А-Я][А-Яа-я\s\"-]+?)(?:\s+и|\s+с\s+другой)/i);
  if (partyMatch) {
    data.counterparty = partyMatch[1].trim();
  }
  
  return data;
}

Для сложных случаев с плохим качеством сканов пригодится статья про сравнение OCR-инструментов. LlamaParse показал себя лучше всего для финансовых документов, но он платный.

3Интегрируем с CRM и таблицами

Bitrix24 имеет нормальное API. Добавляем узел «HTTP Request» и настраиваем:

// Добавление элемента в CRM Bitrix24
{
  "method": "POST",
  "url": "https://ваш-домен.bitrix24.ru/rest/1/ваш-код/crm.deal.add",
  "body": {
    "fields": {
      "TITLE": "Договор с {{ $json.counterparty }}",
      "OPPORTUNITY": "{{ $json.amount }}",
      "DATE_CREATE": "{{ $json.contractDate }}",
      "COMMENTS": "Автоматически создан из вложения почты"
    }
  }
}

Параллельно записываем данные в Google Sheets — для отчётности. Узел «Google Sheets» есть в стандартной библиотеке.

💡

Если ваша CRM — экзотическая система без API, можно использовать подход из статьи про IDEAV. Преобразуйте бизнес-логику в запросы без прямого доступа к БД.

4Уведомления и логирование

Юрист должен знать, что пришёл новый договор. Отправляем сообщение в Telegram:

// Узел Telegram Bot
{
  "chatId": "{{ $vars.telegram_chat_id }}",
  "text": `📄 Новый договор\nКонтрагент: {{ $json.counterparty }}\nСумма: {{ $json.amount }} руб\nДата: {{ $json.contractDate }}\n\nСсылка на файл: {{ $json.fileUrl }}`
}

И обязательно логируем все действия в отдельную таблицу. Что обработали, когда, какие были ошибки. Через месяц это поможет отладить процесс.

Типичные ошибки (чтобы вы их не повторили)

Ошибка	Что происходит	Как исправить
Нет обработки дублей	Один договор обрабатывается 5 раз	Добавить проверку хеша файла или messageId письма
Слишком строгий парсинг	Пропускает 30% документов	Использовать нейросеть для извлечения сущностей
Нет обработки ошибок API	При падении CRM весь workflow ломается	Добавить retry логику и узел «Error Trigger»
Хранение паролей в workflow	Компрометация при экспорте настроек	Использовать Secrets и переменные окружения

Что делать, когда документы становятся слишком сложными?

Бывают договоры с приложениями, спецификациями, нестандартными условиями. Мой совет — не усложняйте парсинг до бесконечности. Лучше выделите такие документы в отдельную очередь для ручной обработки.

Но если хочется автоматизировать всё, смотрите в сторону VLM (Vision-Language Models). Модели вроде Qwen3-VL могут «читать» документы с таблицами и схемами. У меня есть сравнение мультиязычных VLM — некоторые работают локально и дешевле, чем API GPT-4.

Сколько это реально стоит?

Сервер на 2 ядра, 4 ГБ RAM: 500-1000 руб/мес (Selectel, Timeweb)
Доменное имя для n8n: 200 руб/год
Unstructured.io API: первые 1000 страниц бесплатно, потом ~$0.001 за страницу
Ваше время на настройку: 8-12 часов

Итого: вложение 1500 рублей и день работы. Возврат: 100 000 рублей ежемесячно. ROI — 6500% в первый месяц. Даже если я ошибся в расчётах вдвое — всё равно выгодно.

А что дальше? Куда развивать систему

Когда базовый workflow работает, можно добавить:

Проверку через ChatGPT: «Найди рисковые формулировки в этом договоре»
Автоматическое создание ответных писем с исправлениями
Интеграцию с системой электронной подписи
Дашборд в Grafana с аналитикой по типам договоров

И главное — не останавливайтесь на документах. Та же логика работает для счетов, актов, заявок. В компании из нашего кейса через год автоматизировали 80% бумажного оборота.

Самый частый вопрос: «А не заменю ли я этим себя?» Нет. Вы освободите время для задач, которые действительно требуют человека. Вместо переименования файлов — переговоры по сложным контрактам. Вместо заполнения таблиц — анализ рисков. Автоматизация не заменяет людей. Она заменяет рутину.

P.S. Если боитесь, что ваш босс увидит эту статью и задумается о сокращении — не волнуйтесь. Лучше сами предложите автоматизацию. Так вы станете не расходом, а активом. Как показывает статья про 2026 год, тех, кто умеет работать с AI, не увольняют. Увольняют тех, кто боится нажать кнопку «Запустить workflow».

Юрист плакал, а я автоматизировал: как n8n за месяц сэкономил компании 100 тысяч на документах