Когда математика перестаёт быть точной

Вы провели три дня над расчётами. Формулы выверены, единицы измерения согласованы, результат выглядит правдоподобно. Вы отправляете отчёт коллеге на проверку. Через час он возвращает его с одной пометкой на полях: "А где вы взяли коэффициент 0.85 в формуле на странице 7?"

Вы открываете статью, которую цитировали. Коэффициент действительно 0.85. Но в сноске мелким шрифтом: "для температуры 20°C". Ваша система работает при -40°C. Коэффициент должен быть 1.2.

Ошибка на три порядка. Отчёт в мусорку. Три дня работы — коту под хвост.

Теперь представьте, что у вас есть два беспристрастных эксперта, которые работают 24/7, не устают и проверяют каждую цифру. Это Grok 4.1 Thinking и Aristotle.

Важно: это не замена вашей экспертизе. Это усилитель. Как микроскоп для биолога или осциллограф для электронщика. Инструмент, который показывает то, что вы могли пропустить.

Почему обычные LLM проваливаются на инженерных задачах

Давайте сразу расставим точки над i. Вы не можете взять ChatGPT или Gemini, скормить им расчёт прочности балки и получить вменяемый ответ. Они:

Путают единицы измерения (ньютоны с килограммами — классика)
Игнорируют температурные коэффициенты
Не понимают контекст ("расчёт для моста" и "расчёт для микросхемы" — для них одно и то же)
Галлюцинируют с физическими константами

Проблема в том, что обычные LLM оптимизированы для диалога, а не для точных вычислений. Они стараются "угодить" пользователю, а не найти ошибку. Вспомните статью "Как LLM обманывают даже экспертов" — там подробно разбирают этот механический оптимизм.

Grok 4.1 Thinking и Aristotle созданы для другого. Их задача — не поддержать беседу, а найти несоответствия. Они работают как система сдержек и противовесов.

Дуэт: скептик и систематик

Представьте себе двух рецензентов научного журнала. Первый — придирчивый зануда, который проверяет каждую ссылку, каждую цифру, каждое допущение. Второй — системный мыслитель, который смотрит на общую картину: логично ли построено исследование, нет ли противоречий между разделами, соответствует ли методология поставленной задаче.

Grok 4.1 Thinking — это систематик. Aristotle — зануда.

Задача	Grok 4.1 Thinking	Aristotle
Проверка логики расчёта	Смотрит на общую структуру, ищет пропущенные шаги	Проверяет каждое логическое умозаключение
Верификация данных	Сравнивает с известными физическими законами	Ищет оригинальные источники, проверяет цитаты
Анализ допущений	Оценивает, насколько они реалистичны в контексте	Требует обоснования для каждого допущения
Поиск противоречий	Находит нестыковки между разделами работы	Выявляет противоречия внутри одного утверждения

1 Подготовка: что нужно сделать до того, как отправить расчёт ИИ

Самая частая ошибка — скормить модели сырые данные и ждать чуда. Не работает. ИИ не ясновидящий.

Вот что нужно подготовить:

Контекст задачи. Не "рассчитать прочность", а "рассчитать прочность стальной балки двутаврового сечения 20Б1 по ГОСТ 26020-83 для склада в Мурманске при температуре -45°C и нагрузке от снегового покрова по СП 20.13330.2016".
Исходные данные с единицами измерения. Всегда. Даже если кажется очевидным.
Предположения и допущения. Явно перечислите: "пренебрегаем ветровой нагрузкой", "считаем материал идеально упругим", "коэффициент запаса принят 1.5 по рекомендациям...".
Ожидаемый диапазон результатов. "Напряжение должно быть в пределах 200-250 МПа", "КПД системы ожидается 85-90%".

💡

Если вы не знаете, какой результат ожидать — значит, вы не понимаете задачу. ИИ это не исправит. Сначала разберитесь сами, хотя бы на порядки величин.

2 Промпт для Grok 4.1 Thinking: системный анализ

Grok 4.1 нужен структурированный подход. Он любит чёткие инструкции.

# НЕ ТАК:
"Проверь мой расчёт прочности балки"

# ТАК:
"Выступаешь в роли инженера-конструктора с 20-летним опытом. 
Задача: проверка расчёта прочности стальной балки.

Контекст:
- Назначение: складское помещение в Мурманске
- Климатические условия: -45°C, снеговая нагрузка
- Материал: сталь С245
- Нормативный документ: СП 16.13330.2017

Исходные данные:
1. Сечение: двутавр 20Б1 (h=200мм, b=100мм, t=8мм)
2. Пролёт: 6 метров
3. Нагрузка: равномерно распределённая 50 кН/м
4. Коэффициент запаса: 1.5

Мой расчёт:
1. Момент сопротивления Wx = 200 см³
2. Максимальный изгибающий момент M = (q*L²)/8 = (50*6²)/8 = 225 кН*м
3. Напряжение σ = M/Wx = 225000 / 200 = 1125 МПа
4. Сравнение с допустимым: 1125 МПа > 245 МПа (предел текучести) → не проходит

Вопросы для анализа:
1. Правильно ли определён момент сопротивления для данного сечения?
2. Корректна ли формула для изгибающего момента при данных условиях?
3. Нет ли ошибок в единицах измерения (кН/м → Н/мм)?
4. Учтены ли температурные коэффициенты для стали при -45°C?
5. Соответствует ли расчёт нормам СП 16.13330.2017?

Представь ответ в виде структурированного отчёта с разделами:
- Общая оценка логики расчёта
- Поиск арифметических ошибок
- Проверка соответствия нормам
- Рекомендации по исправлению"

Обратите внимание на детали:

Указана конкретная роль (не просто "инженер", а "инженер-конструктор с 20-летним опытом")
Перечислены нормативные документы
Данные приведены с единицами измерения
Вопросы сформулированы конкретно, а не "проверь всё"
Запрошен структурированный вывод

3 Промпт для Aristotle: придирчивая проверка

Aristotle — это инструмент для поиска иголки в стоге сена. Он будет проверять каждую мелочь.

"Выступаешь в роли рецензента научного журнала по строительной механике. 
Твоя задача — найти все возможные ошибки и неточности в приведённом расчёте.

Применяй следующий алгоритм:
1. ПОШАГОВАЯ ПРОВЕРКА КАЖДОЙ ФОРМУЛЫ
   - Проверь физическую размерность каждого слагаемого
   - Убедись, что все коэффициенты имеют обоснование
   - Сравни формулы с эталонными из учебников

2. ВЕРИФИКАЦИЯ ИСХОДНЫХ ДАННЫХ
   - Для каждого параметра найди источник (ГОСТ, СП, учебник)
   - Проверь актуальность нормативного документа
   - Убедись, что данные соответствуют реальным условиям

3. АНАЛИЗ ДОПУЩЕНИЙ
   - Каждое допущение должно быть явно указано
   - Оцени, насколько каждое допущение влияет на результат
   - Предложи альтернативные подходы без этих допущений

4. ПОИСК ПРОТИВОРЕЧИЙ
   - Сравни значения в разных частях расчёта
   - Проверь, не противоречат ли выводы исходным данным
   - Ищи логические разрывы в рассуждениях

Расчёт для проверки:
[вставьте тот же расчёт, что и для Grok]

Формат вывода:
- Критические ошибки (делают расчёт неверным)
- Существенные замечания (влияют на точность)
- Мелкие неточности (стилистические, оформление)
- Рекомендации по исправлению для каждой категории"

Aristotle работает медленнее, но глубже. Он полезен, когда нужно проверить:

Научные статьи перед отправкой в журнал
Диссертационные работы
Критические расчёты (безопасность, медицина)
Патенты и техническую документацию

Реальный кейс: где я сэкономил неделю работы

Недавно я проверял расчёт системы охлаждения для серверной. Инженер предоставил красивый отчёт на 15 страниц. Формулы, графики, таблицы. Всё выглядело идеально.

Я скормил расчёт Grok 4.1. Через 2 минуты он выдал:

"Обнаружено несоответствие: в формуле теплового баланса используется коэффициент теплопроводности воздуха 0.026 Вт/(м·К), но в таблице исходных данных указана температура +35°C. При этой температуре коэффициент должен быть 0.027 Вт/(м·К). Ошибка приводит к занижению требуемой производительности вентиляторов на 4%."

4% — это немного. Но дальше пошло интереснее. Aristotle нашёл:

В расчёте КПД вентиляторов использовались данные для чистого воздуха, хотя в серверной всегда есть пыль
Не учтён нагрев воздуха при прохождении через перфорированные панели (ещё 3% потерь)
Коэффициент одновременности работы серверов взят "из головы", без измерений

Итог: система, рассчитанная на 100 кВт, на самом деле должна была быть на 130 кВт. Разница в 30%.

Стоимость переделки после монтажа: около 2 миллионов рублей. Стоимость проверки ИИ: 0 рублей (если не считать мои 10 минут).

Опасные грабли: что может пойти не так

ИИ — не волшебная палочка. Вот типичные ошибки:

1. Слепая вера в результат

Вы получаете ответ от Grok: "Расчёт верен". И расслабляетесь. А потом оказывается, что ИИ не заметил, что вы используете формулу для статической нагрузки, а у вас динамическая.

Всегда задавайте уточняющие вопросы: "Какие допущения ты считаешь наиболее критичными?", "При каких условиях этот расчёт перестаёт работать?", "Что может измениться, если температура будет на 10 градусов выше?"

2. Неполные исходные данные

Вы даёте ИИ расчёт, но забываете указать, что материал работает в агрессивной среде. ИИ проверяет прочность, но не коррозионную стойкость. Результат: конструкция проходит по прочности, но разъедается за год.

3. Конфликт источников

Grok использует одни нормативные документы, Aristotle — другие. Вы получаете противоречивые рекомендации. Что делать?

Решение: явно указывайте в промпте: "Используй только следующие источники: ГОСТ 27751-2014, СП 20.13330.2016, РД 34.26.203. Если информация противоречива — укажи на противоречие и предложи наиболее консервативный вариант."

Научные гипотезы: как не попасть в ловушку подтверждения

Самое опасное в науке — найти подтверждение своей гипотезе и остановиться. ИИ здесь может быть как помощником, так и врагом.

Пример: вы выдвигаете гипотезу, что новый материал увеличивает КПД солнечных панелей на 15%. Проводите эксперименты. Получаете +14%. Отлично!

Но Aristotle спрашивает:

Была ли контрольная группа?
Учтён ли температурный дрейф параметров?
Достаточен ли размер выборки для статистической значимости?
Не влияет ли на результат время суток (угол падения солнца)?

Промпт для проверки научной гипотезы:

"Выступаешь в роли методолога научных исследований. 
Гипотеза: [формулировка гипотезы]
Экспериментальные данные: [данные]

Проанализируй по следующим критериям:
1. ВАЛИДНОСТЬ ЭКСПЕРИМЕНТА
   - Контрольная группа: есть/нет, адекватна ли
   - Рандомизация: как обеспечивалась
   - Ослепление: single/double blind или отсутствует

2. СТАТИСТИЧЕСКАЯ ОБРАБОТКА
   - Размер выборки и мощность теста
   - Выбранные статистические критерии
   - Уровень значимости (p-value)
   - Коррекция на множественные сравнения

3. АЛЬТЕРНАТИВНЫЕ ОБЪЯСНЕНИЯ
   - Какие другие факторы могли дать такой результат
   - Возможные систематические ошибки
   - Эффект регрессии к среднему

4. ВОСПРОИЗВОДИМОСТЬ
   - Достаточно ли подробно описан метод
   - Можно ли повторить эксперимент по описанию
   - Были ли попытки независимого воспроизведения

Даже если гипотеза подтверждается, найди минимум 3 альтернативных объяснения результатов."

Интеграция в рабочий процесс

Не делайте проверку ИИ последним шагом. Встройте её в процесс:

Черновик → Grok 4.1 (проверка логики, грубые ошибки)
Доработанная версия → Aristotle (детальная проверка)
Финальная версия → Grok 4.1 + Aristotle вместе ("найдите всё, что могли пропустить в предыдущих итерациях")

Это напоминает практику из статьи "Архитектура State-of-the-Art Research Agent", где используется multiple rounds of verification.

Когда это не работает (и что делать)

Бывают ситуации, когда ИИ бесполезен:

Совершенно новые области. Если вы создаёте материал с принципиально новыми свойствами, у ИИ нет reference points для проверки.
Сверхвысокие требования к надёжности. Ядерная энергетика, космос, медицина — здесь нужна человеческая экспертиза плюс формальные методы верификации.
Юридические ограничения. Патентные заявки, коммерческая тайна — не всегда можно отправить данные в облако.

Решение: используйте локальные модели. В статье "Модель на конец света" есть обзор моделей, которые работают на 24 ГБ VRAM. Не такие умные, как Grok, но для проверки арифметики хватит.

Цифровая интуиция: следующий шаг

Сейчас мы используем ИИ как калькулятор на стероидах. Но будущее — в создании "цифровой интуиции".

Представьте: вы только начинаете расчёт, а ИИ уже говорит: "Стоп. Для таких температур и нагрузок обычно используют не сталь, а титан. Вот три причины почему. И вот расчёт, который доказывает, что титан будет на 30% эффективнее при той же цене."

Это не проверка. Это соавторство.

Уже сейчас появляются инструменты вроде Grokkit, которые пытаются заменить большие модели математическими методами. Или фреймворки из статьи "KEF vs OpenAI o3", которые прокачивают reasoning без миллионных бюджетов.

Но пока это будущее. А сегодня — используйте Grok 4.1 Thinking и Aristotle как самых придирчивых и беспристрастных коллег. Тех, кто не боится сказать: "Здесь ошибка. Давайте исправим."

И помните: лучшая проверка — это та, которая находит ошибку до того, как она стала проблемой. Даже если для этого нужно признать, что вы три дня шли не в ту сторону.

Инженерный расчёт на автопилоте: как Grok 4.1 Thinking и Aristotle заменяют коллегу с красной ручкой