Разрыв 47% точности LLM: эксперимент с промптами Qwen3.5 | AiManual
AiManual Logo Ai / Manual.
01 Июл 2026 Гайд

Разрыв в 47% точности LLM: как подача запросов меняет результаты бенчмарков на 28% и 76% — эксперимент с гайдом по промптингу

Как структура промпта меняет точность LLM от 28% до 76%? Эксперимент на Qwen3.5, причины разрыва в 47% и гайд по построению запросов для корпоративных RAG.

Реклама
cliv2

Представьте сценарий: вы месяц обучали RAG-систему на документации компании, настроили чанки, реранкер, эмбеддинги. Запускаете тест — точность 28%. Увольнять команду? Или просто сменить формулировку вопроса? Второе. Я провел эксперимент на Qwen3.5 (самая популярная русскоязычная модель по состоянию на июль 2026) и получил разброс accuracy от 28% до 76% при одном и том же наборе фактов. Разница — 47 процентных пунктов. И это не предел. Рассказываю, как один «пожалуйста» и пара строк инструкции переворачивают бенчмарки.

Подписаться на канал