Слон в посудной лавке
Представьте: 744 миллиарда параметров. Вес модели — больше полутора терабайт. Даже Quantization до 4 бит оставит вас с монстром на 370 ГБ. Ни один RTX 5090, ни даже сервер из четырёх H100 этого не переварит в реальном времени. Но именно эта недосягаемость и делает GLM-5.2, выпущенный под MIT-лицензией, самым интересным событием июня 2026 для сообщества локального AI. Как так? А вот так: дистилляция.
На Reddit уже кипят страсти — пользователи строят планы, как выжать из этой туши кода максимум пользы. Да, сам GLM-5.2 не взлетит на вашем домашнем компе. Но его знания, логика и особенно навыки кодера — идеальный учитель для маленьких моделей.
Не верь ушам — верь бенчмаркам
По тестам HumanEval+, LiveCodeBench и SWE-Bench GLM-5.2 уделывает не только GPT-4o, но и Gemini 2.5 Pro. Разрыв в генерации сложных юнит-тестов — двукратный. Именно это качество собирается перекочевать в локальные модели через дистилляцию. Скажем, вы берёте студента — Llama 3.3 8B или GLM-4.7, гоняете через пайплайн генерации ответов GLM-5.2 на тысячи промптов, а потом дообучаете на этих данных. Результат: ваша локальная 8B внезапно начинает писать код не хуже гиганта. Примерно так работает дистилляция, только с кучей технических нюансов.
🔑 MIT-лицензия снимает все ограничения: можно копировать, модифицировать, использовать в коммерции и даже выпускать собственные дистиллированные модели без упоминания оригинального автора. Единственный запрет — использовать название Zhipu AI так, будто они вас поддерживают. Всё остальное — добро пожаловать в мир вторичных моделей.
Дистилляция не для слабонервных
На практике скормить 744B модели все датасеты мира — задача нетривиальная. Потребуется кластер хотя бы из 8–16 H100 для инференса и генерации данных. Плюс методы снятия отказов могут понадобиться, чтобы учитель отвечал на любые запросы без цензуры. Зато на выходе вы получите компактную модель, способную работать на 12 ГБ VRAM — как раз для локального запуска.
Сообщество уже пробовало дистиллировать GLM-4.7 в REAP-50 — удалось запихнуть 179B в 92 ГБ с потерей всего 3% точности. С GLM-5.2 аппетит вырастет, но и отдача обещает быть выше. Некоторые энтузиасты уже сейчас тренируют 7–13B модели на синтетических данных от GLM-5.2 и обещают выложить GGUF-версии в ближайшие недели.
Что в сухом остатке
GLM-5.2 с MIT-лицензией — это не столько модель для запуска, сколько фабрика знаний для локальных AI. Если вы готовы потратить время и вычислительные ресурсы на пайплайн дистилляции, то получите лучший coding agent, который когда-либо работал на вашем ноутбуке. А если нет — подождите: такие модели появятся в открытом доступе уже к осени 2026. Главное — не тормозите, пока другие качают веса.