Пиксели против стен: почему классические CNN проваливаются в архитектуре
Представьте, что вам нужно нарисовать план квартиры. Вы берете кисть и начинаете закрашивать пиксели - сначала коридор, потом комнаты, потом кухню. Примерно так работают обычные свёрточные нейросети для генерации изображений. Получается красиво, но бесполезно - стены кривые, углы не сходятся, а ванная комната оказывается в гостиной.
WallPlan делает наоборот. Вместо пикселей она рисует графы - узлы в местах пересечения стен, рёбра вдоль самих стен. Как чертёжник с линейкой и угольником, только в 1000 раз быстрее и без кофе-брейков.
Графы стен - это представление планировки как математического графа, где вершины соответствуют углам и пересечениям стен, а рёбра - самим стенам. В отличие от растровых изображений, графы сохраняют топологическую структуру помещения.
Три нейросети в одном флаконе: WinNet, GraphNet, LabelNet
WallPlan - это не одна модель, а целый конвейер из трёх CNN, которые работают как архитектурное бюро:
1 WinNet: ищем окна в стенах
Первая сеть сканирует исходное изображение помещения (обычно это спутниковый снимок или чертёж) и находит оконные проёмы. Не просто прямоугольники на картинке, а именно места в стенах, где должны быть окна. Работает как опытный прораб, который с первого взгляда определяет, где можно прорубить окно, а где несущая стена.
2 GraphNet: строим каркас из стен
Вторая сеть берёт информацию о окнах и генерирует граф стен. Вот тут начинается магия: вместо того чтобы предсказывать каждый пиксель стены, модель предсказывает вероятности соединений между узлами графа. Представьте, что вы соединяете точки в детской книжке-раскраске, только точки - это углы комнат, а линии - стены.
3 LabelNet: расставляем мебель и двери
Третья сеть берёт готовый граф стен и «развешивает таблички» - отмечает, какая комната чем является (спальня, кухня, ванная), где находятся двери, какие стены несущие. Фактически превращает математическую абстракцию в рабочий архитектурный план.
Чем WallPlan отличается от других генеративных моделей
Сравнивать WallPlan с Qwen-Image-2512 или Midjourney - всё равно что сравнивать AutoCAD с Photoshop. Одни рисуют красивые картинки, другой создаёт рабочие чертежи.
| Инструмент | Что генерирует | Можно строить по нему? |
|---|---|---|
| Midjourney / Stable Diffusion | Изображения планировок | Нет - только для визуализации |
| LLaMA 3.1 для 3D | 3D-модели мебели | Да, но только отдельные объекты |
| WallPlan | Графы стен + разметка помещений | Да - это рабочий архитектурный план |
Главное преимущество графового подхода - структурированные данные. Из графа стен можно автоматически:
- Рассчитать площадь помещений
- Проверить соответствие строительным нормам
- Экспортировать в CAD-форматы (DXF, DWG)
- Рассчитать смету материалов
Технические детали, от которых зависит результат
WallPlan тренировали на датасете из 25 тысяч реальных планов квартир. Не синтетических, не нарисованных дизайнерами - настоящих строительных чертежей. Это важно, потому что в реальных планах есть особенности, которые не придумаешь:
Стены толщиной 10 см в одном месте и 25 см в другом. Неправильные углы (не 90 градусов). Коммуникационные шахты, которые портят всю геометрию. Окна, которые начинаются не от пола. WallPlan училась на этом хаосе.
Архитектура использует приём, похожий на тот, что применяется в AlphaEarth Foundations для анализа спутниковых снимков - многоуровневая обработка с разным разрешением. Сначала смотрим на план целиком (где общие контуры), затем увеличиваем (где стены), потом ещё больше (где окна и двери).
Кому подойдёт WallPlan (а кому нет)
Это не инструмент для всех подряд. Если вам нужно быстро набросать планировку для презентации - лучше использовать обычный генератор изображений. WallPlan для тех, кто строит по-настоящему.
Идеальные пользователи:
- Архитектурные бюро - для быстрого создания вариантов планировок на ранних этапах проектирования
- Застройщики - для автоматической генерации типовых планировок в многоквартирных домах
- Реноваторы - когда нужно перепланировать существующее помещение с учётом несущих стен
- ML-инженеры в CV - как пример применения графовых нейросетей к реальным задачам
Не подойдёт:
- Дизайнерам интерьеров - им важнее визуализация, чем точные чертежи
- Хобби-проектам - слишком сложно для разового использования
- Тем, кто хочет «красивые картинки» - здесь результат выглядит как технический чертёж
Ограничения и подводные камни
WallPlan генерирует планировки, но не проектирует здания. Это важное различие. Модель не знает:
- Строительных норм вашего региона (минимальная площадь кухни, высота потолков)
- Расположения коммуникаций (где ввод воды, канализации, электричества)
- Особенностей грунта (нужен ли подвал, какой фундамент)
Также модель плохо справляется с нестандартными помещениями - круглыми комнатами, наклонными стенами, многоуровневыми пространствами. Она обучена на типовых квартирах, а не на музеях Гуггенхайма.
Будущее генеративного дизайна: от пикселей к структурам
WallPlan показывает тренд, который мы видим во многих областях - переход от генерации «картинок» к генерации «структур». Так же, как ComfyUI заменил линейные пайплайны на графовые, архитектурные нейросети переходят от растров к графам.
Что дальше? Вероятно, появятся модели, которые:
- Генерируют не только стены, но и инженерные сети
- Учитывают стоимость материалов при проектировании
- Оптимизируют планировки под энергоэффективность
- Интегрируются с BIM-системами (Revit, ArchiCAD)
Пока архитекторы спорят о постмодернизме и деконструктивизме, нейросети тихо учатся чертить прямые стены под правильными углами. Ирония в том, что самые «творческие» профессии оказываются проще всего для автоматизации - если заменить творчество на оптимизацию.
Совет напоследок: если вы архитектор, не бойтесь нейросетей. Бойтесь архитекторов, которые научились использовать нейросети. Они будут делать в 10 раз больше работы за то же время. И их планировки будут математически оптимальными, даже если скучными.