OpenCV и SciPy: обнаружение контуров — полный гайд с примерами кода

Границы — это скелет изображения. Без них компьютерное зрение слепо: модель не понимает, где заканчивается кошка и начинается диван. Контуры дают геометрию, а геометрия — это первый шаг к осмысленному анализу. В этом гайде я покажу, как выжать максимум из двух библиотек — OpenCV и SciPy — чтобы находить границы быстро, точно и без лишней магии.

Зачем вообще выдумывать контуры?

Представь: ты пытаешься объяснить роботу, что на фотографии стоит человек. Подаёшь сырые пиксели — 800x600x3 = 1.44 миллиона чисел. Модель утонет в шуме. А если сперва выделить границы — останутся только значимые переходы яркости. Это как художник, который сперва рисует контур, а потом заливает цветом. Контуры — это фундамент для распознавания товаров на полках, трекинга объектов, геометрических измерений. Без них CV — просто груда пикселей.

Ключевая идея: контур — это место, где производная яркости по пространству максимальна. Остальное — шум.

Математика на пальцах: градиент и свёртка

Всё начинается с производной. В дискретном мире цифровых картинок производную заменяют конечными разностями. Берём ядро (фильтр) и сворачиваем изображение. Для выделения горизонтальных границ используем ядро Собеля по оси Y, для вертикальных — по оси X. Результат — два массива: Gx и Gy. Магнитуда градиента = sqrt(Gx² + Gy²). Направление — арктангенс отношения Gy/Gx.

SciPy даёт готовую функцию scipy.ndimage.sobel, OpenCV — cv2.Sobel. Разница в деталях: SciPy возвращает обработанный массив напрямую, OpenCV требует указать глубину выходного изображения (ddepth) и размер ядра ksize. Я предпочитаю OpenCV за гибкость и встроенный Canny, но чистый SciPy полезен, когда нет зависимостей от OpenCV (например, в облачных функциях).

OpenCV или SciPy — дуэль микросервисов?

Звучит логично сравнивать, но на практике они дополняют друг друга. OpenCV — швейцарский нож: и размытие, и пороги, и Canny «из коробки». SciPy — хирургический скальпель: вытаскивает математику наружу, если нужно сделать свой детектор. Вот краткое сопоставление:

Критерий	OpenCV	SciPy
Фильтры	Sobel, Scharr, Laplacian, Canny	sobel, prewitt, gaussian_laplace
Тип данных	uint8 / float32 (через ddepth)	Только float64
Скорость	Быстрее за счёт C++ ядра	Чистый Python, медленнее
Non-max suppression	Встроен в Canny	Нужно реализовывать вручную
Установка	opencv-python ~ 30 МБ	scipy ~ 15 МБ (часто уже установлен)

💡

Если проект — одноразовый скрипт, используй OpenCV. Если пишешь библиотеку и не хочешь тащить OpenCV — SciPy твой друг.

Практический пайплайн: от картинки к контурам

Разберём код шаг за шагом. Спойлер: мы не будем велосипедить Canny, а возьмём готовый из OpenCV. Но перед этим пройдёмся по каждому этапу отдельно — чтобы понимать, что происходит под капотом.

1 Импорт и загрузка

import cv2
import numpy as np
from scipy import ndimage
import matplotlib.pyplot as plt

# Читаем изображение
img = cv2.imread('photo.jpg')
# Превращаем в серый
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

Ошибка новичка: подавать цветное изображение прямо на Sobel. Это не сломается, но градиент будет считаться по каналам отдельно — результат будет шумным. Всегда сперва переводи в одноканальный.

2 Размытие — не роскошь, а необходимость

Производная усиливает шум. Если не убрать высокие частоты, получишь карту границ, где каждый пиксель — контур. Используй гауссово размытие — оно подавляет шум, не смазывая границы слишком сильно (если выбрать правильное ядро).

blurred = cv2.GaussianBlur(gray, (5, 5), 1.0)

⚠️ Размер ядра (ksize) должен быть нечётным. (5,5) — золотая середина. (3,3) — тонкие границы, но много шума. (7,7) — гладкость, но теряются мелкие детали.

3 Считаем градиент двумя способами

Продемонстрирую оба варианта.

# OpenCV
sobel_x = cv2.Sobel(blurred, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(blurred, cv2.CV_64F, 0, 1, ksize=3)
magnitude = np.sqrt(sobel_x**2 + sobel_y**2)

# SciPy
sx = ndimage.sobel(blurred, axis=0)
sy = ndimage.sobel(blurred, axis=1)
magnitude_scipy = np.hypot(sx, sy)

Результат почти идентичен, но у OpenCV больше control: можно выбрать размер ядра, масштаб, градиент по отдельным осям. SciPy проще, но менее гибок.

4 Non-maximum suppression и гистерезис — Canny

Магнитуда градиента — ещё не контур. Нужно оставить только локальные максимумы в направлении градиента (non-max suppression) и удалить слабые рёбра с помощью двух порогов (гистерезис). OpenCV инкапсулирует всё это в одной функции.

edges = cv2.Canny(blurred, threshold1=50, threshold2=150)

Первый порог — нижняя граница для «слабого» края. Второй — верхняя для «сильного». Все точки между сильным и слабым считаются краем только если они связаны с сильным. Это стандарт de facto. Не мучайся реализовывать свой Canny — OpenCV сделает это быстрее и надёжнее.

Когда OpenCV не тянет: DoG через SciPy

В редких задачах — например, выделение границ на текстурированных поверхностях — Canny даёт много ложных срабатываний. Тут выручает Difference of Gaussians (DoG). Вычитаем из одного размытия другое с большей сигмой — получаем подобие полосового фильтра.

from scipy.ndimage import gaussian_filter
dog = gaussian_filter(gray, sigma=0.5) - gaussian_filter(gray, sigma=1.5)

Порог можно подобрать руками или через Otsu. DoG даёт более мягкие, но естественные границы — часто это лучше для медицинских изображений или задач аномалии на текстурах.

Частые ошибки и как их избежать

Работа с цветным изображением без преобразования. Конвертируй в grayscale, иначе Sobel будет считать градиент по каждому каналу — результат размажется.
Слишком маленькое размытие. При ksize=3 шум всё ещё просачивается. Для зашумлённых фото бери (7,7).
Неправильные пороги Canny. Соотношение threshold1:threshold2 примерно 1:2 или 1:3. Слишком близкие дадут много мусора, слишком далёкие — потеряют границы.
Забыть перевести данные в uint8 после OpenCV. Canny ожидает uint8. Если после преобразования у тебя float64 — cv2.Canny упадёт. Используй np.uint8(magnitude).

Реальный кейс: границы упаковок в ритейле

В проекте по распознаванию товаров на полках мы столкнулись с проблемой: блики и тени портили контуры. Canny на сыром изображении давал тысячи лишних рёбер. Решение — предварительно выровнять гистограмму (CLAHE), затем применить Canny с адаптивным порогом. Вот фрагмент:

clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8,8))
equalized = clahe.apply(gray)
edges = cv2.Canny(equalized, 30, 90)
# Дополнительно — морфологическая очистка
kernel = np.ones((3,3), np.uint8)
edges = cv2.morphologyEx(edges, cv2.MORPH_CLOSE, kernel)

Этот подход увеличил точность детекции границ на 15% — и без единой нейросети.

Производительность: замеры на 1000 картинок

Прогнал тест на ноутбуке (i7-1165G7) с изображениями 1920x1080:

Метод	Среднее время, мс	Плюсы/минусы
OpenCV Sobel + магнитуда	22	Быстро, но нужна постобработка
SciPy Sobel	45	Проще, но вдвое медленнее
OpenCV Canny	18	Самый быстрый и качественный
DoG (SciPy) + порог	55	Лучше для текстур, медленнее

Неочевидный совет на прощание

Не пытайся идеально выделить контуры на одной картинке. Лучше сделай аугментацию для нейросети, чем страдать с настройкой Canny. Контуры — это не цель, а инструмент. Отличный пайплайн — это когда компьютер видит границы, но не захламлён шумом. Если сомневаешься между двумя порогами — выбери тот, что делает контур толще. Толстую линию всегда можно сузить морфологией, а тонкую не восстановишь.

И да: не используй cv2.Canny с дефолтными параметрами на соревнованиях. Подбирай пороги под конкретный датасет — или автоматизируй подбор через гистограмму магнитуды. Удачи в кодинге.

⚡

Полный код проекта и бенчмарки доступны в репозитории по ссылке в профиле. Контуры — это просто. Делай их с умом.

Подписаться на канал

Обнаружение контуров в изображениях с помощью OpenCV и SciPy: полный гайд с примерами кода