Перейти к основному содержимому

Шаг 3. Настраиваем фильтрацию


Описание.

Графические фильтры помогают подготовить капчу к обучению: привести изображение к нужному цвету, убрать помехи и — самое главное — правильно отмасштабировать.

Как должна выглядеть капча после обработки?

В идеале, после применения фильтров ваша капча должна быть:

  • чёрно-белой — без оттенков серого (буквы — чёрные, фон — белый);
  • очищенной от помех — без линий, точек, кружков и пятен;
  • среднего размера — для простых капч или увеличенной примерно в 1.5–2 раза для сложных.

Виды фильтров.

Два набора.

Есть два типа фильтров:
1. Фильтры для капч — применяются ко всему изображению.
2. Фильтры для символов — используются при обработке уже выделенных символов.

После фильтрации капчи и символы должны выглядеть одинаково, поэтому наборы фильтров обычно почти совпадают.

Но есть исключения:

  • фильтр обрезки краёв нужен только для капч,
  • фильтр, удаляющий часть изображения (например, в цифровой ReCaptcha — фон с номером дома), также применяется только к капче, а не к символам.

Именно поэтому фильтры разделены на две группы.


Самые важные фильтры.

Threshold.

Делает изображение полностью чёрно-белым.

Каждый пиксель становится либо чёрным, либо белым в зависимости от выбранного порогового значения, которое можно задать в настройках фильтра.

Resize.

Меняет размер изображения.

Помните: увеличение масштаба делает символы крупнее, а значит — увеличивает размер окна распознавания символа и нагрузку на ядро. В итоге время распознавания капчи возрастает.


Не советуем чрезмерно применять фильтры.

В попытке полностью удалить все помехи вы рискуете, наоборот, ухудшить результат обучения.