Шаг 3. Настраиваем фильтрацию
Описание.
Графические фильтры помогают подготовить капчу к обучению: привести изображение к нужному цвету, убрать помехи и — самое главное — правильно отмасштабировать.
Как должна выглядеть капча после обработки?
В идеале, после применения фильтров ваша капча должна быть:
- чёрно-белой — без оттенков серого (буквы — чёрные, фон — белый);
- очищенной от помех — без линий, точек, кружков и пятен;
- среднего размера — для простых капч или увеличенной примерно в 1.5–2 раза для сложных.
Виды фильтров.
Два набора.
Есть два типа фильтров:
1. Фильтры для капч — применяются ко всему изображению.
2. Фильтры для символов — используются при обработке уже выделенных символов.
После фильтрации капчи и символы должны выглядеть одинаково, поэтому наборы фильтров обычно почти совпадают.
Но есть исключения:
- фильтр обрезки краёв нужен только для капч,
- фильтр, удаляющий часть изображения (например, в цифровой ReCaptcha — фон с номером дома), также применяется только к капче, а не к символам.
Именно поэтому фильтры разделены на две группы.
Самые важные фильтры.
Threshold.
Делает изображение полностью чёрно-белым.
Каждый пиксель становится либо чёрным, либо белым в зависимости от выбранного порогового значения, которое можно задать в настройках фильтра.
Resize.
Меняет размер изображения.
Помните: увеличение масштаба делает символы крупнее, а значит — увеличивает размер окна распознавания символа и нагрузку на ядро. В итоге время распознавания капчи возрастает.
В попытке полностью удалить все помехи вы рискуете, наоборот, ухудшить результат обучения.