Введение
Описание.
Module Creation Studio (MCS) помогает создавать собственные модули распознавания капч, которые сразу можно использовать в CapMonster.
Некоторые шаги создания модуля могут показаться сложными на первый взгляд. Поэтому в дальнейши х статьях мы разберём всё подробно и пошагово. Если после прочтения останутся вопросы, смело задавайте их нашей поддержке.
Скачать актуальную версию CapMonster MCS x64.
Процесс создания модуля.
Создание модуля распознавания делится на несколько шагов. Далее мы приведём краткое описание каждого из них и дадим ссылку на более подробное объяснение.
Если у вас что-то не получается. Иначе вы рискуете впустую потратить драгоценное время.
Шаг 1. Собираем капчи
Откройте программу и создайте новый проект, дав ему понятное название.
Затем добавьте в проект капчи, для которых вы планируете создать модуль распознавания, и сохраните изменения.
Для дальнейшей работы важно, чтобы эти капчи были корректно распознаны — желательно с максимальной (приближённой к 100%) точностью.
Шаг 2. Собираем символы
Распознавание капч — это по сути распознавание символов, изображённых на них. Чтобы модуль мог этому научиться, ему сначала нужно показать примеры соответствующих символов.
Сбор таких примеров выполняется вручную: просто нажи майте мышкой в центр каждого символа на изображении.
Шаг 3. Настраиваем фильтрацию
Существенно улучшить качество распознавания можно, применив к капче простые графические фильтры.
Например:
- повысить контрастность,
- выделить определённый цвет,
- изменить размер изображения.
Так, капчи с мелкими символами стоит увеличить для более точного распознавания, а капчи с крупными символами — наоборот, уменьшить, чтобы ускорить работу модуля.
Шаг 4. Определяем центры масс
Как мы уже поняли, распознавание капч происходит через символы на изображении. Но пр ежде чем распознать символ, его нужно найти. Поиск выполняется в так называемых потенциальных центрах символов — особых точках, где они могут располагаться.
На этом же этапе задаётся размер окна распознавания — прямоугольной области, в которую должен помещаться самый крупный символ из набора.
Шаг 5. Приступаем к обучению
Когда все ресурсы подготовлены и основные параметры настроены, можно переходить к обучению модуля.
Сначала задаётся сложность ядра — она определяет, насколько хорошо модуль будет справляться с искажёнными символами:
- Сложное ядро — обеспечивает высокий процент распознавани, но обучение и работа такого модуля занимают больше времени.
- Простое ядро — обучается быстрее и работает оперативнее, но его точность ниже.
После этого настраивается сам процесс обу чения. Помните: чем быстрее проходит обучение, тем хуже качество итогового модуля.
Этап обучения — самый продолжительный в создании модуля. В зависимости от сложности капчи он может занять несколько часов или даже сутки.
Шаг 6. Тестируем и улучшаем
После завершения обучения важно протестировать готовый модуль.
Во время обучения система уже автоматически проводит тесты, и процент распознавания отображается в реальном времени. Однако на данном этапе цель другая — подобрать оптимальные параметры и проверить, можно ли повысить точность распознавания уже обученного модуля.
Кроме того, именно здесь вы сможете обнаружить основные причины ошибок и попробовать устранить их, чтобы улучшить итоговое качество работы модуля.