Перейти к основному содержимому

Введение


Описание.

Module Creation Studio (MCS) помогает создавать собственные модули распознавания капч, которые сразу можно использовать в CapMonster.

Некоторые шаги создания модуля могут показаться сложными на первый взгляд. Поэтому в дальнейших статьях мы разберём всё подробно и пошагово. Если после прочтения останутся вопросы, смело задавайте их нашей поддержке.

Скачать актуальную версию CapMonster MCS x64.


Процесс создания модуля.

Создание модуля распознавания делится на несколько шагов. Далее мы приведём краткое описание каждого из них и дадим ссылку на более подробное объяснение.

Попросите помощи в поддержке или на форуме

Если у вас что-то не получается. Иначе вы рискуете впустую потратить драгоценное время.


Шаг 1. Собираем капчи

Откройте программу и создайте новый проект, дав ему понятное название.

Затем добавьте в проект капчи, для которых вы планируете создать модуль распознавания, и сохраните изменения.

Для дальнейшей работы важно, чтобы эти капчи были корректно распознаны — желательно с максимальной (приближённой к 100%) точностью.


Шаг 2. Собираем символы

Распознавание капч — это по сути распознавание символов, изображённых на них. Чтобы модуль мог этому научиться, ему сначала нужно показать примеры соответствующих символов.

Сбор таких примеров выполняется вручную: просто нажимайте мышкой в центр каждого символа на изображении.


Шаг 3. Настраиваем фильтрацию

Существенно улучшить качество распознавания можно, применив к капче простые графические фильтры.

Например:

  • повысить контрастность,
  • выделить определённый цвет,
  • изменить размер изображения.

Так, капчи с мелкими символами стоит увеличить для более точного распознавания, а капчи с крупными символами — наоборот, уменьшить, чтобы ускорить работу модуля.


Шаг 4. Определяем центры масс

Как мы уже поняли, распознавание капч происходит через символы на изображении. Но прежде чем распознать символ, его нужно найти. Поиск выполняется в так называемых потенциальных центрах символов — особых точках, где они могут располагаться.

На этом же этапе задаётся размер окна распознавания — прямоугольной области, в которую должен помещаться самый крупный символ из набора.


Шаг 5. Приступаем к обучению

Когда все ресурсы подготовлены и основные параметры настроены, можно переходить к обучению модуля.

Сначала задаётся сложность ядра — она определяет, насколько хорошо модуль будет справляться с искажёнными символами:

  • Сложное ядро — обеспечивает высокий процент распознавани, но обучение и работа такого модуля занимают больше времени.
  • Простое ядро — обучается быстрее и работает оперативнее, но его точность ниже.

После этого настраивается сам процесс обучения. Помните: чем быстрее проходит обучение, тем хуже качество итогового модуля.

Этап обучения — самый продолжительный в создании модуля. В зависимости от сложности капчи он может занять несколько часов или даже сутки.


Шаг 6. Тестируем и улучшаем

После завершения обучения важно протестировать готовый модуль.

Во время обучения система уже автоматически проводит тесты, и процент распознавания отображается в реальном времени. Однако на данном этапе цель другая — подобрать оптимальные параметры и проверить, можно ли повысить точность распознавания уже обученного модуля.

Кроме того, именно здесь вы сможете обнаружить основные причины ошибок и попробовать устранить их, чтобы улучшить итоговое качество работы модуля.


Шаг 7. Сохраняем результат

Module Creation Studio (MCS) используется только для обучения модулей и хранения их вместе с капчами и вспомогательными данными, которые не нужны при самом распознавании.

Поэтому, когда модуль уже обучен, его нужно сохранить в специальном формате, который поддерживается CapMonster. Именно этот формат позволит программе распознавать капчи автоматически, без участия ручных сервисов.

Когда обучение завершено и точность вас устраивает, перейдите в режим «Тестирование модуля», нажмите «Сохранить» и укажите папку, куда нужно выгрузить ваш готовый модуль.

В результате вы получите полностью готовый модуль распознавания, который можно добавить в CapMonster и использовать в работе.