Обработка текста
🔗 Оригинальная страница — Источник данного материала
Описание
Данный экшен служит для различных манипуляций с текстом, которые в практике требуются очень часто. Обработать спарсенный текст, очистить его от мусора, перевести на другие языки – всё это, и многое другое, может «кубик» обработки текста.
Как добавить действие в проект?
Через контекстное меню Добавить действие → Данные → Обработка текста
Либо воспользуйтесь ❗→ умным поиском.
Где применяется обработка текста?
- ❗→ Escape строки. Для экранирования специальных символов
- ❗→ Regex. П оиск текста регулярным выражением
- ❗→ Spintax. Рандомизировать, уникализировать текст
- ❗→ Split. Разделить строку на несколько других через разделитель
- ❗→ ToChar. Преобразовать Unicode код в символ
- ❗→ ToLower, ToUpper. Преобразовать заглавные буквы в строчные и наоборот
- ❗→ Trim. Очистить текст от лишних пробельных символов
- ❗→ UrlEncode, UrlDecode. Кодировать \ Декодировать URL
- ❗→ В переменную, список, таблицу. Положить данные в переменную, список или таблицу
- ❗→ Замена. Произвести замену в тексте
- ❗→ Перевод. Выполнить перевод на другой язык
- ❗→ Подготовка JavaScript. Обработать текст для использования в экшене Логики (IF-ELSE) или JavaScript
- ❗→ Получить подстроку
- ❗→ Транслитерация. Сделать транслитерацию текста
Как работать с экшеном?
Окно свойств состоит в основном из трёх областей:
- Входная строка – текст, переменная или их комбинация.
- Действия над строкой, свойства и их настройки.
- Выходная строка (результат) в переменной.
Установите курсор в области входной строки, нажмите Ctrl+Пробел и выберите из выпадающего списка полезные константы и переменные проекта. Например, так можно быстро вставить прокси проекта { -Project.Proxy- }
или URL активной вкладки { -Page.Url- }
(другие доступные переменные окружения Вы можете найти в статье Окно переменных )
Все возможные операции с этим «кубиком»:
Escape строки
Экранирование символов.
Этот экшен экранирует пробел и символы *+?|{[()^$.#
(размещает "слэш" перед каждым указанным символом - \
) . Этот метод часто используется для работы с запросами и для того чтобы обработчик регулярных выражений использовал эти символы буквально, а не как команды или метасимволы.
До применения: {"animal": "cat"}
После: \{"animal":\ "cat"}
Regex
Обработка текста регулярными выражениями. Регулярками очень удобно парсить строки для нахождения нужной подстроки по заданному паттерну. Данный экшен позволяет спарсить не только первое найденное значение, но и всю группу и сохранить значения в переменные или таблицу.
Поле ввода “Regex”
В данное поле необходимо ввести регулярное выражение, с помощью которого будет производиться поиск по тексту. Пример -
(?<=<title>).*(?=</title>)
В составлении регулярных выражений Вам может помочь Тестер регулярных выражений
Ошибка при пустом ответе
Если отмечена данная настройка и регулярное выражение ничего не нашло в тексте, то экшен завершится ошибкой (выход по красной ветке).
Обратите внимание на то, что если регулярное выражение вернёт пустую строку, то даже при включённой настройке “Ошибка при пустом ответе” экшен выйдет по зелёной ветке: например, на сайте ничего нет в теге title: <title></title>
, в таком случае регулярное выражение (?<=<title>).*(?=</title>)
сработает, но вернёт пустую строку - экшен завершится успехом.А вот если бы в тексте вообще не было <title></title>
, в таком случае выражение ничего не найдёт и экшен выйдет по красной ветке.
Что брать
Первое
В переменную сохранится первое найденное совпадение.
Все
Сохранить все результаты поиска в список.