Перейти к основному содержимому

Извлечение статьи (Article Extraction)

🔗 Оригинальная страница — Источник данного материала


Описание

Позволяет получить основную статью на странице ресурса.

image-20200816-163409

Где можно применить: 

  • Парсинг контента с ресурсов
  • Работа к текстом

Как добавить действие в проект?

Через контекстное меню Добавить действиеАнализ содержимогоArticle Extraction

image-20200816-163601

Либо воспользуйтесь ❗→ умным поиском.

Как работать с экшеном?

image-20200816-164002

  1. Вкладка с загруженной страницей : a) Активная - таб, который у вас в данный момент перед глазами. b) Первая - первое окно слева. c) По имени - указать имя таба или переменную учитывая регистр букв. d) По номеру - задаём номер вкладки. Нумерация идёт слева направо начиная с 0. Если необходимо закрыть самую первую вкладку, то в поле указываем ноль , последующие вкладки идут по счету 1, 2, 3….
  2. Переменная для результата.
Пример

Нужно получить основную статью с главной странице https://zennolab.com/ru/

image-20200816-164644

Так как мы работаем в одной вкладке, то указываем *Активная

После выполнения экшена статья будет помещена в переменную *text

image-20200816-164847

Пример использования: 

Перейти на страницу и получить текст. Полученный контент складываем в список для дальнейшей работы.

image-20200816-165140

  1. Переходим на страницу.
  2. Получаем основную статью и кладём в переменную.
  3. Записываем в список.

Позволит максимально быстро парсить текст, не прибегая к использованию множества инструментов.

Полезные ссылки

  1. ❗→ Создание контента
  2. ❗→ Распознавание контекста
  3. ❗→ Окно переменных
  4. ❗→ Управление табом