Как извлечь метаданные открытого графа с веб-страницы с помощью UIPath RPA?

Изучение RPA с помощью UIPath. С удовольствием извлекает экранные данные с веб-сайта, обрабатывает их, использует и т. Д.

Однако на странице есть информация, которая не видна, но находится в источнике, например, метатеги открытого графа:

<meta property="og:image" content="https://example.com/foo.jpg" />

Какие варианты доступны для извлечения этого с помощью UIPath? Я так понимаю, что у ExtractData есть флаг ExtractMetaData, но я еще не нашел полезного руководства, которому я мог бы следовать на этом этапе: /


person Mark Mayo    schedule 26.06.2019    source источник
comment
Вы можете использовать UI Explorer, чтобы получить селекторы для интересующего вас метатега, а затем использовать действие GetAttribure для получения содержимого тега.   -  person Hakunamatata    schedule 28.06.2019


Ответы (1)


Вы можете попробовать использовать параметр Очистка данных, выбрав соответствующий вариант на вкладке Мастера, как показано ниже:

введите описание изображения здесь

Теперь вам нужно указать на экране область данных, которую нужно очистить, например:

  1. Данные структуры в виде таблицы
  2. Конкретный элемент на веб-странице
  3. Или все окно

Действие по извлечению данных создает контейнер (Прикрепить браузер или Присоединить окно) с селектором для окна верхнего уровня и Извлечь структурированные Активность данных с частичным селектором, как показано на изображениях ниже:

введите здесь описание изображения  введите описание изображения здесь

Поэтому все, что вам нужно сделать, это поместить свой тег XML в качестве ввода в поле ExtractMetadata, как показано на рисунке ниже:

введите описание изображения здесь

Надеюсь, эта информация будет полезной.

person Konstantinos Palaiodimos    schedule 26.06.2019
comment
Спасибо! Я использовал DataScraping, но не знал, как выбрать невидимый материал. Полагаю, это означает, что я просто использую ввод как ‹meta property = og: image ...? Собираюсь попробовать это сегодня утром. - person Mark Mayo; 27.06.2019
comment
Хм. Пробуем с: ‹extract› ‹column точный = '1' name = 'Content' attr = 'content'› ‹webctrl tag = 'meta' property = 'og: image' /› ‹/column› ‹/extract›, но это просто возвращается пустой: / Есть мысли? - person Mark Mayo; 27.06.2019
comment
попробуйте проследить все окно, в котором существуют ваши метаданные, а затем поместите свое значение ‹meta property = og: image content = ... /› в поле ExtractMetadata. - person Konstantinos Palaiodimos; 27.06.2019