Как использовать регулярное выражение в визуальном скраппинге Portia?

Я могу аннотировать веб-страницы с помощью веб-краулера Portia, мой вопрос заключается в том, как использовать регулярное выражение при извлечении данных.

Например,

Я извлек данные о местоположении со страницы

Вывод выглядит так,

Местоположение : Местоположение xyz,abc

введите здесь описание изображения

Но мне нужны только значения xyz, abc.

Я искал решения в Google, но не получил дополнительной информации.

Не могли бы вы объяснить регулярное выражение в Portia scrapy?


person Magendran V    schedule 21.01.2015    source источник


Ответы (1)


Вам нужно использовать группы захвата для извлечения данных, поэтому в этом случае:

Location: (.*)

Это говорит порции извлечь все данные, следующие за строкой Location:.

Если, например, вы хотите извлечь все данные только между Location: и ,, вы можете использовать следующее:

Location: (.*),

Вы также можете поместить информацию в группу захвата, чтобы извлечь все данные, включая ваш шаблон.

person Ruairi Fahy    schedule 22.01.2015