Я пытаюсь извлечь только электронные письма из текстового столбца в openrefine. в некоторых ячейках указан только адрес электронной почты, а в других - имя и адрес электронной почты в формате john doe <[email protected]>
. Я использовал следующее GREL / регулярное выражение, но он не возвращает весь адрес электронной почты. Для приведенного выше примера я получаю ["[email protected]"]
value.match(
/.*([a-zA-Z0-9_\-\+]+@[\._a-zA-Z0-9-]+).*/
)
Любая помощь горячо приветствуется.
import re \n return re.findall(r"([a-zA-Z0-9_\-\+]+@[\._a-zA-Z0-9-]+)", value)[0]
- это то, что я успешно закончил. спасибо @Wiktor Stribiew и @Ettore Rizza - person Abi Hassen   schedule 03.02.2018