У меня есть список кодов смайликов внутри файла UTF32.red.codes
в виде обычного текста. Простое содержимое файла
\U0001F600
\U0001F601
\U0001F602
\U0001F603
\U0001F604
\U0001F605
\U0001F606
\U0001F609
\U0001F60A
\U0001F60B
Основываясь на вопросе, моя идея состоит в том, чтобы создать регулярное выражение из содержимого файла, чтобы поймать смайлики. Это мой минимальный рабочий пример
import re
with open('UTF32.red.codes','r') as emof:
codes = [emo.strip() for emo in emof]
emojis = re.compile(u"(%s)" % "|".join(codes))
string = u'string to check \U0001F601'
found = emojis.findall(string)
print found
found
всегда пусто. Где я не прав? Я использую питон 2.7
string to check
в вашем файле? Этого не должно быть вstring
, я полагаю. Кроме того, имя переменнойstring
может сбивать с толку, поэтому лучше воздержаться от этого. - person N. Wouda   schedule 08.01.2016\U0001F601
- person emanuele   schedule 08.01.2016string = u'\U0001F601'
. Еще лучше использовать другое имя переменной, напримерsearch
или что-то подобное. - person N. Wouda   schedule 08.01.2016