Я пытаюсь сделать некоторый код Python, чтобы определить, содержит ли строка «комбинированные символы», которые, как я считаю, являются частью Unicode. Теперь, не просто простой персонажей, но больше похожи на это: S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄, где это действительно раздражает. В любом случае, любая помощь - это здорово, спасибо! О, и когда я говорю «обнаружить», код должен вернуть «истину», если он присутствует. Благодаря тонну! Я знаю, что много прошу
Python, как обнаружить «комбинированные символы»?
Ответы (1)
Из Википедии эти символы находятся в кодовых точках Юникода от U+0300 (768) до U. +036F (879), поэтому символы можно получить в Python следующим образом:
combining_marks = set(map(unichr, range(768, 880)))
Чтобы узнать, какие такие символы есть в вашей строке:
combining_marks.intersection(my_string)
person
Alex Hall
schedule
01.08.2017
Есть и другие, такие как комбайнеры смайликов.
- person Ṃųỻịgǻňạcểơửṩ; 23.07.2019
\w
для обнаружения символов слова.. - person Bobby D   schedule 02.08.2017