У меня есть сайт, на котором пользователи могут размещать сообщения (например, на форумах, в комментариях и т. д.), используя настраиваемую реализацию TinyMCE. Многим из них нравится копировать и вставлять из Word, а это означает, что их ввод часто сопровождается множеством связанных встроенных форматов MS.
Я не могу просто избавиться от <span whatever>
, так как TinyMCE полагается на тег span для некоторых элементов форматирования, и я не могу (и не хочу) заставить указанных пользователей использовать функцию TinyMCE «Вставить из Word» (которая не все равно не так хорошо работает).
Кто-нибудь знает библиотеку/класс/функцию, которая позаботится об этом для меня? Это должно быть общая проблема, хотя я не могу найти ничего определенного. Недавно я подумал, что серия регулярных выражений грубой силы, ищущих шаблоны, специфичные для MS, может помочь, но я не хочу переписывать что-то, что уже может быть доступно, если мне не нужно.
Также было бы неплохо исправить фигурные кавычки, тире и т.д. У меня есть свои собственные вещи, чтобы сделать это сейчас, но я действительно хотел бы найти один фильтр MS-преобразования, чтобы управлять ими всеми.