Я использую Owasp Anti с файлом политики Ebay для предотвращения XSS-атак на свой сайт.
Я также использую поиск Hibernate для индексации своих объектов.
Когда я использую этот код:
String html = "special word: été";
// use the Ebay configuration file
Policy policy = Policy.getInstance(xssPolicyFile.getInputStream());
AntiSamy as = new AntiSamy();
CleanResults cr = as.scan(html, policy);
// result is now : "special word: été"
result = cr.getCleanHTML();
Как вы можете видеть, все символы «é» были преобразованы в эквивалентные им HTML-сущности «é
».
Моя страница находится в UTF-8, поэтому мне не нужно это преобразование. Более того, когда я индексирую этот текст с помощью Hibernate Search, он индексирует слово с помощью html-объектов, поэтому я не могу найти слово «été» в своем индексе.
Как я могу заставить antisamy не преобразовывать специальные символы в их эквивалент html-сущности?
Спасибо
PS: проблема была открыта: http://code.google.com/p/owaspantisamy/issues/detail?id=99