Я использую Java DocumentBuilder.parse(InputStream)
для анализа XML-документа. Иногда я получаю искаженные XML-документы, в которых есть лишний мусор после последнего >
, который вызывает SAXException: Content is not allowed in trailing section
. (В случаях, которые я видел, мусор — это просто один или несколько нулевых байтов.)
Мне все равно, что будет после финального >
. Есть ли простой способ проанализировать весь XML-документ в Java и игнорировать любой конечный мусор?
Обратите внимание, что под «игнорировать» я не подразумеваю просто перехват и игнорирование исключения: я имею в виду игнорировать конечный мусор, не выдавать исключение и возвращать объект Document
, поскольку XML до включения окончательного >
действителен.