Мы создаем файлы xlsx с помощью скрипта perl. Файлы обычно содержат тысячи записей. Это делает обнаружение ошибок очень сложной операцией. Этот процесс работал годами без проблем.
На этой неделе мы получили запрос на проверку файла, который содержит ошибки. При открытии Excel сообщил, что файл содержит ошибки, и спросил, хотим ли мы их исправить.
< img src="https://i.stack.imgur.com/KRLNS.jpg" alt="введите здесь описание изображения"> На самом деле мы не хотим восстанавливать данные, а хотим знать, какая часть файл поврежден. Ошибка должна исходить из поврежденных данных, и мы заинтересованы в идентификации этих данных. сообщение журнала показывает следующее:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<recoveryLog xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main">
<logFileName>error068200_01.xml</logFileName> </br>
<summary>Errors were detected in file 'D:\Temp\20161020\file_name.xlsx'</summary>
<repairedRecords summary="Following is a list of repairs:"><repairedRecord>Repaired Records: Cell information from /xl/worksheets/sheet1.xml part</repairedRecord>
</repairedRecords>
</recoveryLog>
Ошибка должна исходить из поврежденных данных. Есть ли какой-либо инструмент/метод, который помогает обнаружить эти поврежденные данные? Я попытался переименовать его в zip-файл, распаковать и открыть с помощью XML-редактора, но не смог найти никаких ошибок в XML-файле.
Мы также проверили, что различные структуры XML-файлов в порядке.
Спасибо и наилучшими пожеланиями