Доступ к файлам Office 2003

Я хочу получить доступ к файлам Office 2003 (.doc, .xls и .ppt), чтобы извлечь текст и некоторые метаданные (количество слов, количество листов, изображений, шаблонов и т. Д.). Я могу сделать это с помощью Open XML SDK для документов Office 2007. Однако это извлечение будет происходить на сервере, на котором не могут быть установлены такие приложения, как Microsoft Office (поэтому я не могу использовать взаимодействие с Office). Я пробовал NPOI, но на самом деле он поддерживает только файлы .xls. Другие библиотеки, которые я нашел, не являются открытыми, я не могу использовать их в своей работе ... Я загрузил NPOI Scratchpad, но код очень "сырой", я не могу использовать его в своей работе. Есть ли у вас еще одна идея получить текст и метаданные из документов Office 2003? Я не очень опытный программист и использую C # (однако, если есть какое-либо решение этой проблемы на C ++, я мог бы рассмотреть возможность его использования). Спасибо.


person nunoaac    schedule 05.04.2012    source источник


Ответы (1)


Есть много библиотек, таких как:

  • ClosedXML (Office 2007)
  • EPPlus (Office 2007)
  • Ячейки Aspose (Office 97-2010, я использую вот этот)

Я не знаю бесплатных библиотек, поддерживающих формат Office 2003.

удачи

person lnu    schedule 05.04.2012