Я использую pisa, библиотеку преобразования HTML в PDF для Python.
Существует ли то же самое для документа Word: библиотека преобразования HTML в .doc для Python?
Я использую pisa, библиотеку преобразования HTML в PDF для Python.
Существует ли то же самое для документа Word: библиотека преобразования HTML в .doc для Python?
Вы можете использовать win32com из расширения Python pywin32 для Windows, чтобы MS Word мог преобразовать его для вас. Простой пример:
import win32com.client
word = win32com.client.Dispatch('Word.Application')
doc = word.Documents.Add('example.html')
doc.SaveAs('example.doc', FileFormat=0)
doc.Close()
word.Quit()
Хотя я не знаю прямого модуля, который может позволить вам преобразовать это, однако:
В случае, если кто-то еще приземлится здесь, пытаясь преобразовать наоборот, приведенный выше код работает, но вам нужно изменить значение FileFormat.
http://msdn.microsoft.com/en-us/library/ff839952.aspx
Пример: отфильтрованный html равен 10 вместо 0.
Обновите с помощью исправления python3.x:
from htmldocx import HtmlToDocx
new_parser = HtmlToDocx()
new_parser.parse_html_file("html_filename", "docx_filename")
#Files extensions not needed, but tolerated