Как преобразовать HTML в MHTML с помощью Python?

Как преобразовать HTML в формат, совместимый с MS Word, особенно в изображение? В основном мне нужно преобразовать HTML (сгенерированный из TinyMCE) в документ MS Word с изображениями и т. Д. (Изображения без URL), и я понял, что MS Word не поддерживает стандарты HTML Data URI. MHTML кажется хорошим вариантом? Как преобразовать HTML с изображениями в MHTML с помощью Python?


person Nishant    schedule 19.04.2014    source источник
comment
Я не могу представить, чтобы кто-то на самом деле желал использовать MHTML (файлы .mht), если они могли этого избежать. Он сильно устарел, никогда не был стандартом, не получил широкой поддержки и не имеет будущего. Должна быть лучшая альтернатива. ИМХО...   -  person FoggyDay    schedule 19.04.2014
comment
Совершенно верно, но это для неудобного требования :)   -  person Nishant    schedule 19.04.2014
comment
В: Рассматривали ли вы RTF? Это также формат Microsoft, он также поддерживает встроенные изображения... и имеет модуль Python: pyrtf.sourceforge.net< /а>   -  person FoggyDay    schedule 19.04.2014
comment
Посмотрю, однако мой источник - HTML, поэтому я подумал, что HTML MHTML будет самым простым.   -  person Nishant    schedule 19.04.2014


Ответы (1)


Советы Тима Голдена по использованию собственного объекта IE могут решить эту проблему: http://timgolden.me.uk/python/win32_how_do_i/create-an-mhtml-archive.html

Но на самом деле я также ищу кроссплатформенное решение для этого.

person swdev    schedule 25.08.2014