knitr html в Word docx с помощью pandoc

Я сохранил пример вывода HTML R markdown в Word, используя pandoc. На самом деле я делаю это только для того, чтобы добавить несколько разрывов страниц для облегчения печати:

system("pandoc -s Exercise1.html -o Exercise1.docx")

Хотя результат приемлем, мне было интересно, есть ли способ сохранить исходную подсветку синтаксиса для блоков R (так же, как они находятся в исходном связанном HTML-документе)?

Кроме того, мне кажется, что в процессе преобразования все изображения теряются, и мне приходится вручную вставлять их в Word. Это нормально?


person Joanne Demmler    schedule 10.11.2013    source источник
comment
Попробуйте открыть HTML-файл в Word.   -  person Artem Klevtsov    schedule 10.11.2013


Ответы (2)


Использование пакета rmarkdown (встроенного в RStudio версии 0.98.682, текущий предварительный выпуск) очень просто преобразовать Rmd в docx, а подсветка кода включена в файл docx.

Вам просто нужно включить это в начало текста уценки:

---
title: "Untitled" # obviously you can change this
output: word_document # specifies docx output
---

Однако похоже, что разрывы страниц по-прежнему не поддерживаются в этом преобразовании.

person Ben    schedule 04.03.2014

Почему бы не преобразовать уценку напрямую в формат Word?

В любом случае Pandoc не поддерживает выделение синтаксиса в Word: "В настоящее время единственные форматы вывода, которые использует эту информацию HTML и LaTeX. "

Об изображениях: файл Word обязательно будет включать их, если вы напрямую конвертируете уценку в Word. Я не уверен насчет источника HTML, но полагаю, что у вас может быть проблема с путём.

person daroczig    schedule 10.11.2013
comment
Когда я использую уценку, отображаются полные вязальные струны. Но, возможно, я заставлю его работать с PDF-файлом между ними ... Сейчас я попробую. - person Joanne Demmler; 10.11.2013