Автоматический ‹a› вокруг заголовков в Pandoc

Этот код уценки:

# Introduction

Превращается в этот HTML-код при компиляции с Pandoc:

<h1 id="introduction"><a href="#introduction">Introduction</a></h1>

Как я использую Markdown:

  1. Создать HTML-документ
  2. Отредактируйте его в MS Word, чтобы добавить нумерацию страниц.
  3. Версия HTML отправляется в блог, версия MS Word отправляется в универ.

В CSS я могу переопределить цвета ссылок, если они находятся внутри тегов H#, но у MS Word есть проблемы с интерпретацией иерархии переопределений CSS... и в любом случае получается неправильный цвет.

Есть ли способ сгенерировать HTML без заголовков, заключенных в теги привязки, как показано ниже?

<h1 id="introduction">Introduction</h1>

person pandasauce    schedule 11.05.2013    source источник
comment
Может быть, я неправильно понял, но вы понимаете, что вы можете напрямую экспортировать из pandoc в формат word?   -  person mb21    schedule 14.11.2013


Ответы (1)


На случай, если решения нет, вот небольшой PHP-скрипт, который я написал для удаления тегов из заголовков, который нужно запустить в результирующем HTML-файле:

<?php
// Usage: php cleanheadings.php myhtmlfile.html

// Check that arguments were supplied
if(!isset($argv[1])) die('No input file, exiting');

// Load file
$content = file_get_contents($argv[1]);

// Cut out the <a> tag
$heading = '/(<h[123456] id="[\w-0-9]+">)(<a href="#[\w-0-9]+">)(.+)(<\/a>)(<\/h[123456])/mu';
$clean   = '$1$3$5';

$cleanhtml = preg_replace($heading,$clean,$content);

// Write changes back to file
file_put_contents($argv[1], $cleanhtml);
?>
person pandasauce    schedule 11.05.2013