Zum Jahreswechsel stand das Schreiben des Zwischenberichts an. Wie jeder gute Programmierer versuche ich natürlich, den Aufwand hierfür zu minimieren und Inhalte sinnvoll wiederzuverwenden 😉 Da WordPress keinen Export nach LaTeX anbietet und auch sonst die Auswahl an Skripten hierfür sehr begrenzt ist (ich habe nur eines in J auf einem Blog mit politisch zweifelhaften Inhalten gefunden), habe ich mir schnell selbst eines in Python geschrieben. Es verwendet das ganz frische Python 3.6, Ihr müsstet also gegebenenfalls ein Update installieren.

convert.zip (GNU GPL v3 oder aktueller)

Enthält die Pakete

Die Benutzung ist einfach, wenn man sich mit Python und LaTeX etwas auskennt: Ihr exportiert den kompletten Blog als WordPress eXtended RSS und führt dann folgenden Befehl aus:

python3 convert.py myblog.de-2017-01-01.xml

Es erstellt einen Ordner convert-output, lädt alle Anhänge herunter und erzeugt dann für jeden Post eine LaTeX-Datei. Eine wichtige Anmerkung: Das Skript setzt voraus, dass Ihr qTranslate-X verwendet. Auch werden (noch) nicht alle HTML-Tags unterstützt. Falls Ihr also einsprachig unterwegs seid, müsstet Ihr in den Zeilen 126-131 die Sprachenbehandlung entfernen. Unterstützung für neue Tags lässt sich durch Erweiterung der Liste „transformations“ in Zeile 49 realisieren: jede Transformation besteht aus einem 2-Tupel aus einem regulären Ausdruck für Python, der das Tag erkennt, und einer Funktion, die als einziges Argument ein Match Object akzeptiert und die Zeichenkette zurückgibt, die in LaTeX das Tag ersetzt.