Transformation von Gutenberg-DE und Zeno.org nach EPUB
Vorgehen:
- Download der einzelnen Kapitel (Massendownload per
robots.txt
gesperrt)
- Extrahieren der Metadaten und des eigentlichen Inhalts aus den
HTML-Dateien
- Evt. Nachladen von Abbildungen
- Umwandeln in XHTML, Umbau der Bildverweise, Fußnoten, ...
- Erzeugen von Strukturinformation, Inhaltsverzeichnis, Metadaten
- Packen zur EPUB-Datei
Automatisieren ab Schritt 2:
http://xml2lms.in-chemnitz.de/epub/
- Erzeugen einer Dateiliste
- Aufruf des Scripts:
pfad/zeno-epub.py [-f] name fileliste
pfad/gutenberg-de-epub.py [-f] name fileliste
-f
bindet FreeSerif-Font ein (erweiterter Zeichensatz)