Drei Schritte zum eBook

© Franck Boston, 123RF

eGutenberg

,
Die Distribution elektronischer Bücher im PDF-Format ist genaugenommen veraltet. Wer Dokumente verteilen will, sollte stattdessen oder wenigstens zusätzlich eine ePub-Datei anbieten, die man ohne jeden Kosteneinsatz generieren kann.
Seit Jahren erwartet, ist endlich Version 4 des Samba-Servers erschienen, der nun als vollwertige Alternative zu Microsofts Active Directory dienen kann. In der ... (mehr)

In der Vergangenheit wurden Dokumente entweder für den Druck oder die Veröffentlichung im Web geschrieben. Beide Ziele sind miteinander vereinbar: Eine für den Drucker aufbereitete Datei im PDF-Format kann am Bildschirm gelesen und eine HTML-Seite ausgedruckt werden.

Die für die elektronische Distribution und insbesondere den Druck bevorzugte PDF-Datei stellt sich aber schnell als ungeeignet heraus, wenn man sie auf einem kleinen Bildschirm lesen will. Das gilt es heute zu berücksichtigen, denn Geräte mit Bildschirmdiagonalen zwischen 4 und 10 Zoll haben bei den Verkaufszahlen die Notebooks überholt. Die sorgfältig für das A4-Format entworfene PDF-Datei mit 10 Punkt großer Schrift ist auf Geräten mit Bildschirmdiagonalen von weniger als 9 Zoll unbrauchbar, wie sich beim Versuch, sie auf einem eReader zu lesen, sehr schnell herausstellt.

Etwas besser sieht es mit der geräteunabhängigen Darstellung von HTML-Dateien aus. Dieses Format krankt jedoch an der systembedingten Schwäche aller Webseiten, nämlich der schlechten Handhabbarkeit bei der Weitergabe. Bilder und Stilinformationen sind vom Text getrennt, was bedeutet, dass jeweils eine ganze Ordnerstruktur distribuiert und beim Leser ausgepackt werden muss. Erschwerend kommt hinzu, dass die meisten reinen eBook-Reader anders als Tablet-PCs HTML-Dateien nicht oder nur sehr eingeschränkt interpretieren können und oft deren Anzeige verweigern.

Aus diesen Gründen sollte man elektronisch zu verteilende Texte möglichst im universellen ePub-Format anlegen. ePub-Dateien sind gezippte Archive mit einer definierten Verzeichnisstruktur ähnlich wie die Textverarbeitungsformate ODF und DOCX. Sie werden von allen Kompaktlesegeräten angezeigt und können problemlos in andere Sonderformate für elektronische Lesegeräte überführt werden.

Nicht ganz geräteunabhängig

Wer ePub-Dateien generieren will, muss sich zunächst einmal von der Vorstellung des klassischen Seitenaufbaus von Büchern und Zeitschriften und damit auch von der Struktur der PDF-Dateien verabschieden. Die Verwandtschaft mit Webseiten wird durch mehrere Faktoren deutlich: Die Texte sind in der Datei im XHTML-Format abgelegt, sie werden mit einem externen Stylesheet (einer typischen CSS-Datei) formatiert, und alle Bilder werden in einem gesonderten Verzeichnis im internettypischen JPEG-Format abgelegt.

Ziel der ePub-Dateien ist eine weitgehend geräteunabhängige Distribution. Ganz geräteabhängig kann sie nie sein, denn was für die 4,3-Zoll-Anzeige eines TrekStor Papyrus mini mit 16-Graustufen in E-Ink-Darstellung ideal ist, wirkt auf dem 9,7-Zoll-Farbdisplay eines iPad 4 oder 5 keineswegs passend (und natürlich umgekehrt). Nur bei richtiger – möglichst minimalistischer – Definition gleicht das Lesegerät die Schriftgröße für eine optimale Darstellung an.

Tabelle 1 zeigt die Elemente einer ePub-Datei im Überblick. Im Hauptverzeichnis befinden sich weiterhin eine Datei mit dem Manifest (»content.opf« ) des Buchs, das die Dokumentenliste enthält, und ein Inhaltsverzeichnis (»toc.ncx« ), beide sind im XML-Format.

Tabelle 1

Die Ordner einer ePub-2-Datei

Ordner

Inhalt

Text

Die eigentlichen Kapitel im XHTML-Format, jede Datei und damit jedes Kapitel dürfen nicht größer sein als 300 KByte. Die Dateien erhalten automatisch die Endung .xhtml. Enthält die Datei Fußnoten, stehen sie gesondert in der Datei »footnotes.xhtml« .

Styles

Das Stylesheet, möglich sind auch mehrere CSS-Dateien zum Beispiel für Anzeige und Druck. Der beziehungsweise die Namen sind beliebig, die Endung lautet ».css« (bei Writer2ePub ist der Name »style001.css« vorgegeben). Auf diese Datei wird in den XHTML-Dateien verwiesen.

Images

(Optionale) Bilder in der Datei, von Writer2ePub im Jpeg-Format exportiert. Grundsätzlich dürfen die Jpeg-Dateien wahlweise (auch gemischt) die Endungen ».jpg« oder ».jpeg« erhalten, weiterhin sind auch GIF- und PNG-Dateien möglich. Hier in dieses Verzeichnis gehört auch eine (optionale) Bilddatei für das Titelblatt.

Fonts

Sind in der Datei besondere Schriften definiert, empfiehlt es sich dringend, sie in der Datei mitzuliefern, denn nur dann können Geräte, bei denen die definierte Schrift nicht installiert ist, den Text richtig darstellen.

Audio

Hier werden in die Datei eingebettete Audiodaten abgelegt.

Video

Hier werden in die Datei abgelegte Videos abgespeichert.

Misc

Was sonst nirgends hinpasst, befindet sich in diesem Ordner. Er ist in der Regel leer.

Es gibt mehrere Möglichkeiten, ein Dokument möglichst professionell ins ePub-Format zu überführen. Ein Weg führt über die entsprechenden Exportfilter der beiden nicht ganz billigen Layoutprogramme Adobe InDesign und Quark XPress. Alternativen dazu finden sich in der Open-Source-Welt. Wie so oft muss man dann aber mehrere Programme mit ergänzenden Funktionen installieren, die Ergebnisse etwas nacharbeiten und außerdem etwas mehr Hintergrundwissen mitbringen als der zahlende Profi, der in seiner Software nur einen Knopf zu drücken braucht.

Dieser Artikel stellt den Arbeitsablauf mit einer Kombination der Programme Apache OpenOffice oder LibreOffice, Sigil und Calibre vor. Hinzu kommen noch einige kleinere Hilfsmittel, darunter ein OO-Plugin und ein Firefox/Seamonkey-Addon. Alle Programme sind direkt und in aktuellen Versionen für Windows, FreeBSD und MacOS X Mountain Lion verfügbar, bei einem Teil der Linux-Distributionen und bei älteren Versionen von MacOS ist es etwas schwieriger, weil es keine aktuelle Binärversion von Sigil gibt und man dann mit einer älteren Version vorliebnehmen muss.

Formate für die elektronische Distribution

Es gibt neben den hier angesprochenen Dateiformaten ePub, HTML und PDF noch eine ganze Reihe von Alternativen. Dateien mit der Endung ».mobi« der Mobipocket-Dateien für das Amazon Kindle, das keine ePub-Dateien verarbeitet, sind fast eins zu eins mit den ePub-Dateien synchronisierbar und deshalb als "Abfallprodukt" mit den hier geschilderten Mitteln erzeugbar. Ein anderes modernes Format ist Djvu [13], das seitenorientiert und deshalb eher mit PDF zu vergleichen ist und mit Calibre nicht genutzt werden kann.

Das Comic-Book-Format (CBR, siehe [14]) besteht nur aus Seiten mit zusammengefügten Bildern und ist für Texte ungeeignet. Eine Zeitlang waren ».lit« -Dateien für den inzwischen eingestellten Microsoft-Reader in Gebrauch, sie spielen heute aber keine Rolle mehr. Die Textverarbeitungsformate ODT, DOC, DOCX und RTF sind für Reader ungeeignet, weil ihre Interpretation schwierig ist. Alle Reader können reine ASCII-Texte in verschiedenen Zeichenkodierungen lesen, aber Bilder und Textauszeichnungen sind dabei natürlich nicht möglich.

Zuerst schreiben

Geschrieben wird das Dokument in Apache OpenOffice oder LibreOffice. Wer das nicht möchte, kann es auch in einer beliebigen anderen Textverarbeitung verfassen, in das Writer-Modul importieren und ins ODT-Format umwandeln. Beim Verfassen von Texten, die später als ePub-Dateien veröffentlicht werden, sind einige Dinge zu beachten. An erster Stelle muss strikt mit Formatvorlagen gearbeitet werden. Wurden den Textelementen Schriftarten, Schriftgrößen und Auszeichnungen direkt zugewiesen, gehen diese beim Umwandeln verloren. Das Formatieren von Textelementen ohne Formatvorlagenzuweisung ist genauso tabu wie bei auf CSS-Dateien basierenden Webseiten.

An den Standardformaten sollte man tunlichst nichts ändern. Man kann zwar grundsätzlich versuchen, seine eigenen Layoutvorstellungen zu übertragen, der Erfolg wird aber sehr begrenzt sein. Das Writer-Plugin überträgt nämlich die Standard-Formate von Writer nur in eigene Standarddefinitionen wie »h1« , »h2« , »h3« und »p« . Diese sind dann natürlich nicht wie erwartet formatiert. Möchte man diese globale Zuweisung umgehen, muss man mit benutzerdefinierten Formaten arbeiten, die unbedingt das Präfix »w2e_« erhalten müssen. Alle anderen benutzerdefinierten Formate werden verworfen und durch die Standardformatvorlage ersetzt.

Man muss natürlich beachten, dass man keine Standardnamen erzeugt – die Extension macht beispielsweise aus »w2e_center« einen Stil »center« , der dann wieder zur normalen Stilvorlage desselben Namens wird. Man hat dann nichts gewonnen. Welche Formate vorbelegt sind, sieht man am besten bei einem Probelauf.

Wichtig beim Schreiben von ePub-Dateien ist, dass man nicht mit Textseiten plant, denn der Seitenumbruch wird vom Anzeigegerät später dynamisch gesetzt. ePub-Dateien müssen in Kapiteln aufgebaut werden, und der Text muss deshalb hierarchisch gegliedert sein. Spielereien wie mehrspaltiger Satz dürfen nicht definiert werden. Leerzeilen zur Trennung von Textabschnitten sind unerwünscht, weil sie später den Lesefluss stören können oder zu Irritationen führen, wenn sie sich am oberen Seitenrand befinden oder wenn sie zu ungewollten Leerseiten führen.

Ein besonderes Problem stellen Fußnoten dar, sie gibt es nämlich in ePub-Dateien nicht (es gibt ja auch keine Seiten!). Fußnoten des Originaldokuments werden deshalb bei ePub-Dateien in Endnoten umgewandelt und im Text entsprechend verlinkt. Viele eBook-Reader können aber mit Hyperlinks nichts anfangen, es wird ja ein gedrucktes Buch emuliert und nicht eine Webseite dargestellt. Das Lesen der Endnoten artet in diesen Fällen für den Leser in umständliches Hin- und Herblättern aus.

Fußnoten sollte man deshalb vermeiden und ergänzende Informationen, die man sonst in Fußnoten untergebracht hätte (vielleicht in Klammern gesetzt), besser in den normalen Text integrieren. Auch die diversen Automatismen einer Textverarbeitung werden nicht umgesetzt; wer Bilder in den Text integriert und die Bildnummern automatisch vergeben lässt und dann im Text auch noch dynamisch verlinkt, wird später feststellen, dass dies zu Fehlern in der Datei führt.

Auch eine automatische Nummernvergabe der Kapitel ist nicht implementiert. Überschriften werden mit den Formaten »h1« , »h2« und so weiter markiert und mit größerer Schrift in der Zeile zentriert.

comments powered by Disqus

Artikel der Woche

Rechneranalyse mit Microsoft-Sysinternals-Tools

Der Rechner verhält sich eigenartig oder Sie haben eine unbekannte Applikation im Task Manager entdeckt und möchten erfahren, worum es sich dabei genau handelt und ob sie möglicherweise gefährlich ist? In so einem Fall helfen die Sysinternals-Tools von Microsoft. Dieser Beitrag stellt die drei Werkzeuge Autoruns, Process Explorer und TCPView vor. (mehr)
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Google+

Ausgabe /2018