Andreas Kämmerle
EPUB3 und KF8 verstehen
Die E-Book-Formate EPUB3 und KF8 –
Möglichkeiten und Anreicherungen im Vergleich
pagina E-Books
•Buch lesen
•Haupttitel
•Inhaltsverzeichnis
•Informationen zu Andreas Kämmerle
•Informationen zum Buch
•Impressum
Andreas Kämmerle studierte Druck- und Medientechnologie an der Hochschule der Medien in Stuttgart. Bereits während des Studiums konzentrierte er sich vorwiegend auf die Themengebiete XML und Webtechnologien.
Seit 2010 beschäftigt er sich bei der pagina GmbH mit der automatisierten Erstellung von E-Books und der Enwicklung crossmedialer Workflows. Er berät Verlagskunden in allen Fragen rund um das Thema E-Books und entwickelt Produktionsworkflows zur automatisierten EPUB-Produktion.
Das vorliegende Buch ist eine umfassende Weiterentwicklung der Bachelorthesis von Andreas Kämmerle, die im Auftrag der Firma pagina GmbH erarbeitet wurde.
Die neuen E-Book-Formate EPUB 3 und KF 8 haben das Potential, die Lücke zwischen den klassischen E-Books und den nativen Apps zu schließen. Auch wenn die Formate von den heute am Markt befindlichen Lesegeräten noch nicht vollständig umgesetzt werden, müssen sich Medienschaffende schon jetzt mit den neuen Möglichkeiten der „Enriched E-Books“ auseinandersetzen.
Das Buch beschreibt die technischen Neuerungen der beiden E-Book-Formate und wagt einen Vergleich der jeweiligen Features. Neben dem technischen Aspekt stehen dabei die Möglichkeiten der typographischen Umsetzung im Fokus.
Das Buch richtet sich sowohl an Verlagsmitarbeiter, die mit der konzeptionellen und gestalterischen Umsetzung von E-Books betraut sind, als auch an Entwickler und technische Betriebe, die E-Books produzieren.
Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
1. Auflage 2012
© pagina GmbH, Tübingen 2012
Herrenberger Straße 51
72070 Tübingen
Lektorat: Tobias Ott
Satz: Andreas Kämmerle
E-Book-Umsetzung: Andreas Kämmerle, Tobias Fischer
eISBN 978-3-8442-3718-4
http://www.pagina-online.de
Das vorliegende Werk ist in all seinen Teilen urheberrechtlich geschützt. Alle Rechte vorbehalten, insbesondere das Recht der Übersetzung, des Vortrags, der Reproduktion, der Vervielfältigung auf fotomechanischem oder anderen Wegen und der Speicherung in elektronischen Medien. Ungeachtet der Sorgfalt, die auf die Erstellung von Text, Abbildungen und Programmen verwendet wurde, können weder Verlag noch Autor, Herausgeber oder Übersetzer für mögliche Fehler und deren Folgen eine juristische Verantwortung oder irgendeine Haftung übernehmen. Die in diesem Werk wiedergegebenen Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. können auch ohne besondere Kennzeichnung Marken sein und als solche den gesetzlichen Bestimmungen unterliegen.
ISBN 978-3-8442-3718-4
Bezeichnung für ein dynamisch umbrechendes, floatierendes Datenformat, bei dem die Formatierung im Gegensatz zu seitenorientierten Formaten erst auf dem Ausgabemedium erfolgt. Zurück.
Der Dublin Core Metadaten-Standard wurde 1995 von der internationalen Dublin Core Metadata Initiative (DCMI) entwickelt und findet unter anderem in HTML Anwendung. Zurück.
Das object-Element ermöglicht die Einbindung aller Arten von Multimedia-Dateien sowie alternativen Inhalten für den Fall, dass das eigentliche Objekt nicht angezeigt werden kann. Zurück.
Während der Name des Verzeichnisses nicht festgelegt ist, ist diese Bezeichnung basierend auf dem früheren E-Book-Standard „Open Publication Structure“ sehr verbreitet. Zurück.
Ein Codec ist eine Art Treiber, der zur Entschlüsselung und damit zur Wiedergabe einer Multimedia-Datei benötigt wird. Zurück.
Die Arbeit an HTML 5 wird voraussichtlich 2014 abgeschlossen sein, vgl. http://dev.w3.org/html5/decision-policy/html5-2014-plan.html. Zurück.
Ermöglicht die direkte Adressierung eines Dokumentelements. toc.xhtml#kapitel1 verweist zum Beispiel auf das HTML-Element mit der ID „kapitel1“ der Datei toc.xhtml. Zurück.
Clientseitige Anwendungen laufen im Unterschied zu serverseitigen Anwendungen direkt auf dem Endgerät des Anwenders ab. Zurück.
Fixed Layouts ermöglichen die Gestaltung statischer, seitenfester Buchlayouts auf Basis bestehender E-Book-Technologien. Zurück.
In EPUB 2 wurde dieses Element ebenfalls verwendet, um Lesegeräten den direkten Aufruf der Coverabbildung anstelle einer eigenen HTML-Coverdatei zu ermöglichen. Zurück.
„Lesetypografie“ (Forssman und Willberg; 2005) des Verlags Hermann Schmidt Mainz Zurück.
Die Rendering-Engines sind für visuelle Darstellung von Text- und weiteren Medieninformationen im Browser zuständig. Die iBooks-Anwendung basiert beispielsweise auf der WebKit-Engine. Zurück.
Zum besseren Verständnis werden im Text sprechende HTML-Entities verwendet. Korrekt ist die XHTML-konforme hexadezimale Notation. Zurück.
Der Herausforderung der digitalen Seitenbereiche widmet sich ein aktueller Entwurf eines „Paged Media“-CSS 3-Moduls des W3C mit Stand Juni 2012. Zurück.
Das Jahr 2012 wird als das Jahr in die Geschichte der Mediennutzung eingehen, in dem sich E-Books am Markt neben dem gedruckten Buch endgültig etabliert haben werden. Auch wenn die Verkaufszahlen der Produkte dieser jungen Technologie noch lange nicht die des großen Bruders Print erreicht haben und vielleicht nie erreichen werden, so ist die kritische Masse an Lesegeräten ebenso längst erreicht wie auch eine sozialpsychologische Akzeptanz in den für die Verlagen wichtigsten Käufer- und Leserschichten. Grund genug für die Publikums- und Fachverlage, ihre Inhalte künftig „crossmedial“, das heißt in mehreren Ausgabekanälen, zu publizieren.
„Crossmedial“ heißt dabei nicht zwingend „multimedial“ – der erste Schritt der Verlage ins digitale Publizieren ist in der Regel der, die selben Inhalte in derselben Anordnung vom Buch ins E-Book zu überführen. Das ist aufwändig genug, sehen sich viele Verlage doch zunächst der Aufgabe gegenüber, die Inhalte überhaupt in einer wieder verwertbaren, digitalen Form vorzuhalten – von einem integrierten Produktionsworkflow für Print und E-Book noch gar nicht zu reden.
Doch ist dies nur der erste Schritt, der die technischen und konzeptionellen Möglichkeiten der neuen Medien noch nicht adäquat berücksichtigt. Im gleichen Maße, wie sich das Mediennutzungsverhalten der Bevölkerung verändert (Interaktion, Zugriff auf vernetzte Information, Video-Einbindung in redaktionellem Kontext und vielem mehr), wächst auch der Druck, Verlagsinhalte diesen neuen Nutzungsgewohnheiten gemäß aufzubereiten.
Mit den beiden neuen E-Book-Standards EPUB 3 und KF 8 ist hierfür erstmalig die technologische Grundlage gegeben. Die „Enriched E-Books“ können kommen. Nicht weniger – aber auch nicht mehr. Denn unstrittig ist, dass viele Verlagsinhalte sich überhaupt nicht für eine derartige Anreicherung eignen. So soll auch mit dem vorliegenden Buch nicht der Eindruck vermittelt werden „nur ein Enriched E-Book ist ein gutes E-Book“. Eine solche Aussage würde verkennen, dass sich viele Leser dem E-Book schlicht aus Komfortgründen – Mobilität, Gewicht, Zugänglichkeit, Skalierbarkeit der Schrift etc. – zuwenden.
Doch wäre es ein Fehler, die neuen Möglichkeiten deswegen als Spielerei oder überflüssigen Ballast abzutun. Denn so, wie es Inhalte gibt, die sich nicht für ein Enriched E-Book eignen, so gibt es andere, bei denen der Nutzen unmittelbar erkennbar ist. Hier entstehen derzeit neue Märkte und neue Möglichkeiten der Produktentwicklung für Verlage. Die Entscheidung für die neuen Formate und deren Einsatz muss also in erster Linie aus Lektorat und Vertrieb kommen.
Weshalb aber ist im E-Book-Markt das Einhalten von Standards so wichtig? Hier kommen wir auf das gravierendste, spezifische Problem bei E-Books zu sprechen: Die Darstellung der Inhalte – präziser, die Berechnung, wie die Inhalte dargestellt werden – erfolgt erst auf dem Zielgerät, also auf dem jeweiligen E-Book-Reader des Kunden. Der Verlag hat also keine vollständige Kontrolle darüber, wie die Inhalte dargeboten werden. Das ist bei der Produktion von gedruckten Medien anders: Ist hier das erste Exemplar korrekt, so gilt das auch für die gesamte Auflage.
Für den Leser darf dieses Problem nicht zutage treten. Er hat zunächst einmal die berechtigte Erwartung, ein fehlerfreies und ansprechend umgesetztes Produkt für sein spezifisches Ausgabegerät zu erhalten. Das Interesse des Verlages muss darüber hinaus gehen. Es gilt, eine möglichst konsistente Darstellung auf allen Lesegeräten sicherzustellen. Wo das nicht ohne Weiteres möglich ist, muss die Optimierung für verschiedene Lesegeräte kostengünstig und automatisiert möglich sein. Der Verlag muss also bei der Produktion von E-Books immer alle gängigen Ausgabegeräte im Blick behalten. Das ist nur darüber zu gewährleisten, dass man sich an einen der Standards hält, die wiederum von den Lesegeräten unterstützt werden.
Aus der Veröffentlichung neuer Lesegeräte, der Nachfrage nach digitaler Literatur und der damit verbundenen, technologiegetriebenen Marktentwicklung haben sich zunächst verschiedene offene und proprietäre E-Book-Formate entwickelt. Aus dieser Vielfalt haben sich heute, neben dem klassischen PDF, die Formate EPUB und Mobipocket als die E-Book-Formate mit den vielversprechendsten Zukunftsaussichten etabliert.
Der offene EPUB-Standard, der unter Beteiligung von Software- und Medienunternehmen entstand, hat sich als das zentrale E-Book-Format für die Verlagswelt etabliert und wird von zahlreichen Ausgabemedien unterstützt. Daneben stellt das proprietäre Mobipocket-Format, das von den Amazon Kindle-Lesegeräten unterstützt wird, aufgrund der Marktposition und der Vertriebs-Infrastruktur des Online-Händlers den größten Konkurrekten im Bereich der reflowable[1] E-Book-Formate dar.
Das EPUB-Format wurde 2007 vom International Digital Publishing Forum entworfen. Das IDPF hat sich zum Ziel gesetzt, technische Standards für das elektronische Publizieren zu definieren. Zu den Mitgliedern der Organisation, speziell der EPUB Working Group, gehören unter anderem Hersteller von E-Reader-Geräten, Software-Unternehmen sowie Verlage und Dienstleister. Entsprechend existiert heute eine Vielzahl an Lesesoftware, -geräten und Autorenwerkzeuge, die das Format unterstützen, allen voran sei die kostenlose Software Adobe Digital Editions und die App iBooks für Apples iPhone und iPad zu nennen.
Bei EPUB handelt es sich um einen freien, internationalen Industriestandard, dessen technische Spezifikationen veröffentlicht sind. Das Format setzt selbst wiederum auf bestehenden Standards und Technologien auf. Diese offene und plattformübergreifende Struktur ermöglicht eine Integration in bestehende Publikationsprozesse.
Allerdings muss festgehalten werden, dass der EPUB-Standard von den bestehenden Leseanwendungen oft eigenwillig und nur unvollständig interpretiert und dargestellt wird. Dieses Problem, das auf die rasche Verbreitung des Formats zurückzuführen ist, wird sich mit den neuen Generationen von Lesegeräten hoffentlich von selbst lösen.
Mobipocket ist das proprietäre Format der Kindle-Plattform von Amazon. Der dahinter stehende französische Hersteller Mobipocket SA wurde im Jahr 2005 von Amazon übernommen. In einer leicht modifizierten Version wird das Format von den Kindle-Lesegeräten, sowie den kostenlosen Leseanwendungen, die für zahlreiche Betriebssysteme existieren, genutzt.
Es handelt sich hierbei um ein binäres und komprimiertes Endformat, das bezüglich der Inhaltsdaten jedoch auch auf bestehenden Standards basiert. Mobipocket weist jedoch, speziell was die Darstellungsmöglichkeiten betrifft, im Vergleich zu EPUB einen deutlich eingeschränkten Feature-Umfang auf.
Dass das Format so erfolgreich ist, liegt zu einem großen Teil an dem intelligenten Vertriebskonzept von Amazon. Der Online-Händler hat schon früh den Mehrwert eines weitreichenden digitalen Ökosystems erkannt und mit der geschlossenen Kindle-Architektur für eine feste Bindung der eigenen Kunden im Bereich E-Books gesorgt. Mit eigener Lese-Hardware (dem Kindle-Reader), die direkt auf das Angebot von Amazon zugreifen kann und somit für eine extrem geringe Hemmschwelle beim Kauf sorgt, wird das Konzept konsequent abgerundet.
Im Oktober 2011 wurde die finale Version der Spezifikation zum neuen EPUB-Standard in der Version 3 von der EPUB-Arbeitsgruppe des IDPF verabschiedet. Zeitgleich kündigte der Online-Händler Amazon Ende Oktober 2011 die Veröffentlichung des neuen E-Book-Formats Kindle Format 8 für seine Kindle-Plattform an, welches das aktuelle Mobipocket-Format ersetzen wird.
EPUB 3 ist eine weitreichende Überarbeitung des EPUB-Standards, die wesentliche Verbesserungen für komplexe, angereicherte und interaktive E-Books liefert. Die entscheidenden Neuerungen lassen sich in die Bereiche Layout, Multimedia-Fähigkeit, Sprachunterstützung sowie verbesserte Zugänglichkeit zusammenfassen. Dabei setzt das IDPF verstärkt auf den Ansatz, bestehende Technologiestandards in EPUB 3 zusammenzuführen.
Mit der Ankündigung des neuen Formats KF 8 seitens Amazon als Antwort auf EPUB 3 bleiben die Erwartungen, die Kindle-Reader würden zukünftig das EPUB-Format unterstützen, bis auf Weiteres unerfüllt. Die Frage, weshalb Amazon nach wie vor auf ein eigenes, proprietäres Format setzt, lässt sich durch die Erhaltung des Wettbewerbsvorteils des Anbieters auf dem bestehenden E-Book-Markt erklären – auch weiterhin können mit den Kindle-Geräten ausschließlich E-Books im Mobipocket- bzw. KF 8-Format, die über das eigene Online-Portal erworben werden, gelesen werden.
Die beiden neuen Formate EPUB 3 und KF 8 basieren im Wesentlichen auf denselben Kerntechnologien HTML 5 und CSS. Die Unterstützung dieser aktuellen Webstandards macht das hohe Innovationspotential des E-Book-Marktes deutlich. Die Formate bieten mit der Unterstützung multimedialer und interaktiver Elemente erstmals Möglichkeiten, die über die Darstellung von gedruckten Inhalten auf unterschiedlichen Displays hinausgehen. Langfristig werden Fortschritte und Innovationen im Bereich der Webanwendungen für E-Books nutzbar.
Mittelfristig wird die Veröffentlichung der neuen E-Book-Formate deutliche Auswirkungen auf den Markt haben. Bis zu einer vollständigen Implementierung durch eine überwiegende Anzahl von Lesegeräten werden noch einige Monate vergehen – eine zeitnahe Umsetzung der weiterentwickelten Standards durch zentrale Leseanwendungen ist jedoch absehbar.
In jedem Fall müssen sich die Verlage damit auseinandersetzen, die neuen technologischen Entwicklungen konzeptionell zu nutzen, um die Digitalisierung aktiv voranzutreiben und sich am Markt zu platzieren. Verlage, die über die klassischen Printformate hinaus als professionelle Informationsanbieter wahrgenommen werden wollen, müssen sich bereits jetzt mit der Planung und Umsetzung neuer Features auseinandersetzen. Nur so kann es gelingen, zum richtigen Zeitpunkt mit neuen Produktformen an den Märkten präsent sein zu können, sobald sich diese etabliert haben.
Für einen Verlag, der erst mit dem Aufbau eines E-Book-Programmes beginnt, wäre es daher naheliegend, gleich die zukunftsträchtigen Formate EPUB 3 und KF 8 einzusetzen oder zumindest konzeptionell zu berücksichtigen – auch für Titel, die keine multimedialen Erweiterungen erfahren sollen.
Die überarbeitete EPUB-Spezifikation bietet im Vergleich zum neuen Kindle-Format eine umfangreichere Implementierung von Features, die die digitalen Möglichkeiten voll ausnutzen. In der derzeitigen Umstellungsphase kommen die Verlage jedoch nicht an einer Doppelstrategie für den Einsatz beider Versionen sowohl des EPUB- als auch des Kindle-Formats (EPUB 2/EPUB 3 und Mobipocket/KF 8) vorbei.
Aktuell stehen die Verlage im Spannungsfeld zwischen der Entwicklung neuer Produktformen und der einfachen Zweitverwertung in neuen Medienformen. Also der sinnvollen Nutzung aller digitalen Möglichkeiten und der Umsetzung der Strukturen und Bestandteile des klassischen gedruckten Buches.
Das beginnt für viele Verlage zunächst mit der systematischen Digitalisierung der Inhalte, um überhaupt den E-Book-Markt bedienen zu können und führt damit zwangsläufig zur Betrachtung der Strukturen vorhandener oder neuer Printpublikationen, die in diesem Zusammenhang als wichtige Grundlagenarbeit von besonderem Interesse für die E-Book-Produktion sind.
Dieses Buch setzt sich mit den neuen E-Book-Formaten EPUB 3 und KF 8 unter der Berücksichtigung der genannten Anforderungen der Verlagsbranche auseinander. Dabei werden in einer grundlegenden Vorbetrachtung zunächst die beiden E-Book-Formate in ihrem Umfang analysiert und Umsetzungsbeispiele gegeben.
Es folgt ein Vergleich der Standards, der die Übertragung von Buchstrukturen in das digitale Format untersucht. Hierauf aufbauend wird eine Referenzübersicht entwickelt, die einen praxisnahen Überblick über die Unterstützung verlagsrelevanter Anforderungen durch die neue Generation der E-Book-Standards gibt.
Grundsätzlich basiert das EPUB-Format auf den Internettechnologien HTML und CSS. Dabei ist die Auszeichnungssprache HTML die Technologie für die Strukturierung der Inhaltsdaten, während die Formatierungssprache CSS für die Darstellung der HTML-Daten verantwortlich ist. Der EPUB-Standard beinhaltet jedoch weit mehr als eine Sammlung von Definitionen für Struktur und Layout von Inhaltsdaten. Neben dieser wichtigsten Festlegung sind im EPUB-Standard auch alle anderen Aspekte, wie ein EPUB aufgebaut ist, verbindlich geregelt.
Bei dem EPUB-Format handelt es sich um einen speziellen ZIP-Container, der eine feste Struktur von Dateien beinhaltet. Die Dateiendung des Formats lautet .epub. Das Umbenennen dieser Dateiextension in .zip ermöglicht das Extrahieren des Inhalts mit einer ZIP-Anwendung.
Abb. 2.1 Typischer Aufbau eines EPUB 3-Containers
Die Art und Anzahl der Dateien, speziell innerhalb des OPS-Ordners, der die eigentlichen Inhaltsdateien enthält, variiert je nach Inhalt und Umfang des EPUBs. Die grundsätzlichen Bestandteile und die Verzeichnisstruktur des Formats sind jedoch festgelegt.
Der EPUB 3-Standard umfasst vier Substandards, die jeweils für unterschiedliche Aufgabenbereiche stehen. Jeder dieser XML-Standards ist von der Organisation IDPF in einem eigenen Spezifikationsdokument definiert. Am 11. Oktober 2011 erreichten die EPUB 3-Spezifikationen nach eineinhalb Jahren Arbeit der EPUB Working Group ihren finalen Stand als „Recommended Specification“. Sie sind unter http://idpf.org/epub/30 abrufbar. Die einzelnen Dokumente gliedern sich wie folgt:
„Publications 3.0“ beschreibt die Metadaten und Dateistruktur innerhalb des EPUB-Containers
„Media Overlays 3.0“ beschreibt die Struktur für die Synchronisierung von Text und Audio