EPUB-WEB

Любопытный документ выпустил IDPF  — EPUB-WEB — своего рода манифест (white paper, unofficial draft), который, вероятно, определит будущее Digital Publishing’а (далее DP) в части его слияния с глобальной сетью. Документ, как минимум, стратегический и уделяет внимание двум направлениям развития спецификаций — по линиям W3C и IDPF.

Основная суть заключается в том, чтобы стереть границу между классическим вебом и отдельно стоящими цифровыми публикациями: пользователи должны иметь возможность динамически переключаться между ними в любой момент. Контент, созданный в первую очередь для сети, может быть легко сохранен для оффлайнового использования как «цифровая публикация» (любимый DP термин), и обратно без каких-либо трудозатратных действий по рефакторингу или оптимизации. Издатели и пользователи получат возможность использовать оба или выбирать из этих режимов. Таким образом декларируется, что цифровые публикации должны стать полноценным подмножеством Open Web Platform.

Единственным существенным различием между EPUB и web на взгляд авторов манифеста является целостность (completeness) «пакета» данных. В случае с EPUB система чтения может быть уверена, что все данные в таком пакете содержат нужные свойства, подчиняются определенной спецификацией иерархии и удовлетворяют требованиям консистентности.

В свою очередь, это позволяет иметь один стандартный подход и к обработке контента, и к его воспроизведению. Эта целостность как ограничение — ключевое отличие текущего онлайн-представления от оффлайнового (portable view).

Очевидно, что работа по внедрению этой концепции потребует существенного понижения и упрощения требований к сложности чтения контента браузерами.

Издателям

Отмечается, что раньше издатели не были вовлечены столь сильно в ИТ процессы, и от многих это потребует налаживания новых процессов по взаимодействию с принципиально иными профессиональными сообществами и парадигмами. Тем не менее, этот же вектор развития приведет к развитию принципиально новых подходов к контенту и инструментам. В особенности в STM-издательствах (Science, Technics, Medicine), где специфичность контента велика: аудио, графики, формулы, результаты исследований в специфических форматах — все это может стать частью интегрального подхода к цифровой печати.

Примечательно, что авторы рассматривают такой подход как подходящий для применения и в закрытом документообороте — внутренние технические спецификации и тд и тп.

Разработчикам систем чтения (reading systems)

Им также будет легче, тк в EPUB 3 используется достаточно широкий набор технологий парадигмы OWP, и, более того, системы чтения часто полагаются на такого рода реализации уровня браузерного ядра. Предполагается, что это будет зафиксировано документально и даст существенный прирост пользовательской базе и сообществу разработчиков.

Веб-дизайнерам

Синергетический эффект от взаимодействия между традиционным книгоиздательским сообществом и веб-дизайнерским приведет к значительному улучшению UI/UX. Кроме того, повысит качество адаптации к различным средам выполнения (очевидно, что объем опыта веб-сообщества в этих вопросах также на порядок больше аналогичного в DP).

Браузеры

Предполагается, что использование «пакетного» подхода снимет ряд ограничений уровня браузерного взаимодействия. Например, в случае узких каналов, предварительно скачанный пакет/архив с контентом, позволит не зависеть далее от сети. Сюда же стоит добавить возможное ad-hoc взаимодействие между пользователями. В целом, этот пункт следует  в фарватере работы над архивным форматом упаковки контента (см. «Специализированный архивный формат»).

Библиотекам и архивным сервисам

Целостность и использование компрессии EPUB-WEB документа играет значительную роль для повышения привлекательности формата как архивного и библиотечного.

Рядовым пользователям

У пользователя будет выбор использования одного и того же контента на множестве устройств: начиная от специализированных и заканчивая любимым браузером. Издателю же не придется выбирать за пользователя. Тот же самый контент может плавно мигрировать между системами со всей пользовательской метаинформацией, вроде заметок и закладок.

Обратная совместимость

EPUB-WEB, вероятно, не будет обратно-совместимым с EPUB3. Однако, непосредственно контент уже выполнен на базе ядра OWP-технологий: HTML, CSS, SVG, Javascript etc, что позволяет снизить издателям трудозатраты на внедрение. Основная часть изменений затронет уровень упаковки, структурных описаний и метаданных публикаций. Те издательства, которые уже вложились в переход с EPUB 2 на 3 так или иначе окажутся впереди.

Специализированный архивный формат

На мой взгляд, едва ли не самая интересная часть документа. Существует определенное количество форматов для оффлайнового архивного хранения документов и описания упаковки цифровых публикаций — OCF, ODF, OOXML. При этом ни один из них не является универсальным и поддерживаемым повсеместно в DP-экосистемах. EPUB-WEB же нуждается в нативном для классического веба формате архивирования. При этом стоит отметить, что мы имеем дело с достаточно специфическими нуждами, что должно быть покрыто расширением такого базового  generic-формата.

Не менее важным в достижении интероперабельности является описание процесса перехода публикации от онлайн к оффлайн представлению и наоборот.

W3C Web Application Working Group недавно опубликовала документ со статусом First Working Draft для Streamable Package Format for the web (web -packaging). Что опять же, на мой взгляд, является технологически революционным и для глобальной сети. Этот документ содержит описание формата упаковки веб-приложений (RIA) для локальной загрузки и выполнения. Хотя, возможно, он и не будет принят за основу, и придется искать иные пути решения.

Структура цифровых публикаций

EPUB3 уже содержит в себе определения базовых технологий для решения вопросов со структурами данных — JSON, XML, (x)HTML. Уже сейчас ясно, что все имеющиеся реализации придется сильно оптимизировать для нужд EPUB-WEB в контексте OWP.

Здесь, кстати, приводится интересный пример с одностраничной публикацией, которая, вероятно, станет самым распространенным случаем: EPUB-WEB должен иметь набор описания всего пакета по умолчанию  (spine, manifest etc), чего нет в текущем формате EPUB3.

Идентификация документа и фрагментов

В глобальной сети HTTP URI служит базовым методом идентификации ресурса или его фрагмента. В переносимых (portable) цифровых публикациях нет никакого эквивалентного метода, тк по определению оффлайновая публикация не обладает никаким HTTP адресом. Имеющаяся внутренняя спецификация для определения фрагментов (CFI) и их местоположения в документе так же не подходит для этих целей.

EPUB-WEB должен будет определить способ, каким образом использовать URI для идентификации фрагментов и документов в сети, так чтобы не вносить изменений в уже имеющуюся схему. Возможно, будет иметь смысл использовать спецификацию W3C Media Fragments (media-frags) в части случаев. Здесь пока больше вопросов, чем ответов.

Обнаружение метаданных

Необходимо определить синтаксис для инлайновых мета-данных. О чем речь: необходим механизм, определенным образом размечающий контент и делающий его машиночитаемым — поисковики, архивные системы крайне в этом нуждаются. В принципе, сам HTML в базе уже позволяет это делать — RDFa и/или Microdata для метаданных вроде заголовков и авторов. Отмечается, что это помогло бы в тч качественнее поддерживать i18n (интернационализация), чем использование JSON или XML.

Стилизация, лэйауты и пагинация

К сожалению, OWP в целом и CSS частности страдают отсутствием решений в части ожиданий сообщества книгоиздателей в вопросах типографики, лэйаутов и прочего. Очевидно, что нативная поддержка постраничного представления рассматривается как критическая функциональность. Текущая спецификация EPUB не определяет этого для reflowable-контента, хотя определенные попытки были в экспериментах по созданию спецификации EPUB Adaptive Layout (PGT).

Безопасность и политики защиты контента

Модель защиты контента глобальной сети в  интересующей нас части базируется на same-origin policy (CORS), которая в свою очередь не применима к переносимым (portable) документам. С другой стороны, господствующая концепция защиты EPUB-контента основана на предположении, что к контенту применяется некоторая внешняя проприетарная DRM-технология. Очевидно, что нужно будет искать компромиссное решение как для онлайн, так и для оффлайн случаев.

Контроль представления и персонализация

Персонализация — первейший механизм необходимый при чтении длинных произведений. Технологии вроде CSS Media Queries прекрасно зарекомендовали себя  в части адаптации контента к различным устройствам, однако, это не то же самое, что персонализация. Управление представлением не описано системно и не имеет документального «фреймворка» под собой. В настоящий момент каждый разработчик берет на себя самостоятельно разработку концепции и реализации такого рода функционала. Очевидно, что EPUB-WEB должен включать в себя такого рода документ.

Перенос контента между сервисами

Разные системы воспроизведения контента могут иметь отличающиеся представления о воспроизведении: pre-paginated, reflowable, image-based и тп. Наличие профилей (profiles) по умолчанию позволило бы избежать недостаточного описания документа при его попадании в среду, где принят иной тип воспроизведения. Добавления в юзер агент специальных правил позволило бы запускать «улучшенное» поведение системы воспроизведения в пределах заданного домена без риска нарушить целостность и функциональность базовой публикации.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *