fb3!!!

на фикшнбуке второй заход обсуждения формата "fb3".
если есть пожелания и профессиональные советы, то думаю, стоит туда обратиться =)
(сам Грибов писал, что он заинтересован.

последние новости (март, 2009):

GribUser написал:
Cobalt написал:
А вообще когда можно ждать окончательную версию стандарта? Хотя бы приблизительные сроки... И от чего это собственно зависит?

Окончательная будет через годик, думаю. Едва ли раньше. Рабочая будет к осени, надеюсь. Драфт уже есть, второй драфт должен быть, по идее, но пока его нету, потому что я ужасно занят текущими проблемами и времени на доработку формата нет.
Зависит скорость разработки пока, в основном, от моей занятости. Так же весьма важно и общественное участие, но сейчас набросали уже кучу замечаний, которые пока сил нет, узкое место - во мне. Хотя, думаю, общество могло бы побольше косяков наловить. Если бы хотя бы пара профи дали себе труд внимательно просмотреть схему, следующий драфт, до которого я таки-доберусь когда-то, стал бы значительно лучше.


.
материалы и ссылки: 1. xslt-код [устарело] 2. краткое описание fb3 [устарело] 3. обсуждение формата [активное обсуждение]

.

Комментарии

Создается впечатление, что делается этот fb3 исключительно для того, чтобы не дать нам редактор и иметь монополию литреса на такие книги:)

это открытый стандарт – они не смогут.
спецификация открыта: все могут ей пользоваться... =)

Просто, как я понял из обсуждения на форуме, преимущества мягко говоря сомнительны(ну разве что картинки менять проще будет), а недостатков(в виде разбивки текста на куски, тоесть лишняя головная боль производителям читалок) хватает. Зачеркивания и подчеркивания тоже не поддерживаются, как и в fb2, ну и т.д.

Ну-ну.
Windows Vista в исполнении фикшнбука.

Больше всего понравилось, что картинки больше не хранятся в XML, а лежат в архиве, отдельно. Я примерно об этом и мечтал. А то редактировать xml в редакторе, когда громадный кусок картинки вставлен сложно. Теперь книжку можно полностью сделать в блокноте/vim. А картинку просто рядом положить. Разве не замечательно?

Картинки изначально в FB2 можно было хранить как внутри XML в , так и во внешних файлах!

Любая смена форматов / программ на руку монополистам, а не нам, и вредит свободному распространению информации :( не случайно упомянули Висту). Сделать открытый стандарт закрытым, добавив какую-то фичу для несовместимости - раз плюнуть (Грибузеру не верю ни на грош). То, что файл будет разбит на части - шаг назад и движение к единичным экземплярам книг в библиотеке, борьба с массовостью (представляете, если на каждый файл из 50000 вам нужна будет отдельная папка? Или хотя бы архив - тормоза). Словом, не удивлюсь, если станет известно, что проект проплачен литресом (Грибузер упоминает его в своем интервью без стеснения, говорит "мы"). Восторгов по поводу

Цитата:
Больше всего понравилось, что картинки больше не хранятся в XML, а лежат в архиве, отдельно. Я примерно об этом и мечтал
отнюдь не разделяю. Для создателей книг, может, станет чуть лучше, а для читателей? Да и для создателей, неужели вы думаете, что все это будет доступно без спецредакторов, еще более неудобных, чем для fb2? Наивность! Архив, контейнер - ладно, а ссылки в теле файла? И - пароль на архив-контейнер... И так тошнит уже от txt-файлов в папках с картинками, будет то же самое. Формат DOCX вспомните! Словом, это еще этап на пути к платным книгам. Думаю, что пираты это своевременно поймут и стандарт проигнорируют. А Грибузеру совет - чем изобретать новые фичи за литресовские 30 серебренников, лучше как следует отладить свой глючный софт для fb2.

computers написал:
Сделать открытый стандарт закрытым, добавив какую-то фичу для несовместимости - раз плюнуть (Грибузеру не верю ни на грош).

Где написано, что fb станет закрытым? Ведь это одна из главных его фич, вроде.

zip - открыто, обкатано, тысячи реализаций под любую платформу. xml - открыто, обкатано, тысячи реализаций под любую платформу.

Другое дело если патенты и еже с ними. Тогда надо будет делать форк. Но на это не пойдут - потеряют популярность. Уроки истории выучены - PC vs Mac.

computers написал:
То, что файл будет разбит на части - шаг назад и движение к единичным экземплярам книг в библиотеке, борьба с массовостью (представляете, если на каждый файл из 50000 вам нужна будет отдельная папка? Или хотя бы архив - тормоза).

Нет, будет как и сейчас. Просто вместо fb2.zip теперь будет просто fb3.

Уверяю, подход fb3 только избавляет от тормазов и расхода памяти. О, я просто мечтаю о fb3.

Представьте себе "Войну и мир" с кучей иллюстраций.

При fb2 нужно полностью распаковать один ГРОМАДНЫЙ xml из zip, затем ещё и конвертировать картинки из base64.

При fb3 распаковываешь лишь нужную часть/главу (zip поддерживает выборочную распаковку). Картинку тоже просто распаковываешь.

Железо отдыхает!!

Далее, представьте что нужно индексировать тысячи файлов. Как _обычно_ это делают - распаковывают ГРОМАДНЫЙ xml и парсят его полностью через библиотеку, ибо по другому лениво. А теперь - распаковываешь лишь файл описания. Опять выгода, гринписовцы довольны.

И размер книжек усохнет, ибо картинки в base64 - страшный перерасход.

computers написал:
Да и для создателей, неужели вы думаете, что все это будет доступно без спецредакторов, еще более неудобных, чем для fb2? Наивность!

Сейчас под Linux вообще нет редакторов специализированных для fb2. Текст поправить ещё можно, благо имеются редакторы xml. А вот картинку вставить - уже нужно голову ломать и с бубном плясать. В таком случае все в разы упрощается - достачно положить в архив cover.jpg. Реализация программы тоже, как я себе это представляю.

Я редактировал одну книгу. Делал это в vim. И просто страшно было заглядывать в конец файла - там картинки в base64. Такой объем, да ещё с подсветкой - жутчайшие тормоза.

А теперь? Красота - отредактировал главу, затем следующую. Можно пойти дальше. Один человек вычитывает одну главу, второй вторую. И все в кучу сваливаешь и пакуешь zip - на выходе fb3.

Аналогия - исходные коды программ разделяют на отдельные файлы. Не кому не взбредет в голову что либо сложнее Hello_World писать все в одном файле. Это же жутко не удобно!

computers написал:
Архив, контейнер - ладно, а ссылки в теле файла? И - пароль на архив-контейнер... И так тошнит уже от txt-файлов в папках с картинками, будет то же самое.

А разве сейчас не стало стандартом fb2.zip? И разве уже сейчас нельзя поставить пароль на контейнер сей?

computers написал:
Формат DOCX вспомните! Словом, это еще этап на пути к платным книгам. Думаю, что пираты это своевременно поймут и стандарт проигнорируют. А Грибузеру совет - чем изобретать новые фичи за литресовские 30 серебренников, лучше как следует отладить свой глючный софт для fb2.

У OOXML проблема не в архиве и отдельных файлах, а в том, что многие вещи в нем прописаны со ссылкой на закрытые форматы.

Лучше вспомните ODF - по сути очень походит на fb3 - зип архив с разрозненными файлами. Только fb3 в разы проще.

=-=-=-=-=

Я так понимаю, единственное недовольство по поводу Гризбузера, но я не знаю кто он такой. Неужели страшнее Балмера?

Вроде как формат вынесен на обсуждение. Что вам не нравиться то?

Так что, вантузойд, не учи красноглазого линуксойда.

Pavel_V написал:
Где написано, что fb станет закрытым? Ведь это одна из главных его фич, вроде.

Скорее всего, постараются ограничить его использование посторонними, закрывая доступ к программам создания. FBE больше в открытый доступ не пойдёт, уже объявлено. Значит создавать файлы в новом формате сможет только закрытая группа людей. Конвертация - тоже только у них. Ну и читалки - щедро и всем. "Покупайте наших слонов!"

"Слоних оставим себе"?

Читалки - всем, но не исходники читалок.

Нам, кстати, придется морочить себе голову с вырезанием из fb3 текста. Иначе - только сканирование+вычитка.

Вопрос профана - судя по обсуждению, переконвертировать из fb3 в fb2 сложно?

ИМХО, не сложнее, чем из txt, или даже проще. Но ведь ничего для этого нет! Еще предстоит создавать все ПО заново. Маразм, никому не нужный, и никогда не заменит fb2. Надеюсь, что дураков не очень много, судя по соотношению восторгов и критики - в основном все правильно поняли. Да мало ли всяких форматов книг - exe, chm - чего не использует дурачье, не дающее себе труда даже посмотреть, что сейчас в тему. Но делать конверторы fb3 to fb2 все равно придется, т.к. литрес однозначно перейдет на fb3. Да еще и ключик к файлу начнут высылать после оплеты :(. Это просто способ борьбы с пиратами.

кхм.
я правильно помню, что пароли в формате PKZIP'а брутятся за минуты-часы?

Верно говоришь.
При желании, схема проста:
- для отвода глаз, публикуется как бы открытый fb3 формат
- литрес и прочие правообладатели реализируют формат "с недокументированными фичами". Для него же делают внутренные закрытые редакторы, плюс раздают бинарные читалки (в которых хрен знает что закодировано, вплоть до поиска меток литреса в файле и стук по сети Большому Брату кто, когда, что и почему читает) "щедро и всем".

Jolly Roger написал:
FBE больше в открытый доступ не пойдёт, уже объявлено. Значит создавать файлы в новом формате сможет только закрытая группа людей.

Вряд ли. Поскольку сам формат не является закрытым, и, к тому же, является очень простым, любой программер напишет редактор fb2 или fb3 за неделю. Другое дело, что написать ХОРОШИЙ редактор сложнее. Но в случае эксцессов редакторов появится немеряно. Да их можно, наверное, и из редакторов html переделывать.

Мне нравится эта фраза - "любой програмер напишет". Вы програмер? Вы будете писать? Или вы знаете програмера, который согласен сесть и абсолютно бесплатно и бескорыстно написать нам редактор? Нормальный редактор, а не блокнот с подсветкой тегов.

Bullfear написал:
Мне нравится эта фраза - "любой програмер напишет". Вы програмер? Вы будете писать? Или вы знаете програмера, который согласен сесть и абсолютно бесплатно и бескорыстно написать нам редактор? Нормальный редактор, а не блокнот с подсветкой тегов.

Ну я программер... И уже примеривался к тому, чтобы написать FB2- редактор под Linux, ибо достало. :)
Другой вопрос, что гораздо менее затратный способ - использовать для подготовки книг уже имеющийся софт, тот же OpenOffice, а писать уже конвертор из формата этого софта в FB2. А насчет недели.... Заакон джуунглей глаасит - "нет ничего проще задачи, которую не надо делать самому" :))))

Хм. А вот это уже мысль :)
Какой из стандартов поддерживаемых OpenOffice наиболее прост по своей структуре? Если здраво рассудить, то конвертор будет гораздо проще написать, главное чтобы формат, из которого необходимо конвертить, был ясным и простым. С дрожью вспоминая валидатор для html =\\

Пардон за тормоза. Стандарт всего один, затра выложу сюда описание.
---------------
Done.
http://lib.rus.ec/b/123534 - что-то типа руководства по использованию
http://lib.rus.ec/b/123535 - официальная спецификация

Здравствуйте, я любой программер.

Уверяю вас, что написать софт, который будет работать с описанным форматом - ежели он действительно таков - не многим сложнее той формы, в которой вы печатаете ответ. Самое сложное - выгрузка zip и общение с файлами с ошибками, в остальном подобное пишется за очень быстро.

BladeL написал:

Уверяю вас, что написать софт, который будет работать с описанным форматом - ежели он действительно таков - не многим сложнее той формы, в которой вы печатаете ответ. Самое сложное - выгрузка zip и общение с файлами с ошибками, в остальном подобное пишется за очень быстро.

Действительно таков. Правда, "Essentials" описывают подмножество языка, но достаточно представительное.
Работа с форматом - бывает разной. Одно дело - конвертер XML <-> XML, другое - читалка, третье - редактор. Переписать OpenOffice за выходные лично я бы не взялся.

Я программер. Я буду писать, ибо достало. ) Была мысль написать только FB2 редактор, однако с появлением деталей FB3 - придется подстраиваться и под него. Книг у меня хватает для скана и оттачивания.

как пишется? =р

Цитата:
При fb2 нужно полностью распаковать один ГРОМАДНЫЙ xml из zip, затем ещё и конвертировать картинки из base64.
При fb3 распаковываешь лишь нужную часть/главу (zip поддерживает выборочную распаковку). Картинку тоже просто распаковываешь.
Железо отдыхает!!
Далее, представьте что нужно индексировать тысячи файлов. Как _обычно_ это делают - распаковывают ГРОМАДНЫЙ xml и парсят его полностью через библиотеку, ибо по другому лениво. А теперь - распаковываешь лишь файл описания. Опять выгода, гринписовцы довольны.

Pavel_V почитайте что пишет по этому поводу создатель читалки для fb2. Кто сказал что парсить 100 файлов по 1кб быстрее, чем один файл 100 кб? Все равно придется парсить все файлы в архиве. Итог - читалка тупо подвисает при открытии содержания. А теперь попробуйте реализовать автопрокрутку для текста из несльких кусков. Или реализовать по описанию, вынесенному в отдельный файл линию прочитанного. Все это делается отнюдь не для удобства читателей, создателя читалок или даже OCR-щиков. Все это делается для того чтобы можно было реализовать бесплатную часть книги, бонус часть и т.д. То, что грибов безуспешно пытался организовать в fb2.1

Цитата:
Кто сказал что парсить 100 файлов по 1кб быстрее, чем один файл 100 кб?

Это объективная реальность :) Попробуйте погонять какой-нибудь парсер.

Stiver написал:
Цитата:
Кто сказал что парсить 100 файлов по 1кб быстрее, чем один файл 100 кб?

Это объективная реальность :) Попробуйте погонять какой-нибудь парсер.

(гоняя парсеры, задумчиво) Какая интересная у Вас реальность...

(печально вздыхая) Другой не выдали...

Stiver написал:
(печально вздыхая) Другой не выдали...

Давайте меняться. Я очень, очень хочу жить в такой реальности, где парсить 100 файлов по 1кб быстрее, чем один файл 100 кб. В такой реальности, наверное, и берега у молочных рек - кисельные.

Запросто :) Даю вводную: машина Pentium-M 800MHz, парсер MSXML 2.0 (Upd: память забыл - 512. А то без нее реальность неполная и берега невкусные :)). Несовременно? А не у всех машины мощные. Для очистки совести можете взять 10 MB вместо 100 KB. Кстати нетрудно понять, почему так происходит. По той же причине например разложить несколько маленьких матриц быстрее, чем одну большую.

Ах да, это все касается естественно DOM парсеров. SAX к объему гораздо менее критичен, но что-то сомневаюсь я, чтобы в популярных программках стали ставить SAX. Или все-таки ошибаюсь?

Stiver написал:
Запросто :) Даю вводную: машина Pentium-M 800MHz, парсер MSXML 2.0 (Upd: память забыл - 512. А то без нее реальность неполная и берега невкусные :)). Несовременно? А не у всех машины мощные. Для очистки совести можете взять 10 MB вместо 100 KB. Кстати нетрудно понять, почему так происходит. По той же причине например разложить несколько маленьких матриц быстрее, чем одну большую.
Ах да, это все касается естественно DOM парсеров. SAX к объему гораздо менее критичен, но что-то сомневаюсь я, чтобы в популярных программках стали ставить SAX. Или все-таки ошибаюсь?

Я понятия не имею что тако DOM и SAX. Парсер - перловый (у-у, ненавижу!) модуль XML::Parser, жрет 100 10-кб fb2-файлов не в пример медленнее, чем один мегабайтный. Машина, правда, побыстрее.

Ну да дело ведь не в этом. А в том, что Bullfeаr правильно сказал: эти контейнерные пляски нужны только для коммерциализации формата. Грибов давно этим дышит.

Мои 5 копеек, прежде чем что либо утверждать о парсинге текста надо таки узнать что такое DOM и SAX.
Мое мнение - несколько меленьких файлов много проще и быстрее.

Denis Tsyplakov написал:
Мои 5 копеек, прежде чем что либо утверждать о парсинге текста надо таки узнать что такое DOM и SAX.
Мое мнение - несколько меленьких файлов много проще и быстрее.

Я прекрасно знаю что такой DOM и SAX и не только они. Один файл 1мб парсится быстрее чем 10 по 100 кб. По вполне объетивным причинам. Учите матчасть, тестируйте, хоть MSDN почитайте, только не смешите народ. А книги максимум 1-2 Mb в fb2 тянут. Те, у кого Pentium-M и MSXML 2.0 это ~1-2% пользователей. Ну и пусть у них притормаживает они привыкли, зато у остальных 98% летать будет. Да и MSXML 2.0 уже давно не поддерживается.

Теперь по теме. Не смешите мои тапочки, fb3. НИКТО не доделал приличный редактор для fb2 за несколько лет. Есть что-то у литреза, но никому не дают. Пока что-то для fb3 выйдет, пройдут годы (если конечно кто-то вообще возьмется писать, денег-то на этом не заработаешь, а гробить несколько месяцев жизни - ищи дураков). Даже читалки, каждый месяц баг фиксы. Вот у меня CoolReader 3 просто перестал запускаться, хотя уже не новый проект.

Цитата:
Один файл 1мб парсится быстрее чем 10 по 100 кб.

Не факт. В случае с DOM, все дерево загоняется в память целиком. В этом случае лучше использовать несколько файлов поменьше.

На нормальном, не кривом парсере разницы при нынешних размерах книг и производительнысти машин, разницы практически нет что сорок раз по разу, что один раз сорок раз.
Мне не нравится что со множеством файлов сложнее будет работать, тот же fb2, я вообще в начале читал far-om, и особо не страдал, а тут идет неоправданное усложнение формата, зачем это надо? чтобы меньше лазили внутрь и меньше писали алтернативных программ...

Мне кажеться, что тут надо принимать во внимание еще и фактор времени - то есть одномоментно парсить один большой файл - кончено быстрее, чем кучу мелких в сумме того же (а реально - несколько большего) объема, но дело-то в том, что читалке совершенно не нужно парсить ВЕСЬ файл - ей хватит оглавления и, к примеру, одной главы. И перескакивание по главам будет происходить быстрее - вместо парсенья всего файла до места начала главы будет извлекаться из архива только нужная глава. Както так. Или я чего-то не понимат?

Bullfear написал:
Все это делается отнюдь не для удобства читателей, создателя читалок или даже OCR-щиков. Все это делается для того чтобы можно было реализовать бесплатную часть книги, бонус часть и т.д. То, что грибов безуспешно пытался организовать в fb2.1

+1

Цитата:
Я так понимаю, единственное недовольство по поводу Гризбузера, но я не знаю кто он такой. Неужели страшнее Балмера?
Единственное недовольство - что это будет формат борьбы с пиратством. Кстати, линуксоид! Грибузер - это и есть автор / создатель всех этих fb, ныне продавшийся литресу. Надо бы знать врагов! Балмер / Гейтс - мелочь пузатая ;). Как и Линус.
Цитата:
Я редактировал одну книгу. Делал это в vim
И много так наредактируешь, без специального софта? Ну, я не против мазохизма, очень даже понимаю и сочувствую ;).

Цитата:
Единственное недовольство - что это будет формат борьбы с пиратством.

Вряд ли.. Через полгода-год-два Либрусек сможет с таким же успехом диктовать формат Литресу, как наоборот.

Не сможет. У них группа программистов, которым платят деньги. У нас такой нету.

Но зато есть пользователи и книги. По-моему лучше иметь "bottle neck" в программистах, чем в книгах и читателях.

Не спорю. Но иметь инициативу в нашем противостоянии мы пока не можем. Организация-с.

Также - особого недостатка в читателях Литрес не имеет. Это у нас программистов не хватает.

Тоже не спорю. Это "пока" оставляет место для надежды :)

Я простой пользователь, совершенно не рублю в программировании, но читать люблю и являюсь пользователем очень многих библиотек. У вас на Либрусеке довольно приличная библиотечная база, но, с моей точки зрения, на том же Альдебаране, книг, несравненно больше, по крайней мере тех, которые интересуют меня. К чему это я?
Да к тому, что пока книги были бесплатными, в обычных текстовых файлах или в формате RTF, мы старожилы инета, привыкли к ним и нас, фактически, интересует текстовая информация, а не всякие прибамбасы с картинками. Чем дальше, тем всё труднее находить не просто нужную книгу, оформленную так сказать, а самый обычный текст. Сначала я приноровился сдирать текст, не смотря на запрет на копирование, так теперь они всё чаще дают только ссылку для скачивания с Литреса, даже не давая ознакомиться с текстом, фактически предлагая кота в мешке. Мне без разницы, проще или сложнее формат файла - это пусть интересует спецов-программистов. Мне важно, чтобы я без проблем мог прочитать текст, пусть и без всяких иллюстраций. Красивая там книжка или нет - это, конечно, важно, но не главное. Важно содержание и доступность для прочтения. А все эти изменения формата - важны только монополистам и, именно, для борьбы с бесплатным доступом к информации.

Цитата:
У вас на Либрусеке довольно приличная библиотечная база, но, с моей точки зрения, на том же Альдебаране, книг, несравненно больше, по крайней мере тех, которые интересуют меня.

Неужели это действительно так?
Не верю.
А что вас конктретно интересует с Альдебарана из того, чего нет на Либрусеке?

Алексей_Н написал:
Неужели это действительно так?
Не верю.

"Старожилу интернета", вероятно, будет интересно узнать, что книги никогда не были бесплатными :-) Вообще, весело со "старожилами" :-)

Pavel_V написал:
Сейчас под Linux вообще нет редакторов специализированных для fb2. Текст поправить ещё можно, благо имеются редакторы xml. А вот картинку вставить - уже нужно голову ломать и с бубном плясать.

Чего плясать-то? Утилита base64 является стандртной и входит в любой дистрибутив. И, чтобы добавить картинку достаточно набрать в консли base64 image.png >> file.fb2, а затем, открыв в том жу vim'е сделать xml обвязку base64 кода.
Pavel_V написал:
И размер книжек усохнет, ибо картинки в base64 - страшный перерасход.

С этим тоже не согласен, и зип и рар очень ловко жмут картинку в base64 до размеров вполне сопоставимых с теми, что занимает файл в png или jpeg.

gmarapet написал:
С этим тоже не согласен, и зип и рар очень ловко жмут картинку в base64 до размеров вполне сопоставимых с теми, что занимает файл в png или jpeg.

Есть такое дело. Разница порядка одного процента.
На размер гораздо больше влияет использование юникода - там разница в размерах зипа превышает десяток процентов по сравнению с архивом в однобайтовом алфавите. Кстати рар в этом отношении гибче, т.к. умеет обрабатывать некоторые структурированные конструкции.

Очень правильная задумка. Только надо было ещё FB2 так делать. А частая смена форматов - не очень хорошо, однако.

ground0 написал:
А частая смена форматов - не очень хорошо, однако.

Больших проблем при fb2->fb3 не должно возникнуть. Сие пройдет на полном автоматизме и без каких-либо проблем. Это вам не из txt/rtf выковыривать что-то.

Pavel_V написал:
ground0 написал:
А частая смена форматов - не очень хорошо, однако.

Больших проблем при fb2->fb3 не должно возникнуть. Сие пройдет на полном автоматизме и без каких-либо проблем. Это вам не из txt/rtf выковыривать что-то.

Я не о перекодировке говорил.

Страницы

X