Вы здесьВалидация fb2
Опубликовано ср, 15/04/2009 - 19:50 пользователем larin
Forums: 1. Добавил валидацию загружаемых книг.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
PipboyD RE:Подайте бедному копеечку на книжку с литреса... 4 дня
sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 1 неделя TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 1 неделя Oleg V.Cat RE:B343695 Александр. Книга 1 1 неделя Isais RE:Калибрятина/Самиздатина 1 неделя md2k15 RE:Относительно Вархаммер 40 000 1 неделя Oleg V.Cat RE:Беженцы с Флибусты 1 неделя tvnic RE:"Коллектив авторов" 2 недели SergL197 RE:Регистрация 2 недели ejik.v RE:Viva Stiver! 2 недели RedRoses3 RE:Флибуста конец? 2 недели Ldrozd RE:Сандра Ньюмен - Джулия [1984] 4 недели konst1 RE: Банда Рафаэля 4 недели Isais RE:Лоренс Даррелл - Горькие лимоны 4 недели Isais RE:B157704 Черепаха Киргала 1 месяц sem14 RE:Литературная премия «Ясная Поляна» 1 месяц blahblahblah2024 RE:Сборник - Советская морская новелла. Том 1 1 месяц Isais RE:Обновление FictionBook Editor 1 месяц Впечатления о книгах
tvv про Михайлов: Без пощады. Книга 3 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
10 11 2 vudy: книга полностью, проверьте на АТ.
vudy про Михайлов: Без пощады. Книга 3 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
10 11 По: "Глава 9"" - и кому надо это счастье ?
badbag про Тимофеев: Честерфилд (Боевая фантастика, Самиздат, сетевая литература)
10 11 Автор пишет читабельно, но не шибко умный и своими попытками сумничать, только смешит, в логику не умеет абсолютно, поэтому у него не фантастика получается, а сказки для подростков. Оценка: плохо
дядя_Андрей про Агония
10 11 Что ж, автор злобно ненавидит Андропова и КГБ, вообще, обвиняя их в подготовке к развалу СССР и, одновременно, страстно мастурбирует на МВД и лично "Великого Министра" (так в тексте, кроме шуток) Николая Анисимовича Щёлокова. ………
gruin про Видум: Не ДРД единой (Альтернативная история, Фэнтези, Самиздат, сетевая литература)
08 11 Сения не сказать отличная, но читать можно. Многовато рассуждений описаний. Оценка: неплохо
gruin про Прядеев: Позывной «Курсант» (Альтернативная история, Попаданцы)
08 11 По идее последняя в серии, а не первая. В остальных о предшестаующих событиях в детдоме, они хуже. А эта вполне читабельна. Но только та, которая "Курсант. На Берлин", на флибусте Оценка: неплохо
obivatel про Назипов: Ингвар. Книга 1 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
08 11 ГГ классический лох (человек, не умеющий «устроиться» и приспособиться к изменениям жизни и в результате обычно небогатый), а лох это судьба. Какие бы плюшки ему вселенная ни накидала, он про профукает, пролопухает, про"№%т. ……… Оценка: нечитаемо
Oleg68 про Кобен: Нарушитель сделки [Deal Breaker ru] (Крутой детектив)
08 11 Хороший триллер- детектив. Автор, как всегда на высоте. Буду продолжать читать серию. Оценка: отлично!
Isais про Берд: Тошнит от колец [Bored of The Rings ru] (Юмористическое фэнтези)
07 11 Поверьте, после этого реально тошнит от колец — после той работы, что пришлось проделать для минимальной удобопонятности этого нестареющего образчика студенческого юмора. Оценка: нечитаемо
Isais про Капельгородская: Зарубежный детектив [энциклопедия] (Энциклопедии, Литературоведение)
07 11 Когда-то покупал эту книгу (печатную) для работы и пользовался ее информацией без претензий и с полным доверием, но только лет через 10, когда появился Тырнет, узнал, что в ней есть довольно много ошибочных сведений, в основном ……… Оценка: хорошо
Barbud про Савинков: Николай I Освободитель. Книга 8 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
07 11 Кое-как, без интереса и по диагонали листая через десяток страниц, домучил восьмую часть. Девятую, наверное, и начинать читать не буду - опус все скучней и скучней. Кстати, судя по последним строкам, автор смылся из Киева ……… Оценка: нечитаемо
Дей про Старатель
07 11 В целом понравилось. Урал, тайга, охота, рыбалка, вот этот колорит и всё такое. Не понравилось в изложении: манера всякий раз вычурно обставлять диалоги. Почему хотя бы иногда не писать прямую речь без дополнений. Кто ……… |
Отв: Валидация fb2
Вы сюда потроллить пришли? Ну, продолжайте без меня.
Отв: Валидация fb2
Я сюда пришел предложить Вам получше продумывать Ваши предложения. Однако корм, как видно, не в коня.
Отв: Валидация fb2
Дело в том, что «расширенное» название для некоторых публикаций — всего-навсего вынужденная мера, — в связи с тем, что в здешней базе данных не может равноправно храниться две единицы с одинаковым названием, одна из них должна стать «дублем». А если, например, у романа два разных перевода, то в здешней библиотеке нет другого выхода, кроме как «расширять» название с учётом переводчика. Вот и всё.
Отв: Валидация fb2
Значит, надо исправлять библиотеку. Бардак очень легко устроить и потом очень сложно разобрать. Я с буквально такой же проблемой сталкивался — люди забивали в одно поле разную по сути информацию, и когда настало время обновлять систему, пришлось долго и упорно весь этот мусор вычищать. Далее, fb2-файл — это образ конкретной книги, а не обобщённый образ литературного произведения, как на фантлабе. Разные издания одной книги должны одновременно сосуществовать в рамках одной библиотеки, пусть даже для него не будет загруженного файла книги. Библиотеку делает библиотекой не куча книг, а структурированный каталог. Если часть этой структуры не поддерживается форматом файла, нужно это унести на уровень библиотеки (например, альтернативные названия, альтернативные издания (журнальный вариант, к примеру) и так далее). На фантлабе построена очень хорошая система каталогизации книг и к ней очень хорошо прикручивается непосредственно файл книги, но из-за политики фантлаба это невозможно. Вот нам нужно что-то типа фантлаба, но с файлами книг, открытой базой и открытым кодом, чтобы коллективный труд нельзя было одним махом прикрыть.
Отв: Валидация fb2
Ну я бы не стал брать ФантЛаб за образец каталогизации книг — именно потому что ФантЛаб не библиотека, а только картотека, каталог. То есть у ФантЛаба сугубо информационная функция — сообщить данные об авторе и всех неэлектронных изданиях его произведений. А Либрусеку нужно в первую очередь снабжать читателей текстами и делать это так, чтобы читатель не путался в многочисленных дубликатах или вариантах одного и того же текста.
И я не могу радикально не возразить такому твоему предложению: «Разные издания одной книги должны одновременно сосуществовать в рамках одной библиотеки, пусть даже для него не будет загруженного файла книги». Нет! нет! и ещё раз нет! В каталоге библиотеки должно быть только то, что в ней есть — только уже загруженные единицы хранения. Сведения же о всех фактических изданиях должны помещаться в раздел «описание автора».
Отв: Валидация fb2
Это никакое не возражение. Я за то, чтобы информация структурированно хранилась в библиотеке, а уж в каком месте она будет показываться — это дело десятое. Если данные структурированные, то их представление можно менять как угодно, в этом и прелесть подхода. У фантлаба данные структурированы, поэтому там можно легко сделать что угодно. На бардаке легко сделать не получится. У фантлаба есть один большой недостаток — там информация может изменяться лишь очень небольшим кругом людей, и некоторых авторов они не хотят принимать по причинам типа «отсутствие публикаций» и так далее. Вот если взять за основу схему данных фантлаба, да сделать на ней открытый движок, да ещё детально описать все правила работы — получится просто фантастическая неубиваемая штука.
Отв: Валидация fb2
Ещё раз — на ФантЛабе структурированы странички с инфой по книгам, имеющим неэлектронное издание. Но не файлы с самими книгами. Разница существенная — у них заведомо нет проблемы с дубликатами текста, ведь текстов нет вообще!
Кроме того, заметь, как на ФантЛабе «прекрасно» структурованы данные о романе «Оружие скальда» Дворецкой, если посмотреть на странички work90693 и work18313. Ну просто сразу всё понятно, где первая редакция, а где вторая, значительно переработанная… — инфа об этом внесена только на страничку цикла, на страничках изданий об этом ни гу-гу. А вообще разобраться с этим циклом, где там именно первые издания романов, а где переделки — без поллитры не разберёшь. Но нужна именно поллитра, помимо ФантЛаба приобретаемая, потому что ФантЛаб нужную инфу не представил.
Отв: Валидация fb2
А электронные книги откуда берутся? Правильно — из неэлектронных. Прикрутить поддержку файлов в книг в схеме фантлаба очень легко. А вот прикрутить поддержку разнообразных метаданных о книгах в либрусеке сложно. И даже если книга изначально электронная, в фантлабе проблем не возникаетю
Блин, это проблема предстваления. Информация-то об этом явно представлена в метаданных книги. Поэтому её можно вывести и на страницу книги. А если не сделано…, ну, мало ли багов в фантлабе. Но заметьте — это баги представления, которые легко фиксятся. Баги в ядре фиксятся сложно.
Отв: Валидация fb2
Очень легко только рассуждать здесь о том, что очень легко прикрутить там. Потому что представление о механизме фиксации данных предельно абстрактное. :-/
В третий раз повторяю. На ФантЛабе для книг создаются страницы — для одного и то же текста этих страниц можно насоздавать чёртову тучу. И, конечно, разобраться в этой чёртовой туче не составит труда, если это один и тот же текст. А вот если один и тот же роман оказывается в нескольких переводах или в нескольких редакциях с разными названиями, то и на ФанЛабе появляются «расширенные» названия с пояснениями в скобках. Чем эта ситуация в положительную сторону отличается от ситуации на Либрусеке, а? Ничем. Всё те же «неправомерные» перелицовки названий.
Дальше. На ФантЛабе строчка в авторской библиографии ссылается на что? — правильно, на страницу с инфой по книге. А эта страница ссылается на страницы с инфой по каждому отдельному изданию. (И читателю ФантЛаба должен ковыряться в этих многочисленных страничках, прежде он поймёт какое издание чем именно отличается от другого, что, например, роман «Железная голова» не входит в роман «Корни гор» 2004 года издания, но представляет собой половину романа «Корни гор» 2007 года издания (роман входит в… роман оригинальное представление инфы, однако)). На Либрусеке строка авторской библиографии должна содержать ссылку на текст. Но никак не на страницу с несколькими ссылками на несколько текстов.
Наконец, есть ли на ФантЛабе рубрика, которая бы объединяла идентичные тексты произведения и обосабливала другие (другой редакции, другого перевода)? Нету. Потому что ФантЛабовцам пофик эти проблемы — их посетители должны отправляться в магазин, а не получать текст на месте.
Отв: Валидация fb2
Вообще-то валидатор ничего в файле не меняет, он только проверяет на вшивость. Или вы про что?
Отв: Валидация fb2
Я про валидатор ничего не знаю. Я лишь предлагаю добавлять в файл информацию о характере изменений, если меняется книга из библиотеки. То есть берётся файл, исправляются ошибки валидации и снова заливается в систему (заменяется битый на новый). При этом увеличивается версия и добавляется блок history. Улучшать в битых файлах можно много чего. Часто там, например, нет разбивки на главы и весь текст идёт одной секцией. Или сноски оформлены угловыми скобками. В идеале это всё надо фиксить, но это долго.
Отв: Валидация fb2
А почему Вы решили, что это не делается? Кто Вам это сказал? Это "предлагается" примерно около года. И если файл правится, а не верстается заново - так и положено делать.
Да, долго. Но надо.
P.S. Если сноски оформлены угловыми скобками - файл так и останется битым. Однозначно.
--------------------
Постепенно дошло и до меня - Вы, похоже, предлагаете добавлять информацию в history автоматом при заливке новой версии? Едва ли это правильно. Оно получится "малоинформативным".
Отв: Валидация fb2
Ну вот неплохо было бы на какое-нибудь видное место положить такие правила, я пока не нашёл.
Да, долго. Но надо.
P.S. Если сноски оформлены угловыми скобками - файл так и останется битым. Однозначно.
--------------------
Нет, нет, нет. Я не предлагают править автоматически fb2-файл. Я предлагал просто как-то стандартизировать процесс изменений, см. начало сообщения.
У меня была другая идея, но я её пока не озвучивал: хочется иметь историю изменения книги в библиотеке. Это совершенно не то же, что document-info/history из файла, это именно лог причин обновлений книги. Например, автор обновляет книгу в библиотеке и пишет на вебформе обновления комментарий типа «фикс ошибок валидации: убраны ошибки распознавания, тег middle-name помещён на правильное место» или «заменено на новую, более качественную версию из другого источника». Но эта идея скорее к функциональности библиотеки относится
Отв: Валидация fb2
Не относится, но определенный смысл в ней есть - если например добавить такое поле да еще и обязательное в "Нашел дубля. Кликните разрешить конфликт" то есть если человек меняет одну книгу на другую ее версию - пусть напишет почему втбрал именно этот вариант" , польза от этого в том что хоть некотторых заставит задуматься прежде чем автоматом кликать на тот что залил сам , да и библиотекарям если разбирать такой "конфликт" то будет легче.
Впрочем вся эта дискуссия к валидации вообще не имеет никакого отношения.
Отв: Валидация fb2
добавте пожалуйста валидацию без загрузки на сайт
Отв: Валидация fb2
http://code.google.com/p/fb2utils/downloads/list
Скачайте себе последнюю версию и тогда Вы сможете валидировать файл до загрузки на сайт.
Отв: Валидация fb2
Как в валидаторе отключить проверку даты?
Отв: Валидация fb2
А как валидатор совместить с новыми жанрами FBE?
Отв: Валидация fb2
Это легко. Достаточно заменить файл FictionBookGenres.xsd (из папки валидатора) на новый.
Отв: Валидация fb2
Спасибо! Успешно.
Отв: Валидация fb2
А вот мне всегда сомнительно, надо ли это делать. Для других библиотек ведь эти файлы тогда могут оказаться невалидными. Или это пофигу и нафигу, и все равно надо чтобы прямо в файле новые жанры?
Отв: Валидация fb2
Уважаемые, столкнулся с такой проблемой валидации данных.
Данный прием использования секций некорректен, выдается ошибка нарушения схемы DTD (expecting image, p...):
<body>
<title><p>Author</p><p>Book name</p></title>
<section>
<title><p>Title of section 1 level</p></title>
<p>Text 1.</p>
<section>
<title><p>Title of section 2 level</p></title>
<p>Text 2.</p>
</section>
</section>
</body>
После валидации курсор ставится в проблемное место - в конце тэга вложенной секции (после второго < section >). Что это значит?
Но если текст 1 заключить в секцию - валидация проходит.
<body>
<title><p>Author</p><p>Book name</p></title>
<section>
<title><p>Title of section 1 level</p></title>
<section>
<p>Text 1.</p>
</section>
<section>
<title><p>Title of section 2 level</p></title>
<p>Text 2.</p>
</section>
</section>
</body>
С чем это связано? Нарушение структуры, правил использования схемы? По логике-то все верно..
Отв: Валидация fb2
При чем тут логика?
В Вашем первом варианте слишком большая нагрузка на интерпретатор читалки получается. Второй вариант проще.
Но все уже давно привыкли к тому, что текст должен быть заключен в теги "section" и теги "p" и "section" не могут быть на одном уровне.
Отв: Валидация fb2
Не может секция начинаться посередине текста. Перед началом секции обязательно должна быть либо (а) закрыта предыдущая секция либо (б) закрыт её title. Иными словами недопустимым является вот это
.
....</p>
<section>.....
Отв: Валидация fb2
Но на практике такое часто случается, даже в моей текущей книге. И как, тогда такие исключения обходить? Согласно описанному второму варианту?
И еще.. валидатор FBUtils на такие случаи размещения секций смотрит спокойно. Либо баг программы, либо это допустимо.
Отв: Валидация fb2
Исправлять.
Отв: Валидация fb2
Путем использования второго варианта? Очевидно..
Отв: Валидация fb2
<body>
<title>
<p>Титл</p>
</title>
<section>
<title>
<p>Уровень 1</p>
</title>
<section>
<p>****************</p>
</section>
<section>
<title>
<p>Уровень 2</p>
</title>
<p>◦******************</p>
</section>
<section>
<title>
<p>Уровень 2</p>
</title>
<section>
<p>◦********************</p>
</section>
<section>
<title>
<p>◦Уровень 3</p>
</title>
<p>**************************</p>
</section>
</section>
</section>
</body>
Отв: Валидация fb2
Да, таким же образом я и поступаю сейчас. Но в этом случае на лицо пустые подзаголовки (< section >) в оглавлении.
Отв: Валидация fb2
Ну и? Почему это Вам мешает?
Ситуация довольно распространённая.
Отв: Валидация fb2
Если так Должно быть, то вопрос по этой теме снимается. Я в создании fb2 еще новичок и потому каждое несоответствие, подозрительное действие воспринимаю критично. :)
Кстати, выше означенная проблема уже описана в http://lib.rus.ec/node/111115
Но мне не дает покоя - почему валидатор FB2Utils такие несоответствия проглатывает? Он не безгрешен? FB2Utils vs FBE - 0:1 :)
Отв: Валидация fb2
Так может быть.
Насчёт валидатора: хотелось бы увидеть конкретный файл.
Отв: Валидация fb2
Отправил в личку файл.
Отв: Валидация fb2
Я Вам ответила. Файл невалидный:
Так что валидатор работает штатно. ;)
Отв: Валидация fb2
Да, спасибо :) без посторонней помощи я бы погряз в самодурстве и лжекритике))
Высказывание про косячность FB2Utils было скороспелым. Выяснилось, что ошибки с секциями он не пропускает.. пока что. Так что, FB2Utils vs FBE - дружественная НИЧЬЯ! :)
Отв: Валидация fb2
Если сделать согласно второму варианту, то в оглавлении появляется пустой раздел (без title, соответствует абзацу с текстом 1):
< Title of section 1 level >
< section >
< Title of section 2 level >
Но это терпимо.
Отв: Валидация fb2
Не все программы для чтения этим грешат. Например, в CR2 в оглавлении никаких пустых разделов не наблюдается. Так что не заморачивайтесь на этот счет, пусть разработчики программ об этом думают.
Отв: Валидация fb2
Согласен. Достаточно лишь не отображать подобные пустышки, а редактор FBE по идее как раз и должен отображать все секции независимо, имеют ли они заголовки (title) или нет.
Зато они в CR3 наблюдаются :)
Отв: Валидация fb2
А вот HaaliReader, AlReader и CoolReader2 это дело в оглавлениях игнорируют.
Отв: Валидация fb2
Вопрос к технической службе.
А можно ли сделать так, чтобы заливаемый fb2 файл в случае выявления on-line валидатором ошибок (речь идёт об ошибках, не носящих критического характера) выдавал бы предупреждение (список выявленных ошибок) и предлагал выбор из двух вариантов:
[а] Ой, простите. Не надо такое заливать, я сейчас поправлю; (XOR)
[б] Всё-таки залить несмотря на ошибки!
При этом по умолчанию работает вариант [а].
Отв: Валидация fb2
сам задавался этим вопросом, пока не увидел тут http://lib.rus.ec/soft в самом низу оффлайн прожку выполняющую проверку) прежде чем заливать просто ей проверяйте :)
Отв: Валидация fb2
Полностью поддерживаю предложение VolgoDon-а. Причиной ляпа может быть обычная запарка или рассеянность, но пути назад уже нет - файл на сайте.
Отв: Валидация fb2
+1
Отв: Валидация fb2
Меньше некачественных файлов будет.
Отв: Валидация fb2
+1000!
Отв: Валидация fb2
Не уверен, сюда ли обращаюсь..
Мне интересно знать, какие стили распознает doc2fb, кроме основного текста и подразделов? Как форматировать цитаты, стихи и т.п.?
Отв: Валидация fb2
Все что выходит из под doc2fb необходимо допиливать руками на FictionBook Editor. Формат doc и pdf вообще лучше сразу перегонять в этот редактор с помощью Any2FB2. И там опять же допиливать вручную.
Отв: Валидация fb2
Лучше воспользуйтесь OOoFBTools, в нем можно все стили расставить, какие нужны для FB2 и даже не требует допиливания в FBE, сразу создает валидный документ, не требует наличия Ворда, как doc2fb, но работает на OpenOffice и требует либо OpenOPffice либо LibreOffice. И все же, хотя допил в FBE после OOoFBTools не требуется, всё же лучше пройтись FBE и посмотреть, что получилось, может что нужно подправить.
Отв: Валидация fb2
Вопрос молодого-начинающего.
Честно все прочитал с самого начала
и не понял - как валидатор установить
и как им пользваться?
Отв: Валидация fb2
http://ge.tt/7W0d0Jt/v/0
Скачать, распаковать, кликнуть на validator-gui перейти к проверяемому фб2 файлу и постараться расшифровать на что валидатор возмущается
Страницы