Блог пользователя lankier

Рейтинг книг и авторов на 03.01.2010

Рейтинг самых популярных книг по мнению читателей либрусека на 03.01.2010.

При подсчете рейтинга использована формула подлинной байесовой оценки. Эта же формула используется на сайтах imdb.com и кинопоиск.ру.

Показаны следующие рейтинга:


  • Общий рейтинг книг

  • Рейтинг книг по группам жанров:

    • Проза

    • Приключения

    • Детское

    • Детективы и Триллеры

    • Любовные романы

    • Наука, Образование



  • Рейтинг авторов

librusec-updater (4 in 1)

Вашему вниманию предлагается новая утилита из пакета fb2utils - librusec-updater. Удаляет, исправляет, обновляет и переименовывает fb2 файлы с либресека.

  • удаляет дубли

  • исправляет невалидный xml

  • обновляет/синхронизирует файлы с информацией из базы данных либрусека

  • переименовывает файлы в соответствии с шаблоном

Утилита работает из командной строки. Для работы ей нужны файлы-тысячники или ежедневные обновления, а также sql-dump-файлы.

Дополнительная информация в fb2 файлах

Как известно, в fb2 файлы можно добавлять дополнительную информацию через тег custom-info, примено так: <custom-info info-type="ключ">значение</custom-info>

Доска почета

Продолжаем исследовать валидность файлов в библиотеке. Три последних архива по 1000 после удаления дублей. Проверка на внутреннюю консистентность.

Сообщения об ошибках:

not linked image - в файле присутствует изображение на которое нет ссылки в тексте. Соответственно изображение показано не будет.

external image - ссылка на внешнее изображение. Не все (ни одна?) читалки умеют загружать внешние изображения.

Статистика валидности fb2 файлов в библиотеках

Выкладываю статистику по пяти коллекциям книг в формате fb2.

Пояснения к статистике

not an xml file - вообще не xml[*].

sax parsing error - проверка на возможность парсинга sax-пасером (здесь используется expat). Самый простой и быстрый парсер xml. Ест всё, что дают. Если файл не парсится sax-парсером вероятность обработки этого файла в какой-либо программе близка к нулю.

dom parsing error - более продвинутый и более строгий dom-парсер (здесь используется libxml2). Применяется во многих программах.

X