Вы здесьПроект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.
Опубликовано пт, 04/04/2008 - 01:59 пользователем soshial
Форум пока очень неудобный для этого, так что пока будем обсуждать здесь...
Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;)
я предлагаю "сплочиться" =D
просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.)
Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет.
СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ.
FAQ:
> Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу.
Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =)
что хотите то и выбираете)
> С каким форматом предстоит работать?
с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =)
общая информация здесь и тут
в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;)
1. общая информация о формате
2. описание тегов и простой пример книги.
3. как сделать книгу
4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только
5. несколько статей и инструкций по fb2
6. Создание электронных книг в формате FictionBook 2.1: практическое руководство
> Условия, правила вычитки, форматирования?
правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.)
[quote]а теперь главное!
в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
нэнси RE:Подайте бедному копеечку на книжку с литреса... 1 день
kopak RE:Таинственная личность админа Флибусты 3 дня Isais RE:Не тот автор 4 дня xieergai60 RE:Продление подписки 6 дней TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 1 неделя Isais RE:Древняя Греция. Читаем... 1 неделя laurentina1 RE:Ирина Александровна Велембовская - Немцы 1 неделя Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Саша из Киева RE:Избранное 2 недели Alligatoreader RE:Багрепорт - 2 2 недели fedor.de RE:Отображение страницы Librusek 3 недели Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 3 недели blahblahblah2024 RE:Беженцы с Флибусты 3 недели sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 3 недели sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 1 месяц Oleg V.Cat RE:B343695 Александр. Книга 1 1 месяц Isais RE:Калибрятина/Самиздатина 1 месяц md2k15 RE:Относительно Вархаммер 40 000 1 месяц Впечатления о книгах
udrees про Бубновский: Мифы о здоровье. Откуда берутся болезни (Здоровье, Альтернативная медицина)
09 12 Когда я начал читать книгу, то был немного разочарован тем, что она написана при поддержке и содействии канала «Военная тайна» и Игоря Прокопенко. Уже одно это говорит о «качестве» материала. Не знаю, уж знал Бубновский о ……… Оценка: плохо
udrees про Бубновский: Здоровье позвоночника. Упражнения от болей в шее и спине при остеохондрозе и межпозвоночных грыжах. Золотая книга [litres] (Медицина, Здоровье)
09 12 Хорошая очередная книга от Бубновского. Узнал кое-что новое, даже в дополнение после прочитанных его других книг. Например, про грыжу много написано. Есть иллюстрации и описания упражнений. Будет полезно прочитать всем, кто страдает от болей в спине. Оценка: хорошо
udrees про Бубновский: Заговор фармацевтов (Альтернативные науки и научные теории)
09 12 Книга, сочетания которой я не понимаю. С одной стороны Бубновский, серьезный доктор, лечащий болезни спины у людей, методику и советы которого лично я тоже использую, и которая помогла мне избавиться от сильных болей в шее. ……… Оценка: плохо
udrees про Бубновский: Колени и стопы без боли. Как сохранить и восстановить подвижность суставов в домашних условиях [litres] (Здоровье)
09 12 Все правильно описано, подробно, с изложением анатомии простым языком, примерами из жизни. Приведены упражнения с иллюстрациями. Их правда не так много, как обычно в других его книгах по кинезитерапии. Прочитать будет полезно, ……… Оценка: отлично!
Maxxim про Терентьев: Точка невозврата (Боевик)
08 12 началось живенько и идея ничего, но потом.... вдаваться смысла нет ,в общем - автор дурак.
Sello про Розенблат: Рассказы [СИ] (Проза, Эссе, очерк, этюд, набросок)
08 12 Я не знаю, где живет сейчас этот товарищ, но, по указанной дате под рассказиками, в 2016г. он пребывал в Израиле. Вот проблема. "Писатель" выставляет перед некоторыми текстами эпиграфы из Набокова, а собственно само написанное ……… Оценка: нечитаемо
Dongel про Шалашов: Господин следователь 1 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
07 12 Дочитал четвертую книгу цикла. Мне очень понравилось! Во-первых, автор проделал колоссальную работу, собирая исторические и архивные материалы. Во-вторых, все повествование очень увлекательно, почти нигде нет "провисающих" ……… Оценка: отлично!
Саша из Киева про Шатирян: Музыкантская команда (Детская проза)
07 12 Кто-нибудь сможет преобразовать эту книгу из djvu в fb2?
Олег Макаров. про Мусаниф: Во имя рейтинга (Юмористическая фантастика)
07 12 Великолепная книга. Как, в общем-то и все остальные у Мусанифа. Что касается мнения уважаемой Vetrenitsa «я категорически не согласна с тем, что, что по телевизору покажут, в то люди и поверят» — думаю, последние три ……… Оценка: отлично!
Isais про Велипольский: Три «Остапа» [СИ] (Научная фантастика, Самиздат, сетевая литература)
06 12 Это, надо заметить, очень редкая птица — научная фантастика, которую следовало бы написать и издать в 1924-м. Или, по крайней мере, в 1956-м. А она каким-то странным образом залетела в 2016-й... Выходит, и среди рассказов бывают «попаданцы».
Mila_48 про Сорока: Чорна Рада, 1663 [uk] (История)
06 12 С благодарностью верстальщику за возможность прочитать эту книгу. Удачи! Оценка: отлично!
дядя_Андрей про Горбатенко: Диверсант. Искусство активной разведки (Публицистика, Спецслужбы)
06 12 kyns71, ну, можете не друг друга. Можете на "куклах" учиться |
Комментарии
Отв: Проект по вычитке книг.
В принципе могу вычистить дубли Донцовой, вставить недостающий фрагмент Тэд Уильямс, ну и попробовать сделать красиво "предложено юзером amyat Подборка военной литературы "
Отв: Проект по вычитке книг.
Жаль а то хотел сделать "Пушкин Стихи не для дам распознать, сделать fb2 http://hagen.ifolder.ru/7492089"
Отв: Проект по вычитке книг.
По-моему, что-то промелькнуло, что эта книга в сети есть. Давайте подождём немного, может, кто-то (с более хорошей памятью) откликнется. ;)
А всё остальное записываю за Вами. Слово - не воробей. :Р
Итак, Донцова и Тэд Уильямс - замётано. :)
Когда закончите, отпишитесь, пожалуйста. Спишемся, я сброшу Вам несколько файлов из "подборки военной литературы".
Договорились?
Отв: Проект по вычитке книг.
"Стихи не для дам"
Сейчас прошелся Гуглом: слова hagen-а потвердились, не видно такой книги. Почему же уважаемому rodent81 не взять эту книгу в работу? Просто сами тексты Пушкина уже распознаны, вычитаны и переведены в html на rvb и feb-web, часть уже есть здесь. Нужно распознать предисловие и примечания, а потом все тексты собрать в один док.
Отв: Проект по вычитке книг.
Ни в коем случае не возражаю. ;) И если уважаемый rodent81 всё ещё настроен, беру на себя обязательство сделать необходимые пометки в таблице. :)
Отв: Проект по вычитке книг.
Беру :)
И Пушкина тоже беру :)
Отв: Проект по вычитке книг.
Отметила. :)
Отв: Проект по вычитке книг
Сдуру взялась делать структуру вот в этой книжке http://lib.rus.ec/b/114534. Билась я с ней и так, и этак, но я все равно не знаю, как ее разумно структурировать.
Так что придется мне просить пардону и постыдно дезертировать.
Это по сути энциклопедический словарь, и FB2 для такого типа книг, по-моему, вообще не подходит. А оптимально подходит для них вовсе даже фомат CHM. Но его я делать не умею. Оптимальность этого формата прекрасно демонстрируется вот здесь http://www.fact400.ru/mif/reich/oglavl.htm, я когда искала информацию о книге, наткнулась на этот сайт. Там вышеупомянутая энциклопедия лежит. С фотографиями. Если кто умеет делать chm-файлы, может сотворите книжечку?
Отв: Проект по вычитке книг
Очень хорошо понимаю. Я тоже спасовала перед этой книгой.
Подождём настоящих умельцев. ;)
Отв: Проект по вычитке книг
Из списка взяла на вычитку "Последний рыцарь" http://lib.rus.ec/b/119322.
Отв: Проект по вычитке книг
Сделано.
пушкин
Сделал Пушкина из пдф в microsoft word, ошибки проверил - нет. Кто сделает фб2?
Отв: пушкин
Выкладывайте. Кто-нибудь когда-нибудь сделает. ;)
Пушкин Стихи не для дам
В формате microsoft word, нужно сделать фб2, орфографию не править, там оригинальная орфография!!!
http://slil.ru/26080435
http://www.rapidshare.ru/761184
Отв: Проект по вычитке книг, подобный альдебарановскому и олдма
Я вообще-то имела в виду, что Вы в библиотеку выложите. ;)
Ладно, я скачаю, выложу. :)
Отв: Проект
К сожалению я не знаю как и куда, если обьясните, то впредь буду делать только так :)
Отв: Проект
Вот. :)
А вообще здесь очень много полезной информации.
Отв: Проект
Забавно ))))
Буду читать rtfm )))
Отв: Проект
Первую неделю Вы ничего не можете менять в библиотеке. Антивандальная мера.
Отнеситесь с пониманием. ;)
Отв: Проект
rodent81: Если позволите, несколько замечаний по оформлению: разбивка на колонки не нужна, строка в стихотворении – это абзац, а не разрыв строки, убирать переносы. golma1: Не могли бы вы подсказать ссылки на материалы по подготовке документов после сканирования? Я бы поместил их в Делаем fb2 книгу.
Отв: Проект
К сожалению, нет. Просто не знаю.
Все мои знания - из накопленного опыта и неоценимой помощи, которую мне многократно оказывали на форуме.
Я пользуюсь FineReader'ом, получаю с его помощью из jpg, pdf или djvu текстовый документ.
Обрабатываю его (в формате rtf) при помощи программы OcrPad, там много полезных (уже встроенных) скриптов для чистки текста.
А далее - как обычно с текстовым документом.
Отв: Проект
Не знаю, то или нет, но у Змея есть ценные "Рекомендации по сканированию книг" http://zmiy.by.ru/#help Они во многом повторяются, часть недоступна уже (вот, кстати, из закладок: http://www.oldsf.ru/OCR.html - там сменился домен. Таки смотри ж, ещё что-то находится... я думал "С.Ф" уже умерла совсем), но в целом рекомендации хороши.
Отв: Проект
Спасибо golma1 и Jolly Roger. Хелп от Змия, когда то читал, пригодилось.
Отв: Проект
Учту на будущее, просто со стихами впервые работал, поэтому оставил как было в оригинале.
Отв: Проект
Дык я не против, прекрасно понимаю ситуацию. Поэтому пока и заливаю на сторонние сервера :)
Отв: Проект по вычитке книг
Скачал отсюда "Война за 'Асгард'" Кирилла Бенедиктова (http://lib.rus.ec/b/6133) Benediktov_Voyna_za_Asgard.6133.fb2 При открытии файла выскакивает ошибка - XML parse error: not wellformed (invalid token) at line 201, column 371. Ещё не приходилось редактировать и исправлять что либо в этом формате, поэтому решил обратиться к специалистам. Исправте кто может...
Отв: Проект по вычитке книг
Попробуйте теперь эту.
Отв: Проект по вычитке книг
Спасибо. Я правда тоже рабочую нашел, поменял с той что была, но как-то криво получилось: нет размера файла, не догадался анотацию добавить и т.д. Так что я наверное её удалю, так как они абсолютно одинаковае внутри, хоть и размеры разные. У Вас красивее получилось.
Отв: Проект по вычитке книг
Смотрите, какая интересная библиотека: http://ae-lib.org.ua/ (Сайт на украинском, но книги там на многих языках)
Никто не хочет перевести книжки в fb2?
Отв: Проект по вычитке книг
Чтобы ссылки не терялись, сделала отдельную тему.
А это можно исправить?
Сейчас обнаружил, что файлы с произведениями Рея Бредбери имеют назсание
Bredberi_
Хотя следовало бы Bradbury.
Я понимаю, что это транслит с русского произношения, но все-таки!
Готов этим заняться, если скажете, как это сделать.
Это, очевидно, касается и других авторов, которые писали на языках, использующих латиницу.
Отв: А это можно исправить?
Вопрос поименования файлов многократно поднимался. При заливке файлы могут иметь какое угодно название (даже правильное ;) ), но при скачке все они получат траскрибированное на латиницу русское имя. И (пока?) ничего с этим поделать нельзя.
Сверил тексты
Сегодня сверил тексты
Рей Бредбери 451 градус по Фаренгейту
В архиве 2 варианта:
http://lib.rus.ec/b/66537 498K
и http://lib.rus.ec/b/103371 678K
Тексты идентичны.
Во втором варианте добавлены иллюстрации.
Отчет о проделанной работе+ вопрос
Добавлено сегодня:
Урсула Ле Гуин - Планета Роканона v 2.1 вычитано
Генри Лайон Олди - Гроза в безначалье v 1.2 - дополнительное форматирование, опечатки
Генри Лайон Олди - Сеть для миродержцев v 1.2 — дополнительное форматирование, опечатки
Генри Лайон Олди - Иди куда хочешь v 1.2 — дополнительное форматирование, опечатки
Генри Лайон Олди - Мы плывем на запад v1.01 - аннотация, жанр, издание
Генри Лайон Олди - Посети меня в моем одиночестве...[=Лодочник] v1.01 - аннотация, жанр, издание (убрал дубль)
Генри Лайон Олди - Сын Черной Вдовы v1.01 - аннотация, жанр, издание
Генри Лайон Олди - Цель оправдывает средства v1.01 - аннотация, жанр, издание
В процессе заливки вылез непонятный глюк.... "Sequence name" теперь берется из "Publisher info", а не из "Title info" чё так!? Неправильно как-то....
Отв: Отчет о проделанной работе+ вопрос
Да, экспериментальным путем вычислено, что серия из publisher-info имеет приоритет. Надо исправить - проставить правильную серию.
Отв: Проект
Отсеял половину Донцовой, подправил названия. Переделываю Пушкина - с учётом пожеланий.
Отв: Проект
Там у Донцовой еще осталась куча дублей. Вы позже продолжите? :)
Отв: Проект
Конечно, доделаю обязательно. Просто связь плохая, приходится частями делать :) Пока не доделаю не уйду :))
Отв: Проект
Договорились. Но Вы вообще не уходите. Зачем? :)
Отв: Проект
Иногда нужно отдыхать от всего ;) но я быстро вернусь :)
Лукьяненко "Осенние визиты"
Слегка почистил Олди (удалил4-5 дублей)
Взял на форматирование Лукьяненко - Осенние визиты
PS И если это не противоречит общественном принцыпам запишите на меня Олдей, я и так решил все откорректировать и переформатировать, чтоб лишнюю работу не делать и ни с кем рогами не бодаться)))
Отв: Лукьяненко "Осенние визиты"
Отмечено. :)
Отв: Лукьяненко "Осенние визиты"
Спасибочки)
Отв: Проект
Переделал Пушкина, конвертнул в фб2 и залил на http://slil.ru/26090161 . Посмотрите, может что надо поправить.
Завтра дочищу Донцову а на неделе доперевожу и вставлю кусок из Уильямса.
На след. неделе залью Сафарли "Туда без Обратно", вот только досканирую и проверю.
Отв: Подскажите плиз.
Пытаюсь залить новую книгу - Павел Когоут "Палачка". Оно говорит мне, что не может опознать жанр. Файл сейчас на ftp лежит в oldvagrant\kogout_pavel_palachka.zip.
Или тут http://qmm.pisem.net он же kogout_pavel_palachka.zip
Я, конечно, где-то не прав, но где неправ - не понимаю. Снова шерстить весь FAQ как-то многодельно. Может кто подскажет?
Да, автор новый.
Отв: Подскажите плиз.
Я посмотрела файл. Там надо кое-что доделать. Если возьмётесь, скажу что именно. Или сама исправлю.
Насчёт жанра - там продублирован 2 раза один и тот же жанр. Может быть, дело в этом?
Отв: Подскажите плиз.
golma1, пожалуйста снимите меня с вычитки Пушкина. Неопределенное время ничего не смогу делать на свом компе.
Прошу у всех прощения за то, что так долго тянул.
Отв: Подскажите плиз.
Я сниму, конечно. Но предполагаю, что эта работа Вас благополучно дождётся. ;)
Отв: Проект по вычитке книг
Скажите, конечно.
Я бы предпочел попробовать самостоятельно все поправить.
Спасибо!
Да, и что такое ошибка 80..020..06 в FBE. Он ее вовсех файлах выдает и не дает сохраняться, паскуда.
Отв: Проект по вычитке книг
Насчёт ошибки не знаю. Но если не даёт сохраняться, то что-то со структурой. Попробуйте пройтись ещё раз в Source - несоответствие начальных и закрывающих тегов, лишние эмфазисы или стронги и многое другое. К сожалению, больше ничего не могу подсказать.
Нужно исправить:
1. убрать второй титл (оставить первый - до первой секции)
2. вынести первые два абзаца в аннотацию
3. выделить субтитлы
4. унифицировать сноски: вместо note 1 должно быть [1] - в FBE есть специальный скрипт; убрать "звёздочки" перед сносками
5. озаглавить body примечаний
6. проверить на разорванные абзацы - в FBE есть специальный скрипт
7. заменить кавычки на "ёлочки" - в FBE есть специальный скрипт, но требуются некие навыки для его использования
8. в дескрипшене убрать дубль жанра
На первый взгляд, всё. ;)
Страницы