Проект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.

Форум пока очень неудобный для этого, так что пока будем обсуждать здесь... Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;) я предлагаю "сплочиться" =D просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.) Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет. СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ. FAQ: > Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу. Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =) что хотите то и выбираете) > С каким форматом предстоит работать? с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =) общая информация здесь и тут в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;) 1. общая информация о формате 2. описание тегов и простой пример книги. 3. как сделать книгу 4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только 5. несколько статей и инструкций по fb2 6. Создание электронных книг в формате FictionBook 2.1: практическое руководство > Условия, правила вычитки, форматирования? правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.) [quote]а теперь главное! в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]

Комментарии

Цитата:
Может, стоит разрешить на такие книги жаловаться? Или не надо торопиться с раздачей 'знаков качества'?

Мне тоже кажется, что опция "пожаловаться" должна остаться. Любой может проглядеть что-нибудь. ;)

За "рапорт" спасибо. Попробую всё исправить.

UPD:
Нашла все упомянутые ошибки. Только "двоеточия вместо точек" - видимо, это глюк Вашей читалки. На этом месте в файле стоят многоточия.
Почищу ещё немного скриптами и залью.

Запутался в ссылках, пишу здесь.
"Звягина" додолбил и больше к нему возвращаться не буду.

Дирк Джентли заменен исправленной версией. Почему-то в форме не работает гиперссылка. На всякий случай: http://lib.rus.ec/b/65775
Странно, вставилась тупым пэйстом.

Аватар пользователя Captain Scarlett

1. Ой. А как же Вы бумажные книги читаете?
2. Я сейчас вычитываю книжку с картинками. И хотела после вычитки еще поработать с картинками - добавить контраст, сделать прозрачный фон, некоторые заново отсканировать (они получились такие мелкие, что невозможно рассмотреть, что же на них изображено). Но дело в том, что у меня мало опыта. Не хотите поучаствовать? Речь идет об этой книге: http://lib.rus.ec/b/111758.

1. А вот! :)
2. Хочу. Люблю играть с картинками, хотя рисовать не умею.

Аватар пользователя Captain Scarlett

Отлично! Предлагаю перейти в личку, потому что я совсем запуталась во всех страницах и ветках этой темы.

Аватар пользователя Captain Scarlett

Блин, лички то нет... Тогда пишите на izaraya @ googlemail.com.

izaraya написал:

2. Я сейчас вычитываю книжку с картинками. И хотела после вычитки еще поработать с картинками Не хотите поучаствовать? Речь идет об этой книге: http://lib.rus.ec/b/111758.

Скажите пожалуйста, а у Вас есть сканы этой книжки, или она же в другом формате - картинки лучше бы оттуда натырить.
Аватар пользователя Captain Scarlett

Нет, я брала книгу с Либрусека, а здесь она уже была в fb2. Картинки можно вытащить из fb2 при помощи скрипта FBE "сохранить объекты" (кажется, он так называется). У меня есть немецкое издание, так что если что - можно отсканировать заново. Может, Вы пока просмотрите картинки и скажете мне, какие именно? Я вечером просмотрю книгу и тоже напишу, какие я хочу отсканить.

Хорошо, сделаю. Немецкое издание еще и лучше - вроде, народ гудел, что не все картинки АСТ пропечатало.

Аватар пользователя Captain Scarlett

Не только картинки: http://lib.rus.ec/node/109864

Как обидно! А это будет очень бессовестно, попросить вас отсканить все картинки? Насколько я поняла по отзывам, картинки являются довольно существенной частью произведения. Тогда, мы бы смогли разобраться сколько веса мы можем выделить на картинки, и качество не очень потерять. По крайне мере попытаться это сделать:). Я не представляю степени сложности процесса сканирования, поэтому не знаю насколько нахальна моя просьба.:)

Аватар пользователя Captain Scarlett

Все - не знаю, но крупные я точно отсканю. Плюс еще несколько пропущенных. Мелкие картинки нормально отсканены, их можно довести в фотошопе.
А вы не знаете, случайно, с чем связаны такие изменения в русском издании?

izaraya написал:
Мелкие картинки нормально отсканены, их можно довести в фотошопе.
При выдирании файла снижается его качество. Ну да ладно. Работать надо с тем, что есть.
izaraya написал:
А вы не знаете, случайно, с чем связаны такие изменения в русском издании?
Нет, не знаю. Я просто, по обыкновению, стала шарить по сети в поисках информации об этой книге и наткнулась на сетования по этому поводу. По предположениям фанатов - экономия бумаги:)
Аватар пользователя Captain Scarlett

Tanja45 написал:
izaraya написал:
Мелкие картинки нормально отсканены, их можно довести в фотошопе.
При выдирании файла снижается его качество.

Тогда буду сканить все :)

Девушки, а как вы "выдираете" картинки из FBE? Научите, плиз.

Аватар пользователя Captain Scarlett

Скрипт "сохранить объекты". Но он сохраняет все картинки, как выдрать только какие-то определенные - я не знаю.

Понятно. Спасибо.

Попробовала скачать скрипт - получаю сообщение "нет такой страницы". :(

Аватар пользователя Captain Scarlett

Щас на мэйл кину.

Зачем скрипт? Файл - экспорт - To Html. Сохраняет как веб страничку с рисунками.

izaraya написал:

Тогда буду сканить все :)

Ура-ура! Вы великий человек, izaraya!:)
А я уж было собралась Вам слать по мылу опрозраченные мелкие пинги (и понги:)) Судя по тем, что были в тексте - они должны быть с какой-то текстурой? Или они просто искажены? А размеры Вас устраивают? А еще там есть рис.22 и он же - рис.64. Его можно один раз вставить и два раза сослаться - съэкономим вес для чего-нибудь красивенького
golma1 написал:
Девушки, а как вы "выдираете" картинки из FBE? Научите, плиз.

Я выдираю экспортом в HTML. Есть во всех редакторах. Но с картинками лучше работать все-таки с изначальными: это из конфетки легко сделать сено , пропущенное через лошадь, а наоборот - сложно.
Аватар пользователя Captain Scarlett

Цитата:
Вы великий человек, izaraya!

*покраснев*
Ну что Вы...

А можно, я "цифры" сканить не буду? Это те маленькие картинки, которые идут в конце каждой секции (точнее, перед названием главы).
И в каком формате сканить? jpg, 300ppi, 256 серого пойдет? Или лучше tiff?

izaraya написал:

А можно, я "цифры" сканить не буду? Это те маленькие картинки, которые идут в конце каждой секции (точнее, перед названием главы).

Если они просто черные, то конечно не нужно. Их размер Вас устраивает? Или чуток увеличить?
izaraya написал:
И в каком формате сканить? jpg, 300ppi, 256 серого пойдет? Или лучше tiff?

Лучше всего в jpg, 300ppi, 256 серого. С ним удобнее всего работать.
Аватар пользователя Captain Scarlett

Цитата:
Если они просто черные, то конечно не нужно. Их размер Вас устраивает? Или чуток увеличить?

Да, они просто черные и очень четкие, как буквы. Увеличивать не надо.
Аватар пользователя Captain Scarlett

Держите первую порцию: http://ifolder.ru/7615101
Картинки 7 и 8, а также 12 и 13 нужно склеить.

Аватар пользователя Captain Scarlett

Цитата:
Судя по тем, что были в тексте - они должны быть с какой-то текстурой? Или они просто искажены?

Я не совсем понимаю. Например?

Цитата:
А размеры Вас устраивают

В оригинале они все, конечно, крупнее, но главное, чтобы картинки были четкими и "читаемыми".

Читал Камю "Калигула". Решил поправить ошибки. Однако возник вопрос.
Действующие лица в диалогах обозначаются по разному: 1) никак, 2) разрядкой (через пробелы), 3) жирным шрифтом (strong'ом).
Судя по всему, преобладает все же жирный шрифт.

А как лучше, с точки зрения стандартизации?

oldvagrant написал:
Читал Камю "Калигула". Решил поправить ошибки. Однако возник вопрос.
Действующие лица в диалогах обозначаются по разному: 1) никак, 2) разрядкой (через пробелы), 3) жирным шрифтом (strong'ом).
Судя по всему, преобладает все же жирный шрифт.
А как лучше, с точки зрения стандартизации?

Действующие лица - strong.
Ремарки - emphasis.

Большинство встреченных мною книг были форматированы именно таким образом. И я делаю точно так же. :)

to golma1 Спасибо. Понял.

izaraya, я Вам отправила "цифирки" по почте.
Работу примете? :)

Аватар пользователя Captain Scarlett

Получила. Мне кажется, нормально, я еще посмотрю, как они смотрятся в книге на небелом фоне.

Кутолин Сергей Алексеевич - Гений, или Стяжание Духа (К 190-летию Н. В. Гоголя). Залил... Большинство ошибок исправил, но мог пропустить некоторые... Так что если кому не трудно, посмотрите... На мой взгляд довольно специфическая книга, с большим количеством цитат... На любителя в общем... ИМХО - не тянет Гоголь на "гения".

Ну, Вы - гигант!

Сделано: Петров Александр, Забавы жестоких богов - http://lib.rus.ec/b/113449
Нормально в общем-то, почитать можно, только сильно затянуто. Можно было бы без особого ущерба процентов 40 выкинуть.

izaraya, я отправила первые "пропингованные" сканы для книги. Размеры я их все же увеличила - старалась, чтобы красиво было. Я обработаю все сканы - тогда и посмотрим, сильно утяжелились или терпимо.
А возможно сканить с той же степенью разрешения, но с размером изображения поменьше, скажем не больше 1024?

Аватар пользователя Captain Scarlett

Цитата:
я отправила первые "пропингованные" сканы для книги.Ничего не получила.

Я ничего не получила.
Цитата:
А возможно сканить с той же степенью разрешения, но с размером изображения поменьше, скажем не больше 1024?

Картинки в оригинале крупные, как сканить их меньше - не представляю, разве что уменьшить после скана.

2. Как сканится, так и сканьте. Все очень здорово.
1. Попробую отправить снова.

izaraya написал:

Я ничего не получила.
Цитата:

(жалобно)Если все-таки пинги первой пайки сканов дошли - подтвердите, пожалуйста, получение. Я их отправила трижды, может отправились?
Жду следующую пайку :)

Дмитрий Глуховский - Сумерки - http://lib.rus.ec/b/113584
Палучайте!

izaraya, следующая партия сканов перепингована и отправена Вам по почте. Вдруг эту партию Вы получите с первого раза:)

golma1, ау :)
Петрова Забавы жестоких богов отметьте, т.к. сделано.

Отметила. :)

Голма, в http://lib.rus.ec/a/24518/ файл http://lib.rus.ec/b/113727 залила и объединила со старой версией
Хи-хи : в качестве паблишера указала сайт, откуда был содран текст, в качестве обложки - картинку с их дом.странички. Запихнула их же илюстрации - получилась вполне сносная книжечка, как настоящая:)

Вы советовали:
"В дескрипшине указать в "имя" - Автор неизвестен, в "фамилия" - Буддизм"
Оказывается, надо обязательно фамилию писать именно так
"- Буддизм". И по ID автор не ищется. Еле справилась с глючеством. И с жанром тоже намучилась - ведь нету такого жанра. Но он есть...

Tanja45 написал:
Голма, в http://lib.rus.ec/a/24518/ файл http://lib.rus.ec/b/113727 залила и объединила со старой версией

Блестяще выполненная работа.

Меня просто покорили Ваше желание добраться до сути и неленивость.
Всем равняться на Tanja45!

Тут soshial подбросил (кроме атомной бомбы о войне:)книжки в билингве (http://lib.rus.ec/node/110706) - как бы польский с русским подстрочником - для обучения языку - но сам сомневался, куда их засунуть.
Тема большая и работы там много и, что славно, английские книжки в этой манере присутствуют. Я, вроде, Хмелевскую в первом приближении сделал. Но куда ее и как в дескрипшене всю эту бодягу обозначить?
Надо это решить один раз. Или у кого мысли здравые уже были?

oldvagrant написал:
Тут soshial подбросил (кроме атомной бомбы о войне:)книжки в билингве (http://lib.rus.ec/node/110706) - как бы польский с русским подстрочником - для обучения языку - но сам сомневался, куда их засунуть.
Тема большая и работы там много и, что славно, английские книжки в этой манере присутствуют. Я, вроде, Хмелевскую в первом приближении сделал. Но куда ее и как в дескрипшене всю эту бодягу обозначить?
Надо это решить один раз. Или у кого мысли здравые уже были?

Надо бы решить.
Но мыслей никаких нет. Разве что в название вставить "билингва" и залить на страницу автора.
Подождём soshial'a, наверное, у него есть какие-нибудь идеи на этот счёт.

Насчёт заливки - не в курсе. :(

у меня просто word тормозит, поэтому самому не получается =((
спасибо тебе oldvagrant. надеюсь не обидешься, если скажу что там надо поставить сразу utf, потому что иначе не отображаются польские символы =((
ещё куда то пропали empty-line, которые очень важны.
и оглавление.

оч. надеюсь, что замечания не воспримешь в штыки.
спасибо, что откликнулся!! =)

У, еще забыл, может кто знает, можно ли загрузить книгу со своего сайта, а не с Либрусековского ftp?
У меня не получилось, но сейчас и вообще выгрузка как-то глючит у меня, потому остался в сумнениях. А было бы хорошо.

oldvagrant написал:
У, еще забыл, может кто знает, можно ли загрузить книгу со своего сайта, а не с Либрусековского ftp?

Да, можно. Но тогда действуиет ограничение по размеру (указано 2 МБ, но на самом деле можно несколько больше).

Страницы

X