Вы здесьFineReader 11: вниманию книгоделов!
Опубликовано вс, 11/12/2011 - 06:12 пользователем golma1
Уважаемые коллеги! В ФР11 обнаружился серьёзный баг. А именно: фрагменты текста, распознанные в стиле "Оглавление", при сохранении напрямую в fb2 исчезают бесследно. Способов борьбы с багом, учитывая, что простая замена стиля (и даже объединение стилей НЕ в пользу "оглавления") ничего не приносит, оказалось немного. 1. После распознавания захожу в редактор стилей (рядом с названием стилей кнопка с сине-красной буквой "А") и смотрю, есть ли там стиль "Оглавление". Для полной уверенности сохраняю только эту страничку в fb2, чтобы проконтролировать сохранность фрагмента. Если кто-то найдёт более изящный способ побороть этот баг, пожалуйста, делитесь.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Den_Klimov RE:Таинственная личность админа Флибусты 1 день
kopak RE:О группе Дятлова. О той самой, того самого... 1 день sem14 RE:Подборка о Первой Мировой 1 день wvd RE:Подайте бедному копеечку на книжку с литреса... 2 дня Isais RE:удаление "двойников" 2 дня Isais RE:Кармен Мола - Пурпурная сеть [litres] 1 неделя Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 неделя Isais RE:Катя Водянова - Дом и два жениха в придачу 2 недели Aleks_Sim RE:Прошу переформатировать, распознать, etc... 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 3 недели Isais RE:Дмитрий Анатольевич Горчев - ЖЖ Дмитрия Горчева (2009–2010) 4 недели Саша из Киева RE:Детям о Ленине (Издание 1965 года) 1 месяц Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 1 месяц babajga RE:Белая княжна 1 месяц Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 1 месяц mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 1 месяц zlyaka RE:С Новым годом! 1 месяц SparkySpirit RE:Жорж Санд - переводы 19 века 1 месяц Впечатления о книгах
Aleks_Sim про Владимирский: На киевском направлении (Военная документалистика)
17 02 Книга сделана и перезалита на основе текста из militera.lib.ru
mysevra про Замяткин: Тай-чи языка, или Вас невозможно научить иностранному языку (Языкознание, Иностранные языки, Самиздат, сетевая литература)
17 02 По форме - много пустой болтовни в фиглярской манере, но по сути метод очень хорош, опробован на английском: в результате заполнились пробелы в аудировании и спонтанном говорении, которые до этого не могли исправить ни школа, ……… Оценка: отлично!
mysevra про Антошенко: Дар Богов (Детективная фантастика, Самиздат, сетевая литература)
17 02 Купилась на "необычные способности людей". Не стоило. Оценка: плохо
mysevra про Акунин: Москва-Синьцзин (Исторический детектив)
17 02 Мило, поверхностно и водевильно. А страна - страна не меняется. Оценка: хорошо
Nicout про Сетров: Воинствующая олигархия США против всего мира и нас (Публицистика)
17 02 Вот я думаю: а может, нас для примера держат. Весь мир смотрит и пальцем показывает: - Видите, дети, так жить нельзя." М.Жванецкий Оценка: нечитаемо
Barbud про Старый: Начало пути (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
16 02 Чудовищное многословие. За пространными авторскими отступлениями и историческими справками нить сюжета еле видна, действие не разворачивается, а вяло подергивается. Явно не осилю. Оценка: нечитаемо
Barbud про Санфиров: Дважды в одну и ту же реку не войти (Альтернативная история)
16 02 И здесь Санфиров ничем не удивил. Все то же суховатое, практически безэмоциональное изложение, почти протокол или синопсис. Ему бы хорошо подошло писать научно-техническую литературу. Попаданец и тут нормальный, без закидонов ……… Оценка: неплохо
Den_Klimov про Бобров: Эпоха мертворожденных [= Украина в огне] (Альтернативная история)
16 02 Случайно дошли руки полистать данный опус, покрытый говном мамонта. Изнутри как оказалась субстанция та же. Литературных качеств касается также. ;) .. Автор, к слову, родом из той местности в Луганской области, куда ………
trampak про Сетров: Воинствующая олигархия США против всего мира и нас (Публицистика)
16 02 Россия-СССР выполнила одну из важнейших своих исторических миссий – она показала человечеству, как не надо жить и поступать.Для самих жителей россии урок не пошёл впрок. Оценка: нечитаемо
Линтра про Зеланд: Трансерфинг себя [litres] (Эзотерика, Самосовершенствование)
16 02 Везде, на всех ресурсах вижу эту книгу. Кто-нить читал? что хорошего сказать могёте, друзья?
Shelest2000 про Хренов: Московское золото, или Нежная попа комсомолки. Часть 1 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
16 02 Нормально. С юмором и без кучи роялей в кустах. Надеюсь на третью книгу.
Линтра про Капба: Как приручить дракона – 3 (Альтернативная история, Киберпанк, Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
16 02 За всю серию, в том числе и за отсутствующую тут четвертую книгу. Очень жизнелюбиво, динамично, сюжет активный, и сюр мой любимый в наличии. Прекрасно! жду пятую книгу. Оценка: отлично! |
Комментарии
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Потому что сразу в фб2 гораздо удобнее. Гораздо.
Отв: FineReader 11: вниманию книгоделов!
Я бы ещё после "Гораздо" поставила три восклицательных знака. ;)
Отв: FineReader 11: вниманию книгоделов!
А мне не понравилось...
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кроме фб2, сохраняю в док (ред. копия), текст (формат. текст) и пдф. Любые пропажи/потери восполняются из копий.
Отв: FineReader 11: вниманию книгоделов!
Да, я тоже сохраняю в доке, редактируемой копией. И даже изготавливаю из него фб2, чтобы удобнее было сравнивать с полученным. Но работаю с файлом, полученным сохранением сразу в фб2.
Преимущества: нет проблемы с тире в диалогах, со списками (когда исчезают цифры), с потерей форматирования.
Пока набранная статистика сравнения говорит о том, что при исправлении бага со стилем "оглавление" ничего больше не теряется. Я ещё какое-то время понаблюдаю, но потом необходимость в изготовлении "контрольного экземпляра", надеюсь, отпадёт.
Кстати, ещё одна подробность: при сравнении файлов док (вернее, фб2, полученное из дока) и фб2 (полученного сразу из ФР) обнаружилось, что ошибки распознавания различаются.
Например: в доке "осколько" - в фб2 "о сколько", т.е. в доке отсутствует нужный пробел.
Откуда берётся - непонятно. :(
Отв: FineReader 11: вниманию книгоделов!
Напоролся на аналогичную граблю, когда (в ФР9) делал "Назад к Мафусаилу": длиннющая пьеса, часть имён персонажей распозналась с разрядкой, часть - с пробелами. Решил через левое полужопие, зато быстро: сохранил в .doc, из него опен-офисом в его родной XML'ный, открыл .xml руками, нашёл нужный стиль и заменил разрядку на жирность, опять открыл опен-офисом, сохранил в .doc, открыл m$ wordviewer'ом и скопипастил в FBE2.
Отв: FineReader 11: вниманию книгоделов!
Кстати в ФР11 напоролся на такую весчь: если ФР сам(!) не распознал сноску как "сноску", то заставить его это понять даже используя стиль "сноска" мне не удалось. Или текст сноски вставлялся непосредственно в текст, где и как ему вздумается, либо, если я выделил сноску отдельной областью, то может и вообще потеряться.
Может кто-нибудь научит: "Как с этим бороться?!"
Отв: FineReader 11: вниманию книгоделов!
Выскажите все претензии на их сайте http://finereader.abbyy.ru/forum/actualforum.aspx. Я там много чего высказал. Кое-что обещали исправить, кое-что подсказали.
Отв: FineReader 11: вниманию книгоделов!
В самой программе Вы ничего изменить не сумеете. Как Вам уже правильно подсказали, нужно жаловаться на сайте разработчика.
Для борьбы с этим багом есть два способа.
1. Положиться на ФР, а потом проверить каждую сноску, добавляя пропущенные.
2. При просмотре (я надеюсь, Вы просматриваете каждую страницу после окончания автоматического распознавания ;) ) переносить текст сноски к слову, заключая его (текст) в фигурные скобки. Потом, уже в fb2, они расставляются одним кликом при помощи соответствующего скрипта.
Каждый выбирает наиболее приемлемый для себя и для конкретного случая. :)
Отв: FineReader 11: вниманию книгоделов!
Спасибо за ответ!
Но чтобы ТАМ жаловаться нужно иметь как минимум лицензионную(!) версию. ;-) Я же, как думается и многие здесь, пока еще игрался с пиратской.
Подсказанные мне Вами способы "борьбы" мне известны и были используемы мною, только это как-то "не кошерно" что-ли. ;-) А потому предпочитаю "добрую старую" ФР9 с выводом текста в Word, с промежуточным редактированием и последующим ручным переносом в FBE (все равно получается ручная работа, что тут, что там, только в моем случае я сам контролирую работу и знаю, что я делал, а в случае ФР11 никто не знает что ему "взбрело в голову сделать" ;-) ).
Кстати еще один камень в огород ФР11: он почему-то отказывается запускать установленный у меня Word 2003 - "не находит" его! :-(
Отв: FineReader 11: вниманию книгоделов!
По-моему, это необязательно.
Но в любом случае: об этом баге уже сообщили.
Не могу с Вами согласиться. ФР11 работает в разы (!) быстрее и распознаёт текст значительно лучше. Кроме того, он поддерживает ручное форматирование: добавленный курсив/болд при сохранении в fb2 перенимается, чего не происходило в более ранних версиях при сохранении в доке.
Да и вообще у него много приятных фич: одно только объединение стилей чего стоит. ;)
А если добавить сюда решение проблемы "тире в диалогах" и списков, то, на мой взгляд, сравнивать обе версии просто не приходится. :)
Насчёт поддержки Word2003, похоже, это у Вас локальный баг. У меня работает. На одном компе стоит 2003, на другом 2007 - в обоих случаях без проблем.
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кстати, если покупать с русской страницы, то за Home версию получается не так-то уж и много, что-то в районе $40-45. Imho, для большинства хоббистов-OCR-щиков сумма вполне "подъемная".
Отв: FineReader 11: вниманию книгоделов!
Home не умеет распознавать ни дежавюшки, ни PDF-ки, только отдельные картинки. Может ли она результат распознания сохранить в нечто удобочитаемое или нужен только копипаст? Короче, Home-версия - это заманка для дураков. Кто покупает Home, тому потом дают скидку 20% на Professional. Об этом у них на форуме где-то было написано.
Отв: FineReader 11: вниманию книгоделов!
Не знал; спасибо, что объяснил! Ну, что тут я могу сказать - они сами себе "злобные Буратино", в таком случае. Платить $170 за Pro версию - это, чисто психологически, для индивидуального пользователя слишком много. Значит, как воровали, так и будут воровать. Думаю, что в самом Abbyy они это прекрасно понимают, но держат такую цену, чтобы не демпинговать на корпоративном рынке.
Отв: FineReader 11: вниманию книгоделов!
Привет! Сохранять в fb2 - но это ничего не даёт - ни сносок, ни разделов! Зачем? Разумно в Word или OpenOffice.Writer а оттуда в fb2! Про плюсы FR11 - скорость очень возросла, много удобных мелочей - показ последней отсканированной страницы в процессе сканирования, и т.д.
Отв: FineReader 11: вниманию книгоделов!
Брехня
Отв: FineReader 11: вниманию книгоделов!
Судя по вашему собачьему юзерпику Вы хотели сказать - "Истинно так!" или можно разбивать на секции? Да или нет?
Отв: FineReader 11: вниманию книгоделов!
Судя по зековско-наркоманскому юзерпику, у вас другие интересы. ;-))
Как правило результат в фб2 разбит на секции и проставлены сноски. Не без ошибок. да. Но 90% проставлено верно.
Так, что не нужно "утверждать", а нужно просто попробовать и убедиться в своей неправоте
Отв: FineReader 11: вниманию книгоделов!
Любезностями обменялись! Но м.б. вы забыли или не знали, что "Беломор Канал" это знаковые (протестные!!!) папиросы для части НТР в прошлом веке! Но оставим это. Так в FineReader 11 можно указать как разбивать на секции при импорте в FB2? Интересно - надо попробовать!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Что значит Если они корректно выделены на бумаге то есть что выделено на бумаге до сканирования? Если не трудно разъясните, это бы ускорило работу! Спасибо
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Слово библиотекаря - закон! Со следующей недели ухожу в Новогодний Запой до 10 января!
Отв: FineReader 11: вниманию книгоделов!
Привет всем! Читаю блог решил попробовать передать из F11 в fb2 напрямую - сноски перекинулись, но разбиение на главы ни в какую! Это есть или нет? Как этого достичь? Мне годится любой способ. Скажем для экспериментов с F11 я doc файл сохранял в PDF а потом его (PDF) "распознавал" в F11
Отв: FineReader 11: вниманию книгоделов!
Вообще-то это в первую очередь зависит от качества распознавания, которое, в свою очередь, зависит от множества параметров, не в последнюю очередь от гарнитуры, которой набрана книга.
Проверьте, каким стилем распознались заглавия. Если этот стиль везде одинаков, но НЕ заголовок, объедините его с одним из заголовков в пользу последнего.
Если стили везде разные и тоже НЕ заголовки, поменяйте в каждом конкретном случае на стиль "заголовок" (любой).
Должно помочь. :)
Однако, на самом деле, это не так существенно даже при том, что ФР не распознал правильно заглавия. В ФБЕ есть замечательный скрипт под названием "Разбиение на секции". Если главы начинаются с одинакового слова, например "Глава" или "Рассказ", то достаточно ввести в первую строку скрипта это слово и нажать на кнопку "Обработать" (или "Обработать и выйти"), то скрипт сам всё сделает.
Полезно перед словом ввести знак ^ - означающий начало строки.
Скрипты - наше всё. Надо только уметь их готовить. ;)
Отв: FineReader 11: вниманию книгоделов!
Уважаемая golma1! Так как все эти возможности ещё в процессе опробования, то создал тестовый файл и с ним пробовал разные варианты
Меня устраивает такой путь -
Спасибо за ответ! Посмотрим что нам ответят в эбби!
Отв: FineReader 11: вниманию книгоделов!
Насчёт стиля "Оглавление" в ААВВYY вообще-то уже было сообщено. И даже ответ получен. ;)
А вот о стилях для правильной разбивке на главы, это интересно. Спасибо. :)
Отв: FineReader 11: вниманию книгоделов!
Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
В целом сохранение в fb2 мне нравится намного больше, чем сохранение в doc, после которого добавляются ещё и ошибки конвертации. ;)
Но это, опять-таки, вопрос личных предпочтений.
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Посмотрим что ответят, хотя ставлю 90% против 10% ничего не ответят
Отв: FineReader 11: вниманию книгоделов!
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Ой, Вы меня неправильно поняли.
Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски.
По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт форму выведения сноски, он лишь соединяет цифру и текст. Всё остальное зависит от желания (умения) программистов читалок. :)
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Ой, Вы меня неправильно поняли. Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски. По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт фор
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Тут некоторое время делал наблюдение кто чем и как читает в давке в общественном транспорте. Поразила меня одна девица щупленькая, небольшого росточка, которая в одной рук держала том Стига Ларссона (там наверное все три девицы были в одном флаконе) Всё спасибо!
Отв: FineReader 11: вниманию книгоделов!
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Все lbook-и показывают примечания внизу страницы и 5 и 6-дюймовые - в последних прошивках там стоит coolreader. Если места на странице для показа всего примечания не хватает - прихватывается следующая страница.
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Отв: FineReader 11: вниманию книгоделов!
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Добавлю, что последняя версия AlReader2 тоже имеет опцию показа сносок внизу страницы. Работает под WindowsMobile.
Отв: FineReader 11: вниманию книгоделов!
Рассказываю о своём способе решения описанной в начальном постинге проблемы.
В редакторе стилей все "Оглавления" (если их больше одного) объединяю в один стиль (отметить все нужные стили и нажать кнопку вверху "Объединить").
Для полученного таким образом стиля устанавливаю маленький размер шрифта, полужирность, курсив и выбираю непривычный шрифт.
В результате встречающийся в тексте стиль "оглавление" резко отличается от основного текста, что облегчает его обнаружение. Не помню, писала ли, поэтому расскажу ещё раз.
"Инфицированную страницу" копирую в блокнот (не в Word! он сохраняется форматирование), а потом снова копирую - из блокнота в ФР. Если на странице есть форматирование, восстанавливаю.
Кстати, аналогичную процедуру стала проделывать со сносками, объединяя все стили в один и придавая ему атрибуты, резко отличающие от основного текста. Это позволяет легко обнаружить части текста в нижней трети страницы, отделённые от предыдущей части, если они распознаны как сноски, что случается довольно часто.
Иллюстрация:
Отв: FineReader 11: вниманию книгоделов!
уважаемая golma1! пож добавьте к списку глюков (т.к. вы МОЖЕТЕ :) им сказать)... во ВСЕХ версиях ФР (начиная с 6 и кончая 11), при распознавании украинских текстов, при встрече конструкции типа "молодчага. Її" ВСЕГДА определяется как "молодчага. її"... :(
а то уже задолбало вручную править...
Отв: FineReader 11: вниманию книгоделов!
Попробую. :)