Вы здесьFineReader 11: вниманию книгоделов!
Опубликовано вс, 11/12/2011 - 06:12 пользователем golma1
Уважаемые коллеги! В ФР11 обнаружился серьёзный баг. А именно: фрагменты текста, распознанные в стиле "Оглавление", при сохранении напрямую в fb2 исчезают бесследно. Способов борьбы с багом, учитывая, что простая замена стиля (и даже объединение стилей НЕ в пользу "оглавления") ничего не приносит, оказалось немного. 1. После распознавания захожу в редактор стилей (рядом с названием стилей кнопка с сине-красной буквой "А") и смотрю, есть ли там стиль "Оглавление". Для полной уверенности сохраняю только эту страничку в fb2, чтобы проконтролировать сохранность фрагмента. Если кто-то найдёт более изящный способ побороть этот баг, пожалуйста, делитесь.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 день
ostap79 RE:Подайте бедному копеечку на книжку с литреса... 1 день Саша из Киева RE:Избранное 5 дней Alligatoreader RE:Багрепорт - 2 6 дней fedor.de RE:Отображение страницы Librusek 1 неделя Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 1 неделя kopak RE:Таинственная личность админа Флибусты 1 неделя blahblahblah2024 RE:Беженцы с Флибусты 1 неделя sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 1 неделя sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 3 недели TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 3 недели Oleg V.Cat RE:B343695 Александр. Книга 1 3 недели Isais RE:Калибрятина/Самиздатина 4 недели md2k15 RE:Относительно Вархаммер 40 000 1 месяц tvnic RE:"Коллектив авторов" 1 месяц SergL197 RE:Регистрация 1 месяц ejik.v RE:Viva Stiver! 1 месяц RedRoses3 RE:Флибуста конец? 1 месяц Впечатления о книгах
nik_ol про Донцова: Амур с гранатой (Иронический детектив, Детективы: прочее)
27 11 Конечно, я рада, что книги Донцовой выходят и выходят, но неужели, если она сама их пишет, то не помнит, что «старичок» был не Коробков, а Гри, её первый муж, до Ивана в этой серии?! Или всё-таки литературные негры клепают?! Оценка: неплохо
neletay про Котов: Ценитель [СИ] (Городское фэнтези, Самиздат, сетевая литература, Приключения)
27 11 Прочитала только несколько первых глав - и уже очень, очень нравится. Нравится все - сюжет, стиль, язык, ГГ, а также автор, который за всем этим видится. С удовольствием читаю дальше, надеюсь не разочароваться.
Lan2292 про Ермаков: Май, весна и апокалипсис. Книга 1 (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
27 11 Так себе чтиво, но не скучно. Оценка: неплохо
Chernovol про Коровин: После «Украины» (Политика, Публицистика)
25 11 Интересно, такие книги кто-то покупает или их бесплатно раздают. Оценка: нечитаемо
sem14 про Лазарис: Белая ворона (Историческая проза)
25 11 Леонид Гомберг 24 июля 2007 Роман известного в Израиле прозаика, поэта и переводчика Владимира Лазариса «Белая ворона» (Тель-Авив: Ладо, 2003) в этом году был включен в «лонг-лист» популярной премии «Букер». И это ……… Оценка: отлично!
decim про Осне Сейерстад
25 11 Попробовала бы Сурайя-реис не подать в суд! Муж бы убил. "Для контекста добавлю, что после публикации книги семья героя подала на Сейерстад в суд за клевету, но после апелляции писательница была признана невиновной, а через ………
tvv про Кич: Большой дом [СИ] (Ужасы, Мистика, Фанфик, Юмористическое фэнтези)
24 11 Совершенно замечательное "Оккультное Простоквашино".
decim про Галинакс: Женщина-рыцарь. Самые необычные истории Средневековья (Исторические приключения, История)
24 11 А вот это уже лучше. Подлинник на сей раз не знаю, а компиляция - явно автор чем-то вдохновлялся, но не ссылается на - получилась годная, и хорошо подобраны иллюстрации. Неплохо. Оценка: неплохо
udrees про Быкова: Школьники «ленивой мамы» (Педагогика, Детская психология)
24 11 Очередная книга про воспитание ребенка, теперь уже в школе. Советы в целом ценные, но явно объем книги их все не может вместить, поэтому думаю можно воспринимать текст как информацию к размышлению, а дальше самим продумывать ……… Оценка: хорошо
udrees про Баковец: Обычная жизнь обычного японца (Фэнтези, Самиздат, сетевая литература)
24 11 Угарная книга про приключения попаданца, оказавшегося в теле японского задрота-клерка. Автор видимо в теме про японское общество, имеется множество описаний нюансов про офисную жизнь, иерархию, привычки японцев, домашний быт. ……… Оценка: хорошо
udrees про Кузичева: Чехов. Жизнь «отдельного человека» (Биографии и Мемуары)
24 11 Довольно большая по объему биография известного писателя. Лично мне показалось, что ее писал театрал, поскольку большая часть книги посвящена театру, постановкам пьес Чехова в театре, реакции публики, трудностям постановки, ……… Оценка: хорошо
udrees про Тесленок: Сладкая История (Фэнтези, Самиздат, сетевая литература)
24 11 Отстой, очередное продолжение гаремника, и что радует – совсем небольшое на 20 страниц с иллюстрациями. Ценности никакой, язык примитивный как валенок. Описание действий как у озабоченного подростка со спермотоксикозом, кругом ……… |
Комментарии
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Потому что сразу в фб2 гораздо удобнее. Гораздо.
Отв: FineReader 11: вниманию книгоделов!
Я бы ещё после "Гораздо" поставила три восклицательных знака. ;)
Отв: FineReader 11: вниманию книгоделов!
А мне не понравилось...
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кроме фб2, сохраняю в док (ред. копия), текст (формат. текст) и пдф. Любые пропажи/потери восполняются из копий.
Отв: FineReader 11: вниманию книгоделов!
Да, я тоже сохраняю в доке, редактируемой копией. И даже изготавливаю из него фб2, чтобы удобнее было сравнивать с полученным. Но работаю с файлом, полученным сохранением сразу в фб2.
Преимущества: нет проблемы с тире в диалогах, со списками (когда исчезают цифры), с потерей форматирования.
Пока набранная статистика сравнения говорит о том, что при исправлении бага со стилем "оглавление" ничего больше не теряется. Я ещё какое-то время понаблюдаю, но потом необходимость в изготовлении "контрольного экземпляра", надеюсь, отпадёт.
Кстати, ещё одна подробность: при сравнении файлов док (вернее, фб2, полученное из дока) и фб2 (полученного сразу из ФР) обнаружилось, что ошибки распознавания различаются.
Например: в доке "осколько" - в фб2 "о сколько", т.е. в доке отсутствует нужный пробел.
Откуда берётся - непонятно. :(
Отв: FineReader 11: вниманию книгоделов!
Напоролся на аналогичную граблю, когда (в ФР9) делал "Назад к Мафусаилу": длиннющая пьеса, часть имён персонажей распозналась с разрядкой, часть - с пробелами. Решил через левое полужопие, зато быстро: сохранил в .doc, из него опен-офисом в его родной XML'ный, открыл .xml руками, нашёл нужный стиль и заменил разрядку на жирность, опять открыл опен-офисом, сохранил в .doc, открыл m$ wordviewer'ом и скопипастил в FBE2.
Отв: FineReader 11: вниманию книгоделов!
Кстати в ФР11 напоролся на такую весчь: если ФР сам(!) не распознал сноску как "сноску", то заставить его это понять даже используя стиль "сноска" мне не удалось. Или текст сноски вставлялся непосредственно в текст, где и как ему вздумается, либо, если я выделил сноску отдельной областью, то может и вообще потеряться.
Может кто-нибудь научит: "Как с этим бороться?!"
Отв: FineReader 11: вниманию книгоделов!
Выскажите все претензии на их сайте http://finereader.abbyy.ru/forum/actualforum.aspx. Я там много чего высказал. Кое-что обещали исправить, кое-что подсказали.
Отв: FineReader 11: вниманию книгоделов!
В самой программе Вы ничего изменить не сумеете. Как Вам уже правильно подсказали, нужно жаловаться на сайте разработчика.
Для борьбы с этим багом есть два способа.
1. Положиться на ФР, а потом проверить каждую сноску, добавляя пропущенные.
2. При просмотре (я надеюсь, Вы просматриваете каждую страницу после окончания автоматического распознавания ;) ) переносить текст сноски к слову, заключая его (текст) в фигурные скобки. Потом, уже в fb2, они расставляются одним кликом при помощи соответствующего скрипта.
Каждый выбирает наиболее приемлемый для себя и для конкретного случая. :)
Отв: FineReader 11: вниманию книгоделов!
Спасибо за ответ!
Но чтобы ТАМ жаловаться нужно иметь как минимум лицензионную(!) версию. ;-) Я же, как думается и многие здесь, пока еще игрался с пиратской.
Подсказанные мне Вами способы "борьбы" мне известны и были используемы мною, только это как-то "не кошерно" что-ли. ;-) А потому предпочитаю "добрую старую" ФР9 с выводом текста в Word, с промежуточным редактированием и последующим ручным переносом в FBE (все равно получается ручная работа, что тут, что там, только в моем случае я сам контролирую работу и знаю, что я делал, а в случае ФР11 никто не знает что ему "взбрело в голову сделать" ;-) ).
Кстати еще один камень в огород ФР11: он почему-то отказывается запускать установленный у меня Word 2003 - "не находит" его! :-(
Отв: FineReader 11: вниманию книгоделов!
По-моему, это необязательно.
Но в любом случае: об этом баге уже сообщили.
Не могу с Вами согласиться. ФР11 работает в разы (!) быстрее и распознаёт текст значительно лучше. Кроме того, он поддерживает ручное форматирование: добавленный курсив/болд при сохранении в fb2 перенимается, чего не происходило в более ранних версиях при сохранении в доке.
Да и вообще у него много приятных фич: одно только объединение стилей чего стоит. ;)
А если добавить сюда решение проблемы "тире в диалогах" и списков, то, на мой взгляд, сравнивать обе версии просто не приходится. :)
Насчёт поддержки Word2003, похоже, это у Вас локальный баг. У меня работает. На одном компе стоит 2003, на другом 2007 - в обоих случаях без проблем.
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кстати, если покупать с русской страницы, то за Home версию получается не так-то уж и много, что-то в районе $40-45. Imho, для большинства хоббистов-OCR-щиков сумма вполне "подъемная".
Отв: FineReader 11: вниманию книгоделов!
Home не умеет распознавать ни дежавюшки, ни PDF-ки, только отдельные картинки. Может ли она результат распознания сохранить в нечто удобочитаемое или нужен только копипаст? Короче, Home-версия - это заманка для дураков. Кто покупает Home, тому потом дают скидку 20% на Professional. Об этом у них на форуме где-то было написано.
Отв: FineReader 11: вниманию книгоделов!
Не знал; спасибо, что объяснил! Ну, что тут я могу сказать - они сами себе "злобные Буратино", в таком случае. Платить $170 за Pro версию - это, чисто психологически, для индивидуального пользователя слишком много. Значит, как воровали, так и будут воровать. Думаю, что в самом Abbyy они это прекрасно понимают, но держат такую цену, чтобы не демпинговать на корпоративном рынке.
Отв: FineReader 11: вниманию книгоделов!
Привет! Сохранять в fb2 - но это ничего не даёт - ни сносок, ни разделов! Зачем? Разумно в Word или OpenOffice.Writer а оттуда в fb2! Про плюсы FR11 - скорость очень возросла, много удобных мелочей - показ последней отсканированной страницы в процессе сканирования, и т.д.
Отв: FineReader 11: вниманию книгоделов!
Брехня
Отв: FineReader 11: вниманию книгоделов!
Судя по вашему собачьему юзерпику Вы хотели сказать - "Истинно так!" или можно разбивать на секции? Да или нет?
Отв: FineReader 11: вниманию книгоделов!
Судя по зековско-наркоманскому юзерпику, у вас другие интересы. ;-))
Как правило результат в фб2 разбит на секции и проставлены сноски. Не без ошибок. да. Но 90% проставлено верно.
Так, что не нужно "утверждать", а нужно просто попробовать и убедиться в своей неправоте
Отв: FineReader 11: вниманию книгоделов!
Любезностями обменялись! Но м.б. вы забыли или не знали, что "Беломор Канал" это знаковые (протестные!!!) папиросы для части НТР в прошлом веке! Но оставим это. Так в FineReader 11 можно указать как разбивать на секции при импорте в FB2? Интересно - надо попробовать!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Что значит Если они корректно выделены на бумаге то есть что выделено на бумаге до сканирования? Если не трудно разъясните, это бы ускорило работу! Спасибо
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Слово библиотекаря - закон! Со следующей недели ухожу в Новогодний Запой до 10 января!
Отв: FineReader 11: вниманию книгоделов!
Привет всем! Читаю блог решил попробовать передать из F11 в fb2 напрямую - сноски перекинулись, но разбиение на главы ни в какую! Это есть или нет? Как этого достичь? Мне годится любой способ. Скажем для экспериментов с F11 я doc файл сохранял в PDF а потом его (PDF) "распознавал" в F11
Отв: FineReader 11: вниманию книгоделов!
Вообще-то это в первую очередь зависит от качества распознавания, которое, в свою очередь, зависит от множества параметров, не в последнюю очередь от гарнитуры, которой набрана книга.
Проверьте, каким стилем распознались заглавия. Если этот стиль везде одинаков, но НЕ заголовок, объедините его с одним из заголовков в пользу последнего.
Если стили везде разные и тоже НЕ заголовки, поменяйте в каждом конкретном случае на стиль "заголовок" (любой).
Должно помочь. :)
Однако, на самом деле, это не так существенно даже при том, что ФР не распознал правильно заглавия. В ФБЕ есть замечательный скрипт под названием "Разбиение на секции". Если главы начинаются с одинакового слова, например "Глава" или "Рассказ", то достаточно ввести в первую строку скрипта это слово и нажать на кнопку "Обработать" (или "Обработать и выйти"), то скрипт сам всё сделает.
Полезно перед словом ввести знак ^ - означающий начало строки.
Скрипты - наше всё. Надо только уметь их готовить. ;)
Отв: FineReader 11: вниманию книгоделов!
Уважаемая golma1! Так как все эти возможности ещё в процессе опробования, то создал тестовый файл и с ним пробовал разные варианты
Меня устраивает такой путь -
Спасибо за ответ! Посмотрим что нам ответят в эбби!
Отв: FineReader 11: вниманию книгоделов!
Насчёт стиля "Оглавление" в ААВВYY вообще-то уже было сообщено. И даже ответ получен. ;)
А вот о стилях для правильной разбивке на главы, это интересно. Спасибо. :)
Отв: FineReader 11: вниманию книгоделов!
Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
В целом сохранение в fb2 мне нравится намного больше, чем сохранение в doc, после которого добавляются ещё и ошибки конвертации. ;)
Но это, опять-таки, вопрос личных предпочтений.
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Посмотрим что ответят, хотя ставлю 90% против 10% ничего не ответят
Отв: FineReader 11: вниманию книгоделов!
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Ой, Вы меня неправильно поняли.
Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски.
По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт форму выведения сноски, он лишь соединяет цифру и текст. Всё остальное зависит от желания (умения) программистов читалок. :)
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Ой, Вы меня неправильно поняли. Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски. По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт фор
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Тут некоторое время делал наблюдение кто чем и как читает в давке в общественном транспорте. Поразила меня одна девица щупленькая, небольшого росточка, которая в одной рук держала том Стига Ларссона (там наверное все три девицы были в одном флаконе) Всё спасибо!
Отв: FineReader 11: вниманию книгоделов!
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Все lbook-и показывают примечания внизу страницы и 5 и 6-дюймовые - в последних прошивках там стоит coolreader. Если места на странице для показа всего примечания не хватает - прихватывается следующая страница.
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Отв: FineReader 11: вниманию книгоделов!
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Добавлю, что последняя версия AlReader2 тоже имеет опцию показа сносок внизу страницы. Работает под WindowsMobile.
Отв: FineReader 11: вниманию книгоделов!
Рассказываю о своём способе решения описанной в начальном постинге проблемы.
В редакторе стилей все "Оглавления" (если их больше одного) объединяю в один стиль (отметить все нужные стили и нажать кнопку вверху "Объединить").
Для полученного таким образом стиля устанавливаю маленький размер шрифта, полужирность, курсив и выбираю непривычный шрифт.
В результате встречающийся в тексте стиль "оглавление" резко отличается от основного текста, что облегчает его обнаружение. Не помню, писала ли, поэтому расскажу ещё раз.
"Инфицированную страницу" копирую в блокнот (не в Word! он сохраняется форматирование), а потом снова копирую - из блокнота в ФР. Если на странице есть форматирование, восстанавливаю.
Кстати, аналогичную процедуру стала проделывать со сносками, объединяя все стили в один и придавая ему атрибуты, резко отличающие от основного текста. Это позволяет легко обнаружить части текста в нижней трети страницы, отделённые от предыдущей части, если они распознаны как сноски, что случается довольно часто.
Иллюстрация:
Отв: FineReader 11: вниманию книгоделов!
уважаемая golma1! пож добавьте к списку глюков (т.к. вы МОЖЕТЕ :) им сказать)... во ВСЕХ версиях ФР (начиная с 6 и кончая 11), при распознавании украинских текстов, при встрече конструкции типа "молодчага. Її" ВСЕГДА определяется как "молодчага. її"... :(
а то уже задолбало вручную править...
Отв: FineReader 11: вниманию книгоделов!
Попробую. :)