Вы здесьFineReader 11: вниманию книгоделов!
Опубликовано вс, 11/12/2011 - 06:12 пользователем golma1
Уважаемые коллеги! В ФР11 обнаружился серьёзный баг. А именно: фрагменты текста, распознанные в стиле "Оглавление", при сохранении напрямую в fb2 исчезают бесследно. Способов борьбы с багом, учитывая, что простая замена стиля (и даже объединение стилей НЕ в пользу "оглавления") ничего не приносит, оказалось немного. 1. После распознавания захожу в редактор стилей (рядом с названием стилей кнопка с сине-красной буквой "А") и смотрю, есть ли там стиль "Оглавление". Для полной уверенности сохраняю только эту страничку в fb2, чтобы проконтролировать сохранность фрагмента. Если кто-то найдёт более изящный способ побороть этот баг, пожалуйста, делитесь.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
merryalbumen RE:Подайте бедному копеечку на книжку с литреса... 5 часов
kopak RE:Таинственная личность админа Флибусты 1 день Саша из Киева RE:Турецкие мусорщики в Анкаре открыли библиотеку, полную... 4 дня Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 5 дней Isais RE:Не тот автор 1 неделя xieergai60 RE:Продление подписки 1 неделя TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 2 недели Isais RE:Древняя Греция. Читаем... 2 недели laurentina1 RE:Ирина Александровна Велембовская - Немцы 2 недели Саша из Киева RE:Избранное 3 недели Alligatoreader RE:Багрепорт - 2 3 недели fedor.de RE:Отображение страницы Librusek 4 недели Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 1 месяц blahblahblah2024 RE:Беженцы с Флибусты 1 месяц sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 1 месяц sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 1 месяц Oleg V.Cat RE:B343695 Александр. Книга 1 1 месяц Isais RE:Калибрятина/Самиздатина 1 месяц Впечатления о книгах
Barbud про Большаков: Целитель #10 (Боевая фантастика, Исторические приключения, Самиздат, сетевая литература)
17 12 Есть авторы, которые не дописывают свой цикл, а есть те, что остановиться не могут, Большаков из вторых. Так и хочется сказать: "Горшочек, не вари!". Оценка: плохо
decim про Чапман: БондиАнна. В Россию с любовью (Биографии и Мемуары)
17 12 Ну, как поплавала?(с) Нечитаемо.
Barbud про Коллингвуд: Благословенный. Книга 1 (Альтернативная история, Самиздат, сетевая литература)
16 12 Автор зря взялся за перо - не его это занятие. Скверный слог, картонные безжизненные персонажи, непомерное внимание к мелочам в ущерб художественности текста. Не советую. Оценка: нечитаемо
Sello про Алексеева: Долгое эхо. Шереметевы на фоне русской истории [litres] (История, Биографии и Мемуары)
16 12 Все бы ничего, каждый пишет и переписывает историю на свой лад. Но вот эти многочисленные сюсюкания - "графинюшка", "Натальюшка", "скворушка" и т.д, просто режущие глаз, наводят на мысль, что наблюдается явный перекос в пересказе ……… Оценка: неплохо
udrees про Бубновский: Мифы о болезнях. Почему мы болеем? (Здоровье, Альтернативная медицина)
15 12 Еще одна книга написанная Бубновским вместе с Игорем Прокопенко, и одно это настораживает при чтении, как и при просмотре его передач «Военная тайна», шокирующие гипотезы и т.д. Он даже сам их рекламирует в конце книги. Зачем ……… Оценка: плохо
udrees про Мантикор: Король механизмов (ЛитРПГ, Самиздат, сетевая литература)
15 12 Продолжение серии не подкачало. Главный герой как друид, довольно редкий и слабый в боевом смысле класс героев снова вершит чудеса, побеждая своих опасных противников. По силе они не уступают ему и герою приходится применять ……… Оценка: неплохо
udrees про Баковец: Бездушный 1 (ЛитРПГ, Самиздат, сетевая литература)
15 12 Интересная книга в жанре РПГ. Здесь немного другая система развития персонажей, с какими-то марками. Ну и навыки тоже интересные. Сам герой – типичный попаданец, в чужое тело. Сюжет крутится вокруг его выживания в новом мире ……… Оценка: хорошо
decim про Анишкин: Моя Шамбала (Детективная фантастика, Социальная фантастика, Попаданцы, Самиздат, сетевая литература)
15 12 Если тут и есть фантастика, то совсем немного. Это скорее беллетризованные воспоминания о послевоенной жизни. Автор сам пишет - имена и события подлинные. |
Комментарии
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Потому что сразу в фб2 гораздо удобнее. Гораздо.
Отв: FineReader 11: вниманию книгоделов!
Я бы ещё после "Гораздо" поставила три восклицательных знака. ;)
Отв: FineReader 11: вниманию книгоделов!
А мне не понравилось...
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кроме фб2, сохраняю в док (ред. копия), текст (формат. текст) и пдф. Любые пропажи/потери восполняются из копий.
Отв: FineReader 11: вниманию книгоделов!
Да, я тоже сохраняю в доке, редактируемой копией. И даже изготавливаю из него фб2, чтобы удобнее было сравнивать с полученным. Но работаю с файлом, полученным сохранением сразу в фб2.
Преимущества: нет проблемы с тире в диалогах, со списками (когда исчезают цифры), с потерей форматирования.
Пока набранная статистика сравнения говорит о том, что при исправлении бага со стилем "оглавление" ничего больше не теряется. Я ещё какое-то время понаблюдаю, но потом необходимость в изготовлении "контрольного экземпляра", надеюсь, отпадёт.
Кстати, ещё одна подробность: при сравнении файлов док (вернее, фб2, полученное из дока) и фб2 (полученного сразу из ФР) обнаружилось, что ошибки распознавания различаются.
Например: в доке "осколько" - в фб2 "о сколько", т.е. в доке отсутствует нужный пробел.
Откуда берётся - непонятно. :(
Отв: FineReader 11: вниманию книгоделов!
Напоролся на аналогичную граблю, когда (в ФР9) делал "Назад к Мафусаилу": длиннющая пьеса, часть имён персонажей распозналась с разрядкой, часть - с пробелами. Решил через левое полужопие, зато быстро: сохранил в .doc, из него опен-офисом в его родной XML'ный, открыл .xml руками, нашёл нужный стиль и заменил разрядку на жирность, опять открыл опен-офисом, сохранил в .doc, открыл m$ wordviewer'ом и скопипастил в FBE2.
Отв: FineReader 11: вниманию книгоделов!
Кстати в ФР11 напоролся на такую весчь: если ФР сам(!) не распознал сноску как "сноску", то заставить его это понять даже используя стиль "сноска" мне не удалось. Или текст сноски вставлялся непосредственно в текст, где и как ему вздумается, либо, если я выделил сноску отдельной областью, то может и вообще потеряться.
Может кто-нибудь научит: "Как с этим бороться?!"
Отв: FineReader 11: вниманию книгоделов!
Выскажите все претензии на их сайте http://finereader.abbyy.ru/forum/actualforum.aspx. Я там много чего высказал. Кое-что обещали исправить, кое-что подсказали.
Отв: FineReader 11: вниманию книгоделов!
В самой программе Вы ничего изменить не сумеете. Как Вам уже правильно подсказали, нужно жаловаться на сайте разработчика.
Для борьбы с этим багом есть два способа.
1. Положиться на ФР, а потом проверить каждую сноску, добавляя пропущенные.
2. При просмотре (я надеюсь, Вы просматриваете каждую страницу после окончания автоматического распознавания ;) ) переносить текст сноски к слову, заключая его (текст) в фигурные скобки. Потом, уже в fb2, они расставляются одним кликом при помощи соответствующего скрипта.
Каждый выбирает наиболее приемлемый для себя и для конкретного случая. :)
Отв: FineReader 11: вниманию книгоделов!
Спасибо за ответ!
Но чтобы ТАМ жаловаться нужно иметь как минимум лицензионную(!) версию. ;-) Я же, как думается и многие здесь, пока еще игрался с пиратской.
Подсказанные мне Вами способы "борьбы" мне известны и были используемы мною, только это как-то "не кошерно" что-ли. ;-) А потому предпочитаю "добрую старую" ФР9 с выводом текста в Word, с промежуточным редактированием и последующим ручным переносом в FBE (все равно получается ручная работа, что тут, что там, только в моем случае я сам контролирую работу и знаю, что я делал, а в случае ФР11 никто не знает что ему "взбрело в голову сделать" ;-) ).
Кстати еще один камень в огород ФР11: он почему-то отказывается запускать установленный у меня Word 2003 - "не находит" его! :-(
Отв: FineReader 11: вниманию книгоделов!
По-моему, это необязательно.
Но в любом случае: об этом баге уже сообщили.
Не могу с Вами согласиться. ФР11 работает в разы (!) быстрее и распознаёт текст значительно лучше. Кроме того, он поддерживает ручное форматирование: добавленный курсив/болд при сохранении в fb2 перенимается, чего не происходило в более ранних версиях при сохранении в доке.
Да и вообще у него много приятных фич: одно только объединение стилей чего стоит. ;)
А если добавить сюда решение проблемы "тире в диалогах" и списков, то, на мой взгляд, сравнивать обе версии просто не приходится. :)
Насчёт поддержки Word2003, похоже, это у Вас локальный баг. У меня работает. На одном компе стоит 2003, на другом 2007 - в обоих случаях без проблем.
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кстати, если покупать с русской страницы, то за Home версию получается не так-то уж и много, что-то в районе $40-45. Imho, для большинства хоббистов-OCR-щиков сумма вполне "подъемная".
Отв: FineReader 11: вниманию книгоделов!
Home не умеет распознавать ни дежавюшки, ни PDF-ки, только отдельные картинки. Может ли она результат распознания сохранить в нечто удобочитаемое или нужен только копипаст? Короче, Home-версия - это заманка для дураков. Кто покупает Home, тому потом дают скидку 20% на Professional. Об этом у них на форуме где-то было написано.
Отв: FineReader 11: вниманию книгоделов!
Не знал; спасибо, что объяснил! Ну, что тут я могу сказать - они сами себе "злобные Буратино", в таком случае. Платить $170 за Pro версию - это, чисто психологически, для индивидуального пользователя слишком много. Значит, как воровали, так и будут воровать. Думаю, что в самом Abbyy они это прекрасно понимают, но держат такую цену, чтобы не демпинговать на корпоративном рынке.
Отв: FineReader 11: вниманию книгоделов!
Привет! Сохранять в fb2 - но это ничего не даёт - ни сносок, ни разделов! Зачем? Разумно в Word или OpenOffice.Writer а оттуда в fb2! Про плюсы FR11 - скорость очень возросла, много удобных мелочей - показ последней отсканированной страницы в процессе сканирования, и т.д.
Отв: FineReader 11: вниманию книгоделов!
Брехня
Отв: FineReader 11: вниманию книгоделов!
Судя по вашему собачьему юзерпику Вы хотели сказать - "Истинно так!" или можно разбивать на секции? Да или нет?
Отв: FineReader 11: вниманию книгоделов!
Судя по зековско-наркоманскому юзерпику, у вас другие интересы. ;-))
Как правило результат в фб2 разбит на секции и проставлены сноски. Не без ошибок. да. Но 90% проставлено верно.
Так, что не нужно "утверждать", а нужно просто попробовать и убедиться в своей неправоте
Отв: FineReader 11: вниманию книгоделов!
Любезностями обменялись! Но м.б. вы забыли или не знали, что "Беломор Канал" это знаковые (протестные!!!) папиросы для части НТР в прошлом веке! Но оставим это. Так в FineReader 11 можно указать как разбивать на секции при импорте в FB2? Интересно - надо попробовать!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Что значит Если они корректно выделены на бумаге то есть что выделено на бумаге до сканирования? Если не трудно разъясните, это бы ускорило работу! Спасибо
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Слово библиотекаря - закон! Со следующей недели ухожу в Новогодний Запой до 10 января!
Отв: FineReader 11: вниманию книгоделов!
Привет всем! Читаю блог решил попробовать передать из F11 в fb2 напрямую - сноски перекинулись, но разбиение на главы ни в какую! Это есть или нет? Как этого достичь? Мне годится любой способ. Скажем для экспериментов с F11 я doc файл сохранял в PDF а потом его (PDF) "распознавал" в F11
Отв: FineReader 11: вниманию книгоделов!
Вообще-то это в первую очередь зависит от качества распознавания, которое, в свою очередь, зависит от множества параметров, не в последнюю очередь от гарнитуры, которой набрана книга.
Проверьте, каким стилем распознались заглавия. Если этот стиль везде одинаков, но НЕ заголовок, объедините его с одним из заголовков в пользу последнего.
Если стили везде разные и тоже НЕ заголовки, поменяйте в каждом конкретном случае на стиль "заголовок" (любой).
Должно помочь. :)
Однако, на самом деле, это не так существенно даже при том, что ФР не распознал правильно заглавия. В ФБЕ есть замечательный скрипт под названием "Разбиение на секции". Если главы начинаются с одинакового слова, например "Глава" или "Рассказ", то достаточно ввести в первую строку скрипта это слово и нажать на кнопку "Обработать" (или "Обработать и выйти"), то скрипт сам всё сделает.
Полезно перед словом ввести знак ^ - означающий начало строки.
Скрипты - наше всё. Надо только уметь их готовить. ;)
Отв: FineReader 11: вниманию книгоделов!
Уважаемая golma1! Так как все эти возможности ещё в процессе опробования, то создал тестовый файл и с ним пробовал разные варианты
Меня устраивает такой путь -
Спасибо за ответ! Посмотрим что нам ответят в эбби!
Отв: FineReader 11: вниманию книгоделов!
Насчёт стиля "Оглавление" в ААВВYY вообще-то уже было сообщено. И даже ответ получен. ;)
А вот о стилях для правильной разбивке на главы, это интересно. Спасибо. :)
Отв: FineReader 11: вниманию книгоделов!
Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
В целом сохранение в fb2 мне нравится намного больше, чем сохранение в doc, после которого добавляются ещё и ошибки конвертации. ;)
Но это, опять-таки, вопрос личных предпочтений.
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Посмотрим что ответят, хотя ставлю 90% против 10% ничего не ответят
Отв: FineReader 11: вниманию книгоделов!
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Ой, Вы меня неправильно поняли.
Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски.
По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт форму выведения сноски, он лишь соединяет цифру и текст. Всё остальное зависит от желания (умения) программистов читалок. :)
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Ой, Вы меня неправильно поняли. Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски. По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт фор
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Тут некоторое время делал наблюдение кто чем и как читает в давке в общественном транспорте. Поразила меня одна девица щупленькая, небольшого росточка, которая в одной рук держала том Стига Ларссона (там наверное все три девицы были в одном флаконе) Всё спасибо!
Отв: FineReader 11: вниманию книгоделов!
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Все lbook-и показывают примечания внизу страницы и 5 и 6-дюймовые - в последних прошивках там стоит coolreader. Если места на странице для показа всего примечания не хватает - прихватывается следующая страница.
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Отв: FineReader 11: вниманию книгоделов!
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Добавлю, что последняя версия AlReader2 тоже имеет опцию показа сносок внизу страницы. Работает под WindowsMobile.
Отв: FineReader 11: вниманию книгоделов!
Рассказываю о своём способе решения описанной в начальном постинге проблемы.
В редакторе стилей все "Оглавления" (если их больше одного) объединяю в один стиль (отметить все нужные стили и нажать кнопку вверху "Объединить").
Для полученного таким образом стиля устанавливаю маленький размер шрифта, полужирность, курсив и выбираю непривычный шрифт.
В результате встречающийся в тексте стиль "оглавление" резко отличается от основного текста, что облегчает его обнаружение. Не помню, писала ли, поэтому расскажу ещё раз.
"Инфицированную страницу" копирую в блокнот (не в Word! он сохраняется форматирование), а потом снова копирую - из блокнота в ФР. Если на странице есть форматирование, восстанавливаю.
Кстати, аналогичную процедуру стала проделывать со сносками, объединяя все стили в один и придавая ему атрибуты, резко отличающие от основного текста. Это позволяет легко обнаружить части текста в нижней трети страницы, отделённые от предыдущей части, если они распознаны как сноски, что случается довольно часто.
Иллюстрация:
Отв: FineReader 11: вниманию книгоделов!
уважаемая golma1! пож добавьте к списку глюков (т.к. вы МОЖЕТЕ :) им сказать)... во ВСЕХ версиях ФР (начиная с 6 и кончая 11), при распознавании украинских текстов, при встрече конструкции типа "молодчага. Її" ВСЕГДА определяется как "молодчага. її"... :(
а то уже задолбало вручную править...
Отв: FineReader 11: вниманию книгоделов!
Попробую. :)