FineReader 12 Professional

Аватар пользователя Антонина82
Forums: 

ABBYY по электронке известил, что вышла версия FineReader 12 Professional. Что нового - здесь,цена - 4490. Я уже с 11 сроднилась. Всяких обновлений побаиваюсь. Кто здесь самый смелый - сообщите, стоит менять шило на мыло?

А может воспользоваться ФР11, 10...?

Аватар пользователя Антонина82

tvnic написал:
А может воспользоваться ФР11, 10...?

Воспользоваться то можно... Но я полностью выверила текст Аполлинера т.1 (тот кто знаком с творчеством писателя - меня поймет). И тут такой срыв...
Написала в службу поддержки ФР. Здесь наверняка действует правило: FineReader - один, а вас бестолковых пользователей - много. Так что когда ответят, да и ответят ли...
Windows писать бесполезно. Они значительно больше ABBYY, да и судя по выскакивающему сообщению - типа, если установим - то известим, ждать ответа бессмысленно
Аватар пользователя Антонина82

Антонина82 написал:
tvnic написал:
А может воспользоваться ФР11, 10...?

Воспользоваться то можно... Но я полностью выверила текст Аполлинера т.1 (тот кто знаком с творчеством писателя - меня поймет). И тут такой срыв...
Написала в службу поддержки ФР. Здесь наверняка действует правило: FineReader - один, а вас бестолковых пользователей - много. Так что когда ответят, да и ответят ли...
Windows писать бесполезно. Они значительно больше ABBYY, да и судя по выскакивающему сообщению - типа, если установим - то известим, ждать ответа бессмысленно

ABBYY ответила (оперативно! 30.06 - с учетом выходных)
Цитата:
Для восстановления корректной работы, пожалуйста, попробуйте переустановить программу

далее описано, как это сделать.
ЗЫ: тихое подозрение, что ответ из разряда стандартных отписок.

Антонина82 написал:
Антонина82 написал:
tvnic написал:
А может воспользоваться ФР11, 10...?

Воспользоваться то можно... Но я полностью выверила текст Аполлинера т.1 (тот кто знаком с творчеством писателя - меня поймет). И тут такой срыв...
Написала в службу поддержки ФР. Здесь наверняка действует правило: FineReader - один, а вас бестолковых пользователей - много. Так что когда ответят, да и ответят ли...
Windows писать бесполезно. Они значительно больше ABBYY, да и судя по выскакивающему сообщению - типа, если установим - то известим, ждать ответа бессмысленно

ABBYY ответила (оперативно! 30.06 - с учетом выходных)
Цитата:
Для восстановления корректной работы, пожалуйста, попробуйте переустановить программу

далее описано, как это сделать.
ЗЫ: тихое подозрение, что ответ из разряда стандартных отписок.

Пишите, что не помогло. Пускай думают. Еще и ругните, корректно.

Антонина82 написал:
Ни в одном формате невозможно сохранить текст.
Поглядел оригинальный пакет, насколько понимаю, он поврежден. Со страницами неладно, нумерация не совпадает, некоторых вообще не нашел. Извлек bmp из FR проекта, почистил, обработал, перевел в tif, тогда дело пошло. Дилетантские рекомендации: резать страницы на половинки до импорта в FR (хотя бы IrfanView), строго следить за порядком номеров страниц, обрабатывать изображения до приемлемого качества, обычно использую Cleanerzoomer 3.7 и апсэмпл до 400 dpi, если есть мелкий текст и всякие над- и подстрочные знаки, 300 dpi будет маловато. После определения блоков на автомате, просмотреть и вручную исправить все, что этот дебильный FR относит к колонтитулам (типа ***, номеров глав и т.д.) и рубит на куски, то есть, текстовый блок на странице должен быть ОДИН. А вот номер страницы должен быть отдельно, его ведь не нужно экспортировать ни в Word, ни в fb2. Понимаю, что для реализации вышеописанного придется ломать шаблон "чистых" OCR-щиков, когда чужие (а бывает и свои) сканы запихиваются в FR на манер Вовки из тридевятого царства "И так сойдет!". Ни в коем случае не пытаюсь навязать свои взгляды, можете действовать как привыкли. Но тогда это будет не первая и не последняя жалоба на FR, ОСь и неблагоприятное расположение звезд на небе. "Запомни, лучше день потерять, потом за пять минут долететь." (с)
Аватар пользователя remembecoventry

GMAP написал:
Понимаю, что для реализации вышеописанного придется ломать шаблон "чистых" OCR-щиков, когда чужие (а бывает и свои) сканы запихиваются в FR на манер Вовки из тридевятого царства "И так сойдет!".
Шаблон хороший, годный. Не ждать, пока придёт профессиональный дядя и всё сделает по инструкции, а запихнуть как есть, и посмотреть что получится. А если не получилось, что-нибудь подкрутить и снова запихнуть. Пока не получится.
Аватар пользователя Антонина82

У меня все страницы в скан вошли. Я потом в обязательном порядке сверяю с бумажной версией. Не было случая, что ФР "сжевал" какую-либо страницу. Он может часть текста "потерять", вернее отнести его к колонтитулам, особенно если есть ***. Но это легко лечится - просто указать, что данная часть текста является основной и вновь распознать страницу. (В ФР-12 это работает, в ФР 11 - не работало)

я смотрю - чем новее программа (винда, ФР, т.д.), то тем больше ошибок и защит и меньше функциональность...

Эту ветку периодически просматриваю. Все хотел задать вопрос и сейчас назрело.
Насколько хороша 12-я версия по сравнению с 11-ой? Есть ли резон ее устанавливать и ради каких плюсов?

Аватар пользователя Антонина82

tvnic написал:
Эту ветку периодически просматриваю. Все хотел задать вопрос и сейчас назрело.
Насколько хороша 12-я версия по сравнению с 11-ой? Есть ли резон ее устанавливать и ради каких плюсов?

Поскольку у меня новая операционка в лице windows 8.1, я не могу дать однозначного ответа. Не знаю, кто виноват, что выскакивают такие ошибки. Я в связке windows ХР+FineReader 12 практически не работала. О плюсах ФР12 могу сказать, что он действительно лучше распознает. Кроме того (очень субъективно), зона неуверенного распознавания стала выделяться значительно чаще и поэтому отловить ошибки, где программа заменила неизвестное ей слово на имеющее в словаре (но неправильное) стало легче.
Аватар пользователя Isais

Говорят, 12-я корректно распознала латиницу с диакритикой (ударения и под.).

Аватар пользователя Антонина82

Isais написал:
Говорят, 12-я корректно распознала латиницу с диакритикой (ударения и под.).

С этим соглашусь, особенно с французским, коим совершенно не владею. Но я проводила такой эксперимент: в книге был французский текст. ФР распознала его и поставила в некоторых словах свои диакритические знаки. Что характерно, я проверяла по словарям, сделала это правильно, в отличии от бумажной версии.

По моим ощущениям - что-то лучше, что-то хуже. Но глобальной разницы нет. Если не нужны ударения, то может и не стоит менять шило на мыло. Того, чего я от 12го ожидал, не появилось. Всё те же детские болезни. Может интерфейс тал поудобней, или просто чуть более вменяемый. А вот распознавание "в лоб" без настроек явно стало хужее. Ненамного, но мне кажется что хуже. Правда много не ковырял.

Аватар пользователя Антонина82

Может кто сумеет спасти Аполлинера т.1 Я выложила файл, который создала ФР и не хочет его сохранять в других форматах, на файлообменник. Сама я точно не смогу с ним ничего сделать, только по новой запускать ФР и выверять текст

Я пока взял. Посмотрю, вечером отпишусь, буду ли ковырять дальше его. А то месяц ждут появления на свет ещё два файла.

Аватар пользователя remembecoventry

Антонина82 написал:
Может кто сумеет спасти Аполлинера т.1 Я выложила файл, который создала ФР и не хочет его сохранять в других форматах, на файлообменник. Сама я точно не смогу с ним ничего сделать, только по новой запускать ФР и выверять текст

Что с ним сделать-то надо? Сохранить в fb2? Или ещё что-то?
Аватар пользователя Антонина82

remembecoventry написал:
Антонина82 написал:
Может кто сумеет спасти Аполлинера т.1 Я выложила файл, который создала ФР и не хочет его сохранять в других форматах, на файлообменник. Сама я точно не смогу с ним ничего сделать, только по новой запускать ФР и выверять текст

Что с ним сделать-то надо? Сохранить в fb2? Или ещё что-то?

Да, в fb2 - было бы замечательно.Я fb2 сама доведу до ума
Аватар пользователя remembecoventry

Антонина82 написал:
remembecoventry написал:
Антонина82 написал:
Может кто сумеет спасти Аполлинера т.1 Я выложила файл, который создала ФР и не хочет его сохранять в других форматах, на файлообменник. Сама я точно не смогу с ним ничего сделать, только по новой запускать ФР и выверять текст

Что с ним сделать-то надо? Сохранить в fb2? Или ещё что-то?

Да, в fb2 - было бы замечательно.Я fb2 сама доведу до ума

Я сейчас на работе. Смогу только вечером из дома — часика через четыре.
PDF с текстовым слоем не нужно?
Аватар пользователя Антонина82

remembecoventry написал:

Я сейчас на работе. Смогу только вечером из дома — часика через четыре.
PDF с текстовым слоем не нужно?

Нет, мне PDF не нужен. Да, Вы особо не торопитесь. Как получится со временем
Аватар пользователя remembecoventry

Антонина82 написал:
remembecoventry написал:

Я сейчас на работе. Смогу только вечером из дома — часика через четыре.
PDF с текстовым слоем не нужно?

Нет, мне PDF не нужен. Да, Вы особо не торопитесь. Как получится со временем

У меня ничего не получилось. Тоже Win 8.1+FR12 — FR молча падает где-то посередине прогрессбара при попытке сохранить ваш пакет в файл и то же самое происходит при повторном распознавании пакета. Проблема в пакете.

Антонина82 написал:
Может кто сумеет спасти Аполлинера т.1 Я выложила файл, который создала ФР и не хочет его сохранять в других форматах, на файлообменник. Сама я точно не смогу с ним ничего сделать, только по новой запускать ФР и выверять текст

Сейчас попробую.

Антонина82 написал:
Может кто сумеет спасти Аполлинера т.1 Я выложила файл, который создала ФР и не хочет его сохранять в других форматах, на файлообменник. Сама я точно не смогу с ним ничего сделать, только по новой запускать ФР и выверять текст

Fb2 я из Вашего я сделал. Но файл предварительно надо было отредактировать в Фане. Там очень многое требует редактирования.
При любой попытке сохранения Вашего файла Фаня зависает.
Надо дать распознать все по новой и тогда сохранять.
Мой файл fb2 лежит https://yadi.sk/d/sSPTFTX-V7pjh

izekbis написал:
Антонина82 написал:
Может кто сумеет спасти Аполлинера т.1 Я выложила файл, который создала ФР и не хочет его сохранять в других форматах, на файлообменник. Сама я точно не смогу с ним ничего сделать, только по новой запускать ФР и выверять текст

Fb2 я из Вашего я сделал. Но файл предварительно надо было отредактировать в Фане. Там очень многое требует редактирования.
При любой попытке сохранения Вашего файла Фаня зависает.
Надо дать распознать все по новой и тогда сохранять.
Мой файл fb2 лежит https://yadi.sk/d/sSPTFTX-V7pjh

К сожалению, сразу не сообразил, что файл идет с Вашими настройками ФР, и поэтому получается такой кривой. Приношу свои извинения. Исправил настройки ФР и переделал файл. Теперь он значительно лучше.
Лежит по тому же адресу https://yadi.sk/d/sSPTFTX-V7pjh

ФР11 отказался открывать проект сделанный ФР12-м.

sd написал:
ФР11 отказался открывать проект сделанный ФР12-м.
что и следовало ожидать.
Аватар пользователя Антонина82

Zadd написал:
sd написал:
ФР11 отказался открывать проект сделанный ФР12-м.
что и следовало ожидать.

Если я ФР12-м открываю файл, сделанный ФР11, то программа сообщает об этом и переделывает файл под новую версию.

Антонина82 написал:
Zadd написал:
sd написал:
ФР11 отказался открывать проект сделанный ФР12-м.
что и следовало ожидать.

Если я ФР12-м открываю файл, сделанный ФР11, то программа сообщает об этом и переделывает файл под новую версию.
Ну так и это тоже очевидно. Новая версия знает всё о старых форматах и поэтому может сконвертировать. А вот старая версия не может знать, что придумают в новой версии, поэтому и не может открыть новый формат.
Загадкой остается только постоянное стремления AbbYY постоянно менять форматы, но это уж их право.
В FR8 довольно интересный формат: чёрно-белая копия сохраняется в tiff-ах, а остальные цвета в frdat-ах, так что если документ монохромный, то полная копия изображения уже имеется в пакете(важно для лучшего захвата рисунков в fb2, чтобы не оставлять на откуп FR). С другой стороны, что за рисунки в монохроме? Чаще всего испорченные, хотя попадаются книжки отсканенные именно в монохроме(1 бит цветности) и тут уж ничего не поделаешь, но на распознание текста это не влияет. Вообще, заметил странную вещь: мне кажется, что FR8 распознает слова именно по моноьхромному оттиску: когда проверяешь неуверенно распознанные FR8 слова только диву даешься: вместо слова на проверочном оттиске черт-те что, хотя на картинке слово разобрать можно, пусть и не слишком хорошо, а иногда и вообще на общей картине ясно видно, а на проверочно нифига. Это, видимо, потому, что FR8 за основу для распознания берёт ч/б рисунок, а остальные цвета наверно, не анализирует. Хотя... текст на цветном фоне анализируется же, хоть и не всегда. Может, он все равно переводит оттиск в ч/б и далее смотрит, что получилось: черный текст на белом фоне или белый текст на чёрном фоне?(ну и потом, после распознания меняет цвет распознанного на нужный, какой был в исходном изображении)
В общем, как-то так.
Аватар пользователя alexej36

Цитата:
Может кто сумеет спасти Аполлинера т.1

Опытным путем выяснено: повреждена стр. 209. Достаточно заново распознать ее и все сохраняется.

alexej36 написал:
Цитата:
Может кто сумеет спасти Аполлинера т.1

Опытным путем выяснено: повреждена стр. 209. Достаточно заново распознать ее и все сохраняется.
А можете методику выяснения? Сколько это занимает: больше, чем заново распознать?
Аватар пользователя Антонина82

Zadd написал:
alexej36 написал:
Цитата:
Может кто сумеет спасти Аполлинера т.1

Опытным путем выяснено: повреждена стр. 209. Достаточно заново распознать ее и все сохраняется.
А можете методику выяснения? Сколько это занимает: больше, чем заново распознать?

Мне тоже это любопытно. Что-то мне подсказывает, что это был пусть первый, но не последний подобный сбой

Да, такие сбои случаются, если, например, внезапно при распознавании выключится компьютер. Тогда повреждённая страница способна создать даже синий экран!
И её надо просто убрать из документа. И отсканировать её снова.

Zadd написал:
alexej36 написал:
Цитата:
Может кто сумеет спасти Аполлинера т.1

Опытным путем выяснено: повреждена стр. 209. Достаточно заново распознать ее и все сохраняется.
А можете методику выяснения? Сколько это занимает: больше, чем заново распознать?

ФР полностью перераспознает всю книгу за 54 сек. Проверил по секундомеру. Искать имеет смысл если сделаны большие правки.
Руководство по ФР12 постоянно здесь http://yadi.sk/d/Z2zAJj-mHq3FY
По ФБЕ последняя версия постоянно здесь http://yadi.sk/d/R8k1J4cRFmYHZ
Аватар пользователя Антонина82

izekbis написал:

ФР полностью перераспознает всю книгу за 54 сек. Проверил по секундомеру. Искать имеет смысл если сделаны большие правки.
Руководство по ФР12 постоянно здесь http://yadi.sk/d/Z2zAJj-mHq3FY
По ФБЕ последняя версия постоянно здесь http://yadi.sk/d/R8k1J4cRFmYHZ

Когда текст полностью проверен, как в случае с Аполлинером
Кстати, вот страница, которая доставила мне столько хлопот. ФР некорректно поработал с примечанием. Он к правильному примечанию, добавил две сноски, просто посчитав, что в тексте они имеются.

Антонина82 написал:
izekbis написал:

ФР полностью перераспознает всю книгу за 54 сек. Проверил по секундомеру. Искать имеет смысл если сделаны большие правки.
Руководство по ФР12 постоянно здесь http://yadi.sk/d/Z2zAJj-mHq3FY
По ФБЕ последняя версия постоянно здесь http://yadi.sk/d/R8k1J4cRFmYHZ

Когда текст полностью проверен, как в случае с Аполлинером
Кстати, вот страница, которая доставила мне столько хлопот. ФР некорректно поработал с примечанием. Он к правильному примечанию, добавил две сноски, просто посчитав, что в тексте они имеются.
Логично, вообще-то посчитал. Если имеются 1) и 2), то что это, если не примечания? Он не мог догадаться, что это: таблица или просто текст, вот и решил, совершенно логично, что это примечания. Он же смысла слов не понимает.

Zadd написал:
Антонина82 написал:
izekbis написал:

Кстати, вот страница, которая доставила мне столько хлопот. ФР некорректно поработал с примечанием. Он к правильному примечанию, добавил две сноски, просто посчитав, что в тексте они имеются.

Логично, вообще-то посчитал. Если имеются 1) и 2), то что это, если не примечания? Он не мог догадаться, что это: таблица или просто текст, вот и решил, совершенно логично, что это примечания. Он же смысла слов не понимает.

Чтобы ФР признал сноску, он должен номер сноски связать с номером текста сноски. Без привязки сноски(примечания) не бывает. Здесь он не должен был этого делать - нет привязки. Поэтому и виснет при преобразовании. Это глюк ФР. Вопрос, как обнаруживать такое некорректное место. При сохранении ФР останавливается на некорректном месте. Пока кроме, как примерно, по проценту «картинки сохранения» и дальше перебором проб сохранения несльких страниц в некорректном месте, ничего не нашел.
Аватар пользователя alexej36

Цитата:
А можете методику выяснения? Сколько это занимает: больше, чем заново распознать?

Про методику выявления. В FR есть возможность сохранять в Fb2 произвольное количество идущих подряд страниц. Если битая попадет в их число - программа зависает, если нет - сохраняет нормально. Дальнейшая последовательность действий очевидна.
Про время - с текстом проделана большая работа, так что вопрос некорректный.
Относительно причины. Возможно дело в жестком диске. После очередной перезаписи информации повредился сектор... у меня такое было, но на флешке...
Аватар пользователя alexej36

Замечен досадный баг. При конвертации в Fb2 рисунки сохраняет только самого низкого качества ("Небольшой размер" (150 dpi)), что бы в настройках ни ставилось.
Обходим ограничения так: сохраняем как .docx. В полученном файле расширение заменяем на zip. Открываем архиватором. Ищем папку media. Рисунки там. Качество их соответствует выставленным настройкам.

12-ой версией пользоваться не спешу. А вот в 11-ой не знаю как (если это возможно) преодолеть такой момент. При сохранении файла приходится постоянно с каждой новой книгой выставлять нужные параметры сохранения (txt, html). Они как-то закрепляются?

Аватар пользователя Isais

Если постоянно меняете формат выходного файла, то придется каждый раз выставлять параметры заново.
Если постоянно передаете OCR в FB2, то достаточно открыть Фаню без файла и в открывшемся окошке "Задачи" выбрать вкладку FB2.
Затем при открытии картиночного файла - выбрать "Файл (ПДФ/изображение) в fb2". Или открывать прямо контекстным меню Винды, как удобнее: "Открыть с помощью FineReader". Сразу открывает в Фане и по распознавании сохраняет в fb2 (главное при этом - не забыть нажать кнопку "Сохранить").

Все больше разочаровываюсь в 12. Номера сносок на странице, все вставляет в одно место. В 11 такого не было. При сохранении в fb2 все картинки почему-то помещает в таблицы. Все приходится править вручную.

izekbis написал:
При сохранении в fb2 все картинки почему-то помещает в таблицы. Все приходится править вручную.
В 11 точно так же.

Zadd написал:
izekbis написал:
При сохранении в fb2 все картинки почему-то помещает в таблицы. Все приходится править вручную.
В 11 точно так же.

В 11 у меня из 10 это было в одном случае А в 12 все.

izekbis написал:
Zadd написал:
izekbis написал:
При сохранении в fb2 все картинки почему-то помещает в таблицы. Все приходится править вручную.
В 11 точно так же.

В 11 у меня из 10 это было в одном случае А в 12 все.

не знаю, у кого как, но у меня в 11 во всех случаях загоняет картинки в таблицы... может сборка неудачная?

izekbis написал:
Все больше разочаровываюсь в 12. Номера сносок на странице, все вставляет в одно место. В 11 такого не было. При сохранении в fb2 все картинки почему-то помещает в таблицы. Все приходится править вручную.
Belomor.canal написал:
Интересно, а что FR12 делает со сносками, которые не знает куда девать, при сохранение в fb2?
FR11 их смело "глотал"
- т.е. найти следы проглоченного текста, можно было тщательным сличением исходника и результата. Из за этого пользоваться такимс сохранением было не возможно или очень накладно!

Zadd написал:
izekbis написал:
Все больше разочаровываюсь в 12. Номера сносок на странице, все вставляет в одно место. В 11 такого не было. При сохранении в fb2 все картинки почему-то помещает в таблицы. Все приходится править вручную.
Belomor.canal написал:
Интересно, а что FR12 делает со сносками, которые не знает куда девать, при сохранение в fb2?
FR11 их смело "глотал"
- т.е. найти следы проглоченного текста, можно было тщательным сличением исходника и результата. Из за этого пользоваться такимс сохранением было не возможно или очень накладно!

В 11 загонял их в конец текста. В 12 сгоняет все номера сносок на странице в одно место. Отключил распонавание сносок. Напмсал все ABBY. Жду ответа.
Аватар пользователя alexej36

Если есть стиль "подпись к картинке" — при конвертации в Fb2 будет таблица. Это не баг. Таково неудачное решение разработчиков FR.

Зато в 12-й можно что-то еще делать в процессе сканирования...

c-rank написал:
Зато в 12-й можно что-то еще делать в процессе сканирования...

Можно только смотреть.

izekbis написал:
c-rank написал:
Зато в 12-й можно что-то еще делать в процессе сканирования...

Можно только смотреть.

Как это, только смотреть?
Можно ранешние страницы переразмечать и перераспознавать, и вообще править картинку. Вот текст править нельзя.

Появилась новая версия ABBYY FineReader 12.0.101.388. Попробовал, вроде без ранее замеченных недостатков. Если есть потребность, могу дать ссылку (или загрузить сюда?).

Страницы

X