А.В. Васильченко. Арийский миф III рейха.

Отконвертировал из PDF (ABBYY PDF-transformer).
Долго возился с форматированием, из-за вставленных иллюстраций (картинки удалены, качество и информативность их низкие).
В fb2 конвертировал с пом. doc2fb, затем вычитывал в FBE. Но возможно, еще косячки остались.
К сожалению, есть ошибки в структуре, никак от них не избавлюсь. Аннотация не на месте.
Да, еще не разобрался с таблицами, как они в fb2 делаются.
Там две двухстолбцовые таблички превратились в одностолбцовый текст, но он и так понятен. А вот четырехстолбцовая таблица, в приложениях, потеряла всякий смысл. Может ее вообще вымарать?

Подправьте, пожалуйста. http://lib.rus.ec/b/357537
Оригинальный PDF здесь: http://files.mail.ru/FHT5VI

ПДФ сильно плохой. Попробую только таблицы переделать

А вот если распознанный пдф.
http://lib.rus.ec/b/355271
..мона ево в fb2?
лесенок там поэтических много, сохранить бы.

Цитата:
..мона ево в fb2?
лесенок там поэтических много, сохранить бы.

Проконвертил я эти стихи в doc, тем же конвертером.
К сожалению, он посвоевольничал, переформатировал строки.
Допустим, это можно исправить вручную, можно и лесенки восстановить, пробелами или табуляцией (есть вроде такие теги?).
Но вот опус "Экзистенциализм" Вознесенский отформатировал в виде креста, причем кое-где строки повернуты перпендикулярно.
Есть стихи, где текст идет наклонно. Как это все сохранить?
Кстати, в данном pdf-е немало OCR-дефектов. Большинство можно исправить по смыслу, но не уверен, что все. А ни оригинала, ни пидиэфа без распознавания нету.
Doc-файл могу кинуть.
Аватар пользователя Isais

DoctorZ написал:
...Но вот опус "Экзистенциализм" Вознесенский отформатировал в виде креста, причем кое-где строки повернуты перпендикулярно.
Есть стихи, где текст идет наклонно. Как это все сохранить?

В FB2 - никак.
Только делать иллюстрацией, картинкой в FB2-файле. Визуальная поэзия такая визуальная...

DoctorZ написал:

Проконвертил я эти стихи в doc, .........
К сожалению, он посвоевольничал, переформатировал строки.
............. это можно исправить вручную, можно и лесенки восстановить, пробелами или табуляцией (есть вроде такие теги?).

Для того и сделал в pdf, чтобы максимаьно сохранить струкруру книги. А doc исправлять ручками ето понятно.

DoctorZ
не пользуйтесь вы этим ABBYY PDF-transformer. поверьте - ABBYY FineReader на несколько порядков лучше http://narod.ru/disk/37657917001/ABBYY%20FineReader%2011.0.102.481.exe.html

wotti написал:

ABBYY FineReader на несколько порядков лучше

Да приходилось им пользоваться, для бумажных документов.
ИМХО, OCR-движок там, скорее всего, общий.
В файнридере там вручную можно отсечь ненужное, типа колонтитулов, нумерации страниц и прочей дребедени, которая изрядно мне крови попортила. Зато Трансформер автоматом весь документ обрабатывает и выплевывает пережеванный результат.
Или в Файнридере эта функция тоже есть, я просто не очень внимательно искал? Надо будет попробовать.
Спасибо за совет.

DoctorZ написал:
wotti написал:

ABBYY FineReader на несколько порядков лучше

Да приходилось им пользоваться, для бумажных документов.
ИМХО, OCR-движок там, скорее всего, общий.
В файнридере там вручную можно отсечь ненужное, типа колонтитулов, нумерации страниц и прочей дребедени, которая изрядно мне крови попортила. Зато Трансформер автоматом весь документ обрабатывает и выплевывает пережеванный результат.
Или в Файнридере эта функция тоже есть, я просто не очень внимательно искал? Надо будет попробовать.
Спасибо за совет.
Файнридер лучше OCR-ит, у него настроек много, можно язык отдельного фрагмента на странице задавать, исправлять ошибки тут же в проекте, а трансформер он только автоматичски распознает и всё. Из умений трансформера FR не умеет только трансформировать DOC в PDF. А в остальном - да, FR лучше.
Автоматом - да, конечно, по умолчанию как раз как только PDF-ку или дежавюшку открываешь, так сразу начинает распознавать автоматом все страницы. Другое дело, что эту функцию можно отключить и распознавать только выбранные страницы со своей собственной разметкой, а не той, которую FR разметил: он иногда так разметит - мама не горюй!Это конечно, если Professional, а есле Home, то он только одну картинку за раз обрабатывает и только из картиночных файлов, ни PDF. ни DjVu не возьмет. Короче, Home - версия для развода лохов на бабки, чтобы, купив Home версию и узнав, что она ничего не умеет. покупали бы Professional.
X