Вы здесьFR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Опубликовано сб, 25/04/2020 - 17:23 пользователем Civilizator
В общем давно уже не распознавал книжки, весь софт ставил заново, многое старое забыл, а умные люди сделали многое полезного нового. В общем замечательно распозналась книжка в ФайнРидере 15-ом, сохранил её в формате ФБ2, загрузил в FBE чтобы прописать там все нужные мелочи и вообще причесать. А оно не сохраняет. Пишет, что незакрытые какие-то "th, td". Файнридер все картинки впихнул внутрь таблиц. Я подозреваю, что надо как-то избавится от таблиц? Но 78 иллюстраций в книжке, замучаешься вручную. запустил скрипт "чистка" - осталось 4 картинки из 78 - явно ненормальная ситуация. Кто-то может подскажет как это правильно сделать? Заранее благодарен.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 2 дня
TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 4 дня Oleg V.Cat RE:B343695 Александр. Книга 1 4 дня Isais RE:Калибрятина/Самиздатина 6 дней md2k15 RE:Относительно Вархаммер 40 000 1 неделя Oleg V.Cat RE:Беженцы с Флибусты 1 неделя tvnic RE:"Коллектив авторов" 1 неделя SergL197 RE:Регистрация 1 неделя ejik.v RE:Viva Stiver! 1 неделя RedRoses3 RE:Флибуста конец? 1 неделя Ldrozd RE:Сандра Ньюмен - Джулия [1984] 3 недели konst1 RE: Банда Рафаэля 3 недели Isais RE:Лоренс Даррелл - Горькие лимоны 3 недели Isais RE:B157704 Черепаха Киргала 3 недели sem14 RE:Литературная премия «Ясная Поляна» 3 недели blahblahblah2024 RE:Сборник - Советская морская новелла. Том 1 4 недели Isais RE:Обновление FictionBook Editor 1 месяц Alex_61 RE:Windows 7 безопасна благодаря помощи NSA??? 1 месяц Впечатления о книгах
Дей про Гаврик: Новая хозяйка блуждающей лавки [СИ] (Любовная фантастика, Самиздат, сетевая литература)
05 11 Какая же мерзость хахаль ГГ, вот уж воистину странные вкусы у некоторых дамочек. Оценка: плохо
Дей про Гаврик: Закуска с характером (Любовная фантастика, Попаданцы, Самиздат, сетевая литература)
03 11 А ведь и правда хорошо. Отличная женская сказка, не стыдно посоветовать. Оценка: хорошо
ikravtso про Вячеслав Александрович Каликинский
03 11 Романы про Агасфера интересные, хотя первый очень "рваный", сложно понять, что за чем происходит, время действия постоянно скачет. А вот фразы на иностранных языках - это некое "твоя моя не понимай". Даже гугль-перевод лучше ………
Дей про Шах: Купеческая дочь замуж не желает (Фэнтези, Попаданцы, Самиздат, сетевая литература)
02 11 Молочный ряд был богатым, представлено все разнообразие молочной продукции здешних краев. Просто молоко, сметана, творог, масло, различные сыры — полутвердые, овечьи, козий сыр. Не заметила плавленого сыра. И кисломолочных ……… Оценка: плохо
Sello про Аллен: Побочные эффекты [Авторский сборник] [Side Effects ru] (Современная проза)
02 11 Его тексты - как если бы, скажем, идя в обратном направлении, посмотреть фильм "Голый пистолет" и после того по нему написать рассказ. Сюр с элементами специфического юмора или, наоборот, юмор с вкраплениями сюра. Но есть ……… Оценка: хорошо
Её Лунная Тень про Трофимов: Драку заказывали? [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
01 11 Грузите запятые бочками. Братья Куромазовы". Автор - двоечник и графоман. Оценка: нечитаемо
andmalin про Трофимов: Драку заказывали? [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
01 11 Довольно неплохо , если первую еле одолел , то вторую и третью прочитал с удовольствием . Оценка: хорошо
decim про Ансари: Цивилизация рассказчиков: как истории становятся Историей [litres] (История, Публицистика, Обществознание)
31 10 За несколько веков на кострах были сожжены десятки тысяч ведьм" - автор повторяет кровавый навет протестантов на католиков, пошедший со времени соперничества Англии и Испании, и убедительно расписанный Шарлем де Костером. ……… Оценка: плохо
udrees про Кронин: Замок Броуди [litres] [Hatter's Castle ru] (Классическая проза)
30 10 Хорошая классическая литература. Книга так живо описывает мрачную и тяжелую жизнь одного семейства в Англии 19 века. С первых страниц понимаешь что все проблемы в жизни этого семейства исходят от одного человека – отца семейства. ……… Оценка: хорошо
udrees про Кронин: Замок Броуди [Hatter's Castle ru] (Классическая проза)
30 10 Хорошая классическая литература. Книга так живо описывает мрачную и тяжелую жизнь одного семейства в Англии 19 века. С первых страниц понимаешь что все проблемы в жизни этого семейства исходят от одного человека – отца семейства. ……… Оценка: хорошо
udrees про Дебрецени: Холодный крематорий. Голод и надежда в Освенциме [litres] (Биографии и Мемуары, Публицистика)
30 10 Жутковатая книга про жизнь в лагере смерти, написана со всеми подробностями, ужасами быта, зверствами, убийствами. Поражает, что хотя Освенцим советские войска освободили еще в конце февраля 1945 года, тем не менее автор книги ……… Оценка: хорошо
udrees про Быкова: Самостоятельный ребенок, или Как стать «ленивой мамой» (Педагогика, Детская психология)
30 10 Книга психолога о том как можно воспитать самостоятельного ребенка. Инструкции и советы интересные, жалко что требуют много времени и усилий. Я думаю не каждая мама и тем более папа смогут иногда терпеть мнение ребенка, но ……… Оценка: хорошо |
Комментарии
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
...
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Сам впихнул или ему кто-то это позволил не изменив тип распознанной области?
Откройте fb2 в текстовом редакторе и воспользуйтесь поиском.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Сам впихнул. Картинки он типизирует как картинки, но при сохранении в ФБ2 из изображения и подписи делает таблицу.
Открыть в редакторе и искать - это и есть "вручную". Это я и без подсказки могу, но лениво столько вручную редактировать, хочется узнать как это правильно автоматизировать. Тем более не последнюю книгу распознаю, на будущее в очереди еще много книжек с большим количеством иллюстраций.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Воспользоваться текстовым редактором чуть сложнее, чем стандартный Блокнот. Применив в нем функцию Поиск/Замена.
Если вы ищете готовое однокнопочное решение вашей проблемы, то вряд ли найдете. А вот правильное средство посоветовать могу - скрипты.
P.S. Кстати, нельзя ли увидеть образец "проблемной" страницы? Как в виде скрина после распознавания, так и после сохранения в fb2.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Ковыряться в FR 15 на предмет "нормализации" дольше, чем вручную "выковыривать" картинки из таблиц.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Открыть в FBE режиме сорцев, запустить тотальную замену в тексте:
<td> > <p>, </td> > </p>
и так далее, всё,<table> > пустое место
и так далее.Может, конечно, получиться, что у вас какой-то
<p>
окажется без</p>
-- тогда вручную в этом же режиме найти и вставить.RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Именно так.
И ещё.
В стареньком ФР12 программа после распознавания выдает список проблемных страниц. Если их не миллион, то можно отменить в них распознанные таблицы и перераспознать.
Наверняка, и в ФР15 так же.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Наверное мой совет не подойдет, поскольку вопрос был о том, как автоматизировать удаление таблиц. Но по собственному опыту могу сказать, что после файнридера автоматический поиск и замену нужно применять крайне осторожно - может возникнуть ситуация, когда файл просто не будет сохраняться. Сам я обычно сначала правлю структуру, до уровня, когда наличие tr, td и tн выводится как единственная ошибка, а потом, поскольку картинки, вставленные файнридером, далеко не идеальны, расставляю их по новой, после правки в фотошопе. И тут уже необходимости в автоматизации особой нет - все делается вручную. Но процесс контролируем и неожиданных ошибок не возникает. Но если хочется автоматизировать, то после правки структуры поиск с заменой (tr, td. th. table и т.д.) может оказаться вполне достаточным.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
И следи за пустыми строками там, где они были в книге: Фаня любит их игнорировать. Но опять же: часто в книге пустые строки ставятся, чтобы отделить цитату или эпиграф или стихи от текста, тогда оформить соответственно, а пустая строка не нужна.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Вы не находите, что несколько нелепо поучать человека, который восемь лет на сайте и сделал уже больше сотни книг? Причем технических претензий к его книгам не возникает -- это не Сундук, будь он неладен!
А поучать опытного верстальщика в таком тоне, как Вы это сделали, вообще ни в какие ворота не лезет.
Язык придерживайте. Невзирая на желание его почесать.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
А я никого не поучаю, просто делюсь своим опытом, которого у меня огого! :))
Ну и ты бы поделился, чивоущтам! Я ж ведь знаю, что ты опытный.
"Опытный" верстальщик
так бы не накосячилтоже может ошибаться. В данном случае я даю ему совет как ещё более опытный.RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
В очередной раз убеждаюсь: комплекс полноценности не лечится.
Тогда придется объяснять
по лбув лоб:и я не скажу, куда вам идти. Не ваше это собачье дело -- решать за меня;Доступно?
Или повторить?
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
себе повтори!
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Вы ведете себя отвратительно! Флибустянский срач пахнет издали. Не "тыкайте" незнакомым людям, хотя бы... А впрочем, кому это я о культуре...
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Блин. Чисто технический вопрос. Ожидался чисто технический ответ. Ну как, как даже в этом народ умудряется найти темы для посраться? Я это понимать отказываюсь! Жалко, что никак это позорище удалить не могу отсюда...
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
можно и так
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
В общем, копипаст - наше всё!
Да, ещё: следите, чтобы не потерялись пустые строки, где они были в книге: Фаня любит их игнорировать. Но опять же: часто в книге пустые строки ставятся, чтобы отделить цитату или эпиграф или стихи от текста, тогда оформить соответственно, а пустая строка не нужна.
Не сохраняйте в doc: потеряются кавычки(точнее, преобразуются из «» в ""). Имеет смысл сохранять в txt UTF8, только опять же нужно следить, чтобы не пропали emphasis и strong там где это надо, а не subtitle или title, ну и стихи надо по особому оформлять: у Фани вообще нет стихов, каждую строку стиха нужно размечать отдельной областью распознавания, чтобы Фаня не слил все строки стиха в одну строку.
Насчёт IrfanView и сохранения картинок: чтобы png получился минимального размера, нужно использовать плагин pngout, этот плагин активен только в версии IrfanView 32бит, поэтому пришлось сносить 64разрядный IrfanView, хоть в нём и было больше плагинов, чем в 32разрядном, но конкретно этот плагин не хотел работать. Для наибольшего сжатия уровень сжатия должен быть 9, но иногда при таком уровне IrfanView может почистить скан от артефактов, а если это не артефакты, а деталь рисунка? Тогда безопасный уровень сжатия 6: рисунок не будет самовольно чиститься от артефактов или деталей рисунка, похожих на артефакты, но размер рисунка будет несколько больше.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Возможно кому-то пригодится.
В PHP есть подходящая функция strip_tags()
Удаляет все HTML теги, какие найдет, кроме разрешенных.
Пример использования.
<?php
$text = 'Какой-то текст содержащий HTML';
strip_tags($text, '<p><a><i><strong><img>');
echo $text;
?>
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Чувствую, лучше всего будет потратить пару дней и разобраться с тем, как самостоятельно написать скрипт для FBE.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Совсем необязательно изобретать скрипт под "php, что джаваскрипт", достаточно написать простенький регексп и под Notepad++ довести ФБ2 до ума. Notepad++ понимает регекспы, если чё.
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Благодаря Violontan проблема решена самым удобным и правильным образом - добавлением скрипта в FBE.
Скрипт "Превратить таблицы в простой текст v1.1" залил в git-хранилище исходников FBE:
github точка com слэш sensboston слэш fictionbookeditor
Лежит в папке
/files/Scripts/19_Обработка форматирования/
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
не работает, при запуске программы "Ошибка выполнения скрипта"
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Попробуйте скачать с такого адреса:
scripts точка fictionbook точка org слэш files3 слэш ConvertTablesIntoText_v1_1.zip
На GitHub.com, я думаю, файл тоже корректный, но его оттуда надо сохранять правым кликом мыши по кнопке "Raw", и далее - "Сохранить объект как...".
RE:FR 15 + FBE 2.6.6 - Как нормализовать нормально FB2?
Автор уже дал альтернативную ссылку, но я и по первоначальной всё скачал. Перед запуском просто просмотрел сохраненный файл и, сравнив с другими скриптами, убрал лишние символы. Всё заработало с первой попытки применения.