Программа объединения разнородной информации

Здравствуйте.

Приглашаю обсудить тему ускорения просмотра накопленной на PC информации.

Наверняка уже ни для кого не проблема скачать из Intrnet-а сотни тысяч книг и JPG-изображений.
Можно даже все их прочитать и просмотреть.
Но всё равно у большинства останется каша в голове.

Трудности можно на простом примере показать:
Тут в навигации Либрусека есть ссылка на картины (ftp...). Картин много, можно долго из лиcтать. Но большинство смотрящих нечего не знают ни о художнике (биография), ни о самих картинах (дата написания картины, размер картины, на чем написана и чем, где хранится, сколько сейчас стОит и т.д.).
В тоже время в самой библиотеке Либрусека можно найти сопутствующую информацию:
= в энциклопедиях есть биографии художников;
= есть отдельные книги, описывающие жизнь творчество художнка, в которых есть подробное описание сюжета каждой картины и обстоятельств, с ней связанных.
Т.е., если задаться целью, то по каждой картине можно найти много интересного. Беда только, что это всё долго и результаты поисков остаются только у искавшего. И то в виде папки Windows с набором файлов.

Предложение:
Начать обсуждать создание системы объединения разнородной информации ссылками, чтобы если где-либо в тексте книги Вам встречается упоминание о картине, то простым нажатием можно перейти к списку имеющихся изображений, а затем к первоисточникам, более подробно описывающим данную картину.

Если кому нравится читать книгу в электронном виде в одном окне, а в другом окне в поисковике набирать соответствующие слова для более углубленного понимания, то можете дальше не смотреть.

Мне кажется, что для создания перекрёстных ссылок на информацию, достаточно сделать формальное описание содержимого каждой единицы информации: файла книги, файла картины, файла фотографии.
Для этого на базе языка XML можно разработать структуру, однозначно описывающую внутреннее содержание файла.

Для книги, например, это будет список всех лиц, описанных в книге или хотя бы упомянутых там. Список географических мест, в которых находятся герои, названия городов, названия рек и гор. Даты описываемых в книге событий. Названия предметов быта и окружающей природы. Получится отдельный файл-описание встречающихся слов и их координатами в тексте (страница, абзац, предложение).

Если ту же процедуру проделать еще с энциклопедией, то получим достаточно информации для объединения этих двух книг.
Теперь, если будет программа-читалка с возможностью подгружать кроме текста файл-описание, то читая просто книгу можно быстро переходить в соответствующие энциклопедические разделы.

Комментарии

zhuvv написал:
это будет список всех лиц, описанных в книге или хотя бы упомянутых там. Список географических мест, в которых находятся герои, названия городов, названия рек и гор. Даты описываемых в книге событий. Названия предметов быта и окружающей природы.
<...>
Теперь, если будет программа-читалка с возможностью подгружать кроме текста файл-описание, то читая просто книгу можно быстро переходить в соответствующие энциклопедические разделы.

Все слова на свете заиндексированы в Яндексе и Гугле, интерактивная энциклопедия-Википедия сделана, и написана программа, которая по щелчку правой кнопки мыши на слово в тексте вызывает статью энциклопедии или ищет дополнительную информацию.

.
Повторить всё то же самое на Либрусеке было бы очень круто.
Я бы таких ребят очень зауважал.

Аватар пользователя Isais

zhuvv написал:

Начать обсуждать создание системы объединения разнородной информации ссылками, чтобы если где-либо в тексте книги...
Беда в том, что внешние ссылки в тексте FB2-файла запрещены. Так что с личных читалок, даже с WiFi, такой фокус не пройдет.
А если читать онлайн... ЕМНИП, в тех пособиях по веб-дизайну, что мне попадались, везде написано, что обилие ссылок в тексте HTML-страницы сильно затрудняет чтение. Можете проверить сами легкость чтения страниц вроде http://en.wikipedia.org/wiki/Michael_Cremo или http://en.wikipedia.org/wiki/International_Society_for_Krishna_Consciousness .

Так что такая система будет крайне полезна и крайне недружелюбна к читателю.

X