Полнотекстовый поиск по Либрусеку

Добрый День !
Вот уже несколько месяцев я разрабатываю полнотекстовый поисковый движок и в качестве теста
решил проиндексировать библиотеку Либрусек, в которой несколько сотен тысяч книг.
Пока что он работает достаточно примитивно, просто ищет вхождения слова (слов) внутри книги.
Есть ограничения на длину поисковой строки, которые в скором времени я постораюсь убрать.
Но уже вполне можно попытаться поискать какието редкие слова в библиотеке, фамилии, населенные пункты и тп.
База Либрусека действительно обширна, содержит 250 гб текста и свыше 11 млн словоформ разных языков.
Здесь все обо всем :)

Поиск доступен по этой ссылке:
pikosec[тчк]com/search

Хорошего Дня !

А сколько ограничение в строке?

Точно не помню, вроде 20 символов.
Но сегодня я исправлю, это искуственное ограничение.

А чем отличается от поиска гуглом с добавкой site:lib.rus.ec/b/

Тем что это поиск не по заголовкам и оглавлениям, а именно содержанию книг.
Тоесть слова и фразы которые встречаются внутри книг.

Bazist написал:
Тем что это поиск не по заголовкам и оглавлениям, а именно содержанию книг.
Тоесть слова и фразы которые встречаются внутри книг.

Вот это тоже поиск именно по содержанию книг.

Правда недавно был период, когда тексты книг гуглу переставали быть доступными. Плюс, недоступны тексты на некоторых иностранных языках.

Пример поиска для строки "аменхатеп"
и отрывок книги

Утром следующего дня в восьмичасовых новостях Первый канал Общественного российского телевидения показал сюжет о «перестановках и новых назначениях, проведенных в Администрации Президента РФ». Кого-то перевели на другую работу, кого-то повысили, а кого-то и вовсе отправили в отставку. И в самом конце, когда диктор уже собиралась перейти к другой теме, вдруг в бегущей строке перед ее глазами, в той самой, которую не видят зрители, появился некий текст, и диктор, молодая симпатичная женщина, машинально, на всю страну прочла:
— Также главой информационно-политического департамента Администрации Президента РФ назначен Рогачев Петр Сергеевич, 1967 года рождения…
Петр нажал кнопку вызова прислуги, попросил принести ему свежих московских газет и везде увидел свою фотографию и даже какую-то придуманную, мало что общего имеющую с настоящей биографию. Из информации, напечатанной в «Коммерческом вестнике», выходило, что он, Петр Рогачев, долгое время являлся топ-менеджером их с Хроновским совместного банка АМЕНХАТЕП, а затем тем же самым «топом», но уже «Юксона». Ни в чем «таком» замечен не был, никакой собственностью в «Юксоне» не владел и так далее и тому, знаете ли, подобное.
— Ловко у тезки получается, — хмыкнул Рогачев, — так, значит, я теперь глава информационно-политического департамента? Отменно! Еще бы знать, что это такое и с чем это едят, но, как говорится, «боссу незачем вникать в суть». Так что прилетим — увидим.
Рогачев стремительно оделся, вызвал машину и приказал везти себя в аэропорт. Проходя по коридору, вдоль спален домашних, столкнулся со своей заспанной супругой. Та, позевывая, дежурно спросила:

Вообще сорри, вижу что гугл ищет и по содержанию книг, поскольку оно открыто.
Чтож, тогда аналогичная функциональность получается, с разницей что это уже отечественный поисковик :)

Хотела написать о том же, но Вы и сами уже увидели. ;)

X