13 апреля, 2015

Поисковые системы в 2015 году

Сейчас есть несколько глобальных поисковых систем в Интернете:


1. Google – самая большая база на данный момент. Хорошо представлен Рунет.


2. Bing – база поменьше, очень мало Рунета.


3. Yandex – середнячок, в прошлом был ориентирован на Рунет.


4. Yahoo! Search – старичок с не очень большой базой, в целом игнорирующий Рунет.


5. DuckDuckGo – гибрид, уровня Bing. База заимствована у других поисковых систем.


6. Ixquick – гибрид, что-то типа DuckDuckGо. Рунет в целом игнорируют.


7. StartPage – проксирует поиск от Google, обеспечивает большую приватность поиска. Но всё-таки база меньше, чем оригинальный Google, т.к. Гугл своим “партнёрам” не даёт всё в лучшем виде.


8. AOL Search – проксирует поиск от Google также, как и StartPage. Поиск работает так, как если бы вы искали в США, т.е. русский регион в целом отключён, но оно и к лучшему. p.s. В 2016-м уже проксируют bing, что очень плохо.


9. YaCy – поиск с базой, распределённой по частным компьютерам. Штука весьма интересная, но в силу известных причин – не получившая популярности.


10. FAROO – база создаётся клиентами, установившими на свой компьютер их программу. Но что-то уж больно мутные и скрытные ребята.


Baidu, как и другие китайские поисковики, полностью игнорируют Рунет, да и не рассчитаны на посторонние регионы. От их существования нам ни холодно, ни жарко.


Русских поисковиков, как видите, в списке нет. Yandex – очевидные голландские еврейпейцы, Миклухо-Маклай Рунета. Можно, конечно, вспомнить о гибриде nigma.ru или о sputnik.ru, но это всё вторичные и втосортные системы, нашего внимания недостойные.


На самом деле причиной для написания заметки было не банальное перечисление активных на данный момент поисковых систем, а нечто совсем другое – желание увидеть и понять, чего именно не хватает Интернету и его обитателям. И для меня, очевидно, что не хватает “Индексатора Интернета” – т.е. поисковой системы, которая не будет “улучшать” свой поиск, а будет сконцентрирована на объёме своей базы и поддержания её актуальности. Причём “умершие” веб-страницы, должны оставаться в результатах поиска и в кэше с пометкой “Из архива”. Таким образом, если в поиске найдётся миллион документов, я ЖЕЛАЮ начать в них разбираться самостоятельно, потратив на это своё время, или уточнить свой запрос, но я не желаю получать в выдаче жалкий обрезок оптимизации и “улучшения” поиска. По заданной теме поиска мне интересны ВСЕ веб-документы, когда-либо проиндексированные системой, а не только лишь самые популярные у народа. Я даже больше скажу – мне гораздо интересней изучать неизвестные сайты, новые сайты, уникальные сайты, а не следовать зову монополий.


Я считаю, что необходимый Интернету “абсолютный индексатор” должен быть создан нашим государством. Это должен быть бюджетный проект, научный проект на базе построенных собственных датацентров, с возникшей вокруг них инфраструктурой. Ни в МОСКВЕ или любом другом городе миллионнике, лучше всего подходит окрестности Твери. Цели: Построить инфраструктуру (датацетры, жильё), нанять людей, произвести абсолютную индексацию Рунета, отработать технологии и идеи, разработать интерфейсы, продолжить индексацию, на этот раз всего Интернета. Продолжать развиваться бесконечно, находить новые таланты, исследовать всю доступную информацию, улучшать индексаторы и индекс, найти, в конце концов, практическое применение всей созданной системы. То государство, которое поступит так, получит множество преимуществ перед своими конкурентами. Информация – это основополагающая часть всего будущего мира. Так банально – тот, кто владеет всей информацией и умеет с ней управляться – владеет миром.