Новости    Библиотека    Байки    Ссылки    О сайте


05.09.2013

Джонатон Флетчер и его JumpStation: веб-поиск задолго до Google

Сегодня нам порой кажется, что известнейшая поисковая система Google существовала всегда — между тем она появилась только в 1998 году. Но, оказывается, самый настоящий веб-поисковик успешно функционировал ещё в 1994 году, задолго до возникновения Google, и его придумал британский программист Джонатон Флетчер.

Джонатон Флетчер и его JumpStation: веб-поиск задолго до Google
Джонатон Флетчер и его JumpStation: веб-поиск задолго до Google

В начале девяностых интернета, каким мы его знаем сегодня, не существовало: Сеть состояла из нескольких десятков тысяч текстовых страниц, объединённых в никак не связанные между собой блоки при помощи гиперссылок. Никакого поиска по этим страницам не было, и найти нужную информацию, не зная точного адреса, было невозможно.

Первый в мире браузер с удобным графическим пользовательским интерфейсом, рассчитанный на операционную систему WIndows 3.1, появился лишь в апреле 1993 года: он носил название NCSA Mosaic и был разработан в Национальном центре суперкомпьютерных приложений (NSCA) при Иллинойсском университете в США. Это был первый браузер, способный демонстрировать изображения внутри самого текста, а не в отдельном окне.

В браузере Mosaic была специальная страница What’s New («Что нового»), на которой собиралась информация о новых сайтах, появившихся в Сети. Однако чтобы такая информация была добавлена разработчиками Mosaic, создатели сайта должны были обратиться с соответствующей просьбой в Национальный центр суперкомпьютерных приложений. Сегодня сложно это себе представить, но данные вносились в ручном режиме, и об оперативности мало кто задумывался.

Но присутствовала и другая проблема: поскольку этот своеобразный браузерный каталог формировался вручную, ни о каких обновлениях входивших в него сайтов узнать было невозможно. Изменения никак не индексировались, о новом контенте ничего не сообщалось, а ссылки быстро устаревали и становились недействительными.

Джонатон Флетчер и его JumpStation: веб-поиск задолго до Google
Джонатон Флетчер и его JumpStation: веб-поиск задолго до Google

Как раз в эти годы талантливый студент Джонатон Флетчер (Jonathon Fletcher) завершал обучение в шотландском Университете Стёрлинга по специальности «информатика» (computer science) и очень рассчитывал продолжить образование, поступив в аспирантуру Университета Глазго. Однако финансирование было урезано, и вуз не смог принять нового аспиранта, поэтому Флетчер вернулся в alma mater и устроился на работу в технологический департамент Университета Стёрлинга. Здесь он впервые столкнулся с интернетом и со страницей What’s New браузера Mosaic.

Работая над созданием университетского веб-сервера, Флетчер понял, насколько несостоятельна сама идея, положенная в основу страницы What’s New. Ручное добавление сайтов и невозможность отслеживания обновлений делали её практически бесполезной. А поскольку Флетчер был дипломированным специалистом как раз в области компьютеров, он решил написать программу, способную автоматически индексировать изменения внесённых в список сайтов и позволяющую осуществлять поиск по актуальным страницам.

Так на свет появился первый в мире поисковый робот, «веб-паук», а это именно та технология, которая лежит в основе всех современных поисковых систем, включая Google, «Яндекс», Yahoo! и другие.

Флетчер назвал свою программу JumpStation. Она включала в себя список страниц, которые должен посетить поисковый робот, а также алгоритмы автоматической индексации и посещения всех гиперссылок, которые встречались ему на пути. Процесс должен был продолжаться до тех пор, пока роботу больше некуда будет зайти. Флетчер быстро написал простой в использовании поисковый алгоритм по индексируемым страницам и разместил ссылку на свою страницу на What’s New. Спустя 10 дней после первого запуска JumpStation, 21 декабря 1993 года, «паук» остановился: он проиндексировал 25 тысяч страниц.

К июню 1994 года количество проиндексированных JumpStation страниц достигло уже 275 тысяч. Интернет бурно развивался, и стали очевидны ограничения маленького университетского сервера: ёмкость винчестеров тогда была несоизмерима с современной, а сами жёсткие диски были очень дорогими. Недостаток места вынудил Флетчера ограничить глубину индексирования только названиями страниц и заголовками опубликованных на них текстов, однако даже с такой нагрузкой существующее оборудование справлялось с трудом.

К сожалению, Университет Стёрлинга не мог обеспечить необходимое финансирование, а Флетчер не сумел убедить руководство в перспективности проекта JumpStation, поэтому он был постепенно свёрнут. К тому же проект не являлся основной работой Флетчера, который должен был заниматься системным администрированием и технической поддержкой университетских занятий. История JumpStation закончилась, когда Флетчеру предложили научную работу в Токио, от которой молодой специалист просто не мог отказаться.

Джонатон Флетчер (в середине) на конференции SIGIR 2013
Джонатон Флетчер (в середине) на конференции SIGIR 2013

Разумеется, поиск по компьютерным базам данных существовал задолго до интернета и робота Флетчера. Однако именно он придумал систему поиска в Сети со всеми её необходимыми компонентами, присущими современным поисковым движкам.

* * *

В отличие от создателей Google Сергея Брина и Ларри Пейджа, имя Джонатона Флетчера ни о чём не говорит даже специалистам. Сегодня Флетчер живёт в Гонконге, и о его вкладе в развитие Всемирной сети знают лишь бывшие сотрудники по Университету Стёрлинга.

И хотя Флетчер давно не работает в области обработки информации, бывшие коллеги не забыли о его существовании, и совсем недавно он был приглашён на международную конференцию по поиску информации SIGIR 2013, проходившую с 28 июля по 1 августа в ирландском Дублине. Первая же секция, открывшая форум, была посвящена 20-летию создания JumpStation — самого первого поискового движка в интернете, который работал и выглядел для пользователя практически так же, как и современные системы.

Джонатон Флетчер стал специально приглашённым гостем на этой конференции и принял участие в обсуждении истории и перспектив веб-поиска с представителями Google, Microsoft и Yahoo!. Флетчер предпочёл не касаться подробностей давно минувших дней, но заявил о важности самой идеи поиска в море данных. По его мнению, интернет отнюдь не вечен — в отличие от проблемы нахождения информации, и это желание искать и находить данные никак не зависит от конкретных носителей.

Двадцать лет назад Флетчер не смог заинтересовать своей идеей, намного опередившей время, ни университетское руководство, ни потенциальных инвесторов — и остался в стороне от огромного международного бизнеса, который уже вполне обоснованно сравнивают с некоей надгосударственной спецслужбой. Тем не менее не может не заслуживать уважения один тот факт, что ещё на заре интернета Флетчер смог реализовать на практике идею, которую с успехом эксплуатируют до сих пор.

Олег Нечай


Источники:

  1. computerra.ru





Пользовательский поиск


Диски от INNOBI.RU




© Злыгостев Алексей Сергеевич, подборка материалов, оцифровка, статьи, оформление, разработка ПО 2001-2017
При копировании материалов проекта обязательно ставить активную ссылку на страницу источник:
http://informaticslib.ru/ "InformaticsLib.ru: Информатика"