НОВОСТИ   БИБЛИОТЕКА   ЮМОР   КАРТА САЙТА   ССЫЛКИ   О САЙТЕ  




20.11.2006

Интернет на основе здравого смысла

В то время как "всемирная паутина" состоит из миллиардов документов и ссылок, которые их связывают между собой, разработчики и сотни компаний, создающих всё новые стартапы, ищут новые пути к пониманию потребностей пользователей.

Их цель – поставить эти потребности "во главе интернета", чтобы он стал меньше похож на каталог и больше – на путеводитель. Некоторые из них даже разрабатывают системы, понимающие человеческое поведение. Проблема искусственного интеллекта, когда машины смогут думать вместо того, чтобы просто исполнять команды, занимает исследователей уже не один десяток лет.

"Веб 3.0" – "проект", который находится в самой начальной стадии своего развития и который уже назван скептиками "нереальным". Но соответствующие технологии и их разработка уже нашли своих приверженцев как в крупных корпорациях типа IBM или Google, так и в небольших фирмах. Их проекты сейчас чаще всего концентрируются на возможностях практического применения, вроде рекомендаций по планированию отпуска или прогнозирования будущих музыкальных хитов.

Но в будущем более мощные системы смогут работать как персональные советчики в таких же неоднородных и сложных сферах, как финансовое планирование: например, составление пенсионного плана для семейной пары или образовательный консалтинг, когда тот или иной сервис выберет Вам оптимальный для поступления университет. Всем этим проектам прогресс технологий, более мощные компьютеры – только на руку.

"Это можно назвать Всемирной Базой Данных (World Wide Database)", – говорит Нова Спивак, основатель компании, которая разрабатывает технологию, определяющую отношения между кусочками информации в сети. – "Мы хотим пройти путь от интернета связанных документов к интернету связанной информации".

"Веб 2.0", предполагающий возможность интеграции веб-приложений (например, электронных географических карт) и сервисов (например, фото-хостингов), в последнее время находится в центре внимания компаний Силиконовой долины. Но коммерческий интерес к "Веб 3.0" (или, как его называют некоторые, "семантический Веб") с его идеей "умных сервисов" уже появился.

Классический пример "эры Веб 2.0" – "мэш-ап", термин, предполагающий интеграцию различных сервисов. Например, сайт по поиску недвижимости с интегрированными картами Google Maps в итоге представляет собой новый, более удобный сервис, с помощью которого каждый пользователь может сразу увидеть все предлагаемые для продажи дома на карте.

А разработчиков "семантического Веба" занимает вопрос о том, как создать систему, которая сможет дать чёткий и максимально полный ответ на простой запрос вроде этого: "Я ищу тёплый курорт, чтобы отдохнуть во время отпуска; у меня есть на это $3000. И кстати, со мной будет 11-летний ребёнок". В нынешних условиях поиск такой информации может занять не один час: придётся просмотреть списки авиарейсов, отелей, фирм по аренде автомобилей. В условиях "Веб 3.0" пользователь в идеале должен сразу получить полный пакет информации так же профессионально и оперативно, как если бы это делал агент туристической фирмы.

Как именно будут построены подобные системы, как долго они будут разрабатываться и как скоро начнут выдавать корректные ответы на запросы – вот основные темы для ожесточённых споров учёных и разработчиков. Некоторые из них сосредоточены на создании новой структуры, которая заменит нынешний интернет, другие – на разработке новых приложений, которые смогут "извлекать смысл" из существующих потоков информации. Но все сходятся во мнении о том, что эти системы принесут больший доход, нежели нынешние поисковики, которые выдают тысячи и даже миллионы документов, но не отвечают непосредственно на вопросы.

Для понимания потенциала технологий "понимания человеческих желаний" можно привести пример Page Rank: эта технология позволяет компании Google использовать потенциал человеческих знаний и решений для ранжирования результатов поиска. (Она интерпретирует ссылку с одной веб-страницы на другую как "голос", при этом "голоса" на более популярных страницах имеют больший вес.)

Но исследователи двигаются дальше. Компания уже упомянутого мистера Спивака – Radar Networks – исследует содержание социальных сайтов, которые позволяют пользователям размещать, совместно работать и обсуждать различные виды контента, от описания путешествий до фильмов. Технология этой компании построена на системе баз данных нового поколения, которая определяет и сохраняет ассоциативные связи между частями информации так же, как связи между теми или иными людьми (коллегами, друзьями, родственниками).

Пример использования этой технологии – KnowItAll, проект исследовательской группы Вашингтонского Университета, финансируемый Google. В его рамках создана система Opine, собирающая и сортирующая мнения пользователей с различных тематических сайтов. Демонстрационный проект, посвящённый отелям, "понимает" такие параметры, как температура в номере, комфортабельность кровати и цены, а также различает, что такое "великолепно", "неплохо" и "сойдёт", чтобы выдавать полезные ответы на запросы. На современных сайтах пользователю придётся просмотреть огромные списки комментариев и отзывов от других пользователей, а "вебтринольная" система будет сама взвешивать и ранжировать все комментарии, чтобы найти оптимальное, разумное решение и помочь рядовому пользователю быстро найти нужный отель.

"Система поймёт, что "идеально чистый" – лучше, чем просто "чистый"", – говорит Орэн Эцциони, исследователь из Вашингтонского Университета, руководитель проекта. – "Мы пытаемся дать понять, что текст в интернете – просто огромный источник информации".

Нынешний интернет, можно сказать, находится в "фазе Lego", конструктора, в котором части информации механически стыкуются друг с другом. Приверженцы "Веб 3.0" видят "будущую версию интернета" как эру, в которой машины будут делать интеллектуальную работу.

Исследователи уже сейчас отмечают появление интеллектуальных технологий. К примеру, специальные веб-камеры фиксируют незаконное вторжение на какую-либо территорию, а программы идентифицируют дату, время, место вторжения и иногда даже личность преступников, передавая данные на охранный пульт. Исследователи утверждают, что это и есть зачатки "Веб 3.0".

"Это – важная тема: люди ещё просто не понимают, насколько сильно они зависят от искусственного интеллекта", - говорит Дэниэл Хиллис, специалист в этой сфере, основатель компании Metaweb Technologies. Его компания до сих пор не раскрывает, что за продукты разрабатывает, хотя на их сайте написано, что "Metaweb планирует построить новую инфраструктуру интернета".

И Radar Networks, и Metaweb частично связаны с военными и разведывательными структурами. Начальные исследования в этих компаниях финансировались ЦРУ, АНБ и другими государственными агентствами США; работа началась вскоре после появления концепции "семантического Веба", созданной Тимом Бернерсом-Ли в 1999 году.

Разведслужбы помогли подключить к разработкам исследователя Дуга Лэната, чья компания Cycorp продаёт системы и сервисы правительству и частным корпорациям. Основная разработка компании – система искусственного интеллекта Cyc, которая, как обещает Лэнат, однажды сможет отвечать на любые вопросы, как написанные, так и произнесённые устно. Изначально система строилась на введённых в неё миллионах фактов, которые она должна "выучить", однако на лекции, прочитанной в прошлом году в офисе компании Google, Лэнат сообщил, что сейчас Cyc "учит" сетевой контент. Этот процесс, по словам исследователей, должен продемонстрировать методы построения "Веб 3.0".

Лэнат утверждает, что на данный момент система уже может отвечать на вопросы, заданные на обычном человеческом языке, например, "Какой город в США может быть подвержен эпидемии сибирской язвы летом?"

В это же время сотрудники IBM говорят, что они регулярно используют "цифровой слепок" 6 миллиардов сетевых документов для проведения исследований и ответов на различные вопросы корпоративных клиентов. Компания использовала свою систему в маркетинговом исследовании для телевизионных сетей, собрав и обработав информацию онлайн-сообществ. А при помощи информации о популярности тех или иных музыкальных треков на различных сайтах университетских сообществ исследователи смогли предугадать лидеров хит-парадов следующих двух недель.

Уже ведутся споры о том, смогут ли системы вроде Cyc создать "новую версию интернета" либо человеческий интеллект сможет самостоятельно развиться на новый манер при помощи этих технологий. Сторонники второй точки зрения говорят, что подобное уже происходит, и примеры тому – такие сайты, как del.icio.us и Flickr (система "закладок" и фото-хостинг, приобретённые компанией Yahoo), а также Digg – новостной сервис, чей контент формируют сами пользователи.

Например, на Flickr пользователи помечают фотографии тегами, тем самым помогая другим быстрее находить интересующие их изображения. "С помощью Flickr Вы сможете найти те изображения, которые никогда бы не нашёл компьютер", – говорит Прабхакар Рагнаван, руководитель исследовательского направления в Yahoo. – "То, над чем мы бились в течение долгих лет, вдруг стало таким простым. И это не стало бы столь простым без Всемирной паутины".


Источники:

  1. businesspress.ru








© Злыгостев А.С., 2001-2019
При использовании материалов сайта активная ссылка обязательна:
http://informaticslib.ru/ 'Библиотека по информатике'
Рейтинг@Mail.ru
Поможем с курсовой, контрольной, дипломной
1500+ квалифицированных специалистов готовы вам помочь