Абонентам Услуги О предприятии Тех. информация Ресурсы Интернет
Домой
  

Компьютерное Обозрение
#39, 11 - 17 октября 2000

Ваша персональная поисковая машина!
Сергей Митилино

Без систем поиска сегодня сложно себе представить Всемирную Паутину, при этом появляются все новые и новые службы. Например, уже несколько компаний предлагают всем желающим оснастить свои персональные сайты функцией поиска. Зачем мне поисковая машина? -- можете спросить вы. С ответа на этот вопрос, пожалуй, и начнем.

Зачем?

Прежде всего попробуем опровергнуть распространенное заблуждение: мой сайт оснащен отличной системой меню, навигация не составляет проблемы для посетителей. К сожалению, это маловероятно. Множество профессионалов пытаются придумать вариант понятного и лаконичного интерфейса, но, увы, удается это очень редко. То, что кажется логичным вам, не будет столь очевидным для других. По-прежнему пользователи чаще пытаются отыскать необходимую им информацию именно с помощью функции поиска. Согласно результатам исследований, треть всех посетителей непременно воспользуются поиском, если смогут добраться до него. Кроме того, современный сервис в состоянии превратить это невзрачное поле ввода в могущественного союзника любого Web-мастера. Регулярно просматривая отчеты, сгенерированные сервером, вы, как в магическом кристалле, будете читать самые сокровенные мысли и желания посетителей.

Конечно, бесплатное индексирование, как и любые иные бесплатные услуги, имеет свои ограничения. В данном случае они касаются или количества Web-страниц, или объема информации. Однако, учитывая текстовую природу документов, подлежащих обработке, максимальный объем в несколько мегабайт не должен стать серьезным препятствием. Другое дело, впишется ли дизайн поискового механизма в оформление сайта и не будут ли результаты поиска рекламной информацией? Впрочем, подобных служб существует уже не менее десятка, и среди них вы обязательно подберете подходящую. Абсолютное большинство позволяет корректировать формат выдачи результатов, а некоторые и вовсе не приемлют рекламы.

Компании
Atomz.com

Наибольшей степенью благоприятствования некоммерческим пользователям отличается фирма Atomz.com. Зарегистрировавшись в системе Atomz.com Search, Web-мастер получает в свое распоряжение средство отчетов, настраиваемое оформление страниц с результатами и доступ к управлению поисковым механизмом. Для бесплатного варианта сервиса установлено ограничение в 500 страниц, которые автоматически будут просматриваться роботом только раз в неделю. Никакой рекламы -- внешний вид интерфейса можно настроить, используя HTML-теги для модернизации шаблонов. Для ленивых или неосведомленных о тонкостях языка HTML пользователей подготовлен широкий выбор стандартных вариантов оформления. Единственное, что будет напоминать посетителю об истинном авторе поискового сервиса, -- логотип компании Atomz.com. Этот ярлычок должен присутствовать обязательно, хотя и предлагаются несколько вариантов его исполнения. Помимо текста, поисковый механизм умеет индексировать MP3-файлы, ролики Flash и документы в формате PDF. Но берегитесь! PDF-файл вполне может содержать множество страниц, учитываемых по отдельности.

Ограничить область, доступную роботу, достаточно легко с помощью адресной маски или соответствующих инструкций в файле robots.txt. При необходимости даже внутри страниц несложно выделить не подлежащие индексированию фрагменты тегом <no index>. Даже защищенные страницы станут доступны службе, если вы позаботитесь сообщить ей пароль. Владельцы нескольких сайтов в рамках единой учетной записи смогут подписаться на услуги поиска для каждого из них в отдельности. Обновление индекса выполняется не только по расписанию, но и по требованию пользователя. Что касается самого механизма поиска, то он умеет не только "тупо" сортировать слова, но и работать с правилами английского правописания. Например, даже если посетитель набрал ключевое слово с ошибкой, Atomz.com Search исправит ее (это задача ПО идентификации слов по созвучности), также применяется подбор других окончаний (-ing, -ed и т. д.) и синонимов. Правда, синонимы придется искать вручную. Причем предполагается, что толчком для подобной деятельности будут отчеты по запросам, которые покажут, какими именно ключевыми словами чаще пользуются посетители. Впрочем, для русско- или украиноязычных сайтов (в кодировках iso-8859-5 и koi8-r) отсутствие автоматизации этой функции является, скорее, положительным фактором. Служба Atomz.com Search пользуется большой популярностью и у коммерческих потребителей. Зарегистрировавшись на сайте, вы попадете в "компанию" таких известных организаций, как Bank of Canada, HP Developer's Resources, предвыборный штаб Эла Гора -- AlGore2000, BellSouth Corp. и SETI Institute.

Atomz.com была образована корпорацией Avivo в июле 1999 г. Если бегло просмотреть состав ее администрации, то создается впечатление, что эта команда целиком сбежала из Macromedia: Стивен Казмер (Steven R. Kusmer) -- бывший управляющий подразделением коммерции и маркетинга этой компании, Майкл Томпсон (Michael P. Thompson) -- в прошлом директор инженерного подразделения, Кевин Уоллес (Kevin G. Wallace) -- один из директоров Learning Division of Macromedia. Так что опыта в развитии Internet-бизнеса руководству Atomz.com не занимать.

FreeFind

FreeFind -- служба, нацеленная исключительно на бесплатный сервис, поэтому приготовьтесь к валу рекламы. Тем не менее Web-мастера, не имеющие возможности оплатить услуги коммерческих систем и стойко переносящие появление чужих баннеров на страницах их сайтов, просто обязаны ознакомиться с достижениями этой компании. Ведь если все прочие участники рынка локального поиска работают с некоммерческими пользователями по остаточному принципу, то FreeFind готова уделить им максимум внимания. Можете сразу забыть об ограничениях на количество страниц и объем информации. Величина, равная 32 MB, -- всего лишь средство отпугнуть уж очень наглых поклонников "шары". Как утверждают сотрудники компании, необходимо только попросить -- и лимит будет снят. Множество узлов с более чем 10 тыс. страниц подписались на услугу поиска и не платят ни цента. Причем пользователь получает доступ к самому широкому спектру функций, обычно относящихся к коммерческим услугам. Например, автоматическое построение "карты" сайта, формируемой вместе с обновлением индекса. Если стандартный формат -- многоуровневый список (нечто вроде дерева каталогов в Проводнике) -- вас не устраивает, то перед началом индексации можно выбрать один из двух других вариантов представления: таблицы и простой список. Еще одна чрезвычайно полезная функция -- What's new --обеспечивает индикацию внесенных изменений. В результате каждый посетитель сможет легко определить, что новенького появилось на сайте в его отсутствие.

Конечно, не всегда новая страница действительно содержит свежую информацию, и не каждый HTML-файл стоит включать в карту. К счастью, и What's new, и Site map поддаются точной настройке и контролю как с помощью интерфейса системы, так и с использованием особых тегов.

Не может не радовать отсутствие ограничения на количество индексируемых сайтов. Однако настоящий восторг вызывает возможность объединить эти индексы (опция Additional URLs), что упростит задачи пользователя и Web-мастера. Теперь несложно образовать некое взаимодополняющее сообщество из специализированных персональных узлов, предоставив посетителям каждого из них информацию обо всех. Что касается сканирующего робота, то он прекрасно осведомлен о существовании файлов robots.txt, но не умеет пользоваться страницами, защищенными паролем. Игнорируется содержимое файлов PDF, DOC и прочих, чей формат отличается от текстового или стандартного HTML.

Существуют определенные проблемы с некоторыми провайдерами бесплатного хостинга и службами перенаправления (come.to и др.). Однако они общие для всех поисковых механизмов, большинство из них уже выявлено, а решения найдены. Минимальная частота автоматического обновления индекса равняется одним суткам, что очень неплохо. Внешний вид страниц с результатами поддается настройке, разрешается использовать свои фон и графику, изменять текстовые сообщения, однако избавиться от рекламы невозможно. На страничке отчетов собираются драгоценные сведения о том, что и когда чаще всего ищут посетители. Чтобы не нарушать дизайн -- плод вашего художественного гения, FreeFind предлагает на выбор как минимум десяток вариантов каждого функционального элемента, начиная от ярлычка "What's new" и заканчивая кнопкой "Search". Конечно, не испробовав на себе всех прелестей этой службы, трудно сказать, как реализованы собственно сортировка результатов и работа с интернациональными кодировками (об этом не говорится ни слова в официальных документах), однако на словах все выглядит более чем обнадеживающе.

PicoSearch

Чем хороша данная коммерческая служба, так это весьма лояльными ограничениями для бесплатных пользователей (1500 страниц) и своими широкими возможностями. Вариант подписки Free Plan включает в себя регистрацию до 3 URL и позволяет выполнять поиск по нескольким сайтам. Уникальна функция Partitioned Search Engines, с помощью которой организуется раздельный поиск для каждого из тематических разделов вашего узла. Корректно обслуживаются страницы, защищенные паролем. Поддерживается индексирование мультимедийных файлов (в качестве примера приводятся форматы MP3, MIDI, Shockwave). Осмотр документов в формате DOC, RTF, Postscript, PDF, Excel производится только при подписке на Professional ($200 в год) и Premium Plans ($400 в год).

Коммерческим пользователям разрешено модифицировать страницы с результатами поиска по своему усмотрению, в отличие от варианта Free, в котором предусмотрена только минимальная коррекция их внешнего вида. Сэкономив $200, вы должны будете удовлетвориться сменой фона, графического логотипа, подбором собственных шрифтов и прочими косметическими улучшениями. Искоренить логотип службы (так называемый branding) без списания со своего счета вышеозначенной суммы также не удастся. Более того, в стандартных шаблонах вообще не предусмотрено размещение рекламных баннеров, даже ваших собственных. Среди административных функций стоит выделить отчеты о наиболее популярных запросах, просмотр списка проиндексированных документов, поддержку специальных тегов, ограничивающих деятельность поискового робота. Но нет в мире совершенства -- заставить службу автоматически сканировать ваш сайт невозможно. Так что для часто обновляемых узлов единственно приемлемым вариантом является профессиональная или premium-подписка.

WhatUseek intraSearch

К лету 2000 г. фирма WhatUseek, основанная в январе 1999 г., уже насчитывала 200 тыс. подписчиков. Несмотря на невзрачный, весьма скромный дизайн собственного сайта, служба предлагает удивительное сочетание функций для вашего. Чтобы объяснить свою приверженность "делу локального поиска", ее авторы создали целую идеологию. Суть заключается в лозунге "Последняя миля поиска", который трактуется как "Наибольшая несуществующая инфраструктура поиска на уровне Web-сайтов". Впрочем, философствования не мешают компании поддерживать свой сервис на высоком уровне. Существуют три варианта подписки: персональный, бизнес и особый -- для государственных, образовательных или некоммерческих организаций. В рамках каждого из них есть разделение на базовый с рекламой и Ad Free. Естественно, первый из них бесплатный, а второй обойдется в сумму от 5 до $40 в месяц в зависимости от количества индексируемых страниц. Для подключения сайта объемом свыше 1000 страниц тоже придется раскошелиться. Но при этом откроется доступ абсолютно ко всем перечисленным ниже функциям вне зависимости от варианта подписки (что выглядит немного странно).

Минимальная частота обновления индекса равняется одним суткам, количество входных URL не ограничено, поддерживаются исключающие адресные маски и парольная защита сайтов. Отчеты позволят отслеживать наиболее популярные запросы, выделять среди них те, что не дали результатов, отслеживать количество показов для форм ввода запросов. К любым словам можно подбирать синонимы, есть функция распознавания окончаний слов (-ing), но при необходимости ее легко отключить. Реакция робота на файл robots.txt поддается настройке, что особенно актуально в случае узлов бесплатного хостинга, которые могут навязывать членам их сообщества свои правила. Внешний вид базовых шаблонов страниц с результатами модернизируется с помощью непосредственного редактирования в HTML или с использованием фирменного языка разметки ITL. Сайт позволено разбивать на отдельные тематические разделы, каждый из которых будет иметь собственный индекс. Посетители смогут выбирать, в каком из них искать введенные ключевые слова.


И в заключение...

Возможно, посетив сайты всех вышеперечисленных служб, вы так и не смогли прийти к окончательному решению. Тогда не остается ничего иного, кроме как предложить на ваш суд еще несколько адресов, которые не вошли в обзор по причине существующих рамок журнальной публикации.

  • SearchButton -- лимит в 1000 страниц, единственный начальный URL, автоматическое реиндексирование раз в месяц, реклама. К сожалению, уникальная опция Community Search, позволяющая обслуживать целые сообщества сайтов, оставлена исключительно для коммерческих пользователей;
  • SiteMiner -- составная часть проекта MyComputer.com, лимит в 250 страниц, реклама;
  • BeSeen MySearch -- филиал LookSmart, весьма "щадящее" ограничение в 5000 страниц, реклама. На самом деле это WhatUseek, но в другой "обертке".

Удачи...

Информация взята на сайте ITC Online

Домой