Поисковые системы: кто кого ищет?
20 сентября 2004
Рубрика: Интернет и сети.
Автор: Наргиза Юсупова.
pic

Сегодня в Интернете наблюдается непрерывный, прогрессирующий рост. Причем Всемирная паутина растет как по своим размерам, так и по своей популярности. С каждым днем в Сети появляются миллионы новых страниц, увеличивается количество пользователей, неуклонно растут объемы продаж через Интернет. Таким образом, создание WWW поставило разработчиков Сети перед острой необходимостью внедрить новые механизмы, обеспечивающие поиск информации. И если сначала анархия и свобода казались замечательным достижением, то сейчас хаотичность расположения информации зачастую порождает значительные трудности. Образование поисковых систем явилось еще одним доказательством реальной значимости накопленного информационного массива: как только сформировалось «что искать», появились инструменты «как это делать».

Но задача «поисковиков» не ограничивается только систематизацией «добычи» информации, хотя она и является главной. Немаловажное значение имеет сам факт вхождения в мировое информационное пространство, что расширяет возможности всех его участников, прежде всего, с точки зрения собственного позиционирования в общемировом информационном контенте.

pic

Сегодня неамериканские и неанглоязычные сегменты Всемирной паутины переживают подъем благодаря массовому распространению компьютеров и удешевлению доступа к Интернету. Американская часть (прежде всего северная его половина) всех пользователей сети, составлявшая когда-то более 90%, сегодня охватывает менее четверти их, в то время как количество неанглоязычных пользователей Интернетом неуклонно растет. Азиатско-Тихоокеанский регион занимает первое место по масштабам увеличения численности пользователей, русскоговорящий Интернет также демонстрирует не менее стремительные темпы развития (http://www.webpromo.com.ua/news/16.html).

Итак, что же такое поисковые системы?
Поисковые системы — это полностью автоматизированные интерактивные сервисные службы, осуществляющие поиск информации в Интернете по введенному пользователем текстовому запросу.

Для чего создаются поисковые системы и какими они бывают?

В зависимости от цели создания поисковые системы условно можно разделить на следующие виды:

1. Коммерческие — предназначенные в первую очередь для непосредственного получения денег с сайта. Это может быть виртуальный магазин, платный сайт, система прямых дилерских продаж, сервер платных услуг и прочее.

2. Рекламные — создаваемые и «раскручиваемые» исключительно в качестве рекламной площадки. Удачнее всего в этом направлении продвигаются всякого рода коннекторы и сообщества (например, rambler.ru, list.ru, chat.ru и пр.).

3. Имиджевые — создаваемые чаще всего крупной фирмой для продвижения своей марки посредством нового и весьма дешевого mass media. Прямая прибыль, как и расходы, не имеет в данном случае особого значения, но косвенные затраты обязательно учитываются и контролируются.

4. Корпоративные — призванные продвигать марку компании и в то же время предоставлять информацию о корпорации, способствовать оформлению онлайновых продаж и «завязыванию» контактов. Такой «поисковик» всегда уникален так же, как и содержащая его корпорация.

5. Благотворительные — преследующие решение разнообразных задач, определяемых их разработчиками и спонсорами. Они обычно имеют фиксированный бюджет, отпущенный хоть и на определенные, но весьма расплывчатые цели.

6. Нетематические, некоммерческие. В эту категорию входят домашние странички, доморощенные «персональные» клубы, рейтинги, посещаемые только их создателями, «суперкаталоги» с тремя ссылками и прочие. Создаются они чаще всего для развития собственных навыков, демонстрации мнимой «крутости» разработчиков, «от нечего делать» и так далее. Подобные проекты обычно призваны удовлетворить личные амбиции своих создателей.
Конечно, возможны комбинации всего перечисленного, а также иные их вариации.

Все поисковые системы в сети Интернет в зависимости от механизма поиска делятся на две группы:

• индивидуальные, реализующие один или несколько типов поиска
• интегрированные, выполняющие поиск с привлечением ряда индивидуальных систем и обобщающие их результаты.

Индивидуальные поисковые системы, в свою очередь, можно подразделить на:

• индексные (тематические) каталоги ресурсов Сети, оснащенные функциями их просмотра по ключевым словам
• автоматические поисковые программы, обеспечивающие просмотр документов, приводимых в их индексной базе.

Поисковые системы также различаются по применяемым подходам к сбору и обработке информации, организацией баз данных, предоставляемым пользователям возможностям формулировки запросов и проведению поиска в базах данных. Исходя из этого, можно выделить два типа поисковых систем:

I — поисковые машины (роботы), осуществляющие сбор информации автоматически по заданному алгоритму, обходя при этом web-серверы и скачивая web-страницы с помощью имеющихся на них гиперссылок. Затем роботы производят полнотекстовое индексирование всех найденных документов и формируют базу данных, в которой хранятся сведения о содержащихся в документах словах и их URL-адреса. Наиболее совершенные поисковые системы позволяют формулировать достаточно сложные запросы, используя объединение ключевых слов в логические выражения и введение дополнительных ограничений (например, использование даты создания документа, доменных имен серверов и прочее).

II — каталоги ресурсов Интернета, формируемые не роботом, а людьми. Такие справочно-поисковые системы имеют тематическую рубрикацию, причем число уровней в рубрикации варьируется в зависимости от сложности структуры каталога и объема содержащейся информации. Если речь идет о ресурсах WWW, то вносимые в каталог записи, как правило, содержат название web-сайта, его URL-адрес, краткое описание тематики сайта и имеющейся на нем информации (аннотацию), а также ряд дополнительных сведений, часто используемых в служебных целях (страну, город, адрес электронной почты ответственного за сайт лица). Одна группа каталогов свободно пополняется любым пользователем Сети, заполнившим соответствующие интерактивные формы, другая — имеет редакторские службы, в задачу которых входят проверка присланных адресов и редактирование аннотаций, а также поиск интересных сайтов и составление описаний к ним. В большинстве каталогов имеющиеся сведения индексируются, что позволяет проводить поиск по ключевым словам. При этом, разумеется, остается возможность поиска нужной информации путем выбора интересующих рубрик и последовательного просмотра их содержания.

Таким образом, поисковые системы различаются как по объему баз данных и качеству размещенных в них ресурсов, так и по результативности своей работы. Некоторые системы оперируют только информацией, предоставляемой им при регистрации (например, Yahoo! и OpenText), другие же, получив адрес главной страницы, засылают на нее робота, сканирующего весь ресурс с целью сбора о нем по возможности наиболее полных сведений, систематизации их и внесения в базу данных. У каждого из этих подходов имеются свои достоинства и недостатки как для пользователей Сети, так и для самих «поисковиков», что связано со скоростью обработки запроса, соответствием результатов исходным данным, точностью выполнения запроса и т.п.

Как работает поисковая система?

Каждая поисковая система имеет свой алгоритм работы. Рассмотрим его на примере поисковой системы Yandex.
Любой поисковый сервер представляет собой огромное хранилище информации. Собирают эту информацию специальные роботы — так называемые Spiders (пауки), или Bots. Они собирают данные о сайтах — индексируют их. Периодически робот возвращается на свой сервер, отдавая ему собранную информацию, которая приводится в надлежащий вид, заносится в специальную базу данных и после этого может быть найдена пользователем поисковых сайтов. По некоторым данным, поисковые сервера могут дать от 30% до 60% суммарного трафика web-ресурса.
Основной алгоритм работы поисковой системы Yandex и рейтинг выстраивается на основе запроса ключевого слова. При этом учитывается и анализируется следующее:

1. Общее количество ключевых слов на сайте.
2. Общее количество ключевых слов на странице.
3. Соотношение общего числа слов на сайте к количеству ключевых слов на сайте.
4. Соотношение общего числа слов на странице к количеству ключевых слов на странице.
5. Индекс цитирования.
6. Общее количество страниц сайта.
7. Общий объем сайта.
8. Общий объем каждой страницы.
9. Возраст сайта.
10. Периодичность обновления информации на сайте.
11. Последнее обновление страниц сайта.
12. Общее число картинок (рисунков) на сайте.
13. Наличие замещающих надписей на рисунках (картинках).
14. Длина замещающих надписей рисунков (картинок).
15. Использование фреймов.
16. Язык сайта.
17. Размер шрифта, которым оформлены ключевые слова.
18. Жирность шрифта ключевых слов.
19. Характер написания ключевых слов — в разрядку или нет.
20. Вид ключевых слов — заглавными буквами или нет.
21. Расположение ключевых слов от начала страницы.
22. Стиль заголовков и наименований ключевых слов.
23. Наличие и анализ мета-тэгов.
24. Наличие и содержание описания и свойств страницы.
25. Наличие файла «робот».
26. Географическое месторасположение сайта.
27. Комментарии внутри программного кода сайта.
28. Тип страниц каждой страницы сайта: html или asp.
29. Соответствие ключевых слов сайта тому разделу каталога поисковой машины, в котором зарегистрирован сайт.
30. Ряд других специальных технических параметров.

Период обновления индекса генератора или базы данных — от одной недели до месяца. После регистрации (точнее, предложения для регистрации) сайта в поисковых системах ссылка на него появится не одновременно, а только тогда, когда будет обновлена база данных каждой поисковой системы.

pic

Однако сама по себе регистрация в поисковых системах практически ничего не дает — нужно сначала подготовить и оптимизировать страницы сайта, чтобы в результате поиска пользователем информации в данной области деятельности web-ресурс появлялся в списке результатов поиска одним из первых.

Что повышает позицию
в рейтингах поисковых систем?

Большинство поисковых систем живет за счет размещаемой на них рекламы, поэтому их владельцам необходимо одно: высокий процент посещаемости и большое количество поисков. Особенно это касается, так называемых, платных, или «кликовых» «поисковиков», каждый посетитель которых представляет собой потенциального клиента для кого-то из рекламодателей, с которыми работает тот или иной портал. В силу этого «поисковики» заинтересованы в добавлении как можно большего количества ресурсов в свою базу данных, ибо расширение качественного контента, предоставляемого посетителям — одна из неотъемлемых составляющих их успеха.

pic

С другой стороны, создатели web-ресурсов также заинтересованы в их «раскрутке», что значительно облегчает регистрация на поисковых системах. Но тут не все так просто, так как, скорее всего, сайтов на такую же тему уже большое количество. Если сайт регистрируется формально, не подвергаясь «определенным операциям», то о каком-либо притоке посетителей с поисковиков можно забыть. Однако степень «посещаемости» можно значительно повысить. Этот процесс называется web-оптимизацией, или SEO (сокр. от англ. Search Engine Optimization).
Существует достаточно большое количество факторов, способных помочь добиться высоких позиций в результатах поиска. Проблема заключается в том, что каждая из поисковых систем реагирует на данные факторы совершенно различным образом, к тому же формулы вычисления предпочтений меняются достаточно часто. И те приемы и способы, которые приносили отличные результаты год назад, теперь могут не сработать вообще. Но вместе с тем существуют так называемые технические приемы, которые работают независимо от ситуации и формул предпочтений. Остановимся на них подробнее.

1. Ключевые фразы. Ключевые фразы — это фразы, тщательно и адекватно описывающие содержание информации, расположенной на web-ресурсе. При этом необходимо постоянно иметь в виду, что любую работу с ключевыми словами необходимо строить на основе фраз, а не отдельных слов. В противном случае, даже большое количество прекрасных ключевых слов, разрозненно используемых, ничем хорошим не заканчивается. К примеру, «раскручивается» сайт определенного туристического агентства, для чего решено использовать ключевое слово «туризм». Но данный термин слишком размыт для того, чтобы привести на web-ресурс необходимую аудиторию, а не, к примеру, владельцев магазинов по продаже котелков, палаток, топориков и охотничьих спичек, равно как и гостиниц и т.п. А вот если использовать ключевую фразу, скажем, «Туризм на озере Мичиган» — в этом случае сразу отсекаются ненужная часть аудитории и, соответственно, внушительное количество конкурентов, что позволяет наверняка занять место в десятке результатов соответствующего поиска.

2. Мета-тэги. Некоторые поисковые системы при формировании предпочтений обращают внимание на мета-тэги, включаемые в код web-страниц (например:

pic

Использование подобных тэгов позволяет существенно повысить позиции web-ресурса в рейтингах тех поисковиков, которые их используют.
Несколько слов по поводу ключевых слов, используемых в мета-тэгах. В них следует ориентироваться на ключевые фразы, на которые опираются представители целевой аудитории. Фразы эти следует располагать в тэгах по приоритетности, разделяя слова запятыми. При необходимости используются множественные числа. К примеру, маловероятно, что кто-то станет искать по ключевому слову «компьютер» — скорее всего, пользователь введет в строку поиска запрос «компьютеры». При помощи такого подхода обеспечивается большая эффективность, ибо в любом случае ключевые фразы представляют собой всего лишь отдельные слова, а пользователь в этом случае имеет возможность поиска как по фразам, так и по словам.
К тому же следует иметь в виду, что более или менее искушенный пользователь не будет вводить в строку запроса одно слово, так как прекрасно понимает, что поисковая система выбросит в качестве результатов поиска огромное количество совершенно не нужных ему страниц. Поэтому абсолютное большинство пользователей, как правило, гораздо более специфично в своих запросах. К примеру, вряд ли кто-то будет вводить запрос «компьютер» или даже «компьютеры», поиск будет сужен — например, «бесплатные компьютеры для учителей».

3. Заголовки. Если используется в качестве браузера Netscape или MS Internet Explorer, следует обратить внимание на верхнюю левую часть экрана, а именно — на размещенную там надпись. Это заголовок web-страницы. Как правило, поисковые системы при сортировке ключевых слов по приоритетности отдают предпочтение именно заголовкам. Поэтому при определении заголовка для каждой web-страницы необходимо подобрать соответствующие ключевые слова и придать им форму логической и грамматической целостности. При этом следует иметь в виду, что длинные заголовки при занесении в базу данных «поисковиков» обрезаются, а короткие и звучные принимают значение ключевых фраз. Также необходимо учесть, что ключевое слово в заголовке получает свой удельный вес в зависимости от того, какой процент заголовка оно составляет. Предположим, что заголовок web-страницы содержит слово «компьютеры» и состоит из четырех слов. В этом случае ключевое слово «компьютеры» имеет удельный вес в 25%. Если же заголовок насчитывает всего лишь два слова, то удельный вес «компьютеров» для поисковой системы возрастает вдвое, то есть до 50 %, и получает значительно большее предпочтение для «поисковика». Но надо также иметь в виду, что каждая поисковая система имеет собственную формулу вычисления приоритетности, поэтому для того, чтобы формировать заголовки для каждой системы в отдельности, необходимо знать соответствующие правила.

4. Слова в самом начале страницы. Контент web-страницы должен содержать ключевые слова в самом ее начале, при изложении первых предложений текстовой информации. В этом случае данные слова также приобретают значение приоритетных ключевых, что следует иметь в виду при формировании логической структуры текста на той или иной странице, хотя, конечно, они и не обладают такой значимостью, как тэги и заголовки.

5. Не поддавайтесь на соблазн спама ключевых слов! Существует множество нелегальных приемов увеличения цитируемости страниц ресурса путем спама ключевых слов, то есть множественного их повторения в мета-тэгах или на самих страницах, располагая их во всех местах, используя одинаковый цвет шрифта и фона, чтобы они не бросались в глаза. Такая промоушинговая деятельность очень сильно раздражает владельцев поисковых систем, ибо является ничем иным, как обычным спамом. К тому же таким образом невозможно снискать требуемое и заслуженное доверие со стороны целевой аудитории и создать основу для развития стабильного бизнеса, рассчитанного на длительную перспективу. Все «хитрости» должны быть законными с правовой и технической точек зрения, и только в этом случае они могут считаться хорошим промоушинговым приемом. А залог успешной раскрутки заключается, во-первых, в том, чтобы размещать на страницах качественную информацию, а во-вторых, в том, чтобы использовать ключевые слова как можно лучше на законных основаниях. Кстати говоря, спамеры поисковых систем рискуют остаться вообще за пределами внимания последних, ибо владельцы поисковых машин тщательно за этим следят — в конечном итоге ресурс будет окончательно и бесповоротно удален из их баз данных.

6. Плата за позиции. Любой владелец любой поисковой системы приобретает абсолютную уверенность в том, что клиент настроен серьезно относительно развития собственного электронного бизнеса в том случае, если он готов платить за то, чтобы его web-ресурс имел высокую позицию в рейтинге. Традиционная бизнес-модель «желтых страниц», досок объявлений и других подобных ресурсов заключается в том, что если информация должна получить приоритет и быть на самом верху, за это необходимо заплатить.

7. Страницы-проводники. Если web-ресурс должен учитывать требования каждой поисковой системы отдельно, целесообразно использовать в своей работе страницы-проводники. Для этого выясняются ключевые слова, которым отдает предпочтение та или иная поисковая машина, их расположение и последовательность, механизм формирования мета-тэгов, заголовок и тому подобное, после чего разрабатывается и, соответственно, регистрируется для каждой поисковой системы своя страница, ведущая непосредственно на данный web-ресурс.
Выше приведены несколько наиболее распространенных способов повышения позиции собственного web-ресурса в рейтингах поисковых систем. Несмотря на то, что приемов промоушинга при работе с поисковиками существует бесчисленное количество, изложенные данные являются основополагающими и при правильном подходе их вполне достаточно для обеспечения web-ресурсу высоких позиций.

pic

За счет чего и где берутся деньги?

Как известно, за доступ в Интернет надо платить: пойти к провайдеру, зарегистрироваться и внести абонентскую плату. То есть источник денег — пользователь, а потребитель денег — провайдер.
Если бы во Всемирной Сети были только домашние странички пользователей и электронная почта, то эта схема являлась полным и исчерпывающим описанием экономической модели Интернета. К тому же некоторые провайдеры предлагают какое-то время бесплатного доступа в Сеть. Объясняется это тем, что, кроме платы за доступ, взимаемой с пользователей, в Интернет есть и другие источники доходов — причем как для провайдера, так и для пользователя. Рассмотрим некоторые из них.

Хостинг

Чтобы пользователь мог разместить свою домашнюю страничку в Интернете, провайдер, как правило, предоставляет клиентам услуги хостинга. То есть пользователь может бесплатно разместить свой небольшой сайт на сервере провайдера. Если требуется разместить в Интернете большой объем информации, то уже бесплатным хостингом не обойтись. Существуют специализированные сервисы, которые занимаются предоставлением платного хостинга. Здесь можно получить возможности самостоятельного управления почтовыми ящиками, организации открытого и закрытого доступа к различным разделам сайта, хранения информации в базе данных, возможность web-программирования и тому подобное.
Также, если размещаемый web-ресурс предъявляет очень высокие требования к хосту, то необходим собственный интернет-сервер, круглосуточный доступ к которому придется оплачивать. Именно поэтому все ведущие фирмы-производители имеют в Интернете собственные сайты, которые, как правило, размещены на собственных интернет-серверах.
Таким образом, при организации серьезного сайта деньги уже взимаются не только с пользователей Интернета за доступ к информации, а еще и с владельца сайта за размещение информации.

Реклама

Некоторые сайты оказались достаточно популярными для пользователей Интернета, и вездесущие бизнесмены воспользовались этим фактом для организации рекламы. Со временем были разработаны различные технологии интернет-рекламы, которые сделали рекламу доступной практически для всех сайтов. (К примеру, размещение одного рекламного банера размером 468*60 пикселей в течение одного дня на главной странице «под шапкой поиска» rambler обойдется в $4800). Таким образом, владельцы сайтов получили возможность зарабатывать на рекламе. Сейчас этой возможностью пытается воспользоваться едва ли не каждый автор интернет-странички. Для этого достаточно зарегистрировать свой сайт в какой-нибудь банерообменной сети или в партнерской программе и установить на его страницах соответствующий HTML-код.
При этом существуют разные способы оплаты. Некоторые рекламодатели платят владельцу сайта за каждый просмотр рекламы посетителями сайта — оплата за показы (например, просмотр рекламного динамического банера размером 468*60 пикселей на главной странице той же поисковой системы rambler обойдется в $400 — $500 за один показ в зависимости от количества показов), некоторые — только за переход посетителя с данного сайта на сайт рекламодателя — оплата за клики. Но существуют и более сложные способы оплаты: например, процент от суммы покупки, совершенной посетителем с данного сайта (http://www.rambler.ru/doc/pl/head.shtml).

Платные сервисы

Кроме бесплатной информации, в Интернете существует множество платных сервисов. Это и интернет-магазины, и службы хранения информации, и различные базы данных и так далее, и тому подобное. Большинство из них прямого отношения к Интернету не имеет. Например, книжный интернет-магазин, скорее, имеет отношение к торговле или к издательскому бизнесу, а Интернет для него лишь коммуникационная среда. Здесь основной финансовый поток течет в руки книгоиздателей. Но если интернет-магазин организован интернет-компанией, то понятно, что прибыль от него будет направлена на развитие Интернета.
Существуют специализированные платные интернет-сервисы, например системы интернет-статистики. Здесь владелец сайта для получения подробной статистической информации о посещаемости своего сайта обязан за нее заплатить. Существуют, например, развлекательные сервисы, в которых для получения доступа к играм и другой развлекательной информации пользователь должен заплатить абонентскую плату. Таким образом, платные интернет-сервисы являются дополнительным источником финансирования Интернета, причем плата может взиматься как с пользователей Интернета, так и с владельцев сайтов.

Бесплатные сервисы

Поисковые системы, рейтинги, каталоги — это все интернет-сервисы, и они, как правило, бесплатные. Некоторые из них часть своих услуг предоставляют за деньги, поэтому в определенной степени они могут быть отнесены к предыдущему пункту, но основной доход такие интернет-сервисы приносят за счет рекламы. Многие из них имеют собственные рекламные технологии, поэтому их смело можно зачислить в разряд интернет-рекламы.

Сопутствующий бизнес

Самый популярный из сопутствующего бизнеса — web-дизайн. Прямого отношения к развитию структуры Интернета он не имеет. Здесь финансовый поток течет напрямую от заказчика к исполнителю мимо провайдеров и хостеров. К этому же разряду относится банерный дизайн, услуги по «раскрутке» сайта и так далее. Однако в связи с постоянно растущим интересом к Интернету web-дизайн становится все более актуальным видом услуг. Им занимаются откровенно «все, кому не лень»: от студентов и школьников до солидных фирм. Как и в ситуации с платными сервисами, если услугу по web-дизайну предоставляет интернет-компания, то прибыль от нее направляется на развитие Интернета.

Положение в Узбекистане

В настоящее время в Узбекистане функционирует ряд поисковых систем, количество и эффективность работы которых явно недостаточны. Одним из таких серверов является поисковая система www.search.uz Также программой «Инициатива Цифрового Развития» ПРООН создан научно-образовательный портал Re.Uz, «оснащенный» поисковой системой Research.uz (http://search.re.uz). Данный информационный ресурс имеет поддержку морфологии узбекского, русского и английского языков, распределенную систему новостей, базу данных электронных статей, курсы дистанционного обучения и многое другое. Кроме того, существует версия поисковой системы http://www.google.uz на узбекском языке. То есть можно сказать, что мы находимся лишь на начальном пути создания национальных поисковых систем. Поскольку «фронт работы» в этом направлении еще впереди, то позволим себе остановиться на характеристике основных подходов при разработке поисковых систем:

Во-первых, способность работы с предельно большими объемами информации.

Во-вторых, «многоязыковость» поисковой системы, способной определять исходные языки документов, оперировать с морфологическими формами различных языков в запросах и ответах.

В-третьих, «простота и доступность» — создание инструмента, с помощью которого рядовые владельцы сайтов смогут изготовить собственную локальную поисковую систему. Идея заключается в возможности обновления данных локальной поисковой базы синхронно с центральной базой поисковой системы. То есть актуальность данных поисковой системы полностью зависит от частоты сканирования ресурсов на предмет обновления индекса. При этом обновление центральной базы осуществляется в реальном времени с частотой сканирования ресурса. Если владельцу ресурса не требуется локальная поисковая система, то он может использовать готовое программное обеспечение синхронного обновления локальной и центральной баз данных.

pic

Данный механизм значительно облегчит создание региональных, областных, республиканских и иных баз данных. «Коллекции» могут создаваться не только по территориальному принципу, но и по тематическому. При этом центральная база данных всегда будет «знать», к какой конкретно «коллекции» принадлежит тот или иной документ. Это свойство может быть легко использовано в дальнейшем для ограничения тематики поиска.
В-четвертых, распределенность сетевых структур. Так, например, сканирование производится множеством агентов под руководством центрального диспетчера, индекс для поиска распределен по другим серверам, причем данный факт не является копированием полного индекса на разные сервера. В процессе обработки одного поискового запроса в работу могут быть задействованы десятки серверов различной направленности действия. На многих этапах данного процесса возможна параллельная работа серверов, чем достигается снижение результирующего времени обработки запроса. Вся процедура, производимая в рамках поисковой системы, в основе своей содержит сетевые взаимодействия различных компонент в различных узлах сети системы.
В-пятых, ретроспективность — создание базы данных состояния ресурсов сети в отдельно взятый интервал времени в рамках построения поисковой системы. Это означает, что на практике можно будет увидеть, как выглядел тот или иной ресурс, к примеру, три месяца или год назад. В этом случае данный проект мог бы стать частью национальной программы создания библиотеки ресурсов.
В-шестых, ориентировка на наиболее популярные форматы документов — таких, как Microsoft Word, Excel, RTF, PDF, PostScript, PowerPoint, и других.
В-седьмых, создание нового механизма ранжирования результатов поиска, учитывающего все известные на сегодня оригинальные методы. При этом отдельные материалы данной разработки могут использоваться для обучения проектированию различных составляющих поисковой системы.

Приложение

Перечень и характеристика поисковых систем и каталогов мирового значения

Orphus system
Подписывайтесь на канал infoCOM.UZ в Telegram, чтобы первыми узнавать об ИКТ новостях Узбекистана
В Telegram
В Одноклассники
ВКонтакте