Что и как ищут пользователи в Интернете
18 октября 2008
Рубрика: Интернет и сети. Тэги:
Автор: .

pic

Яндекс опубликовал исследование на тему «Что и как ищут пользователи в Интернете». Предлагаю ознакомиться с сокращенным вариантом публикации.

Описать все, что связано с поиском в интернете, в одном исследовании невозможно. Поэтому наш отчет рассказывает только о том, что и как люди ищут в интернете – о формулировках поисковых запросов, ошибках и опечатках, появлении новых слов и новых запросов. В нем нет информации о релевантности выдачи, алгоритмах ранжирования и прочих вещах, интересных, например, вебмастерам, оптимизаторам и разработчикам поисковых систем. Исследование адресовано всем пользователям интернета, по крайней мере, тем, которые хотя бы иногда что-то ищут.

Все выводы основаны на данных поиска Яндекса. Информационный бюллетень включает в себя данные с сентября 1997 года по сентябрь 2008 года.

В 1997 году, когда поисковая система Яндекс только появилась, в Рунете было около 18 тысяч сайтов и около 3 миллионов страниц. Объем всех текстов Рунета составлял 7,5 Гб — то есть все существовавшие на тот момент сайты легко бы поместились сейчас на одну хорошую флешку. Количество пользователей Рунета не превышало 200 тысяч, и в день они задавали около тысячи запросов к Яндексу. Теперь в Рунете как минимум 13 миллионов сайтов, а полугодовая аудитория, по данным ФОМ, — более 32 миллионов человек. По оценке Яндекса, сегодня пользователи русскоязычного интернета просматривают страницы результатов поиска всех поисковых машин более 1,9 миллиарда раз в месяц.

Около 2,5% запросов сформулированы как вопрос. То есть это обычные вопросы, и пользователи, которые их задают, общаются с поисковой системой так, будто это живой человек. У Яндекса даже спрашивают «как пройти в библиотеку?» — в среднем 41 раз в месяц, «зачем герасим утопил муму?» — 53 раза и «кто убил лору палмер?» — 107 раз.

Самый популярный вопрос, с которым пользователи обращаются к Яндексу, — «как». Вопросов, начинающихся с «как», задают больше, чем вопросов, начинающихся со всех остальных вопросительных слов вместе взятых. Интересно, что вопрос «что» значительно популярнее вопроса «кто», и в частности вопрос «что делать» интересует пользователей больше вопроса «кто виноват».

Самые короткие составляющие запросов к Яндексу — отдельные буквы и цифры. Пользователей интересуют все буквы русского алфавита, больше всего — предлоги и однобуквенные союзы (например, и в августе 2008 искали 4385966 раз), а меньше всего — ъ (меньше 9 тысяч запросов в месяц).

Наиболее длинные осмысленные слова — как правило, сложные существительные, состоящие из нескольких корней. Самое длинное слово, заданное в качестве запроса к Яндексу в августе 2008 года, состоит из 37 символов — гиппопотомомонстросесквиппедалиофобия. По этому запросу находится 4583 страницы (на сентябрь 2008 года).

Среди самых длинных запросов, на которые существуют ответы в интернете, преобладают различные химические соединения (этилоксиэтилпарафенилендиаминсульфат — 35 символов), названия компаний (средневолжсксельэлектросетьстрой — 32 символа) и разного рода фобии (например, гексакосиойгексеконтагексофобия — 31 символ).

В запросах на поиск картинок самые длинные запросы — это электростеклоподъемник и электроводонагреватель — по 22 символа.

Для общения с поисковой машиной чаще всего используют существительные — эту часть речи содержат 75% запросов к поиску. Вторая по распространенности часть речи — прилагательные, они присутствуют в 16% запросов к веб-поиску. Глаголы используют только в 5% случаев, а наречия есть менее чем в 1% запросов.

Большинство пользователей не позволяют себе грубостей с поисковой системой — матерную лексику содержит сравнительно небольшое количество запросов — полтора процента. Тем не менее матерных слов больше, чем, например, наречий или числительных (количественных и порядковых вместе взятых). Числительные присутствуют всего в 0,2% запросов.

Свои запросы к поиску русскоязычные пользователи в основном пишут на кириллице (более 72% запросов). Латиницей написаны около 15% запросов, а около 11% содержат и кириллические, и латинские символы. Чуть более 1% — это запросы из одних чисел, пустые или бессмысленные. Приблизительно в каждом десятом поисковом запросе присутствует название организации или сайта. В этом случае пользователь часто хочет найти вполне определенный сайт, и все остальные результаты поиска его не интересуют.
14-15% всех запросов содержат различные ошибки и искажения. Ошибки в поисковых запросах возникают по разным причинам — не только из-за неграмотности, но и из-за стремления найти ответ как можно быстрее, неверной раскладки клавиатуры и т.п. Две трети всех ошибок — орфографические (пропущенные буквы, неправильное написание слов и т.п.).
Самая распространенная ошибка сейчас — однокласники (с одной с). Запрос «одноклассники» встречается в 8 раз реже грамотного запроса «одноклассники», но входит в топ-10 запросов к Яндексу в августе 2008. Это единственный запрос с ошибкой среди ста самых частотных поисковых запросов.

Самые популярные запросы — только очень небольшая часть всех запросов к поиску. По данным на август 2008, общее количество запросов из первой сотни составляет около семи процентов от всех поисковых запросов (около 1,8 миллиона запросов к Яндексу в день). Большинство запросов достаточно редки — каждый из них задается реже ста раз в день. Именно такие, низкочастотные, запросы составляют три четверти поисковых запросов (более 20 миллионов в день).

Обычно пользователи из разных регионов ищут в интернете похожие вещи. Но, конечно, в каждом регионе существуют специфические, «местные» запросы — например, названия аэропортов или магазинов. Чтобы выделить такие запросы, можно использовать специальный показатель — региональность. Региональность запроса — это отношение частоты, с которой задавали этот запрос пользователи определенного региона, к количеству всех запросов из этого региона. Чем больше это отношение (то есть доля того или иного запроса среди всех запросов), тем более этот запрос «местный», то есть наиболее популярный в определенном регионе. Сравнение показателей региональности в разных регионах позволяет увидеть, какие запросы характерны для того или иного региона.

При помощи поисковых запросов можно увидеть, как меняется интерес пользователей к различным понятиям и событиям. Для этого в январе 1999 года был придуман НИНИ-индекс — индекс Непостоянства Интересов Населения Интернета. Он показывает, к каким запросам интерес пользователей внезапно вырос, а к каким — упал.

Резкое появление интереса со стороны пользователей связано с различными новостями — общественно-политическими или светскими. В июле 2008 года никаких политических событий не происходило, и наибольший всплеск интереса вызвала радиопередача с участием Кати Гордон и Ксении Собчак (запросы [ксения собчак], [собчак], [собчак гордон], [гордон] и т.п.) Другие июльские всплески интереса были вызваны смертями Нонны Мордюковой и Михаила Пуговкина.

В августе 2008 года пользователей интересовали уже совсем другие вещи — российско-грузинский конфликт ([война в осетии], [война в южной осетии], [война грузия]) и олимпиада ([дневник олимпиады], [медали олимпиады], [итоги олимпиады]). На третьем месте — свадьба Ксении Бородиной.

Кроме новостей и важных событий резкие всплески интереса вызывают мемы —
практически любая информация, которая неожиданно становится популярной и мгновенно распространяется среди пользователей интернета. Например, слово «превед», вопрос «как вы относитесь к пробуждению Ктулху?» и т.п. Одно из последних таких явлений — запуск большого адронного коллайдера в Швейцарии, который готовился летом 2008 года. Еще год назад адронными коллайдерами никто, кроме нескольких специалистов, не интересовался — ежемесячное количество запросов не превышало нескольких десятков. Этим летом пользователи задавали десятки тысяч запросов [адронный коллайдер] и [большой адронный коллайдер].

Еще много интересных цифр найдете в полном отчете по адресу http://www.yandex.ru/redir?dtype=stred&pid=39&cid=2052&url=http://download.yandex.ru/company/yandex_search_autumn_2008_ru.pdf — в формате PDF.

Orphus system
Подписывайтесь на канал infoCOM.UZ в Telegram, чтобы первыми узнавать об ИКТ новостях Узбекистана
В Telegram
В WhatsApp
В Одноклассники
ВКонтакте