В современном обществе интернет представляет не только инфокоммуникационную сеть, но и мощный инструмент для проведения разнообразных исследований в социальных и экономических областях.
Одним из направлений исследовательского использования Интернета является получение обобщенных данных мониторинга того или иного сегмента информационного пространства на основании сервисов статистики посещаемости сайтов [1, 2]. В свете изложенного проведение анализа сервисов Интернет-статистики как исследовательских инструментов представляется актуальным.
В качестве объектов исследования выбраны наиболее крупные сервисы Рунета, представляющие данные рейтинга сайтов в открытом доступе. Очевидно, что в первую очередь необходимо учитывать информацию об общем количестве сайтов, входящих в рейтинг. Ранжировка сайтов происходит по количеству посетителей с возможностью представления результатов за день, неделю и месяц. Также, в зависимости от позиции владельца сайта, существует возможность просмотра подробной статистики. Подробная статистика на различных сервисах существенно отличается по набору параметров, доступных для анализа. В наиболее лаконичных вариантах в подробной статистике представлены только данные по количеству посещений и просмотров с возможностью группировки по временным периодам. С другой стороны стоят сервисы, предоставляющие полный набор данных веб-мониторинга сайта, включая разрешение экрана, пол, возраст, используемую операционную систему, статистику переходов и множество других характеристик.
Таким образом, в качестве критериев оценки исследуемых рейтинговых сервисов определены
- Количество сайтов в рейтинге. Эта информация, как правило, представлена на странице рейтингового сервиса.
- Доля открытых статистик. Для оценки данного параметра использованы первые 30 позиций в общем рейтинге каждого сервиса.
- Качество открытых статистик. Для оценки данного параметра использована 10 балльная шкала: 1 соответствует случаю, когда открытая статистика содержит только данные, использованные в построении рейтинга (число посетителей и количество посещений), 10 соответствует полному набору данных веб-мониторинга сайта в открытой статистике.
Результаты исследования по первому критерию, полученные по данным [3] представлены в таблице 1.
Таблица 1. Результаты анализа открытых рейтинговых ресурсов по количеству сайтов в рейтинге
Адрес ресурса |
Количество сайтов в рейтинге |
top.mail.ru |
849 322 |
top100.rambler.ru |
148 772 |
hotlog.ru |
126 056 |
liveinternet.ru/rating/ru |
329 817 |
yandeg.ru |
7 481 |
rating.openstat.com |
более 200 000* |
directrix.ru |
12 298 |
*данные [4]
Данные таблицы 1 позволяют выделить для дальнейших исследований 5 ресурсов, исключив yandeg.ru и directrix.ru как недостаточно репрезентативные.
Результаты анализа доли и качества открытых статистик приведены в таблице 2.
Таблица 2. Результаты анализа рейтинговых ресурсов по открытым статистикам
Адрес ресурса |
Количество открытых статистик |
Доля открытых статистик |
Качество открытых статистик |
top.mail.ru |
19 |
0.63 |
5 |
liveinternet.ru/rating/ru |
13 |
0.43 |
10 |
rating.openstat.com |
30 |
1.00 |
2 |
top100.rambler.ru |
30 |
1.00 |
1 |
hotlog.ru |
18 |
0.60 |
2 |
При оценке качества открытых статистик ресурсов top.mail.ru и hotlog.ru номинально присутствует возможность просмотра полных статистик веб-мониторинга, но доступны только пункты рейтинговых параметров. На ресурсе top.mail.ru просмотр полных статистик веб мониторинга возможен в 5 случаях из 30 проверенных и 19 открытых. На ресурсе hotlog.ru из 30 поверенных и 18 открытых возможность просмотра полных статистик веб-мониторинга не обнаружена.
Таким образом, из результатов проведенного анализа следует, что не смотря на большое количество рейтинговых ресурсов, только незначительная часть обладает необходимой репрезентативностью выборки – более 100 000 сайтов. Для ранжировки отобранных пяти ресурсов оценочные критерии представлены в виде безразмерных единичных коэффициентов [5] К1, К2 и К3. Натуральные диапазоны критериев выбраны: для количества сайтов от 100 000 до 900 000, для качества статистик от 1 до 10. Результаты, представленные в таблице 3, показывают, что ранжировка по среднему безразмерному критерию из трех и ранжировка по количеству сайтов в рейтинг полностью совпадают. В целом, если при исследовании необходимо использование данных, содержащихся в полных статистиках веб-мониторинга, то следует использовать только два первых из исследованных ресурсов. В случаях, когда достаточно данных о количестве посещений, допустимо использовать любой из исследованных ресурсов или кросс-выборку из нескольких ресурсов.
Таблица 3. Безразмерные коэффициенты
Адрес ресурса |
К1 , количество сайтов |
К2, доля открытых статистик |
К3, качество открытых статистик |
среднее |
top.mail.ru |
0,94 |
0,63 |
0,50 |
0,69 |
liveinternet.ru/rating/ru |
0,29 |
0,43 |
1,00 |
0,57 |
rating.openstat.com |
0,13 |
1,00 |
0,20 |
0,44 |
top100.rambler.ru |
0,06 |
1,00 |
0,10 |
0,39 |
hotlog.ru |
0,03 |
0,60 |
0,20 |
0,28 |
Выводы
По результатам проведенного исследования получено:
- Для Рунета выделены 5 ресурсов, обладающих возможностью показа статистики сайтов и количеством сайтов в рейтинге более 100 000.
- Установлено, что качественными открытыми статистиками, содержащими полные данные веб-мониторинга обладают два ресурса из исследуемых.
- Проведена ранжировка исследуемых ресурсов с применением безразмерных критериев, отражающих количество сайтов, долю открытых статистик и качество открытых статистик.