Самая точная статистика сайта для его владельца

Многим у кого есть платный хостинг хотелось бы всегда иметь под рукой точную и адекватную статистику сайта. Существует масса сервисов: Google Analytics, liveinternet, HotLog, Rambler top 100 - все они бесплатно покажут самую разнообразную информацию о статистике сайта. Они для этого созданы и не плохо с этим справляются. Но их показания о посещаемости сайта настолько "разнообразны", что часто различаются в одних и тех же показателях. К тому же непонятно что делать, если требуется знать статистику не посещения web-страницы, а скачивания какого-либо ресурса (программы, видео, аудио и пр.), ссылки на который рассыпаны богатой россыпью по всему интернету.

        Простое, бесплатное и очень точное решение по сбору статистики сайта - проанализировать лог файл сервера, который содержит в себе в хронологическом порядке обращения к файлам, в том числе и страницам сайта. Если Вы владелец платного сайта и не знаете как посмотреть лог сайта, терзайте службу поддержки.

        Допустим лог для сбора статистики сайта будет выглядеть следующим образом:

 

        В хронологической последовательности располагаются ip пользователя, дата и время его обращения, на какие страницы заходил и прочее. Допустим нас интересует сколько раз был скачан файл "ACE_setup.exe", + детализация, сколько уникальных пользователей закачивали программу, с каких сайтов больше было запросов. Все это возможно сделать с помощью бесплатной программы ReplaceRex, которая позволяет работать через bat файл (т.е. настроив шаблон замены, дальнейшие сборы статистики сайта можно делать в один клик).
        Итак, первым делом необходимо настроить шаблон замены. Запускаем программу, набираем в поле редактирования имя шаблона "Статистика сайта" и нажимаем кнопку "Новый шаблон". 

        В диалоге редактирования шаблона выбираем в верхнем списке тип замены "Оставить только строки, содержащие Образец1", нажимаем кнопку "<== Добавить" и в поле редактирования "Образец1" вводим "ACE_setup.exe". Таким образом, первым действием мы оставляем строки, соответствующие попыткам пользователей закачать файл "ACE_setup.exe". Причем ReplaceRex после обработки файла сразу покажет статистику, сколько строк оставлено, т.е. сколько попыток закачать было предпринято за время ведения лог файла. 

        Но поскольку каждый пользователь может не один раз пытаться скачать файл или скачивать его частями и в разное время, то дополнительно вторым действием ставим сортировку с одновременным удалением одинаковых пользователей. На выходе после этого действия мы получим набор строк с уникальным посетителем в каждой. Если бы мы поставили это действие на первое место, то мы бы легко получили статистику сайта по количеству уникальных посетителей.


        В третьем действии задаемся целью получить статистику закачек в разрезе сайтов, с которых эти закачки осуществлялись. Для этого добавляем "Сортировать строки по элементу между Образец1 и Образец2", Образец1=Образец2=" "(пробел), номер нахождения первого образца = 10, номер нахождения второго образца после найденного первого = 1. Что означают эти поля и вообще все действие? Ищется в строке подстрока, находящаяся между 10 пробелом и следующим за ним пробелом. В нашем случае это и есть название сайта, с которого совершалась закачка. Затем производится сортировка по этим подстрокам и в алфавитном порядке выстраиваются все строки, в которых были найдены эти подстроки.

        На втором действии очень похожая операция, только вдобавок к этому удаляются все строки с повторами найденных подстрок. Причем одновременно выводится статистика сайта по найденным элементам. Т.е. если мы третье действие заменим также на "Сортировать и оставить только неодинаковые", то в статистике увидим с каких сайтов и сколько раз было скачана программа:

        Теперь когда шаблон готов, можно просто использовать его вручную, как раньше, выбирая в самом ReplaceRex шаблон "статистика сайта" и файл, который нужно обработать. Но можно поступить еще проще: создать текстовой файл с расширением bat и набрав в нем слудующую инструкцию ReplaceRex.exe +open +stat in_file="access_log.processed.1" out_file="stat_setup.txt" templet="stat_setup.shbl" , где
+open означает открытие результирующего файла после всех замен по шаблону
+stat означает добавление статистики в результирующий файл
in_file= задает файл для обработки
out_file= задает имя результирующего файла
templet= имя шаблона (последние 3 параметра рекомендуется набирать полными именами, если bat файл запускается из другой директории)


        Теперь достаточно просто запустить bat файл, подложив ему перед этим свежий лог файл и статистика сайта у нас перед глазами.

скачать ReplaceRex

Читайте также:
Пиксельный Контроль - новые горизонты возможностей автоматизирующих программ
Поиск самой надежной и простой программы автоматизации действий пользователя