Об авторе: Алексей Макров - сертифицированный специалист по работе с системой веб-аналитики Google Analytics. Ведет внутрикорпоративные курсы работы с Google Analytics. В его активе успешный опыт создания концепций автоматизированных средств анализа сайтов. На данный момент занимается разработкой концепций использования систем веб-аналитики в поисковом продвижении и проведением исследований с целью разработки новых эффективных методологий продвижения интернет-сайтов.
Многим известно, что не бывает инструментов веб-аналитики, которые идеально подсчитывают всю статистику. Данные Google Analytics (GA) также не претендуют на абсолютную точность. Так, например, вопросы точности данных могут возникнуть у вас при сравнении показателей GA с данными Яндекс.Метрики или других систем интернет-статистики. В данной статье будет подробно рассмотрен вопрос точности и корректности данных Google Analytics.
Существует множество причин, по которым статистика Google Analytics не является абсолютно точной, но со многими из них сталкиваются пользователи и других систем веб-аналитики, так как они используют схожие технологии, например, JavaScript-дескрипторы и cookie-файлы.
В целом, причины неточности подсчета можно разделить на две категории:
проблемы, которые зависят целиком от вашего сайта и настроек отслеживания, и, следовательно, вы их можете исправить;
проблемы, не зависящие от вас, исправить которые вы не можете.
Далее мы рассмотрим эти проблемы более подробно и постараемся найти пути их решения.
Давайте начнем с тех проблем, которые вы можете исправить.
Google Analytics работает только на тех страницах, на которых установлен код отслеживания (Google Analytics Tracking Code). Если на странице нет кода отслеживания, то в GA не будет никаких данных по этой странице: ни посещений, ни просмотров, ни каких-либо других показателей.
В данной статье описаны некоторые методы отладки кода GA, например, с помощью специального расширения для браузера Google Chrome.
Многие вебмастеры и владельцы сайтов обеспокоены скоростью загрузки страниц. И это правильно. Но, как следствие, часто код GA размещают перед закрывающим тегом </body>
, для того чтобы различные элементы сайта загрузились до выполнения JS-кода.
Google рекомендует размещать код трекинга Google Analytics перед закрывающим тегом </head>
. Размещая JS-код Google Analytics в конце <body>
, вы рискуете не посчитать посетителей, которые успеют перейти по любой другой ссылке сайта раньше, чем выполнится код отслеживания. Учитывая сегодняшние «раздутые» страницы, объемы которых порой достигают 2 МБ (и это не предел!), вероятность такого перехода крайне высока.
Код ga.js весит 15 КБ. Разместив его в <head>
, вы не проиграете во времени, зато точно выиграете в корректности подсчетов статистики.
Не допускайте дублирования одинаковых кодов отслеживания, иначе путаницы в данных не избежать.
Если на страницах вашего сайта часто возникают ошибки при выполнении JS-кода, то это может стать причиной некорректного подсчета статистики. Дело в том, что при возникновении ошибки в каком-либо JS-скрипте на странице, может быть остановлен движок JavaScript в браузере и, как результат, не будет выполнен код отслеживания GA. Поэтому важно, чтобы все скрипты JS на страницах работали корректно.
Методы, используемые в коде отслеживания GA, чувствительны к регистру, поэтому важно следить за тем, чтобы имена методов были написаны правильно. Например:
_gaq.push([’_trackPageview’])
а не
_gaq.push([’_trackPageView’])
или
_gaq.push([’_trackpageview’])
Если вы используете нестандартные методы отслеживания, например _trackTrans()
для отслеживания транзакций в электронной коммерции или _setDomainName() для кросс-доменного отслеживания, то обязательно проследите за корректностью написания наименований данных методов.
Содержание лишних пробелов в аргументах функций также расценивается как ошибка синтаксиса. Например, данный участок кода выполнен не будет:
_gaq.push([’_setAccount’, 'UA-65432-1']);
Также идентификатор аккаунта обязательно должен содержать UA. Его отсутствие является одной из самых частых ошибок при первичной настройке кода.
Как часто вы посещаете свой собственный сайт? Частота посещений сайта вами или другими сотрудниками вашей компании может искажать общую статистику посещаемости. Для того чтобы избежать возникновения данной погрешности, можно использовать блокировщик Google Analytics, представляющий собой расширение ко всем наиболее популярным браузерам.
В случае если в вашей компании работает большое число сотрудников, то наиболее подходящим вариантом является создание специального профиля, который будет исключать данные посещений сотрудников компании. Создайте профиль и примените фильтр, исключающий трафик из вашей сети.
Для грамотного отслеживания различных рекламных кампаний (РК), будь то контекстная реклама, баннерная реклама или другие виды РК, следует использовать инструмент персонализированных кампаний. Его применение поможет вам точно отслеживать эффективность своих кампаний. С рекомендациями по настройке этого инструмента можно ознакомиться здесь. Функционал персонализированных кампаний реализуется за счет добавления к URL-адресам специальных UTM-меток.
Очень часто при ведении рекламных кампаний в Яндекс.Директе рекламодатели забывают о немаловажном факте: если не задать URL-адресам в объявлениях UTM-метки, то все посещения с объявлений Директа в поисковой выдаче будут засчитаны Google Analytics как обычные переходы из поисковых систем и отнесены к сегменту бесплатного поискового трафика. В Google AdWords можно настроить функцию автоматической пометки, и тогда присваивать метки вручную будет не нужно. Но если метки вообще отсутствуют, то это также приведет к смешению оплачиваемого трафика с бесплатным. Эти ошибки приводят к критичной невозможности корректной оценки объемов естественного поискового трафика. Поэтому, если вы используете контекстную рекламу, следите за чистотой собственной статистики — настраивайте метки.
К сожалению, это так. Даже если вы корректно настроили все на вашем сайте, то часть посетителей будет не учтена или посчитана неправильно. И вот несколько причин, по которым это происходит:
Если у пользователя отключен JavaScript, то код отслеживания выполняться не будет. Процент пользователей, у которых в браузере отключен JavaScript, по разным оценкам составляет до 2%. Поэтому данная проблема носит несущественный характер.
Для присваивания каждому пользователю уникальных параметров GA использует несколько cookie-файлов, которые позволяют идентифицировать пользователя как уникального посетителя и хранить данные о его сессии. На основе всех данных, хранящихся в cookie-файлах, позже рассчитываются различные метрики. Отсюда вытекает целый ряд проблем, связанных с cookie-файлами:
у пользователя может быть отключен прием cookie-файлов в браузере, тогда его посещение не будет зарегистрировано GA;
если пользователь (или специальное программное обеспечение на компьютере пользователя) периодически очищает cookie-файлы, то это вносит погрешность в расчет различных показателей, связанных с последовательностью пользовательских сессий, т.к. после того как cookie-файлы удалены, переход на сайт будет засчитываться как новое уникальное посещение, даже если пользователь уже побывал на сайте.
Google Analytics использует несколько cookie-файлов. Но основными являются два вида:
_utma.
Создаются при первом вашем посещении веб-сайта и хранятся 2 года, до тех пор, пока вы их не удалите или не переустановите браузер. Они нужны, чтобы в следующее посещение идентифицировать вас как посетителя, уже заходившего на сайт. Обновляются на 2 года при каждом новом посещении.
_utmb
. Создаются при каждом вашем новом посещении веб-сайта. Их срок действия составляет 30 минут, и они регулярно обновляются, когда вы совершаете какое-либо действие на сайте, приводящее к вызову одного из методов GA.
Таким образом, если utmb cookie-файл не обновляется на протяжении 30 минут, то он становится неактивным.
Например, если вы посмотрели веб-страницу, отошли на час от компьютера, оставив открытой вкладку, а затем снова вернулись к посещению этого сайта, то ваше посещение будет зарегистрировано GA как два разных посещения. Насколько это может исказить вашу статистику — это очень субъективный вопрос, ответ на который зависит от особенностей аудитории вашего сайта.
Эта ситуация лучше всего иллюстрируется примером:
Пользователь A посетил сайт site.ru в первый раз, в браузере появился cookie-файл utma. На следующий день пользователь B с того же компьютера совершает свое первое посещение веб-сайта site.ru. По факту, два различных пользователя, возможно с разными целями, зашли на сайт в первый раз, но т.к. метрика уникальных посетителей связана с cookies, то будет зафиксирован один уникальный посетитель и два посещения.
С распространением мобильных технологий наши посещения сайтов уже не привязаны к одному устройству. По дороге на работу мы можем зайти на сайт нового интернет-магазина со своего смартфона, чтобы ознакомиться с предлагаемым ассортиментом. Днем, находясь на работе, мы несколько раз посетим этот сайт, чтобы определиться с подходящим товаром. А вечером оформим заказ со своего ноутбука. Таким образом, за один день мы создадим трех уникальных посетителей, и в итоге покупка будет зарегистрирована GA как покупка, совершенная в первое посещение, хотя это далеко не так.
Несмотря на то, что у Google Analytics есть функционал отчетов в режиме реального времени, лишь некоторая часть метрик отображается в них. Для остальных метрик расчет производится намного позднее: от
Если на ваш сайт приходит большое число посетителей, то при запросе определенных отчетов вы можете увидеть сообщение о том, что данный отчет основан на выборке данных. Это означает, что при построении данного отчета Google Analytics использует не все данные с целью повышения производительности. Подробнее о семплировании можно почитать здесь.
Итак, вы никогда не получите идеальной статистики посещаемости. С этим стоит просто смириться. Но при корректной настройке кода отслеживания на сайте Google Analytics можно добиться достаточно высокой точности, которой хватит, чтобы сделать действенные выводы на основе анализа данных.
Спасибо Алексею за удобный чек-лист. Эта шпаргалка будет особенно полезна пользователям, которые еще не «обжигались» на описанных выше примерах!
От себя хотел бы добавить несколько пунктов, которые также могут привести к проблемам с точностью данных:
1. Данные могут быть изменены фильтрами Google Analytics — важно помнить, что фильтры могут не только «резать» но и изменять данные в отчётах;
2. Отчёты могут содержать данные о трафике «роботов» — существуют «роботы», исполняющие скрипты GA (на моей практике преимущественно роботы Яндекса). Данный трафик можно отделить при помощи следующего сегмента: https://www.google.com/analytics/web/permalink?uid=g4ID2sjLQoqojdWZOoGxAA
3. Неправильные настройки часового пояса — однажды, клиент пожаловался, что реклама показывается не в то время, которое было оговорено. Оказалось, что проблема была в настройках часового пояса счётчика.
4. Обязательно заполняйте поля, которые помечены словом «required» например:
Помимо этого я часто сталкиваюсь с вопросами: почему данные разных систем веб-аналитики отличаются? Помимо причин, описанных выше, перечислю еще несколько популярных:
1. Различия в методах подсчёта сессий / % отказов и т.п.
2. Отличия в сроке жизни cookie
3. Разные модели атрибуции — к примеру при прямом трафике в Google Analytics присваивается последний рекламный канал, а в Яндекс.Метрике нет.
Безусловно, на сбор данных о посещаемости сайтов влияет огромное количество факторов, как зависящих от корректной настройки и установки счетчиков, так и неподвластных аналитику.
Все, что зависит от аналитиков и верстальщиков — корректная генерация фрагмента кода и его размещения на сайте с учетом всех требований по установке Google Analytics, должно соблюдаться неукоснительно. При этом ошибок в кодах отслеживания можно избежать, если точно копировать коды, которые генерирует Analytics, а также используя фрагменты кода из руководства по настройке и изменяя в них требуемые данные.
Собранные данные априори не могут быть достоверными на 100 %, да это, как правило, и не требуется. Главное, чем следует руководствоваться при аналитике сайтов — это не столько точные значения параметров и показателей (ведь они получены с неизвестной погрешностью), сколько тренды и динамика. Сравнивать отчетные периоды между собой и исследовать зависимости, выводить закономерности.
Более того, я часто замечаю, что просмотрев один из отчетов в Google Analytics за предыдущий период сегодня, зайдя в тот же самый отчет за тот же самый период завтра, я увижу отличающиеся данные. Система скорректировала данные, а расхождения между тем, что я увидела в первый и во второй раз порой достигают 1 — 2 %.
Ассинхронный код не повлияет на работу сайта.
Что касается установки нескольких кодов счетчиков GA на сайт, то с подобной проблемой я сталкивалась, когда владелец сайта самопроизвольно производил установку кодов отслеживания, не зная всех тонкостей работы. Ожидаемо, что это приводило к искажению и накрутке данных.
В то же время одновременное использование счетчика GA и UA вполне допустимо. И сейчас, когда UA еще работает не в полную силу и не поддерживает ремаркетинг, одновременное их использование необходимо.
Когда UA будет запущен в полной мере, использование GA, на мой взгляд, сократится. Как станет и меньше искажений в статистике. А проблемы с одним пользователем и несколькими устройствами удастся избежать.
Среди множества проектов «Бюро» существует несколько интернет-магазинов. Для них мы так же активно используем различные метрики (Яндекса и Google). Например, с проектом Интернет-магазина haldi.ru мы долгое время пытались найти причину различия в показаниях данных метрик. И пока мы не внедрили несколько методик, описанных в данной статье, статистика продолжала выдаваться с погрешностями. Сейчас же обе статистики показывают близкие значения, позволяя делать более глубокий анализ. На мой взгляд, представленный материал не просто актуален и эффективен, он должен быть взять на вооружение владельцами Интернет-магазинов и веб-студиями, специализирующимися на их разработке.
Проведите конкурс среди участников CMS Magazine
Узнайте цены и сроки уже завтра. Это бесплатно и займет ≈5 минут.
SEO аналитик в SiteClinic.ru
Статья весьма актуальна. Особенно вопрос кросс-доменного отслеживания. За последние несколько месяцев мне пришлось столкнуться с рядом порталов, у которых настройка была некорректной. Данные по поддоменам либо не собирались, либо собирались некорректно, что не позволяло делать на их основе какие-либо выводы.
Также согласен и с тем, что о факторах, на которые невозможно повлиять, нужно просто помнить, не заостряя на них внимание, поскольку имеющейся информации (при корректной настройке аналитики) более чем достаточно.
Главное — постоянно обрабатывать эти данные, делать выводы и регулярно корректировать стратегию в зависимости от получаемых результатов. Обязательно нужно помнить о настройке целей. Также обращайте внимание на источники трафика, анализируйте их в порядке важности.